notas de mecánica cuántica - rodolfo a. díaz s

373
Mec´ anica Cu´ antica: Notas de Clase Rodolfo Alexander Diaz S. Universidad Nacional de Colombia Departamento de F´ ısica Bogot´ a, Colombia 4 de agosto de 2010

Upload: julian-david-realpe

Post on 03-Jul-2015

425 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Mecanica Cuantica: Notas de Clase

Rodolfo Alexander Diaz S.Universidad Nacional de Colombia

Departamento de FısicaBogota, Colombia

4 de agosto de 2010

Page 2: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Indice general

1. Linear or vector spaces 10

1.1. Definition of a linear vector space . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.2. Algebraic properties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3. Vector subspaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.4. Dimension and bases in vector spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.5. Mappings and transformations in vector spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.6. Linear transformations of a vector space into itself . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.6.1. Projection operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.7. Normed vector spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

1.7.1. Convergent sequences, cauchy sequences and completeness . . . . . . . . . . . . . . . . . . . . 18

1.7.2. The importance of completeness in quantum mechanics . . . . . . . . . . . . . . . . . . . . . 19

1.7.3. The concept of continuity and its importance in Physics . . . . . . . . . . . . . . . . . . . . . 19

1.8. Banach Spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.8.1. Continuous linear transformations of a Banach space into scalars . . . . . . . . . . . . . . . . 20

1.8.2. Continuous linear transformations of a Banach space into itself . . . . . . . . . . . . . . . . . 20

1.9. Hilbert spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

1.9.1. Orthonormal sets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

1.9.2. The conjugate space H∗ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

1.9.3. The conjugate and the adjoint of an operator . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

1.10. Normal operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

1.11. Self-Adjoint operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

1.12. Unitary operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

1.13. Projections on Hilbert spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

1.14. Basic theory of representations in a general finite dimensional vector space . . . . . . . . . . . . . . . 31

1.14.1. Representation of operators in a given basis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

1.14.2. Change of coordinates of vectors under a change of basis . . . . . . . . . . . . . . . . . . . . . 34

1.14.3. Change of the matrix representative of linear transformations under a change of basis . . . . 34

1.15. Active and passive transformations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

1.16. Theory of representations on finite dimensional Hilbert spaces . . . . . . . . . . . . . . . . . . . . . . 36

1.16.1. Linear operators in finite dimensional Hilbert spaces . . . . . . . . . . . . . . . . . . . . . . . 38

1.17. Determinants and traces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

1.18. Rectangular matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

1.19. The eigenvalue problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

1.19.1. Matrix representative of the eigenvalue problem . . . . . . . . . . . . . . . . . . . . . . . . . . 42

1.19.2. Eigenvectors and the canonical problem of matrices . . . . . . . . . . . . . . . . . . . . . . . 43

1.20. Normal operators and the spectral theorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

1.20.1. A qualitative discussion of the spectral theorem in infinite dimensional Hilbert spaces . . . . 47

1.21. The concept of “hyperbasis” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

1.22. Definition of an observable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

1.23. Complete sets of commuting observables (C.S.C.O.) . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

1.24. Some terminology concerning quantum mechanics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

1.25. The Hilbert Space L2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

2

Page 3: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

INDICE GENERAL 3

1.25.1. The wave function space z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

1.26. Discrete orthonormal basis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

1.26.1. Funcion delta de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

1.27. Closure relations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

1.28. Introduction of hyperbases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

1.29. Closure relation with hyperbases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

1.30. Inner product and norm in terms of the components of a vector in a hyperbases . . . . . . . . . . . . 59

1.31. Some specific continuous bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

1.31.1. Plane waves . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

1.31.2. “Delta functions” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

1.32. Tensor products of vector spaces, definition and properties . . . . . . . . . . . . . . . . . . . . . . . . 61

1.32.1. Scalar products in tensor product spaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

1.32.2. Tensor product of operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

1.32.3. The eigenvalue problem in tensor product spaces . . . . . . . . . . . . . . . . . . . . . . . . . 63

1.32.4. Complete sets of commuting observables in tensor product spaces . . . . . . . . . . . . . . . . 65

1.33. Restrictions to an operator to a subspace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

1.34. Functions of operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

1.34.1. Some commutators involving functions of operators . . . . . . . . . . . . . . . . . . . . . . . . 67

1.35. Differentiation of operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

1.35.1. Some useful formulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

1.36. State space and Dirac notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

1.37. Dirac notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

1.37.1. Elements of the dual or conjugate space E ∗r . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

1.37.2. The correspondence between bras and kets with hyperbases . . . . . . . . . . . . . . . . . . . 71

1.38. The action of linear operators in Dirac notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

1.38.1. Projectors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

1.39. Hermitian conjugation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

1.39.1. The adjoint operator A† in Dirac notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

1.39.2. Mathematical objects and hermitian conjugation in Dirac notation . . . . . . . . . . . . . . . 76

1.40. Theory of representations of E in Dirac notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

1.40.1. Orthonormalization and closure relation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

1.40.2. Representation of operators in Dirac notation . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

1.41. Change of representations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

1.41.1. Transformation of the coordinates of a ket . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

1.41.2. Transformation of the coordinates of a bra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

1.41.3. Transformation of the matrix elements of an operator . . . . . . . . . . . . . . . . . . . . . . 83

1.42. Representation of the eigenvalue problem in Dirac notation . . . . . . . . . . . . . . . . . . . . . . . 84

1.42.1. C.S.C.O. in Dirac notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

1.43. The continuous bases |r〉 and |p〉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

1.43.1. Orthonormalization and closure relations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

1.43.2. Coordinates of kets and bras in |r〉 and |p〉 . . . . . . . . . . . . . . . . . . . . . . . . . . 85

1.43.3. Changing from the |r〉 representation to |p〉 representation and vice versa . . . . . . . . . 87

1.43.4. The R and P operators . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

1.43.5. The eigenvalue problem for R and P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

1.44. General properties of two conjugate observables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

1.44.1. The eigenvalue problem of Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

1.44.2. The action of Q,P and S (λ) in the |q〉 basis . . . . . . . . . . . . . . . . . . . . . . . . . . 92

1.44.3. Representation in the |p〉 basis and the symmetrical role of P and Q . . . . . . . . . . . . . 93

1.45. Diagonalization of a 2 × 2 hermitian matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

1.45.1. Formulation of the problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

1.45.2. Eigenvalues and eigenvectors of K . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

1.45.3. Eigenvalues and eigenvectors of H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

Page 4: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

4 INDICE GENERAL

2. Construccion fenomenologica de los postulados de la mecanica cuantica 98

2.1. La radiacion del cuerpo negro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

2.2. El efecto fotoelectrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

2.3. El efecto compton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

2.4. El problema espectroscopico y la teorıa de Bohr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

2.4.1. La teorıa de Wilson y Sommerfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

2.5. Los postulados de De Broglie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

2.6. Sıntesis de los resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

2.7. El experimento de Young de la doble rendija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

2.7.1. Interpretacion mecano-cuantica de la dualidad onda partıcula . . . . . . . . . . . . . . . . . . 102

2.7.2. Proceso de medicion, preparacion de un sistema y el principio de la descomposicion espectral 103

2.8. Dualidad onda partıcula para la materia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

2.9. Aspectos ondulatorios de una partıcula material . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

2.9.1. Estados cuanticos arbitrarios como superposicion de ondas planas . . . . . . . . . . . . . . . 109

2.9.2. Perfil instantaneo del paquete de onda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

2.9.3. El principio de incertidumbre de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

2.10. El principio de complementariedad para la dualidad onda partıcula y su relacion con el principio deincertidumbre de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

2.11. Evolucion temporal de paquetes de ondas libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

2.12. Caracterizacion de paquetes de onda gaussianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

2.12.1. Integrales basicas para paquetes gaussianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

2.12.2. Perfiles de paquetes de onda gaussianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

2.12.3. Relaciones de incertidumbre para paquetes gaussianos . . . . . . . . . . . . . . . . . . . . . . 120

2.13. Evolucion temporal de paquetes de onda gaussianos (opcional) . . . . . . . . . . . . . . . . . . . . . 121

2.13.1. Dispersion del paquete de onda gaussiano (opcional) . . . . . . . . . . . . . . . . . . . . . . . 121

3. Ecuacion de Schrodinger y sus propiedades 124

3.1. Plausibilidad de la ecuacion de Schrodinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

3.2. Ecuacion de Schrodinger para una partıcula sometida a un potencial escalar independiente del tiempo:estados estacionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

3.3. Propiedades generales de la ecuacion de Schrodinger . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

3.3.1. Determinismo en las soluciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

3.3.2. Principio de superposicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

3.3.3. Conservacion de la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

3.3.4. La ecuacion de continuidad para la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 131

3.3.5. Expresion polar de la corriente de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 132

3.4. Aplicacion de la ecuacion de Schrodinger a potenciales discontınuos . . . . . . . . . . . . . . . . . . . 133

3.5. Potenciales rectangulares, analogo optico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

3.5.1. Estrategia de solucion para potenciales acotados con discontinuidades de salto . . . . . . . . 134

3.5.2. Expresion para la corriente en regiones de potencial constante . . . . . . . . . . . . . . . . . . 136

3.6. El potencial escalon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

3.6.1. E > V0, reflexion parcial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

3.6.2. E < V0; reflexion total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

3.7. Barrera de potencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

3.7.1. E > V0, resonancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

3.7.2. Caso E < V0: Efecto tunel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

3.8. Pozo de potencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

3.8.1. Partıcula con energıa −V0 < E < 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

3.8.2. Partıcula con energıa E > 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

Page 5: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

INDICE GENERAL 5

4. Enunciado matematico de los postulados de la mecanica cuantica 158

4.1. Los fenomenos clasicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

4.2. Los fenomenos cuanticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160

4.3. Establecimiento de los postulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161

4.3.1. Descripcion de los estados y las cantidades fısicas . . . . . . . . . . . . . . . . . . . . . . . . . 161

4.3.2. El proceso de medicion y la distribucion de probabilidad . . . . . . . . . . . . . . . . . . . . . 161

4.3.3. Relevancia fısica de las fases en mecanica cuantica . . . . . . . . . . . . . . . . . . . . . . . . 164

4.3.4. El proceso de medida y la reduccion del paquete de onda . . . . . . . . . . . . . . . . . . . . 165

4.3.5. Evolucion fısica de los sistemas cuanticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166

4.3.6. Reglas de cuantizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166

5. Consecuencias de los postulados sobre los observables y sus medidas 169

5.1. Consideraciones estadısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

5.1.1. Valor medio de un observable para un sistema en un estado dado . . . . . . . . . . . . . . . . 170

5.1.2. Valor esperado para los observables X,P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172

5.1.3. Valor esperado para el commutador de dos observables . . . . . . . . . . . . . . . . . . . . . . 172

5.1.4. La desviacion media cuadratica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

5.2. Observables compatibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

5.3. Observables no compatibles e incertidumbres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

5.4. La desviacion media cuadratica y el principio de incertidumbre para observables arbitrarios (opcional)178

5.4.1. Paquetes de mınima incertidumbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

5.5. Preparacion de un estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

5.6. Propiedades adicionales de la ecuacion de Schrodinger . . . . . . . . . . . . . . . . . . . . . . . . . . 182

5.6.1. Aspectos adicionales sobre la conservacion de la probabilidad (opcional) . . . . . . . . . . . . 182

5.7. Evolucion del valor esperado de un observable y su relacion con la mecanica clasica . . . . . . . . . . 184

5.7.1. Evolucion temporal de los valores esperados de R, P: Teorema de Ehrenfest . . . . . . . . . 185

5.8. Soluciones de la ecuacion de Schrodinger para sistemas conservativos . . . . . . . . . . . . . . . . . 187

5.8.1. Estados estacionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

5.8.2. Constantes de movimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189

5.8.3. Frecuencias de Bohr de un sistema y reglas de seleccion . . . . . . . . . . . . . . . . . . . . . 190

5.8.4. Relacion de incertidumbre entre tiempo y energıa . . . . . . . . . . . . . . . . . . . . . . . . . 191

5.8.5. Cuarta relacion de incertidumbre para un paquete de onda unidimensional . . . . . . . . . . 193

5.9. Consecuencias fısicas del principio de superposicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193

5.9.1. Diferencia entre superposicion lineal y mezcla estadıstica . . . . . . . . . . . . . . . . . . . . . 194

5.9.2. Efectos de interferencia en fotones polarizados . . . . . . . . . . . . . . . . . . . . . . . . . . 195

5.9.3. Suma sobre los estados intermedios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196

5.10. El principio de superposicion para casos en que varios estados estan asociados a una medida . . . . . 198

5.10.1. El principio de superposicion para valores propios degenerados . . . . . . . . . . . . . . . . . 198

5.10.2. Aparatos insuficientemente selectivos en la medida . . . . . . . . . . . . . . . . . . . . . . . . 199

5.11. Discusion general sobre el fenomeno de interferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

5.12. Medicion insuficiente de espectros contınuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

5.13. Postulado de reduccion del paquete de onda (quinto postulado) para un espectro contınuo . . . . . . 203

6. Aplicacion de los postulados cuando se posee informacion parcial de un sistema 204

6.1. Aplicacion de los postulados cuando se mide un observable de un subsistema . . . . . . . . . . . . . 204

6.1.1. Interpretacion fısica de los estados que son productos tensoriales . . . . . . . . . . . . . . . . 205

6.1.2. Significado fısico de estados que no son productos tensoriales . . . . . . . . . . . . . . . . . . 206

6.2. Operador densidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

6.2.1. El concepto de mezcla estadıstica de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

6.2.2. Estados puros y operador densidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208

6.2.3. Mezcla estadıstica de estados: estados no puros . . . . . . . . . . . . . . . . . . . . . . . . . . 210

6.2.4. Propiedades generales del operador densidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 211

6.2.5. Populaciones y coherencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212

Page 6: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

6 INDICE GENERAL

6.3. Aplicaciones del operador densidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

6.3.1. Sistema en equilibrio termodinamico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

6.3.2. Descripcion de subsistemas con base en observables globales de un sistema: el concepto detraza parcial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

6.3.3. Traza parcial y operador densidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

7. Formulaciones alternativas de la mecanica cuantica 218

7.1. Operador evolucion temporal: definicion y propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . 218

7.1.1. Operador evolucion temporal para sistemas conservativos . . . . . . . . . . . . . . . . . . . . 220

7.1.2. Observaciones adicionales sobre el operador evolucion temporal (opcional) . . . . . . . . . . . 220

7.2. Bras, kets y observables equivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

7.2.1. La transformada de un operador y sus propiedades . . . . . . . . . . . . . . . . . . . . . . . . 222

7.3. La imagen de Schrodinger y la imagen de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . 222

7.3.1. Algunos sistemas simples en la imagen de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . 224

7.4. La imagen de interaccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224

8. El oscilador armonico cuantico 227

8.1. Propiedades generales del oscilador armonico cuantico unidimensional . . . . . . . . . . . . . . . . . 227

8.2. El problema de valores propios del Hamiltoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228

8.3. Determinacion del espectro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230

8.3.1. Interpretacion de los operadores a, a† y N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231

8.3.2. Estudio de la degeneracion del espectro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232

8.4. Estados propios del Hamiltoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233

8.4.1. Construccion de los kets propios con base en el ket del estado base . . . . . . . . . . . . . . . 233

8.4.2. Ortonormalidad de los kets propios (opcional) . . . . . . . . . . . . . . . . . . . . . . . . . . . 234

8.4.3. Accion de los operadores creacion y destruccion sobre los autoestados del Hamiltoniano . . . 236

8.5. Funciones propias asociadas a los estados estacionarios en la base |x〉 . . . . . . . . . . . . . . . . 237

8.6. Valores esperados y dispersion para los observables cuando el sistema esta en un estado estacionariodel oscilador armonico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238

8.7. Propiedades del estado base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241

8.8. Evolucion temporal de los observables del oscilador armonico . . . . . . . . . . . . . . . . . . . . . . 242

9. Estados coherentes cuasi-clasicos del oscilador armonico (opcional) 244

9.1. Parametrizacion del oscilador clasico con parametros cuanticos . . . . . . . . . . . . . . . . . . . . . 244

9.2. Construccion de los estados coherentes o cuasi-clasicos . . . . . . . . . . . . . . . . . . . . . . . . . . 245

9.3. Propiedades de los estados |α〉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247

9.3.1. Valores permitidos de la energıa para un estado coherente |α〉 . . . . . . . . . . . . . . . . . . 248

9.3.2. Calculo de los observables X,P en el estado |α〉 . . . . . . . . . . . . . . . . . . . . . . . . . . 250

9.4. Generador y funcion de onda de los estados coherentes . . . . . . . . . . . . . . . . . . . . . . . . . . 251

9.5. Los estados coherentes son completos pero no ortogonales . . . . . . . . . . . . . . . . . . . . . . . . 253

9.6. Evolucion temporal de los estados coherentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254

9.7. Tratamiento mecano-cuantico de un oscilador armonico macroscopico . . . . . . . . . . . . . . . . . . 256

10.Teorıa general del momento angular en mecanica cuantica 258

10.1. Definicion de momento angular por sus propiedades de conmutacion . . . . . . . . . . . . . . . . . . 258

10.1.1. Cuantizacion del momento angular orbital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258

10.1.2. Definicion de momento angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259

10.2. Propiedades algebraicas del momento angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260

10.2.1. Algebra de los operadores J2, J3, J+, J− . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260

10.3. Estructura de valores y vectores propios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261

10.3.1. Notacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261

10.3.2. Caracterısticas generales de los valores propios de J2 y J3 . . . . . . . . . . . . . . . . . . . . 262

10.3.3. Determinacion de los valores propios de J2 y J3 . . . . . . . . . . . . . . . . . . . . . . . . . . 264

Page 7: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

INDICE GENERAL 7

10.4. Propiedades de los vectores propios de J2 y J3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265

10.4.1. Generacion de autoestados por medio de los operadores J+ y J− . . . . . . . . . . . . . . . . 266

10.5. Construccion de una base estandar con base en un C.S.C.O . . . . . . . . . . . . . . . . . . . . . . . 267

10.5.1. Descomposicion de E en subespacios del tipo E (j, k) . . . . . . . . . . . . . . . . . . . . . . . 269

10.6. Representaciones matriciales de los operadores momento angular . . . . . . . . . . . . . . . . . . . . 270

10.6.1. Representaciones matriciales del tipo (Ji)(j) en la base estandar para j arbitrario . . . . . . . 271

10.6.2. Representaciones matriciales en la base estandar para j = 0 . . . . . . . . . . . . . . . . . . . 272

10.6.3. Representaciones matriciales en la base estandar para j = 1/2 . . . . . . . . . . . . . . . . . . 272

10.6.4. Representaciones matriciales en la base estandar para j = 1 . . . . . . . . . . . . . . . . . . . 273

11.Propiedades de los momentos angulares orbitales 275

11.1. Momentos angulares orbitales como operadores diferenciales en coordenadas esfericas . . . . . . . . . 278

11.2. Valores permitidos de l y m . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279

11.3. Propiedades fundamentales de los armonicos esfericos . . . . . . . . . . . . . . . . . . . . . . . . . . . 280

11.3.1. Ortonormalidad y completez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280

11.3.2. Propiedades de paridad y conjugacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281

11.4. Construccion de bases estandar de la funcion de onda espacial de una partıcula sin espın . . . . . . . 281

11.5. Valores esperados y desviaciones medias cuadraticas de observables cuando el sistema esta en unestado |l,m, k〉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

11.6. Probabilidades asociadas a la medida de L2 y L3 en un estado arbitrario . . . . . . . . . . . . . . . . 284

11.7. Ejemplos de calculos de probabilidad para L2 y L3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287

11.7.1. Funcion de onda parcialmente separable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287

11.7.2. Funcion de onda totalmente separable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288

11.7.3. Comportamiento de la probabilidad con θ y ϕ . . . . . . . . . . . . . . . . . . . . . . . . . . . 288

12.Interacciones centrales en mecanica cuantica 290

12.1. El problema de dos cuerpos y su reduccion al problema equivalente de una partıcula en MecanicaClasica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290

12.2. Reduccion del problema de dos cuerpos en mecanica cuantica . . . . . . . . . . . . . . . . . . . . . . 293

12.2.1. Autovalores y autofunciones del Hamiltoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . 293

12.3. El problema clasico de una partıcula sometida a una fuerza central . . . . . . . . . . . . . . . . . . . 295

12.4. Hamiltoniano cuantico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296

12.5. Solucion general del problema de valores propios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297

12.5.1. La ecuacion radial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297

12.5.2. Comportamiento de la solucion radial en el origen . . . . . . . . . . . . . . . . . . . . . . . . 298

12.6. Estados estacionarios de una partıcula en un potencial central . . . . . . . . . . . . . . . . . . . . . . 299

12.6.1. Degeneracion de los niveles de energıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300

13.Atomos hidrogenoides 302

13.1. El atomo de Hidrogeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302

13.2. Problema de valores propios del atomo de Hidrogeno . . . . . . . . . . . . . . . . . . . . . . . . . . . 303

13.3. Solucion de la ecuacion radial por series de potencias . . . . . . . . . . . . . . . . . . . . . . . . . . . 305

13.3.1. Serie de potencias radial y relaciones de recurrencia . . . . . . . . . . . . . . . . . . . . . . . 305

13.3.2. Condicion asintotica ρ→ ∞ y truncamiento de la serie . . . . . . . . . . . . . . . . . . . . . . 307

13.3.3. Coeficientes del polinomio radial en terminos de c0 . . . . . . . . . . . . . . . . . . . . . . . . 308

13.3.4. Calculo de c0 y de la funcion radial para l = 0, k = 1 . . . . . . . . . . . . . . . . . . . . . . 309

13.3.5. Calculo de c0 y de la funcion radial para l = 0, k = 2 . . . . . . . . . . . . . . . . . . . . . . 309

13.3.6. Calculo de c0 y de la funcion radial para l = k = 1 . . . . . . . . . . . . . . . . . . . . . . . . 310

13.4. Parametros atomicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311

13.5. Resumen de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312

13.6. Discusion de los resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313

13.6.1. Dependencia angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313

Page 8: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

8 INDICE GENERAL

14.Corrientes de probabilidad en atomos hidrogenoides, acoples con campos magneticos 316

14.1. Corrientes de probabilidad para las soluciones estacionarias del atomo de Hidrogeno . . . . . . . . . 316

14.1.1. Efecto sobre la corriente debido a la introduccion de un campo magnetico . . . . . . . . . . . 317

14.2. Atomo de hidrogeno en un campo magnetico uniforme: paramagnetismo, diamagnetismo y efectoZeeman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318

14.2.1. Hamiltoniano del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318

14.2.2. Estimacion numerica de las contribuciones H0, H1 y H2 . . . . . . . . . . . . . . . . . . . . . 320

14.2.3. Termino diamagnetico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321

14.2.4. Termino paramagnetico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322

14.3. Efecto Zeeman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322

14.3.1. Corrimiento de los niveles atomicos con la correccion paramagnetica . . . . . . . . . . . . . . 323

14.3.2. Oscilaciones dipolares electricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323

14.3.3. Frecuencia y polarizacion de la radiacion emitida . . . . . . . . . . . . . . . . . . . . . . . . . 325

15.Momento angular intrınseco 327

15.1. Comportamiento clasico de atomos paramagneticos inmersos en un campo magnetico . . . . . . . . . 327

15.2. Experimento de Stern-Gerlach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328

15.3. Resultados del experimento y el momento angular intrınseco . . . . . . . . . . . . . . . . . . . . . . . 329

15.4. Evidencia experimental del momento angular intrınseco del electron . . . . . . . . . . . . . . . . . . 331

15.4.1. Estructura fina de las lıneas espectrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331

15.4.2. Efecto Zeeman anomalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331

15.5. Introduccion del momento angular intrınseco en el formalismo de la mecanica cuantica no relativista 332

15.6. Propiedades de un momento angular 1/2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333

15.6.1. Resumen de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336

15.6.2. Representacion matricial de los observables de espın . . . . . . . . . . . . . . . . . . . . . . . 336

15.7. Descripcion no relativista completa de operadores y estados de partıculas con espın 1/2 . . . . . . . 337

15.7.1. Construccion de los estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337

15.7.2. Construccion de operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340

15.8. Representacion en la base |p, ε〉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343

15.9. Calculos de probabilidad para estados de espın 1/2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343

16.Adicion de momentos angulares 345

16.1. El problema clasico de la adicion del momento angular . . . . . . . . . . . . . . . . . . . . . . . . . . 345

16.2. Momento angular total en mecanica cuantica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345

16.3. La adicion de dos momentos angulares es otro momento angular . . . . . . . . . . . . . . . . . . . . 348

16.4. Adicion de dos momentos angulares con j(1) = j(2) = 1/2 . . . . . . . . . . . . . . . . . . . . . . . . . 350

16.4.1. Autovalores de J3 y su degeneracion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350

16.4.2. Diagonalizacion de J2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351

16.4.3. Autoestados de J2 y J3: singlete y triplete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352

16.5. Metodo general de adicion de dos momentos angulares arbitrarios . . . . . . . . . . . . . . . . . . . . 353

16.5.1. Formacion del sistema a partir de dos subsistemas . . . . . . . . . . . . . . . . . . . . . . . . 353

16.5.2. Momento angular total y sus relaciones de conmutacion . . . . . . . . . . . . . . . . . . . . . 354

16.5.3. Cambio de base a realizar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355

16.5.4. Autovalores de J2 y J3 : Caso de dos espines j1 = j2 = 1/2. . . . . . . . . . . . . . . . . . . . 356

16.5.5. Autovalores de J3 y su degeneracion: Caso general . . . . . . . . . . . . . . . . . . . . . . . . 357

16.5.6. Autovalores de J2 : caso general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358

16.6. Autovectores comunes de J2 y J3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360

16.6.1. Caso especial j1 = j2 = 1/2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361

16.7. Autovectores de J2 y J3 : Caso general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362

16.7.1. Determinacion de los vectores |JM〉 del subespacio E (j1 + j2) . . . . . . . . . . . . . . . . . . 362

16.7.2. Determinacion de los vectores |JM〉 en los otros subespacios . . . . . . . . . . . . . . . . . . 363

16.8. Transformacion de la base desacoplada a la base acoplada y coeficientes de Clebsch-Gordan . . . . . 364

Page 9: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

INDICE GENERAL 9

17.Propiedades generales de los sistemas de dos estados 36717.1. Formulacion del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36717.2. Consecuencias de la introduccion del acople sobre los niveles de energıa y los estados estacionarios . 368

17.2.1. Efecto del acople sobre los estados estacionarios del sistema . . . . . . . . . . . . . . . . . . . 36817.2.2. Efecto de un acople debil sobre los niveles de energıa y estados estacionarios . . . . . . . . . 37017.2.3. Efecto de un acople fuerte sobre los niveles de energıa y estados estacionarios . . . . . . . . . 370

17.3. Evolucion temporal del vector de estado: oscilacion del sistema entre dos estados sin perturbar . . . 371

Page 10: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 1

Linear or vector spaces

We shall describe the most important properties of linear or vector spaces. This treatment is not rigorous at all,and only some simple proofs are shown. Our aim limits to provide a framework for our subsequent developments.

1.1. Definition of a linear vector space

Any non-empty set of objects V = xi form a linear space (or a vector space) if there is a “sum” operationdefined between the elements, and a “multiplication” by scalars (i.e. the system of real or complex numbers) suchthat

1. If xi ∈ V , and α is a scalar, then αxi ∈ V

2. If xi,xj ∈ V , then xi + xj ∈ V

3. xi + xj = xj + xi, ∀xi,xj ∈ V

4. xi + (xj + xk) = (xi + xj) + xk, ∀xi,xj,xk ∈ V

5. (α+ β)xi = αxi + βxi ; ∀xi ∈ V

6. α (xi + xj) = αxi + αxj , ∀xi,xj ∈ V

7. (αβ)xi = α (βxi) ; ∀xi ∈ V

8. 1xi = xi ; ∀xi ∈ V

9. ∃ an element 0 ∈ V such that xi + 0 = xi, ∀xi ∈ V

10. ∀xi ∈ V , ∃ an element in V denoted by −xi such that xi + (−xi) = 0

The element 0 is usually called the null vector or the origin. The element −x is called the additive inverse ofx. We should distinguish the symbols 0 (scalar) and 0 (vector). The two operations defined here (sum and productby scalars) are called linear operations. A linear space is real (complex) if we consider the scalars as the set of real(complex) numbers.

Let us see some simple examples

Example 1.1 The set of all real (complex) numbers with ordinary addition and multiplication taken as the linearoperations. This is a real (complex) linear space.

Example 1.2 The set Rn (Cn) of all n-tuples of real (complex) numbers is a real (complex) linear space under thefollowing linear operations

x ≡ (x1, x2, . . . , xn) ; y ≡ (y1, y2, . . . , yn)

αx ≡ (αx1, αx2, , αxn) ; x + y ≡ (x1 + y1, x2 + y2, . . . , xn + yn)

10

Page 11: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.2. ALGEBRAIC PROPERTIES 11

Example 1.3 The set of all bounded continuous real functions defined on a given interval [a, b] of the real line,with the linear operations defined pointwise as

(f + g) (x) = f (x) + g (x) ; (αf) (x) = αf (x) ; x ∈ [a, b]

We can see that a linear or vector space forms an abelian group whose elements are the vectors, and withaddition as the law of combination. However, the vector space introduce an additional structure by consideringmultiplication by scalars which is not a group property.

Some very important kinds of vector spaces are the ones containing certain sets of functions with some specificproperties. We can consider for example, the set of functions defined on certain interval with some condition ofcontinuity integrability etc. For instance, in quantum mechanics we use a vector space of functions.

1.2. Algebraic properties

Some algebraic properties arise from the axioms:The origin or identity 0 must be unique. Assuming another identity 0′ we have that x + 0′ = 0′ + x = x for all

x ∈ V. Then 0′ = 0′ + 0 = 0. Hence 0′ = 0.The additive inverse of any vector x is unique. Assume that x′ is another inverse of x then

x′ = x′ + 0 = x′ + (x+(−x)) =(x′ + x

)+(−x) = 0 + (−x) = −x

⇒ x′ = −x

xi + xk = xj + xk ⇒ xi = xj to see it, we simply add −xk on both sides. This property is usually called therearrangement lemma.

α · 0 = 0 we see it from α · 0 + αx = α · (0 + x) = αx = 0 + αx and applying the rearrangement lemma.0 · x = 0 it proceeds from 0 · x + αx = (0 + α)x = αx = 0 + αx and using the rearrangement lemma.(−1)x = −x we see it from x+(−1)x = 1·x+(−1)x = (1 + (−1))x = 0x = 0 = x+ (−x) and the rearrangement

lemma.αx = 0 then α = 0 or x = 0; for if α 6= 0 we can multiply both sides of the equation by α−1 to give α−1 (αx) =

α−10 ⇒(α−1α

)x = 0 ⇒ 1x = 0 ⇒ x = 0. If x 6= 0 we prove that α = 0 by assuming α 6= 0 and finding a

contradiction. This is inmediate from the above procedure that shows that starting with α 6= 0 we arrive to x = 0.It is customary to simplify the notation in x + (−y) and write it as x− y. The operation is called substraction.

1.3. Vector subspaces

Definition 1.1 A non-empty subset M of V is a vector subspace of V if M is a vector space on its own right withrespect to the linear operations defined in V .

This is equivalent to the condition that M contains all sums, negatives and scalar multiples. The other propertiesare derived directly from the superset V . Further, since −x = (−1)x it reduces to say that M must be closed underaddition and scalar multiplication.

When M is a proper subset of V it is called a proper subspace of V . The zero space 0 and the full space Vitself are trivial subspaces of V .

The following concept is useful to study the structure of vector subspaces of a given vector space,

Definition 1.2 Let S = x1, ..,xn be a non-empty finite subset of V , then the vector

x = α1x1 + α2x2 + . . . + αnxn (1.1)

is called a linear combination of the vectors in S.

We can redefine a vector subspace by saying that a non-empty subset M of V is a linear subspace if it is closedunder the formation of linear combinations. If S is a subset of V we can see that the set of all linear combinationsof vectors in S is a vector subspace of V , we denote this subspace as [S] and call it the vector subspace spanned by

Page 12: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

12 CAPITULO 1. LINEAR OR VECTOR SPACES

S. It is clear that [S] is the smallest subspace of V that contains S. Similarly, for a given subspace M a non-emptysubset S of M is said to span M if [S] = M . Note that the closure of a vector space under an arbitrary linearcombination can be proved by induction from the closure property of vector spaces under linear operations. Noticeadditionally, that the proof of induction only guarantees the closure under any finite sum of terms, if we have aninfinite sum of terms (e.g. a series) we cannot ensure that the result is an element of the space, this is the reasonto define linear combinations as finite sums. If we want a property of closure under some infinite sums additionalstructure should be added as we shall see later.

Suppose now that M and N are subspaces of V . Consider the set M + N of all sums of the form x + y withx ∈M and y ∈ N . Since M and N are subspaces, this sum is the subspace spanned by the union of both subspacesM +N = [M ∪N ]. It could happen that M +N = V in this case we say that V is the sum of M and N . In turnit means that every vector in V is expressible as a sum of a vector in M plus a vector in N . Further, in some casesany element z of V is expressible in a unique way as such a sum, in this case we say that V is the direct sum ofM and N and it is denoted by

V = M ⊕N

we shall establish the conditions for a sum to become a direct sum

Theorem 1.1 Let a vector space V be the sum of two of its subspaces V = M+N . Then V = M⊕N ⇔M∩N = 0

Proof: Assume first that V = M⊕N , we shall suppose that ∃ z 6= 0 with z ∈M∩N , and deduce a contradictionfrom it. We can express z in two different ways z = z + 0 with z ∈ M and 0 ∈ N or z = 0 + z with 0 ∈ M andz ∈ N . This contradicts the definition of a direct sum.

Now assume M ∩N = 0, by hypothesis V = M +N so that any z ∈ V can be expressed by z = x1 + y1 withx1 ∈ M and y1 ∈ N . Suppose that there is another decomposition z = x2 + y2 with x2 ∈ M and y2 ∈ N . Hencex1 + y1 = x2 + y2 ⇒ x1 − x2 = y1 − y2; but x1 − x2 ∈M and y1 − y2 ∈ N . Since they are equal, then both belongto the intersection so x1 − x2 = y1 − y2 = 0 then x1 = x2 and y1 = y2 showing that the decomposition must beunique. QED.

When two vector subspaces of a given space have only the zero vector in common, it is customary to call themdisjoint subspaces. It is understood that it does not correspond to disjointness in the set-theoretical sense, after alltwo subspaces of a given space cannot be disjoint as sets, since any subspace must contain 0. Thus no confusionarises from this practice.

The concept of direct sum can be generalized when more subspaces are involved. We say that V is the directsum of a collection of subspaces M1, ..,Mn and denote it as

V = M1 ⊕M2 ⊕ . . .⊕Mn

when each z ∈ V can be expressed uniquely in the form

z = x1 + x2 + . . . + xn ; xi ∈Mi

In this case if V = M1 + ..+Mn, this sum becomes a direct sum if and only if each Mi is disjoint from the subspacespanned by the others. To see it, it is enough to realize that

V = M1 +M2 + ..+Mn = M1 + [M2 + ..+Mn] = M1 + [∪ni=2Mi]

then V = M1 ⊕ [M2 + ..+Mn] if and only if M1 ∩ [∪ni=2Mi] = 0, proceeding similarly for the other M ′is we arrive

at the condition above. Note that this condition is stronger than the condition that any given M i is disjoint fromeach of the others.

The previous facts can be illustrated by a simple example. The most general non-zero proper subspaces of R3

are lines or planes that passes through the origin. Thus let us define

M1 = (x1, 0, 0) , M2 = (0, x2, 0) , M3 = (0, 0, x3)M4 = (0, x2, x3) , M5 = (x1, 0, x3) , M6 = (x1, x2, 0)

M1,M2,M3 are the coordinate axes of R3 and M4,M5,M6 are its coordinate planes. R3 can be expressed by directsums of these spaces in several ways

R3 = M1 ⊕M2 ⊕M3 = M1 ⊕M4 = M2 ⊕M5 = M3 ⊕M6

Page 13: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.4. DIMENSION AND BASES IN VECTOR SPACES 13

for the case of R3 = M1⊕M2⊕M3 we see that the subspace spanned by M2 and M3 i.e. M2+M3 = [M2 ∪M3] = M4

is disjoint from M1. Similarly M2 ∩ [M1 ∪M3] = 0 = M3 ∩ [M1 ∪M2]. It is because of this, that we have a directsum.

Now let us take M3, M6 and M ′ defined as a line on the plane M4 that passes through the origin making anangle θ with the axis x3 such that 0 < θ < π/2, since R3 = M3 +M6 it is clear that

R3 = M3 +M6 +M ′ ; M3 ∩M6 = M3 ∩M ′ = M6 ∩M ′ = 0 (1.2)

however this is not a direct sum because M3 + M6 = R3 so that M ′ ∩ (M3 +M6) 6= 0. Despite each subspaceis disjoint from each other, there is at least one subspace that is not disjoint from the subspace spanned by theothers. Let us show that there are many decompositions for a given vector z ∈ R3 when we use the sum in (1.2).Since R3 = M3 +M6 a possible decomposition is z = x + y + 0 with x ∈M3, y ∈M6, 0 ∈M ′. Now let us take anarbitrary non-zero element w of M ′; clearly M3 +M6 = R3 contains M ′ so that w = x′ +y′with x′ ∈M3, y′ ∈M6.Now we write z = x +y = (x− x′) + (y − y′) + x′ + y′ then z = (x− x′) + (y − y′) + w. We see that (x − x′) is inM3 and (y − y′) is in M6. Now, since w ∈ M ′ and w 6= 0 this is clearly a different decomposition with respect tothe original one. An infinite number of different decompositions are possible since w is arbitrary.

Finally, it can be proved that for any given subspace M in V it is always possible to find another subspace N inV such that V = M ⊕N . Nevertheless, for a given M the subspace N is not neccesarily unique. A simple exampleis the following, in R2 any line crossing the origin is a subspace M and we can define N as any line crossing theorigin as long as it is not collinear with M ; for any N accomplishing this condition we have V = M ⊕N .

1.4. Dimension and bases in vector spaces

Definition 1.3 Let V be a vector space and S = x1, ..,xn a finite non-empty subset of V . S is defined as linearlydependent if there is a set of scalars α1, .., αn not all of them zero such that

α1x1 + α2x2 + ..+ αnxn = 0 (1.3)

if S is not linearly dependent we say that it is linearly independent, this means that in Eq. (1.3) all coefficients α imust be zero. Thus linear independence of S means that the only solution for Eq. (1.3) is the trivial one. Whennon-trivial solutions exists the set is linearly dependent.

¿What is the utility of the concept of linear independence of a given set S? to see it, let us examine a givenvector x in [S], each of these vectors arise from linear combinations of vectors in S

x = α1x1 + α2x2 + ..+ αnxn ; xi ∈ S (1.4)

we shall see that for the ordered set S = x1, ..,xn the corresponding ordered set α1, .., αn associated with x byEq. (1.4) is unique. Suppose there is another decomposition of x as a linear combination of elements of S

x = β1x1 + β2x2 + ..+ βnxn ; xi ∈ S (1.5)

substracting (1.4) and (1.5) we have

0 = (α1 − β1)x1 + (α2 − β2)x2 + ..+ (αn − βn)xn

but linear independence require that only the trivial solution exists, thus αi = βi and the ordered set of coefficientsis unique. This is very important for the theory of representations of vector spaces. The discussion above permitsto define linearly independence for an arbitrary (not necessarily finite) non-empty set S

Definition 1.4 An arbitrary non-empty subset S ⊆ V is linearly independent if every finite non-empty subset of Sis linearly independent in the sense previously established.

As before, an arbitrary non-empty set S is linearly independent if and only if any vector x ∈ [S] can be writtenin a unique way as a linear combination of vectors in S.

The most important linearly independent sets are those that span the whole space i.e. [S] = V this linearlyindependent sets are called bases. It can be checked that S is a basis if and only if it is a maximal linearlyindependent set, in the sense that any proper superset of S must be linearly dependent. We shall establish withoutproof a very important theorem concerning bases of vector spaces

Page 14: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

14 CAPITULO 1. LINEAR OR VECTOR SPACES

Theorem 1.2 If S is a linearly independent set of vectors in a vector space V , there exists a basis B in V suchthat S ⊆ B.

In words, given a linearly independent set, it is always possible to add some elements to S for it to become abasis. A linearly independent set is non-empty by definition and cannot contain the null vector. Hence, we see thatif V = 0 it does not contain any basis, but if V 6= 0 and we can take a non-zero element x of V , the set x islinearly independent and the previous theorem guarantees that V has a basis that contains x, it means that

Theorem 1.3 Every non-zero vector space has a basis

Now, since any set consisting of a single non-zero vector can be enlarged to become a basis it is clear that anynon-zero vector space contains an infinite number of bases. It worths looking for general features shared by all basesof a given linear space. Tne first theorem in such a direction is the following

Theorem 1.4 Let S = x1, x2, .., xn be a finite, odered, non-empty subset of the linear space V . If n = 1 then S islinearly dependent⇔ x1 = 0. If n > 1 and x1 6= 0 then S is linearly dependent if and only if some one of the vectorsx2, ..., xn is a linear combination of the vectors in the ordered set S that precede it.

Proof: The first assertion is trivial. Then we settle n > 1 and x1 6= 0. Assuming that one of the vectors xi inthe set x2, ..., xn is a linear combination of the preceding ones we have

xi = α1x1 + ...+ αi−1xi−1 ⇒ α1x1 + ...+ αi−1xi−1 − 1 · xi = 0

since the coefficient of xi is 1, this is a non-trivial linear combination of elements of S that equals zero. Thus S islinearly dependent. We now assume that S is linearly dependent hence the equation

α1x1 + ...+ αnxn = 0

has a solution with at least one non-zero coefficcient. Let us define αi as the last non zero coefficient, since x1 6= 0then i > 1 then we have

α1x1 + ...+ αixi + 0 · xi+1 + ...+ 0 · xn = 0 ⇒ xi =

(−α1

αi

)x1 + ...+

(−αi−1

αi

)xi−1

and xi is written as a linear combination of the vectors that precede it in the ordered set S. QED

The next theorem provides an important structural feature of the set of bases in certain linear spaces

Theorem 1.5 If a given non-zero linear space V has a finite basis B1 = e1, ..., en with n elements, then anyother basis B2 = fi of V must be finite and also with n elements.

The following theorem (that we give without proof) gives a complete structure to this part of the theory ofvector spaces

Theorem 1.6 Let V be a non-zero vector space. If B1 = ei and B2 = uj are two bases of the vector space,then B1 and B2 are sets with the same cardinality.

These theorem is valid even for sets with infinite cardinality. This result says that the cardinality of a basis isa universal attribute of the vector space since it does not depend on the particular basis used. Hence the followingare natural definitions

Definition 1.5 The dimension of a non-zero vector space is the cadinality of any of its basis. If V = 0 thedimension is defined to be zero.

Definition 1.6 A vector space is finite-dimensional if its dimension is a non negative integer. Otherwise, it isinfinite-dimensional.

Page 15: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.5. MAPPINGS AND TRANSFORMATIONS IN VECTOR SPACES 15

As any abstract algebraic system, vector spaces requires a theory of representations in which the most abstractset is replaced by another set with more tangible objects. However, for the representation to preserve the abstractproperties of the vector space, set equivalence and linear operations must be preserved. This induces the followingdefinition

Definition 1.7 Let V and V ′ two vector spaces with the same system of scalars. An isomorphism of V onto V ′ isa one-to-one mapping f of V onto V ′ such that f (x + y) = f (x) + f (y) and f (αx) = αf (x)

Definition 1.8 Two vector spaces with the same system of scalars are called isomorphic if there exists an isomor-phism of one onto the other.

To say that two vector spaces are isomorphic means that they are abstractly identical with respect to theirstructure as vector spaces.

Now let V be a non zero finite dimensional space. If n is its dimension, there exists a basis B = e1, .., en whoseelements are written in a definite order. Each vector x in V can be written uniquely in the form

x = α1e1 + ..+ αnen

so the n−tuple (α1, .., αn) is uniquely determined by x. If we define a mapping f by f (x) = (α1, .., αn) we see thatthis is an isomorphism of V onto Rn or Cn depending on the system of scalars defined for V .

Theorem 1.7 Any real (complex) non-zero finite dimensional vector space of dimension n is isomorphic to Rn

(Cn).

Indeed, this theorem can be extended to vector spaces of arbitrary dimensions, we shall not discuss this topichere. By now, it suffices to realize that the isomorphism establishes here is not unique for it depends on the basischosen and even on the order of vectors in a given basis. It can be shown also that two vector spaces V and V ′ areisomorphic if and only if they have the same scalars and the same dimension.

From the results above, we could then be tempted to say that the abstract concept of vector space is nouseful anymore. However, this is not true because on one hand the isomorphism depends on the basis chosen andmost results are desirable to be written in a basis independent way. But even more important, almost all vectorspaces studied in Mathematics and Physics posses some additional structure (topological or algebraic) that are notneccesarily preserve by the previous isomorphisms.

1.5. Mappings and transformations in vector spaces

For two vector spaces V and V ′ with the same system of scalars we can define a mapping T of V into V ′ thatpreserves linear properties

T (x + y) = T (x) + T (y) ; T (αx) = αT (x)

T is called a linear transformation. We can say that linear transformations are isomorphisms of V into V ′ sincelinear operations are preserved. T also preserves the origin and negatives

T (0) = T (0 · 0) = 0 · T (0) = 0 ; T (−x) = T ((−1)x) = (−1) T (x) = −T (x)

we shall see later that the states of our physical systems are vectors of a given vector space. Hence, the transforma-tions of these vectors are also important in Physics because they will represent transformations in the states of oursystem. We shall see later that the set of all linear transformations are in turn vector spaces with their own internalorganization.

Let us now define some basic operations with linear transformations, a natural definition of the sum of two lineartransformations is of the form

(T + U) (x) ≡ T (x) + U (x) (1.6)

and a natural definition of multiplication by scalars is

(αT ) (x) ≡ αT (x) (1.7)

Page 16: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

16 CAPITULO 1. LINEAR OR VECTOR SPACES

finally the zero and negative linear transformations are defined as

0 (x) ≡ 0 ; (−T ) (x) ≡ −T (x) (1.8)

with these definitions it is inmediate to establish the following

Theorem 1.8 Let V and V ′ be two vector spaces with the same system of scalars. The set of all linear transfor-mations of V into V ′ with the linear operations defined by Eqs. (1.6, 1.7, 1.8) is itself a vector space.

The most interesting cases are the linear transformations of V into itself and the linear transformations of Vinto the space of scalars (real or complex). We shall study now the first case.

1.6. Linear transformations of a vector space into itself

In this case we usually speak of linear transformations on V . The first inmediate consequence is the capabilityof defining the composition of operators (or product of operators)

(TU) (x) ≡ T (U (x)) (1.9)

associativity and distributivity properties can easily be derived

T (UV ) = (TU)V ; T (U + V ) = TU + TV

(T + U) V = TV + UV ; α (TU) = (αT )U = T (αU)

we prove for instance

[(T + U)V ] (x) = (T + U) (V (x)) = T (V (x)) + U (V (x))

= (TV ) (x) + (UV ) (x) = (TV + UV ) (x)

commutativity does not hold in general. It is also possible for the product of two non-zero linear transformation tobe zero. An example of non commutativity is the following: we define on the space P of polynomials p (x) the linearoperators M and D

M (p) ≡ xp ; D (p) =dp

dx⇒ (MD) (p) = M (D (p)) = xD (p) = x

dp

dx

(DM) (p) = D (M (p)) = D (xp) = xdp

dx+ p

and MD 6= DM. Suppose now the linear transformations on R2 given by

Ta ((x1, x2)) = (x1, 0) ; Tb ((x1, x2)) = (0, x2) ⇒ TaTb = TbTa = 0

thus Ta 6= 0 and Tb 6= 0 but TaTb = TbTa = 0.Another natural definition is the identity operator I

I (x) ≡ x

we see that I 6= 0 ⇔ V 6= 0. FurtherIT = TI = T

for every linear operator T on V . For any scalar α the operator αI is called scalar multiplication since

(αI) (x) = αI (x) = αx

it is well known that for a mapping from V to V ′ to admit an inverse from V ′ to V requires to be one-to-one andonto. In this context this induces the definition

Definition 1.9 A linear transformation T on V is non-singular if it is one-to-one and onto, and singular otherwise.

Page 17: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.6. LINEAR TRANSFORMATIONS OF A VECTOR SPACE INTO ITSELF 17

When T is non-singular its inverse can be defined so that

TT−1 = T−1T = I

it can be shown that when T is non-singular T−1 is also a linear transformation.For future purposes the following theorem is highly relevant

Theorem 1.9 If T is a linear transformation on V , then T is non-singular⇔ T (B) is a basis for V whenever Bis.

1.6.1. Projection operators

We shall discuss some very important types of linear transformations. Let V be the direct sum of two subspacesV = M ⊕N it means that any vector z in V can be written in a unique way as z = x + y with x ∈M and y ∈ N .Since x is uniquely determined by z this decomposition induces a natural mapping of V onto M in the form

P (z) = x

it is easy to show that this transformation is linear and is called the projection on M along N . The most importantproperty of these transformations is that they are idempotent i.e. P 2 = P we can see it taking into account thatthe unique decomposition of x is x = x + 0 so that

P 2 (z) = P (P (z)) = P (x) = x = P (z)

The opposite is also true i.e. a given linear idempotent linear transformation induces a decomposition of the spaceV in a direct sum of two subspaces

Theorem 1.10 If P is a linear transformation on a vector space V , P is idempotent⇔there exists subspaces Mand N in V such that V = M ⊕N and P is the projection on M along N .

Proof : We already showed that decomposition in a direct sum induces a projection, to prove the opposite letdefine M and N in the form

M ≡ P (z) : z ∈ V ; N = z : P (z) = 0M and N are subspaces and correspond to the range and the null space of the transformation P respectively. Weshow first that M +N = V , this follows from the identity

z = P (z) + (I − P ) (z) (1.10)

P (z) belongs to M by definition, now

P ((I − P ) (z)) = (P (I − P )) (z) =(P − P 2

)(z) = (P − P ) (z) = 0 (z) = 0

thus (I − P ) (z) belongs to the null space N so M +N = V . To prove that this is a direct sum we must show thatM and N are disjoint (theorem 1.1). For this, assume that we have a given element P (z) in M that is also in Nthen

P (P (z)) = 0 ⇒ P 2 (z) = P (z) = 0

thus the common element P (z) must be the zero element. Hence, M and N are disjoint and V = M ⊕N . Further,from (1.10) P is the projection on M along N .

Of course in z = x + y with x ∈ M , y ∈ N we can define a projection P ′ (z) = y on N along M . In this caseV = M ⊕N = N ⊕M but now M is the null space and N is the range. It is easy to see that P ′ = I − P .

On the other hand, we have seen that for a given subspace M in V we can always find another subspace N suchthat V = M ⊕ N so for a given M we can find a projector with range M and null space N . However, N is notunique so that different projections can be defined on M .

Finally, it is easy to see that the range of a projector P corresponds to the set of points fixed under P i.e.M = P (z) : z ∈ V = z : P (z) = z.

Page 18: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

18 CAPITULO 1. LINEAR OR VECTOR SPACES

1.7. Normed vector spaces

Inspired in the vectors of Rn in which we define their lengths in a natural way, we can define lengths of vectorsin abstract vector spaces by assuming an additional structure

Definition 1.10 A normed vector space N is a vector space in which to each vector x there corresponds a realnumber denoted by ‖x‖ with the following properties: (1) ‖x‖ ≥ 0 and ‖x‖ = 0 ⇔ x = 0.(2) ‖x + y‖ ≤ ‖x‖ + ‖y‖(3) ‖αx‖ = |α| ‖x‖

As well as allowing to define a length for vectors, the norm permits to define a distance between two vectors xand y in the following way

d (x,y) ≡ ‖x− y‖it is easy to verify that this definition accomplishes the properties of a metric

d (x,y) ≥ 0 and d (x,y) = 0 ⇔ x = y

d (x,y) = d (y,x) ; d (x, z) ≤ d (x,y) + d (y, z)

in turn, the introduction of a metric permits to define two crucial concepts: (a) convergence of sequences, (b)continuity of functions of N into itself (or into any metric space).

We shall examine both concepts briefly

1.7.1. Convergent sequences, cauchy sequences and completeness

If X is a metric space with metric d a given sequence in X

xn = x1, .., xn, ...

is convergent if there exists a point x in X such that for each ε > 0, there exists a positive integer n0 such thatd (xn, x) < ε for all n ≥ n0. x is called the limit of the sequence. A very important fact in metric spaces is that anyconvergent sequence has a unique limit.

Further, assume that x is the limit of a convergent sequence, it is clear that for each ε > 0 there exists n0 suchthat m,n ≥ n0 ⇒ d (x, xm) < ε/2 and d (x, xn) < ε/2 using the properties of the metric we have

m,n ≥ n0 ⇒ d (xm, xn) ≤ d (xm, x) + d (x, xn) <ε

2+ε

2= ε

a sequence with this property is called a cauchy sequence. Thus, any convergent sequence is a cauchy sequence.The opposite is not necessarily true. As an example let X be the interval (0, 1] the sequence xn = 1/n is a cauchysequence but is not convergent since the point 0 (which it wants to converge to) is not in X. Then, convergencedepends not only on the sequence itself, but also on the space in which it lies. Some authors call cauchy sequences“intrinsically convergent” sequences.

A complete metric space is a metric space in which any cauchy sequence is convergent. The space (0, 1] is notcomplete but it can be made complete by adding the point 0 to form [0, 1]. In fact, any non complete metric spacecan be completed by adjoining some appropiate points. It is a fundamental fact that the real line, the complex planeand Rn, Cn are complete metric spaces.

We define an open sphere of radius r centered at x0 as the set of points such that

Sr (x0) = x ∈ X : d (x, x0) < r

and an open set is a subset A of the metric space such that for any x ∈ A there exists an open sphere Sr (x) suchthat Sr (x) ⊆ A.

For a given subset A of X a point x in X is a limit point of A if each open sphere centered on x contains atleast one point of A different from x.

A subset A is a closed set if it contains all its limit points. There is an important theorem concerning closedmetric subspaces of a complete metric space

Theorem 1.11 Let X be a complete metric space and Y a metric subspace of X. Then Y is complete⇔it is closed.

Page 19: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.7. NORMED VECTOR SPACES 19

1.7.2. The importance of completeness in quantum mechanics

In quantum mechanics we work in an infinite dimensional vector space of functions in which we shall frequentlyencounter series of the form

∞∑

n=1

cnψn

with ψn being functions in our space that describe physical states and cn are some appropiate coefficients. For thisseries to have any physical sense, it must be convergent. To analyze convergence we should construct the sequenceof partial sums

1∑

n=1

cnψn,

2∑

n=1

cnψn,

3∑

n=1

cnψn, ...

if this series is “intrisically” convergent the corresponding sequence of partial sums should be a cauchy sequence.Any series that defines a cauchy sequence has a bounded norm

∥∥∥∥∥

∞∑

n=1

cnψn

∥∥∥∥∥ <∞

it would then be desirable that an intrinsically convergent series given by a superposition of physical states ψn beanother physical state ψ. In other words, the limit of the partial sums should be within the vector space that describeour physical states. To ensure this property we should demand completeness of the vector space that describe thephysical states of the system.

On the other hand, it would be usual to work with subspaces of the general physical space. If we want toguarantee for a series in a given subspace to be also convergent, we should require for the subspace to be completeby itself, and according to theorem 1.11 it is equivalent to require the subspace to be closed with respect to thetotal space. Therefore, closed subspaces of the general space of states would be particularly important in quantummechanics.

1.7.3. The concept of continuity and its importance in Physics

The concept of continuity arises naturally for mappings of a metric space into another metric space. Let f be amapping of (X, d1) into (Y, d2) we say that f is continuous at x0 ∈ X if for each ε > 0 there exists δ > 0 such thatd1 (x, x0) < δ ⇒ d2 (f (x) , f (x0)) < ε. This mapping is said to be continuous if it is continuous for each point in itsdomain.

Continuity is also an essential property in Physics since for most of physical observables or states we requiresome kind of “smoothness” or “well behavior”. Continuity is perhaps the weakest condition of well behavior usuallyrequired in Physics.

We have previously defined isomorphisms as mappings that preserve all structure concerning a general vectorspace. It is then natural to characterize mappings that preserve the structure of a set as a metric space

Definition 1.11 If X,Y are two metric spaces with metrics d1 and d2 a mapping f of X into Y is an isometry ifd1 (x,x′) = d2 (f (x) , f (x′)) ∀x,x′ ∈ X. If there exists an isometry of X onto Y , we say that X is isometric to Y .

It is clear that an isometry is necessarily one-to-one. If X is isometric to Y then the points of these spaces canbe put in a one to one correspondence in such a way that the distance between pairs of corresponding points are thesame. In that sense, isometric spaces are abstractly identical as metric spaces. For instance, if we endow a vectorspace V with a metric then another metric vector space V ′ will be identical to V as metric and vector space if andonly if there is an isometric isomorphism between them. Isometry preserves metric (distances) while isomorphismpreserve vector structure (linear operations). Of course a norm-preserving mapping is an isometry for the metricinduced by such a norm. Thus for our purposes norm preserving mappings will be isometries.

Page 20: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

20 CAPITULO 1. LINEAR OR VECTOR SPACES

1.8. Banach Spaces

From our experience in classical mechanics we have seen that the concept of a vector space is useful especiallywhen we associate a length to the vectors, this induces the concept of normed vector spaces, the norm in turn inducesa metric i.e. a natural concept of the distance between vectors. Metric structure in turn lead us to the conceptsof convergent sequences and continuity of functions. In particular, the previous discussion concerning completenessincline us in favor of spaces that are complete. Then we are directly led to normed and complete linear spaces

Definition 1.12 A banach space is a normed and complete vector space

As in any vector space, linear transformations are crucial in the characterization of Banach spaces. Since a notionof continuity is present in these spaces and continuity is associated with well behavior in Physics, it is natural toconcentrate our attention in continuous linear transformations of a banach space B into itself or into the set ofscalars. Transformations of B into itself will be useful when we want to study posible modifications of the vectors(for instance the time evolution of the vectors describing the state of the system). On the other hand, transformationsof B into the scalars will be useful when we are interested in connecting the state of a system (represented by avector) with a measurement (which is a number).

Before considering each specific type of continuous linear transformation, we should clarify what the meaningof continuity of a linear transformation is. Since continuity depends on the metric induced on the space, we shoulddefine for a given space of linear transformations on a Banach space B, a given metric. We shall do it by firstdefining a norm, specifically we shall define the following norm

‖T‖ = sup |T (x)| : ‖x‖ ≤ 1 (1.11)

We shall refer to the metric induce by this norm when we talk about the continuity of any linear transformationof a Banach space into itself or into the scalars. It can be shown that for this norm continuity is equivalent toboundedness.

1.8.1. Continuous linear transformations of a Banach space into scalars

Let us consider first the continuous linear transformations of B into the scalars. This induces the following

Definition 1.13 A real (or complex) functional is a continuous linear transformation of a real (or complex) normedlinear space into R (or C).

Definition 1.14 The set of all functionals on a normed linear space N is called the conjugate space of N and isdenoted by N ∗.

For the case of general normed spaces (and even for Banach spaces), the structure of their conjugate spaces is ingeneral very intrincate. However we shall see that conjugate spaces are much simpler when an additional structure(inner product) is added to Banach spaces.

1.8.2. Continuous linear transformations of a Banach space into itself

Let us discuss now the continuous linear transformations of Banach spaces into themselves.

Definition 1.15 An operator is a continuous linear transformation of a normed space into itself.

A particularly useful result in quantum mechanics is the following

Theorem 1.12 If a one-to-one linear transformation T of a Banach space onto itself is continuous, then its inverseis automatically continuous

Though we do not provide a proof, it is important to note that this result requires the explicit use of completeness(it is not valid for a general normed space). We see then that completeness gives us another desirable property inPhysics: if a given transformation is continuous and its inverse exist, this inverse transformation is also continuous.

Let us now turn to projectors on Banach spaces. For general vector spaces projectors are defined as idempotentlinear transformations. For Banach spaces we will required an additional structure which is continuity

Page 21: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.8. BANACH SPACES 21

Definition 1.16 A projector in a Banach space B, is defined as an idempotent operator on B

The consequences of the additional structure of continuity for projectors in Banach spaces are of particularinterest in quantum mechanics

Theorem 1.13 If P is a projection on a Banach space B, and if M and N are its range and null space. Then Mand N are closed subspaces of B such that B = M ⊕N

The reciprocal is also true

Theorem 1.14 Let B be a banach space and let M and N be closed subspaces of B such that B = M ⊕ N . Ifz = x +y is the unique representation of a vector z in B with x in M and y in N . Then the mapping P defined byP (z) = x is a projection on B whose range and null space are M and N respectively.

These properties are interesting in the sense that the subspaces generated by projectors are closed subspacesof a complete space, and then they are complete by themselves. We have already said that dealing with completesubspaces is particularly important in quantum mechanics.

There is an important limitation with Banach spaces. If a closed subspace M is given, though we can alwaysfind many subspaces N such that B = M ⊕ N there is not guarantee that any of them be closed. So there is notguarantee that M alone generates a projection in our present sense. The solution of this inconvenience is anothermotivation to endow B with an additional structure (inner product).

Finally, the definition of the conjugate N ∗ of a normed linear space N , induces to associate to each operator inthe normed linear space N and operator on N ∗ in the following way. Let us form a complex number c0 with threeobjects, an operator T on N , a functional f on N and an element x ∈ N , we take this procedure: we map x inT (x) and then map this new element of N into the scalar c0 through the functional f

x → T (x) → f (T (x)) = c0

Now we get the same number with other set of three objects an operator T ∗ on N∗, a functional f on N (the samefunctional of the previous procedure) and an element x ∈ N (the same element stated before), the steps are nowthe following, we start with the functional f in N ∗ and map it into another functional through T ∗, then we applythis new functional to the element x and produce the number c0. Schematically it is

f → T ∗ (f) → [T ∗ (f)] (x) = c0

with this we are defining an apropiate mapping f ′ such that f ′ (x) gives our number. In turn it induces an operatoron N∗ that maps f in f ′ and this is the newly defined operator T ∗ on N∗. In summary this definition reads

[T ∗ (f)] (x) ≡ f (T (x)) (1.12)

where f is a functional on N i.e. an element in N ∗, T an operator on N and x an element of N . If for a given T wehave that Eq. (1.12) holds for f and x arbitrary, we have induced a new operator T ∗ on N∗ from T . It can be shownthat T ∗ is also linear and continuous i.e. an operator. When inner product is added to the structure, this operatorbecomes much simpler.

By using the norm (1.11) applied to operators on B∗ we have

‖T ∗‖ = sup ‖T ∗ (f)‖ : ‖f‖ ≤ 1

it can be proved that‖T ∗‖ = ‖T‖ (1.13)

such that the mapping T → T ∗ is norm preserving and therefore an isometry, we can also see that

(αT1 + βT2)∗ = αT ∗

1 + βT ∗2 ; I∗ = I ; (T1T2)

∗ = T ∗2 T

∗1 (1.14)

since linear operations are preserved the mapping T → T ∗ is an isometric isomorphism. However, the product isreversed under the mappping, this shows that the spaces ß(T ) and ß(T ∗) are equivalent as metric and vector spacesbut they are not equivalent as algebras (the spaces are not isomorphic as algebras).

Page 22: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

22 CAPITULO 1. LINEAR OR VECTOR SPACES

1.9. Hilbert spaces

In R3 it is customary to define a set of three ortonormal vectors ui such that any vector in R3 can be writtenas x = αiui sum over repeated indices. The dot product is defined such that

x · y ≡ ‖x‖ ‖y‖ cos θ (1.15)

the dot product is a good mathematical tool for many purposes in solid analytic geometry. If we accept the statementthat the zero vector is orthogonal to every vector we can say that the dot product is null if and only if both vectorsare orthogonal. Let vi be a given basis (non necessarily orthonormal) of R3; any two vectors in R3 are expressedin the form

x = αivi ; y = βjvj (1.16)

the dot product and the norm of these two vectors can be written

x · y = (αivi) · (βjvj) = αiβjvi · vj ≡ αiβjmij

x · x = ‖x‖2 = (αivi) · (αjvj) = αiαjvi · vj ≡ αiαjmij

These expressions can be in general complicated. Notice that these and other algebraic operations with dot productsbecome much easier when an orthonormal basis is used since in this case we have mij = δij so that x ·y = αiβi andx · x = αiαi. These facts put orthonormal basis in a privileged position among other bases.

Further, an attempt of extension of these ideas to C 3 permits to define the inner product in this space in thefollowing way, given the vectors (1.16) where α and β are complex we define

(x,y) = (α∗ivi) · (βjvj) = α∗

i βjmij

the conjugate on α appears to obtain the norm of a complex vectors with the inner product of such a vector withitself, as can be seen by using an orthonormal basis in which mij = δij

(x,x) = ‖x‖2 = α∗iαi = |αi| |αi|

the simplification above comes from the extension of the concept of orthogonality two complex vectors, they areorthogonal if and only if (x,y) = 0.

In both the real and complex cases, the concept of orthogonality was very important not only because of thegeometry but also because of the algebra. We observe for instance, that no angle like the one in (1.15) can be definedin the complex case, but the algebra of inner products continues being simple and useful. On the same ground, wewere able to talk about orthogonality in the complex case via the inner product and exploit the advantages oforthonormal sets, although two vectors of the complex plane are not “perpendicular”.

In the same way, in abstract vector spaces is not so clear how to use the concept of orthogonality in a geometricalway, but from the discussion above it is clear that the extension of the concept would represent great simplificationsfrom the algebraic sense. Notwithstanding, we shall see that the extension of the concept of inner product will alsoprovide some geometrical interpretations.

As always in mathematics, a natural extension should come from the extrapolation of the essential propertiesof the concept in the restricted way, the inner product in the complex and real spaces has the following properties

(x, αy + βz) = α (x,y) + β (x, z) ; (x,y) = (y,x)∗ ; (x,x) = ‖x‖2

we are led to the following

Definition 1.17 A Hilbert space is a real or complex Banach space whose norm arises from an inner product, whichin turn is defined as a complex function (x,y) of the vectors x and y with the following properties

(x, αy + βz) = α (x,y) + β (x, z)

(x,y) = (y,x)∗

(x,x) = ‖x‖2

Page 23: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.9. HILBERT SPACES 23

Definition 1.18 Two vectors x,y in a Hilbert space are said to be orthogonal if (x,y) = 0, we denote it as x ⊥ y.A vector is said to be normal or unitary if (x,x) = 1.

From the definition the following properties hold

|(x,y)| ≤ ‖x‖ ‖y‖ (1.17)

‖x + y‖2 + ‖x − y‖2 = 2 ‖x‖2 + 2 ‖y‖2 (1.18)

4 (x,y) = ‖x + y‖2 − ‖x− y‖2 + i ‖x + iy‖2 − i ‖x− iy‖2 (1.19)

x ⊥ y ⇒‖x + y‖2 = ‖x− y‖2 = ‖x‖2 + ‖y‖2 (1.20)

Eq. (1.17) is known as the Schwarz inequality. Eq. (1.18) is known as the paralelogram law because in plane geometryit reduces to the theorem which says that the sum of the squares of the sides of a paralelogram equals the sum ofthe squares of its diagonals. As well as its geometrical interpretation, this law says that only certain Banach spacescan be converted into Hilbert spaces, only those normed complete spaces in which the norm obeys the paralelogramlaw can become a Hilbert space. Further, if for a given norm, the paralelogram law is satisfied, then Eq. (1.19),gives us the recipe to define an inner product from such a norm. Finally, for reasons easy to visualize Eq. (1.20) iscalled the pithagorean theorem.

As a matter of illustration let us prove the paralelogram law Eq. (1.18)

‖x + y‖2 + ‖x− y‖2 = (x + y,x + y) + (x− y,x − y)

= (x,x + y) + (y,x + y) + (x,x − y) − (y,x − y)

= (x,x) + (x,y) + (y,x) + (y,y) + (x,x) − (x,y) − (y,x) + (y,y)

= (x,x) + (y,y) + (x,x) + (y,y)

= 2 ‖x‖2 + 2 ‖y‖2

A vector x is said to be orthogonal to a non empty set S, if x ⊥ y for all y ∈ S. The orthogonal complementof S is the set of all vectors orthogonal to S, it is denoted as S⊥. Two non empty sets M and N are orthogonal ifx ⊥ y for all x ∈M and for all y ∈ N ; this is denoted as M ⊥ N . If M is a closed vector subspace of H then M ⊥

is also closed. The following theorems are important for physical purposes

Theorem 1.15 If M and N are closed vector subspaces of a Hilbert space H such that M ⊥ N , then the linearsubspace M +N is also closed

Theorem 1.16 If M is a closed linear subspace of a Hilbert space H, then H = M ⊕M⊥

Thus we see that the expansion of the union of closed subspaces preserves the closure property and so thecompleteness property too. In addition, theorem 1.16 says that given a closed subspace of H we can always finda closed subspace to generate H by direct sum. Besides, the closed space that makes the work is the orthogonalcomplement. It means that for any given closed subspace M we can define a projection with range M and nullspace M⊥. Contrast this with the problem arising in Banach spaces in which we cannot guarantee the closure ofthe complementary space.

1.9.1. Orthonormal sets

An orthonormal set ei in H is a non empty subset of H such that if i 6= j then ei ⊥ ej and ‖ei‖ = 1 for alli. this set could be of any cardinality (non necessarily countable). The zero Hilbert space has no orthonormal sets.The following theorems are of great practical interest

Theorem 1.17 Let e1, .., en be a finite orthonormal set in H. If x is a vector in H we have

n∑

i=1

|(ei,x)|2 ≤ ‖x‖2 (1.21)

x−n∑

i=1

(ei,x) ei ⊥ ej ; j = 1, .., n (1.22)

Page 24: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

24 CAPITULO 1. LINEAR OR VECTOR SPACES

We can give the following interpretation of this theorem: Eq. (1.21) says that the sum of the components of avector in the various orthogonal directions defined by the ortonormal set, cannot exceed the length of the vector.Similarly, Eq. (1.22) says that if we substract from a vector its components in several perpendicular directions theresultant has no components left in those directions.

The following theorem shows that the coefficients obtained for a given vector from an orthonormal set are notarbitrary

Theorem 1.18 If ei is an orthonormal set in a Hilbert space H, and if x is any vector in H, the set S =ei : |(ei,x)|2 6= 0

is either empty or countable.

These results permit to extend theorem 1.17 for arbitrary orthonormal sets

Theorem 1.19 Let ei be an arbitrary orthonormal set in H. If x is a vector in H we have

∑|(ei,x)|2 ≤ ‖x‖2 (1.23)

x−∑

(ei,x) ei ⊥ ej ; j = 1, .., n (1.24)

where the symbol of sum means the following, defining the set S =ei : |(ei,x)|2 6= 0

, we define the sum to be zero

(number or vector) when S is empty. If S is finite, the definitions in (1.24, 1.23) coincide with the ones in (1.21,1.22), if S is countably infinite, the sums become series

∑∞n=1 for a given order of the set S = e1, .., ei, .., in this

case the limit of the series is independent of the order chosen for S.

Definition 1.19 An orthonormal set in H is said to be complete if it is maximal, that is, if it is impossible to addan element e to the set while preserving the orthonormality in the new set.

Theorem 1.20 Every orthonormal set in a Hilbert space is contained in a complete orthonormal set

Theorem 1.21 Every non-zero Hilbert space contains a complete orthonormal set

Theorem 1.22 Every orthonormal set is linearly independent

Theorem 1.23 Let H be a Hilbert space and ei an orthonormal set in H. The following conditions are equivalentto one another

ei is complete (1.25)

x ⊥ ei ⇒ x = 0 (1.26)

∀ x ∈ H ⇒ x =∑

(ei,x) ei (1.27)

∀ x ∈ H ⇒ ‖x‖2 =∑

|(ei,x)|2 (1.28)

This is perhaps the most important theorem in terms of applications in Physics, and in particular quantummechanics. It is convenient to discuss some terminology related with it. The numbers (x, ei) are called the Fouriercoeeficients of x and Eq. (1.27) is its Fourier expansion. Eq. (1.28) is called Parseval’s equation. All these equationsrefer to a given complete orthonormal set.

This sequence of theorems are similar to the ones explained in the general theory of vector spaces in whichcomplete orthonormal sets replaced the concept of bases, and fourier expansions replaced linear combinations.

It is clear that for finite dimensional spaces Fourier expansions become linear combinations. On the other hand,since orthonormal sets are linearly independent (Theorem 1.22), it is easy to see that in the case of finite dimensionalspaces complete orthonormal sets are linearly independent sets that generate any vector by linear combinations.Hence, complete orthonormal sets are bases.

For infinite dimensional spaces there is a different story. If we remember that linear combinations are finite bydefinition, we see that in this case Fourier expansions are not linear combinations. For a given linearly independentset to be a basis, it is necessary for any vector of the space to be written as a linear combination of such a set, basis

Page 25: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.9. HILBERT SPACES 25

certainly exists for Hilbert spaces according to theorem 1.3 but complete orthonormal sets are NOT basis in thesense defined for the general theory of vector spaces.

Moreover theorem 1.18 shows that the Fourier expansion given in Eq. (1.27) is always countable, this is aremarkable result because it means that the fourier expansion for a given complete orthonormal set is always aseries, even if the cardinality of the complete orthonormal set is higher than the aleph (cardinality of the integers).

The informal discussion above can be formally proved to produce the following statement

Theorem 1.24 A Hilbert space is finite dimensional if and only if every complete orthonormal set is a basis.

However, owing to the analogy between bases and complete orthonormal sets the following theorem is quiteexpected

Theorem 1.25 Any two complete orthonormal sets of a given Hilbert space have the same cardinality.

And this fact induces a natural definition

Definition 1.20 The orthogonal dimension of a Hilbert space H is the cardinality of any complete orthonormal setin H.

It is important to keep in mind the difference between the dimension and the orthogonal dimension of a Hilbertspace of infinite dimension.

1.9.2. The conjugate space H∗

We have defined the conjugate space of a Banach space B as the set of all functionals in B i.e. of all linearcontinuous mappings of B into the scalars. We said however that the structure of the conjugate spaces of an arbitraryBanach space is very complex. Fortunately, this is not the case for Hilbert spaces in which the inner product providesa natural association between H and H∗.

Let y be a fixed vector in H and consider the function fy defined by

fy (x) ≡ (y,x) (1.29)

it is easy to prove linearity

fy (αx1 + βx2) = (y, αx1 + βx2) = α (y,x1) + β (y,x2)

fy (αx1 + βx2) = αfy (x1) + βfy (x2)

continuity comes from the Schwarz inequality

|fy (x)| = |(x,y)| ≤ ‖x‖ ‖y‖ ⇒ |fy (x)| ≤ ‖y‖

then fy is bounded and so continuous. Indeed it can be shown that |fy (x)| = ‖y‖. We then have found an algorithmto generate some functionals from the mapping

y → fy (1.30)

described above, this is a norm preserving mapping of H into H ∗. However, it can be shown that indeed this is amapping of H onto H∗ as stated in this

Theorem 1.26 Let H be a Hilbert space, and f an arbitrary functional in H ∗. Then there exists a unique vectory ∈ H such that

f (x) = (y,x) ∀x ∈ H

Page 26: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

26 CAPITULO 1. LINEAR OR VECTOR SPACES

since the mapping (1.30) is norm preserving, we wonder if it is linear, this is not the case because

fy1+y2 (x) = (y1 + y2,x) = (y1,x) + (y2,x) = fy1 (x) + fy2 (x)

fαy (x) = (αy,x) = α∗ (y,x) = α∗fy (x)

such that

fy1+y2 = fy1 + fy2 ; fαy = α∗fy (1.31)

however the mapping (1.30) is an isometry (it preserves metric) since

‖fx − fy‖ = ‖fx−y‖ = ‖x− y‖

we can characterize H∗ in the following way

Theorem 1.27 H∗ is a Hilbert space with respect to the inner product defined by (fx, fy) = (y,x).

1.9.3. The conjugate and the adjoint of an operator

A really crucial aspect of the theory of Hilbert spaces in Physics is the theory of operators (continuous lineartransformations of H into itself), we shall see later that observables in quantum mechanics appear as eigenvaluesof some of these operators.

We have defined the conjugate of an operator for Banach spaces but they are still too general to get a richstructural theory of operators. The natural correspondence between H and H ∗ will provide a natural relationbetween a given operator on H and its corresponding conjugate operator on H ∗.

Let T be an operator on a Banach space B. We defined an operator on B∗ denoted T ∗ and called the conjugateof T by Eq. (1.12)

[T ∗ (f)] (x) = f (T (x)) (1.32)

and Eqs. (1.13, 1.14) says that T → T ∗ is an isometric isomorphism between the spaces of linear operators on Hand H∗. We shall see that the natural correspondence between H and H ∗ permits to induce in turn an operatorT † in H from the operator T ∗ in H∗. The procedure is the following: starting from a vector y in H we map it intoits corresponding functional fy, then we map fy by the operator T ∗ to get another functional fz then we map thisfunctional into its (unique) corresponding vector z in H the scheme reads

y → fy → T ∗fy = fz → z

the whole process is a mapping of y to z i.e. of H into itself. We shall write it as a single mapping of H into itselfin the form

y → z ≡ T †y

the operator T † induced in this way from T ∗ is called the adjoint operator. Its action can be understood in thecontext of H only as we shall see. For every vector x ∈ H we use the definition of T ∗ Eq. (1.32) to write

[T ∗ (fy)] (x) = fy (T (x)) = (y, Tx)

[T ∗fy] (x) = fz (x) = (z,x) =(T †y,x

)

so that

(y, Tx) =(T †y,x

)∀x,y ∈ H (1.33)

we can see that Eq. (1.33) defines T † uniquely and we can take it as an alternative definition of the adjoint operatorassociated with T . It can also be verified that T † is indeed an operator, i.e. that it is continuous and linear. We canalso prove the following

Page 27: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.10. NORMAL OPERATORS 27

Theorem 1.28 The adjoint operation T → T † is a one-to-one onto mapping with these properties

(T1 + T2)† = T †

1 + T †2 , (αT )† = α∗T † ,

(T †)†

= T

(T1T2)† = T †

2T†1 ;

∥∥∥T †∥∥∥ = ‖T‖ ;

∥∥∥T †T∥∥∥ =

∥∥∥TT †∥∥∥ = ‖T‖2

0∗ = 0 , I∗ = I (1.34)

If T is non-singular then T † is also non-singular and

(T †)−1

=(T−1

)†

Notice for instance that(T †)† = T implies that

(Ty,x) =(y, T †x

)∀x,y ∈ H (1.35)

We define the commutator of a couple of operators T1, T2 as

[T1, T2] ≡ T1T2 − T2T1

this operation has the following properties

[T1, T2] = − [T2, T1] (1.36)

[αT1 + βT2, T3] = α [T1, T3] + β [T2, T3] (1.37)

[T1, αT2 + βT3] = α [T1, T2] + β [T1, T3] (1.38)

[T1T2, T3] = T1 [T2, T3] + [T1, T3]T2 (1.39)

[T1, T2T3] = T2 [T1, T3] + [T1, T2]T3 (1.40)

[[T1, T2] , T3] + [[T3, T1] , T2] + [[T2, T3] , T1] = 0 (1.41)

such properties can be proved directly from the definition, Eq. (1.36) shows antisymmetry and Eqs. (1.37, 1.38)proves linearity. Finally, relation (1.41) is called the Jacobi identity.

It can be seen that the space of operators on a Hilbert space H (called ß(H)) is a Banach space and moregenerally a Banach Algebra. This organization permits an elegant theory of the operators on Hilbert spaces.

The theory of quantum mechanics works on a Hilbert space. In addition, the most important operators on theHilbert space in quantum mechanics are self-adjoint and unitary operators, which are precisely operators that havea specific relation with its adjoints.

1.10. Normal operators

Definition 1.21 An operator on a Hilbert space H that commutes with its adjoint[N,N †] = 0 is called a normal

operator

There are two reasons to study normal operators (a) From the mathematical point of view they are the mostgeneral type of operators for which a simple structure theory is possible. (b) they contain as special cases the mostimportant operators in Physics: self-adjoint and unitary operators.

It is clear that if N is normal then αN is. Further, the limit N of any convergent sequence of normal operatorsNk is also normal

∥∥∥NN † −N †N∥∥∥ ≤

∥∥∥NN † −NkN†k

∥∥∥+∥∥∥NkN

†k −N †

kNk

∥∥∥+∥∥∥N †

kNk −N †N∥∥∥

=∥∥∥NN † −NkN

†k

∥∥∥+∥∥∥N †

kNk −N †N∥∥∥→ 0

then NN † −N †N = 0 and N is normal then we have proved

Page 28: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

28 CAPITULO 1. LINEAR OR VECTOR SPACES

Theorem 1.29 The set of all normal operators on H is a closed subset of ß(H) that is closed under scalar multi-plication

It is natural to wonder whether the sum and product of normal operators is normal. They are not, but we canestablish some conditions for these closure relations to occur

Theorem 1.30 If N1 and N2 are normal operators on H with the property that either commutes with the adjointof the other, the N1 +N2 and N1N2 are normal.

The following are useful properties for the sake of calculations in quantum mechanics

Theorem 1.31 An operator N on H is normal⇔ ‖Nx‖ =∥∥N †x

∥∥∀x ∈ H

Theorem 1.32 If N is a normal operator on H then∥∥N2

∥∥ = ‖N‖2

1.11. Self-Adjoint operators

We have said that the space of operators on a Hilbert space H (called ß(H)), is a special type of algebra (aBanach Algebra) which has an algebraic structure similar to the one of the complex numbers, except for the factthat the former is non-commutative. In particular, both are complex algebras with a natural mapping of the spaceinto itself of the form T → T † and z → z∗ respectively. The most important subsystem of the complex plane isthe real line defined by the relation z = z∗, the corresponding subsystem in ß(H) is therefore defined as T = T †,an operator that accomplishes that condition is called a self-adjoint operator. This is the simplest relation that canbe established between an operator and its adjoint. It is clear that self-adjoint operators are normal. Further, wealready know that 0† = 0 and I† = I thus they are self-adjoint. A real linear combination of self-adjoint operatorsis also self-adjoint

(αT1 + βT2)† = α∗T †

1 + β∗T †2 = αT †

1 + βT †2

further, if Tn is a sequence of self adjoint operators that converges to a given operator T , then T is also self-adjoint

∥∥∥T − T †∥∥∥ ≤ ‖T − Tn‖ +

∥∥∥Tn − T †n

∥∥∥+∥∥∥T †

n − T †∥∥∥ = ‖T − Tn‖ + ‖Tn − Tn‖ +

∥∥∥T †n − T †

∥∥∥

= ‖T − Tn‖ +∥∥∥(Tn − T )†

∥∥∥ = ‖T − Tn‖ + ‖(Tn − T )‖ = 2 ‖T − Tn‖ → 0

shows that T − T † = 0 so that T = T † this shows the following

Theorem 1.33 The self-adjoint operators in ß(H) are a closed real linear subspace of ß(H) and therefore a realBanach space which contains the identity transformation

Unfortunately, the product of self-adjoint operators is not necessarily self-adjoint hence they do not form analgebra. The only statement in that sense is the following

Theorem 1.34 If T1, T2 are self-adjoint operators on H, their product is self-adjoint if and only if [T1, T2] = 0

It can be easily proved that T = 0 ⇔ (x, Ty) = 0 ∀x,y ∈ H. It can be seen also that

Theorem 1.35 If T is an operator on a complex Hilbert space H then T = 0 ⇔ (x, Tx) = 0 ∀x ∈ H.

It should be emphasized that the proof makes explicit use of the fact that the scalars are complex numbers andnot merely the real system.

The following theorem shows that the analogy between self-adjoint operators and real numbers goes beyond thesimple analogy from which the former arise

Theorem 1.36 An operator T on H is self-adjoint⇔ (x, Tx) is real ∀x ∈ H.

An special type of self-adjoint operators are the following ones

Page 29: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.12. UNITARY OPERATORS 29

Theorem 1.37 A positive operator on H is a self-adjoint operator such that (x, Tx) ≥ 0, ∀x ∈ H. Further, if(x, Tx) ≥ 0, and (x, Tx) = 0 ⇔ x = 0 we say that the operator is positive-definite.

It is clear that the following operators are positive: 0, I, TT †, T †T note also that all the analoguous elementsin the complex plane are non-negative numbers 0, 1, zz∗ = z∗z = |z|2.

Theorem 1.38 If A is a positive operator then I +A is non-singular

Continuing the analogy between ß(H) and the algebra of complex numbers, we can see that a complex numbercan be written as its real and imaginary parts in the form

z = a1 + ia2 ; a1 ≡ z + z∗

2, a2 ≡ z − z∗

2i

in a similar way we can decompose an arbitrary operator T on H in the form

T = A1 + iA2 ; A1 ≡ T + T †

2; A2 ≡ T − T †

2i(1.42)

it is clear that A1 and A2 are self-adjoint so they can be called the “real” and “imaginary” components of theT operator. If T is self-adjoint its imaginary part is zero as expected. We can see that it is precisely because of thenon commutativity of the self-adjoint operators that non-normal operators exist

Theorem 1.39 If T is an operator on H it is normal ⇔ its real and imaginary parts commute

1.12. Unitary operators

Perhaps the most important subsystem of the complex plane after the real line is the unit circle characterizedby the equation zz∗ = z∗z = |z|2 = 1. This leads to a natural definition of an special subset of the normal operators

Definition 1.22 An operator U on H which satisfies the equation UU † = U †U = I is said to be unitary

Unitary operators are thus the analogues of complex numbers of unitary absolute value. In words, unitaryoperators are those non-singular operators whose inverses equal their adjoints, they are thus mappings of H ontoitself. The geometric significance of these operators can be clarified with the following theorem

Theorem 1.40 If T is an operator on H, the following conditions are equivalent to one another

T †T = I (1.43)

(Tx, Ty) = (x,y) ∀x,y ∈ H (1.44)

‖T (x)‖ = ‖x‖ ∀x ∈ H (1.45)

In general an operator T with any of the properties (1.43-1.45), is an isometric isomorphism of H into itself,since T preserves linear operations, the inner product and the norm (and thus the metric). For finite-dimensionalspaces any of them are necessary and sufficient conditions for T to be unitary. Nevertheless, this is not the casewhen we treat with infinite-dimensional spaces, let us see an example: consider the operator T in C∞ given by

T x1, x2, ... = 0, x1, x2, ...

which preserves norms but has no inverse. The point is that this is an isometric isomorphism into H but not ontoH (the image does not contain any element of C∞ with a non-null first component). So in the case of infinitedimension, the condition to be onto must be added to the conditions (1.43-1.44) for an operator to be unitary.

Theorem 1.41 An operator on H is unitary⇔is an isometric isomorphism of H onto itself.

Page 30: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

30 CAPITULO 1. LINEAR OR VECTOR SPACES

In words, unitary operators are those one-to-one and onto operators that preserve all structure relevant for aHilbert space: linear operations, inner products, norm and metric.

In practice, unitary operators usually appear in Physics as operations that keep the norm of the vectors unaltered(like rotations in ordinary space), even this is usually the definition utilized in Physics books.

There is another theorem useful in the theory of representations for Hilbert spaces which is also used sometimesas the definition

Theorem 1.42 An operator T on H is unitary ⇔ T ei is a complete orthonormal set whenever ei is.

Another important characteristic for physical applications is the following

Theorem 1.43 The set of all unitary operators on H forms a group

1.13. Projections on Hilbert spaces

In Banach spaces we defined projections as idempotent continuous linear trasnformations or equivalently asidempotent operators. We also saw that a couple of closed subspaces such that B = M⊕N induces a projection andviceversa. We saw however that for a given closed subspace M of B there is not necessarily another closed subspacesuch that B = M ⊕N .

In contrast, theorem 1.16 guarantees that for a given closed subspace M of a Hilbert space H there always existsa decomposition with another closed subspace in the form H = M ⊕M⊥. Besides, in this decomposition the closedcomplementary space is precisely the orthogonal complement of M . Since orthogonality is a very important newconcept that arises from Hilbert spaces, we shall concentrate on projections induced by this particular decomposition.It is natural then to look for the new features required by a given projection in order to have M as its range andM⊥ as its null space

Theorem 1.44 If P is a projection (with the definition given in Banach spaces) on H with range M and null spaceN then M ⊥ N ⇔ P = P † and in this case N = M⊥.

A projection in which its range and null space are perpendicular is called an orthogonal projection. Indeed,orthogonal projections are the only ones that are relevant in the theory of operators on Hilbert spaces, then we shallredefine the concept of projection once again

Definition 1.23 A projection on a Hilbert space will be defined as an idempotent, continuous, and self-adjointlinear transformation. If idempotent, continuous, non-self adjoint linear transformations are of some use, we callthem non-orthogonal projections.

The following facts are easy to show, 0 and I are projections and they are distinct if and only if H 6= 0. P isthe projection on M ⇔ I − P is the projection on M⊥.

We can also see thatx ∈M ⇔ Px = x ⇔ ‖Px‖ = ‖x‖

it can also be seen that P is a positive operator and ‖P‖ ≤ 1.Sometimes occur in Physics that a given operator T on H maps a proper subspace M of H into itself. The

following chain of definitions permits to study this kind of operators

Definition 1.24 Let T be an operator on H, and M a closed vector subspace of H. M is said to be invariant underT if T (M) ⊆M .

In this case the restriction of T to M can be regarded as an operator of M into itself. A more interesting situationoccurs when M and M⊥ are invariant under T

Definition 1.25 If both M and M⊥ are invariant under T , we say that M reduces T or that T is reduced by M .

This situation invites us to study T by restricting its domain to M and M⊥. The projections provide the mostrelevant information for these scenarios

Page 31: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.14. BASIC THEORY OF REPRESENTATIONS IN A GENERAL FINITE DIMENSIONAL VECTOR SPACE31

Theorem 1.45 A closed vector subspace M is invariant under an operator T ⇔M⊥ is invariant under T †

Theorem 1.46 A closed vector subspace M reduces an operator T ⇔M is invariant under both T and T †

Theorem 1.47 If P is the projection on a closed vector subspace M of H, M is invariant under an operatorT ⇔ TP = PTP

Theorem 1.48 If P is the projection on a closed vector subspace M of H, M reduces an operator T ⇔ TP = PT

Theorem 1.49 If P and Q are projections on closed linear subspaces M and N then M ⊥ N ⇔ PQ = 0 ⇔ QP = 0

We wonder whether the sum of projections in our present sense is also a projection. This is the case only undercertain conditions

Theorem 1.50 If P1, .., Pn are projections on closed subspaces M1, ..,Mn of a Hilbert space H, then the sumP = P1 + ..+Pn is a projection ⇔the P ′

i s are pairwise orthogonal i.e. PiPj = δijPi, in that case P is the projectionon M = M1 + ..+Mn.

1.14. Basic theory of representations in a general finite dimensional vector

space

In this section we intend to establish an equivalence between abstract objects such as elements of vector spacesand linear transformations, in a more tangible language suitable for explicit calculations. This is the gist of thetheory of representations for vector spaces

1.14.1. Representation of operators in a given basis

If n is the dimension of a finite-dimensional vector space V , a set of n linearly independent vectors in V , forms abasis for the vector space. Given a certain ordered basis u1, ..,un in a vector space V any vector can be writtenas a linear combination of such a basis, we shall use the convention of sum over repeated indices

x = xiui (1.46)

The coefficients xi are called the coordinates of the vector x, relative to the ordered basis ui. Linear independenceensures that the set of coordinates (x1, .., xn) is unique when the basis is ordered in a well-defined way.

A mapping T of V into itself, associates each vector x with another vector y in V

y = Tx

if the mapping is one-to-one and onto it admits an inverse1

x = T−1y

if the transformation is linear we have

T (αx+βy) = αTx + βTy ∀x,y ∈ V

where α and β are complex numbers. The definition of T is intrinsic and does not depend on the particular basischosen for the vector space. Notwithstanding, for many practical purposes we define a representation of both thevectors and operators in a basis ui. In that case, we can describe the action of T by a transformation of coordinates(in the same basis)

yi = Ti (x1, x2, . . . , xn) i = 1, . . . , n

1If the mapping is only one-to-one but not onto, the inverse still exist but restricted to the vector subspace in which all the vectorsx ∈ V are mapped.

Page 32: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

32 CAPITULO 1. LINEAR OR VECTOR SPACES

if Ti admits an inverse we getxi = T−1

i (y1, y2, . . . , yn) i = 1, . . . , n

the necessary and sufficient condition for the existence of the inverse is that the jacobian J ≡ ∂T i/∂xj be differentfrom zero.

On the other hand, if we assume that T is a linear transformation we can write

y = Tx = T (xiui) = xiTui (1.47)

Eq. (1.47) says that y is a linear combination of the vectors Tui, and the coefficients of the combination(coordinates) coincide with the coordinates of x in the basis ui. The vectors Tui must be linear combinationsof uj and we denote the coefficients of these linear combinations as Tji

vi ≡ Tui = ujTji (1.48)

the real or complex coefficients Tji can be organized in a square arrangement of the form

T ≡

T11 T12 · · · T1n

T21 T22 · · · T2n...

... · · · ...Tn1 Tn2 · · · Tnn

this square arrangement symbolized as T is called the matrix representative of the linear transformation T relativeto the ordered basis ui. Substituting in Eq. (1.47)

yjuj = ujTjixi

and since the uj are linearly independentyj = Tjixi

this operation is represented by the following notation

y1

y2...yn

=

T11 T12 · · · T1n

T21 T22 · · · T2n...

... · · · ...Tn1 Tn2 · · · Tnn

x1

x2...xn

y1

y2...yn

=

T11x1 + T12x2 + ..+ T1nxnT21x1 + T22x2 + ..+ T2nxn

...Tn1x1 + Tn2x2 + ..+ Tnnxn

and is usually written in the formy = Tx

the last equality appears in matrix notation where T is the matrix representative of the linear operator T in theordered basis ui. Similarly, x and y are the coordinate representatives of the intrinsic vectors in the same orderedbasis. Eq. (1.48) shows clearly how to construct the matrix T, i.e. applying the operator to each vector in thebasis, and writing the new vectors as linear combinations of the basis. The coefficient of the i − th new vectorassociated to the j − th element of the basis gives the element Tji in the associated matrix. Observe that for amatrix representative to be possible, the linearity was fundamental in the procedure.

On the other hand, since we are looking for an isomorphism among linear transformations on V and the setof matrices (as an algebra), we should define linear operations and product of matrices in such a way that theseoperations are preserved in the algebra of linear transformations. In other words, if we denote by [T ] the matrixrepresentative of T in a given ordered basis we should find operations with matrices such that

[T1 + T2] = [T1] + [T2] ; [αT ] = α [T ] ; [T1T2] = [T1] [T2]

Page 33: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.14. BASIC THEORY OF REPRESENTATIONS IN A GENERAL FINITE DIMENSIONAL VECTOR SPACE33

we examine first the product by a scalar, according to the definition (1.7) we have

(αT ) (ui) = α (Tui) = α (ujTji) = uj (αTji) ⇒(αT ) (ui) = uj (αTji) ⇒ (uj) (αT )ji = uj (αTji)

using linear independence we obtain the algorithm for scalar multiplication

(αT )ji = αTji

Now for the sum we use the definition 1.6

(T + U)uj = Tuj + Uuj = uiTij + uiUij = ui (Tij + Uij) ⇒(T + U)uj = ui (Tij + Uij) ⇒ ui (T + U)ij = ui (Tij + Uij)

and along with linear independence it leads to

(T + U)ij = (Tij + Uij)

Moreover, for multiplication (composition) we use definition 1.9

(TU)ui = T (Uui) = T (ujUji) = UjiT (uj) = Uji (Tuj) = Uji (ukTkj) ⇒(TU)ui = (TkjUji)uk ⇒ uk (TU)ki = uk (TkjUji)

linear independence gives(TU)ki = TkjUji (1.49)

It can be easily shown that the matrix representations of the operators 0 and I are unique and equal in anybasis, they correspond to [0]ij = 0 and [I]ij = δij.

Finally, we can check from Eq. (1.48) that the mapping T → [T ] is one-to-one and onto. It completes the proofof the isomorphism between the set of linear transformations and the set of matrices as algebras.

On the other hand, owing to the one-to-one correspondence T ↔ [T ] and the preservation of all operations, wesee that non-singular linear transformations (i.e. invertible linear transformations) should correspond to invertiblematrices. We denote

[T−1

]the matrix representative of T−1, and our goal is to establish the algorithm for this

inverse matrix, the definition of the inverse of the linear transformation is

TT−1 = T−1T = I

since the representation of the identity is always [I]ij = δij , the corresponding matrix representation of this equationis

[T ]ik[T−1

]kj

=[T−1

]ik

[T ]kj = δij (1.50)

this equation can be considered as the definition of the inverse of a matrix if it exists. A natural definition is then

Definition 1.26 A matrix which does not admit an inverse is called a singular matrix. Otherwise, we call it anon-singular matrix.

Since T−1 is unique, the corresponding matrix is also unique, so the inverse of a matrix is unique when it exists.A necessary and sufficient condition for a matrix to have an inverse is that its determinant must be non-zero.

The algebra of matrices of dimension n× n is called the total matrix algebra An, the preceding discussion canbe summarized in the following

Theorem 1.51 if B = u1, ..,un is an ordered basis of a vector space V of dimension n, the mapping T → [T ]which assigns to every linear transformation on V its matrix relative to B, is an isomorphism of the algebra of theset of all linear transformations on V onto the total matrix algebra An.

Theorem 1.52 if B = u1, ..,un is an ordered basis of a vector space V of dimension n, and T a linear trans-formation whose matrix relative to B is [aij ]. Then T is non-singular ⇔ [aij ] is non-singular and in this case[aij]

−1 =[T−1

].

Page 34: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

34 CAPITULO 1. LINEAR OR VECTOR SPACES

1.14.2. Change of coordinates of vectors under a change of basis

We have already seen that any vector space has an infinite number of bases. Notwithstanding, once a given basisis obtained, any other one can be found by a linear transformation of the original basis.

Let uj be our “original” ordered basis andu′j

any other ordered basis. Each u′

i is a linear combination of

the original basis

u′i = aijuj i = 1, . . . , n (1.51)

linear independence of ui ensures the uniqueness of the coefficients aij . The natural question is whether we require

any condition on the matrix representation aij in Eq. (1.51) to ensure that the setu′j

be linearly independent.

If we remember that there is a one-to-one correspondence between matrices and linear transformations we see thataij must correspond to a (unique) linear transformation A. In this notation Eq. (1.51) becomes

u′i = Auj (1.52)

now appealing to theorem 1.9 we see thatu′j

is a basis if and only if A is non-singular, but A is non-singular if

and only if [A]ij = aij is a non-singular matrix. Thus Eq. (1.52) can be written in matrix notation as

u′ = Au (1.53)

the new set u′i is a basis if and only if the matrix A is non-singular. Any vector x can be written in both bases

x = xiui = x′iu′i = x′iaijuj = x′jajiui (1.54)

and owing to the linear independence of ui

xi = x′jaji = aijx′j ; aij ≡ aji

where aij ≡ aji indicates the transpose of the matrix A. In matrix form we have

u′ = Au , x = Ax′

(1.55)

and using Eq. (1.55) we get

x′ = A−1x (1.56)

observe that if the original basis transform to the new one by a non-singular matrix A (Eq. 1.53), the original

coordinates transform to the new ones by the matrix A−1 (Eq. 1.56). It is easy to show that A−1 = A−1 then A isnon-singular if and only if A is non-singular. Hence Eq. (1.56) makes sense whenever A is non-singular.

Defining the transpose of a column matrix as

x = (x1, x2, . . . , xn)

the Eq. (1.54) can be written as

x = xu = x′u′

which gives a convenient notation for the coordinate-form of vectors in different basis.

It is important to emphasize that the vector x has an intrinsic meaning while its coordinates depend on thebasis chosen.

1.14.3. Change of the matrix representative of linear transformations under a change of basis

Let us define an intrinsic equation for a linear transformation T of V into itself

y = Tx (1.57)

Page 35: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.14. BASIC THEORY OF REPRESENTATIONS IN A GENERAL FINITE DIMENSIONAL VECTOR SPACE35

y and x denote here intrinsic vectors while y,x are their representation in coordinates under a given ordered basis.Starting with the ordered basis ui we write equation (1.57) in matrix form

y = Tx (1.58)

for any other ordered basis u′i the matrix and coordinate representatives are different and we write them as

y′ = T′x′ (1.59)

we remark that Eqs. (1.58) and (1.59) represents the same intrinsic Equation (1.57).

Since we know the relation between the coordinate representatives given by Eq. (1.56), our goal here is to knowthe relation between the matrix representatives of T . Using Eq. (1.56) we find

y′ = A−1y = A−1

Tx = A−1

TAA−1

x =(A−1TA

)(A−1x

)

y′ = T′x′ (1.60)

where we have defined

T′ ≡ A−1TA (1.61)

from Eqs. (1.60, 1.61) we see that T′ is the representative matrix of the operator T in the new basis u′i where

the matrix A−1 gives the transformation between coordinates from the old basis to the new one Eq. (1.56). Weremember that A must be non-singular to represent a change of basis.

Definition 1.27 The transform of a matrix A (also called a similarity transformation) by a non singular matrixS, is defined as A′ = SAS−1. The matrices A′ and A are said to be equivalent.

Eq. (1.61) shows that the new matrix representation of T (i.e. T′), is equivalent2 to the old matrix representationT, and the transform of T by A−1 is T′.

We can also consider a transformation S from a vector space V into another V ′

x′ = Sx, x = S−1x′

For S−1 to be linear, it is necessary that V and V ′ be of the same dimensionality. If a linear operator T is defined inV , then T and S induce a linear operator in V ′ in the following way let map x′ of V ′ into y′ of V ′ in the followingway

x′ → x = S−1x′ → y = Tx = T(S−1x′)→ y′ = Sy = S

(T(S−1x′))

hence the mapping x′ → y′ has been performed as

x′ → y′ =(STS−1

) (x′)

or course, we can define a mapping T ′ of V ′ into itself that makes the work in a single step, thus

T ′ ≡ STS−1 ; y′ =(STS−1

) (x′) (1.62)

The transformation given by (1.62) is also a similarity transformation. Although the transformations shown in 1.61and 1.62 resembles, they have fundamental differences. In 1.61 we are representing the same mathematical object bytaking different bases, and is a matrix equation. By contrast, Eq. (1.62) expresses a relation between two differentmathematical transformations acting on different spaces3, and the equation is intrinsic, independent of the basis.

2Similarity transformations provides an equivalence relation between two matrices. Thus, the expression equivalent matrices becomeslogical. In addition, we see that T and T′ describe the same mathematical object (though in different bases), so that the term equivalenceacquires more sense in this context.

3It could be argued that both spaces are identical since they have the same dimensionality. This is true only for their properties asgeneral vector spaces, but not necessarily for any additional algebraic or topological structure on them.

Page 36: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

36 CAPITULO 1. LINEAR OR VECTOR SPACES

1.15. Active and passive transformations

In Physics, it is important to differentiate between two types of transformations, the passive ones and the activeones. We can understand passive transformations by examining the transformations y → y ′, x → x′ and T → T ′

to go from Eq. (1.58) to Eq. (1.59), if we remember that both are representatives of the same intrinsic equation(1.57) we realize that the mappings described above do not change the vectors or the transformation but only theirrepresentatives. These mappings (called passive mappings) thus correspond to a change in the basis and not to achange on the mathematical objects by themselves.

In contrast, an active mapping or transformation transforms a mathematical object into another one. For in-stance, in the first of Eqs. (1.62) we map a linear transformation on V into a different linear transformation on V ′,the mathematical object itself has changed. Similarly the mapping x′ → y′ through T ′ described by the second ofEqs. (1.62) is an active transformation because x′ and y′ are two different vectors.

The difference between a passive and active mappings or transformations should be clear from the context. Forinstance Eqs. (1.61) and (1.62) are identical in form from the algebraic point of view, but (1.61) represents a passivetransformation (a change of basis or a change of representation), while (1.62) represents an active one.

1.16. Theory of representations on finite dimensional Hilbert spaces

We shall study n−dimensional Hilbert spaces. We remember that an inner product is a mapping that takes anordered pair of vectors x,y in a vector space V, and associates to it a scalar α denoted by α = (x,y) such that

(x,y) = (y,x)∗ ; (x, βy) = β (x,y) ; (x1 + x2,y) = (x1,y) + (x2,y)

(x,x) ≥ 0, and (x,x) = 0 ⇔ x = 0

the definition of the inner product is intrinsic (basis independent). The norm of a vector is defined as ‖x‖2 ≡ (x,x).This in turn allows us to normalized the vectors, i.e. construct vectors with norm or “length” equal to one by therule

ui =xi√(x,x)

=xi‖xi‖

(1.63)

such that (ui,ui) = 1. Different inner products defined into the same vector space, lead to different Hilbert spaces.Another important concept that arises from the inner product is that of orthogonality. An orthonormal set is a setxi with xi ∈ H such that

(xi,xj) = δij

The theory of representations of a finite dimensional Hilbert space is particularly simple if we realize that in finitedimension, the Fourier expansion given by Eq. (1.27) becomes a linear combination, the series in (1.28) to calculatethe norm becomes a finite sum, and finally complete orthonormal sets become bases. These are the main ideas thatlead to the theory of representations in a Hilbert space

Our first goal is to find the way in which the coordinates of a given vector are obtained from the inner product.We first see the form of the coordinates when the basis consists of a complete orthonormal basis. Rewriting theFourier expansion (1.27) in finite dimension and using sum over repeated indices we have

x = (ui, x)ui = xiui

so the coordinate of a vector x associated with the normal vector ui is given by

xi = (ui, x)

Let us now see how an arbitrary inner product can be calculated using an orthonormal basis

(x, y) = (xiui, yjuj) = x∗i yj (ui,uj) = x∗i yjδij = x∗i yi (1.64)

the norm of a vector is also easily seen as

‖x‖2 = (x, x) = x∗i xi = |xi| |xi| (1.65)

Page 37: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.16. THEORY OF REPRESENTATIONS ON FINITE DIMENSIONAL HILBERT SPACES 37

if the basis vi is not an orthonormal set, we can express the scalar product by determining the numbers

mij ≡ (vi,vj) (1.66)

the properties of the inner product lead to mij = m∗ji. This numbers form a matrix that we shall call the metric

matrix. Defining (Aij)† ≡ A∗

ji (the adjoint or hermitian conjugate of the matrix A) we find that m = m†, from

the definition of the adjoint matrix we see that (AB)† = B†A†. A matrix that coincides with its adjoint is calledself-adjoint or hermitian. The metric matrix is hermitian. We shall see now that knowing the metric matrix in acertain basis, we can find any possible inner product

(x,y) = (xivi, yjvj) = x∗i yj (vi,vj) = x∗i yjmij

(x,y) = x†my

and the norm becomes(x,x) = x∗imijxj = x†mx (1.67)

representing x as a one column matrix, x† is a one row matrix with the coordinates conjugated. The quantities ofthe form x†Ay, with A hermitian, are called hermitian forms. If additionally we impose that x†Ax ≥ 0, we have apositive definite hermitian form4.

Gram-Schmidt process for orthonormalization of linearly independent sets

From the previous discussion, it is very clear that complete orthonormal sets posses many advantages withrespect to other sets of linearly independent vectors. It leads us to study the possibility of finding an orthonormal setfrom a given set of linearly independent vectors in a Hilbert space. The so-called Gram-Schmidt orthonormalizationprocess starts from an arbitrary set of independent vectors x1,x2, ..,xn, ... on H and exhibits a recipe to constructa corresponding orthonormal set u1,u2, ..,un, ... with the property that for each n the vector subspace spannedby u1,u2, ..,un is the same as the one spanned by x1,x2, ..,xn.

The gist of the procedure is based on Eqs. (1.24, 1.63). We start by normalizing the vector x1

u1 =x1

‖x1‖

now we substract from x2 its component along u1 to obtain x2 − (u1,x2)u1 and normalized it

u2 =x2 − (u1,x2)u1

‖x2 − (u1,x2)u1‖

it should be emphasized that x2 is not a scalar multiple of x1 so that the denominator above is non-zero. It is clearthat u2 is a linear combination of x1,x2 and that x2 is a linear combination of u1,u2. Therefore, u1,u2 spans thesame subspace as x1,x2. The next step is to substract from x3 its components in the directions u1 and u2 to geta vector orthogonal to u1 and u2 according with Eq. (1.24). Then we normalize the result and find

u3 =x3 − (u1,x3)u1 − (u2,x3)u2

‖x3 − (u1,x3)u1 − (u2,x3)u2‖

once again u1,u2,u3 spans the same subspace as x1,x2,x3. Continuing this way we clearly obtain an orthonor-mal set u1,u2, ..,un, ... with the stated properties.

Many important orthonormal sets arise from sequences of simple functions over which we apply the Gram-Schmidt process

In the space L2 of square integrable functions associated with the interval [−1, 1], the functions xn (n = 0, 1, 2, ..)are linearly independent. Applying the Gram Schmidt procedure to this set we obtain the orthonormal set of theLegendre Polynomials.

4An inner product guarantees that the hermitian form constructed with the metric matrix are positive-definite. However, it is usualin relativity to define a pseudo-metric that leads to non positive definite hermitian forms. Observe that the metric tensor in relativityhas some negative diagonal elements which would be forbidden if they arose from an authentic inner product.

Page 38: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

38 CAPITULO 1. LINEAR OR VECTOR SPACES

In the space L2 of square integrable functions associated with the entire real line, the functions xne−x2/2 (n =

0, 1, 2, ..) are linearly independent. Applying the Gram Schmidt procedure to this set we obtain the normalizedHermite functions.

In the space L2 associated with the interval [0,+∞), the functions xne−x (n = 0, 1, 2, ..) are linearly independent.Orthonormalizing it we obtain the normalized Laguerre functions.

Each of these orthonormal sets described above can be shown to be complete in their corresponding Hilbertspaces.

1.16.1. Linear operators in finite dimensional Hilbert spaces

First of all let us see how to construct the matrix representation of a linear operator by making profit of theinner product. Eq. (1.48) shows us how to construct the matrix representation of T in a given basis by applying theoperator to each element ui of such a basis

Tui = ujTji ⇒ (uk, Tui) = (uk,ujTji)

⇒ (uk, Tui) = Tjimkj

if the basis is orthonormal then mkj = δkj and

Tki = (uk, Tui) (1.68)

Eq. (1.68) gives the way to construct an element of the matrix representative of an operator T on H through theinner product and using an orthonormal basis.

Now we turn to the problem of finding a relation between the matrix representative of an operator and thematrix representative of its adjoint. If we have a linear operator T on a Hilbert space, another operator called itsadjoint and denoted as T † exists such that

(Tx,y) =(x, T †y

)∀x,y ∈ V

the matrix representative of T † has a rather simple relation with the matrix representative of T when an orthonormalbasis is used

(T (xiui) , ykuk) = (xiT (ui) , ykuk) = x∗i yk (Tui, uk)

and using (1.48) we findx∗i yk (ujTji, uk) = x∗i ykT

∗jiδjk = x∗i ykT

∗ki = x∗i T

∗ikyk

on the other hand we have (x, T †y

)= x∗i

(T †)ikyk

and taking into account that x and y are arbitrary, we have(T †)ik

= T ∗ik ⇒ T† = T∗ (1.69)

and so the matrix representative of T † is the conjugate transposed of the matrix representative of T . Once again, it isimportant to emphasize that it is only valid in an orthonormal basis, it can easily be proved that for an arbitrary basisdescribed by the metric matrix m, the matrix representation of T † is m−1T∗m. Remembering that an operatoris hermitian or self-adjoint if it coincides with its adjoint operator (T = T †) i.e. (Tx,y) = (x, Ty) , ∀x,y ∈ V,we conclude that in an orthonormal basis, hermitian operators are represented by hermitian matrices.

In particular, the form to calculate the norm described in (1.65), is usually taken for granted and is easy toforget that it only applies in orthonormal bases as we can see from (1.67). This is because the coordinates of avector with respect to vi are not given by Fourier coefficients of the form described in Eq. (1.27)

Now assume that we go from an orthonormal basis ui into another orthonormal basis u′i. We know from theorem

1.42 that a linear operator is unitary if and only if it transforms a complete orthonormal set into another completeorthonormal set, then if A is a unitary operator we have

δij = (Aui, Auj) =(u′i,u

′j

)= (ukaki,umamj) = a∗kiamj (uk,um) = a∗kiamjδkm

δij = a∗kiakj = a∗ikakj

Page 39: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.17. DETERMINANTS AND TRACES 39

so the matrix of transformation from ui into u′i accomplishes

A†A = 1

now, if we demand for the matrix to be non-singular it must have a unique inverse such that

A†A = AA† = 1

therefore a matrix that transform an orthonormal basis into another orthonormal basis must satisfy

A† = A−1

by theorem 1.51 these matrices are associated with unitary operators as long as we use an orthonormal basis, thusit is natural to call them unitary matrices.

1.17. Determinants and traces

A very important property of any matrix is its determinant denoted by |A| and is a real or complex numberassociated with the matrix. Its construction was primarily motivated by the study of simultaneous linear equations.We assume that the reader is familiarized with the concept and the calculation of this quantity. We have mentionedthat a matrix admits an inverse if and only if its determinant is non-null. This is because the inverse of a matrixA depends on |A|−1. The determinant of the transpose coincides with the determinant of the matrix

∣∣∣A∣∣∣ = |A| (1.70)

a for the conjugate matrix (in which we conjugate each of its elements) we get

|A∗| = |A|∗ (1.71)

Additionally it can be demostrated that the determinant of the product is the product of the determinants

|AB| = |A| · |B| (1.72)

and since the determinant of the identity is 1 we get

1 = |1| =∣∣AA−1

∣∣ = |A| ·∣∣A−1

∣∣

so that ∣∣A−1∣∣ = |A|−1 (1.73)

if any row or column is multiplied by a scalar α, the determinant is also multiplied by the scalar. For example inthree dimensions

∣∣∣∣∣∣

α a11 α a12 α a13

a21 a22 a23

a31 a32 a33

∣∣∣∣∣∣=

∣∣∣∣∣∣

a11 α a12 a13

a21 α a22 a23

a31 α a32 a33

∣∣∣∣∣∣= α

∣∣∣∣∣∣

a11 a12 a13

a21 a22 a23

a31 a32 a33

∣∣∣∣∣∣

(1.74)

so that if we multiply an n× n matrix by a scalar, the determinant is

|αA| = αn |A| (1.75)

in particular

|−A| = (−1)n |A| (1.76)

another important property is the trace of the matrix defined as the sum of its diagonal elements

TrA = aii (1.77)

Page 40: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

40 CAPITULO 1. LINEAR OR VECTOR SPACES

we emphasize the sum over repeated indices. We prove that

Tr [AB] = Tr [BA] (1.78)

in this way

Tr [AB] = (AB)ii = aikbki = bkiaik = (BA)kk = Tr [BA]

it is important to see that the trace is cyclic invariant, i.e.

Tr[A(1)A(2) . . .A(n−2)A(n−1)A(n)

]= Tr

[A(n)A(1)A(2) . . .A(n−2)A(n−1)

]

= Tr[A(n−1)A(n)A(1)A(2) . . .A(n−2)

](1.79)

and so on. To prove it, we define

B ≡ A(1)A(2) . . .A(n−1)

so that

Tr[A(1)A(2) . . .A(n−2)A(n−1)A(n)

]= Tr

[BA(n)

]= Tr

[A(n)B

]= Tr

[A(n)A(1)A(2) . . .A(n−2)A(n−1)

]

and taking into account that the indices (1) , (2) , ... are dumb, any cyclic change is posible. It worths saying thatproperty (1.78) does not mean that the matrices can be commuted to calculate the trace, for instance for three ormore matrices the trace is not the same for any order of the matrices, only cyclic changes are possible. In that sense,we should interpret (1.78) as a cyclic change and not as a commutation.

But the most important properties of the traces and determinants is that they are invariant under a similaritytransformation

∣∣A′∣∣ =∣∣BAB−1

∣∣ = |B| · |A| ·∣∣B−1

∣∣ = |B| · |A| · |B|−1

⇒∣∣A′∣∣ = |A|

where we have used (1.72) and (1.73).

Now for the invariance of the trace

Tr[A′] = Tr

[BAB−1

]=

n∑

i=1

(BAB−1

)ii

=∑

ikl

bikaklbli =∑

ikl

blibikakl

=∑

kl

δklakl =∑

k

akk = TrA

alternatively we can see it by using the cyclic invariance of the trace(see Eq. 1.79), such that

Tr[A′] = Tr

[BAB−1

]= Tr

[B−1BA

]= TrA

the invariance of determinants and traces under similarity transformations are facts of major importance becauseall representations of a given linear transformation are related each other by similarity transformations. It meansthat determinants and traces are intrinsic quantities that can be attributed to the linear trasnformations thus

Definition 1.28 We define the trace and the determinant of a given linear transformation of V into itself bycalculating the trace and determinant of the matrix representative of the linear transformation in any basis.

1.18. Rectangular matrices

A rectangular matrix is an arrangement of numbers consisting of m rows and n columns. In that case we saythat the matrix has dimensions m× n. The elements of such a matrix will be of the form

(A)ik = aik ; i = 1, . . . ,m ; k = 1, . . . , n

Page 41: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.19. THE EIGENVALUE PROBLEM 41

the transpose of this matrix would have dimensions n ×m. A column vector arrangement (from now on, we shallcall it simply a “vector”, though it is not neccesarily a vector in all the sense of the word) is a rectangular matrixof dimension m× 1, its transpose (a row “vector”) is a rectangular matrix of dimensions 1 ×m.

Now, it would be desirable to extrapolate the algorithm of square matrices composition to calculate products ofrectangular matrices

cij ≡ aikbkj

It is observed that this extrapolation of the matrix product to the case of rectangular matrices C = AB, can bedefined consistently only if the number of columns of A coincides with the number of rows of B.

AB = C if A ≡ Am×n and B ≡ Bn×d ⇒ Cm×d

In particular, the product of a column vector (m × 1 matrix) with a m × m matrix in the form xA cannot bedefined. Nevertheless, the product of the transpose of the vector (row vector) and the matrix A in the form xAcan be defined. In a similar fashion, the product Ax cannot be defined but Ax can. From these considerations thequantities Ax and xA correspond to a new column vector and a new row vector respectively.

From the dimensions of the rectangular matrices we see that

Am×n ⇒ An×m and Bn×d ⇒ Bd×n

and the product AB is defined. However, their transposes can only be multiplied in the opposite order, i.e. in theorder BA. Indeed, it is easy to prove that, as in the case of square matrices, the transpose of a product is theproduct of the transpose of each matrix in the product, but with the product in the opposite order. Applying thisproperty it can be seen that

(Ax) = xA ; (xA) = Ax

where we have taken into account that the transpose of the transpose is the original matrix.

1.19. The eigenvalue problem

If T is a linear transformation on a vector space of finite dimension n, the simplest thing that the lineartransformation can do to a vector is to produce a “dilation” or “contraction” on it, eventually changing the “sense”of the “arrow” but keeping its “direction”. In algebraic words, certain vectors can be transformed into a scalarmultiple of itself. If x is a vector in H this operation is given by

Tx = λx (1.80)

a non-zero vector x such that Eq. (1.80) holds, is called an eigenvector of T , and the corresponding scalar λ iscalled an eigenvalue of T . Each eigenvalue has one or more eigenvectors associated with it and to each eigenvectorcorresponds a unique eigenvalue.

Let us assume for a moment that the set of eigenvalues for a given T is non-empty. For a given λ consider the

set M of all its eigenvectors together with the vector 0 (which is not an eigenvector), we denote this vectors as x(λ)i .

M is a linear subspace of H, we see it by taking an arbitrary linear combination of vectors in M

T(αix

(λ)i

)= αiT

(x

(λ)i

)= αiλx

(λ)i = λ

(αix

(λ)i

)⇒

T(αix

(λ)i

)= λ

(αix

(λ)i

)

such that a linear combination is also an eigenvector with the same eigenvalue. Indeed, for Hilbert spaces it canbe shown that M is a closed vector subspace of H. As any vector space, M has many basis and if H is finitedimensional, complete orthonormal sets are basis. The dimension of M is thus the maximum number of linearlyindependent eigenvectors associated with λ. M is called the vector eigenspace generated by the eigenvalue λ. Thisdiscussion induces the following

Definition 1.29 A given eigenvalue λ in Eq. (1.80) is called n−fold degenerate if n is the dimension of theeigenspace M of H generated by λ. In other words, n is the maximum number of linearly independent eigenvectorsof λ. If n = 1 we say that λ is non-degenerate.

Page 42: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

42 CAPITULO 1. LINEAR OR VECTOR SPACES

Even for non-degenerate eigenvalues we always have an infinite number of eigenvectors, for if x(λ) is an eigen-vector, then αx(λ) is also an eigenvector for any scalar α. Eq. (1.80) can be written equivalently as

(T − λI)x = 0 (1.81)

we return to the problem of the existence of eigenvalues, the operator T on C∞ given by

T x1, x2, ... = 0, x1, x2, ...is an operator on a Hilbert space that has no eigenvalues. We confront then the problem of characterizing the typeof operators that admit eigenvalues. In the finite dimensional case, we shall see that the theory of representationsand the fundamental theorem of algebra ensures the existence of eigenvalues for an arbitrary operator.

1.19.1. Matrix representative of the eigenvalue problem

The one to one correspondence between matrices and operators in the finite dimensional case permits to makea matrix representation of the eigenvalue equation (1.80). Let T be the n× n matrix associated with the operatorT and x the column vector representative of x (an n× 1 matrix). Eq. (1.80) is written as

Tx = λx (1.82)

which is the eigenvalue equation associated with the matrix. The idea is trying to solve for the eigenvalues andeigenvectors in a given representation. The values λ are in general complex. According with our previous discussionthe eigenvalue is the “dilatation”or “contraction” factor, if it is a negative real number it “inverts the sense of thearrow”. Let us rewrite the eigenvalue equation as

(T− λ1)x = 0 (1.83)

for simplicity we shall use n = 3 but the arguments are valid for arbitrary finite dimensions. In three dimensionsthe explicit form of (1.83) becomes

(T11 − λ)X1 + T12X2 + T13X3 = 0

T21X1 + (T22 − λ)X2 + T23X3 = 0

T31X1 + T32X2 + (T33 − λ)X3 = 0 (1.84)

This set of homogeneous equations for X1, X2, X3 has non trivial solution only if the determinant of the system isnull, therefore

|T− λ1| =

∣∣∣∣∣∣

T11 − λ T12 T13

T21 T22 − λ T23

T31 T32 T33 − λ

∣∣∣∣∣∣= 0 (1.85)

this condition is known as the secular or characteristic equation of the matrix. The variables to be found arethe eigenvalues λ associated with the matrix. It worths saying that even if non-trivial solutions exist, the set ofhomogeneous equations (1.84) do not give us definite values for all the components of the eigenvectors but only forthe quotient among these components. This can be understood either from algebraic or geometric arguments. Fromthe algebraic point of view, it is related with the fact that the product of the eigenvector x with any scalar is also aneigenvector, this can be seen inmediately from (1.83)5. Geometrically, this implies that only the “direction” of theeigenvector is determined but not its “length” neither its “sense”. This is particularly apparent in three dimensions.Since T represents a linear transformation, it is clear that if T preserves the direction of x i.e. Tx = λx it alsopreserves the “direction” of the vector αx for α arbitrary.

When the determinant (1.85) is expanded, we observe that the solution of the secular equation reduces to findingthe roots of a polynomial of n degree. Appealing to the fundamental theorem of algebra we always have exactly ncomplex roots, some of them could be repeated so that we could have fewer than n distinct roots. In general we canconstruct no more than n linearly independent vectors xk each one associated with an eigenvalue λk. By now, theset of eigenvalues are associated to a matrix, but in order to associate it to its corresponding operator, we shouldbe sure that the set of eigenvalues is the same for any representation of the operator i.e. that all equivalent matriceshave the same set of eigenvalues

5Alternatively, this can be seen form the fact that the secular equation only has non-trivial solution when one or more of the equationsis linearly dependent with the others. In such a case there are more variables than equations and hence an infinite number of solutions.

Page 43: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.19. THE EIGENVALUE PROBLEM 43

Theorem 1.53 If two n× n matrices are equivalent i.e. T ′ = STS−1 then both have the same set of eigenvalues.

In summary, the fundamental theorem of Algebra together with the intrinsic meaning of the set of eigenvalues,solves the problem of the existence of eigenvalues for linear transformations on finite-dimensional vector spaces.

Definition 1.30 The set of eigenvalues of T is called its spectrum and is denoted by σ (T ).

Theorem 1.54 If T is an arbitrary linear transformation on a finite dimensional complex vector space, the spectrumof T constitute a non-empty finite subset of the complex plane. The number of elements in this subset does not exceedthe dimension n of the space.

Some other important theorems related with the set of eigenvalues are the following

Theorem 1.55 T is singular ⇔ 0 ∈ σ (T ).

Theorem 1.56 If T is non-singular, then λ ∈ σ (T ) ⇔ λ−1 ∈ σ(T−1

)

More information about the spectral resolution of some types of operators in a Hilbert space will be given bymeans of the spectral theorem. By now, we turn to the problem of the sets of eigenvectors and its relation with thecanonical problem of matrices.

1.19.2. Eigenvectors and the canonical problem of matrices

Since we can have many representations of a given operator by changing basis, many matrix representativescan be constructed. It is natural to wonder whether it is posible to choose the basis in such a way that the matrixrepresentative is as simple as possible. In practice, the simplest matrices are diagonal matrices i.e. matrices forwhich Tij = 0 for i 6= j. Thus, we are looking for a basis under which the matrix representative of a given operatorT is diagonal. Starting with a given basis ui we obtain a matrix representative of T (denoted by T), we wonderwhether there exists another basis u′

i for which the matrix representative T′ of T is diagonal. From Eqs. (1.53,1.61) we see that T and T′ are related by a similarity transformation that also gives us the transformation amongthe bases

u′ = Au ; T′ = A−1TA (1.86)

We shall see that for finite dimensional matrices, the canonical problem of matrices is intimately related withthe structure of its eigenvectors. Let us consider the representation Xk of the eigenvectors of T with respect to theoriginal basis ui. We denote the i−th coordinate of the k−th eigenvector in the form Xik (with respect to theoriginal basis). We are able to settle an square arrangement with this eigenvectors, putting them aside as columnvectors. In three dimensions, such an arrangement has the form

X ≡ (X1 X2 X3) =

X11 X12 X13

X21 X22 X23

X31 X32 X33

(1.87)

Eqs. (1.83) are written for each eigenvalue λk and its corresponding eigenvector Xk in the form

(T− λk1)Xk = 0 ⇒ TXk = λkXk no sum over k (1.88)

writing Eqs. (1.88) in components with respect to the basis ui we get (for n dimensions)

n∑

j=1

TijXjk = λkXik ⇒

n∑

j=1

TijXjk =

n∑

j=1

Xijδjkλk (1.89)

Page 44: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

44 CAPITULO 1. LINEAR OR VECTOR SPACES

in the two previous equations there is no sum over the repeated index k. The Xjk element is the j−th component ofthe Xk vector. Now, the quantity δjkλk can be associated with a diagonal matrix, in three dimensions this matrixis written as

λ ≡

λ1 0 00 λ2 00 0 λ3

(1.90)

in matrix form Eq. (1.89) reads

TX = Xλ

multiplying on left by X−1 we find

X−1TX = λ (1.91)

it corresponds to a similarity transformation acting on T. Note that the matrix X built from the eigenvectors is thetransformation matrix (comparing with 1.86 we have X ≡ A). We see then that matrix T is diagonalized by X bymeans of a similarity transformation and the elements of the diagonal correspond to the eigenvalues (λk associatedwith the column vector Xk of the matrix X in Eq. 1.87). When there are some degenerate eigenvalues i.e. someof them acquire the same value, it is not always possible to diagonalize the matrix T. It is because in that case,the eigenvectors that form the matrix X are not necessarily linearly independent. If any given column vector of thematrix is linearly dependent with the others, the determinant of X is zero and X−1 does not exist.

On the other hand, when diagonalization is possible, the determinant and the trace of T can be calculated takinginto account that such quantities are invariant under a similarity transformation, therefore

detT = det[X−1TX

]= detλ = λ1λ2 . . . λn (1.92)

TrT = Tr[X−1TX

]= Trλ = λ1 + λ2 + . . .+ λn (1.93)

so that the determinant and the trace of a diagonalizable matrix are simply the product and sum of its eigenvaluesrespectively.

In summary, a canonical form of a given matrix can be obtained as long as the eigenvectors of the matrix forma basis, the question is now open for the conditions for the eigenvectors to form a basis, and this is part of theprogram of the spectral theorem.

1.20. Normal operators and the spectral theorem

Let T be an operator on a finite-dimensional Hilbert space H. By theorem 1.54 the spectrum σ (T ) is a non-empty finite set of complex numbers with cardinality less than or equal to the dimension n of H. Let λ1, .., λm bethe set of distinct eigenvalues; let M1, .., Mm be their corresponding eigenspaces; and let P1, .., Pm be the projectionson these eigenspaces. The spectral theorem is the assertion that the following three statements are equivalent toone another

I) The M ′is are pairwise orthogonal and H = M1 ⊕ ...⊕.Mm

II) The P ′i s are pairwise orthogonal, I =

∑mi=1 Pi, and T =

∑mi=1 λiPi.

III) T is normal.

The assertion I) means that any vector x ∈ H can be expressed uniquely in the form

x = x1 + ..+ xm ; xi ∈Mi ; (xi, xj) = 0 for i 6= j (1.94)

applying T on both sides and using linearity

Tx = Tx1 + ..+ Txm = λ1x1 + ..+ λmxm (1.95)

this shows the action of T on each element of H in an apparent pattern from the geometrical point of view. It isconvenient to write it in terms of projections on each Mi. Taking into account that Mj ⊆ M⊥

i for each i and forevery j 6= i we obtain from Eq. (1.94) that

Pix = xi

Page 45: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.20. NORMAL OPERATORS AND THE SPECTRAL THEOREM 45

from which it follows

Ix = x = x1 + ..+ xm = P1x+ ..+ Pmx

Ix = (P1 + ..+ Pm)x ; ∀x ∈ H

therefore

I =m∑

i=1

Pi (1.96)

and relation (1.95) gives

Tx = λ1x1 + ..+ λmxm = λ1P1x+ ..+ λmPmx

Tx = (λ1P1 + ..+ λmPm)x ; ∀x ∈ H

hence

T =m∑

i=1

λiPi (1.97)

Eq. (1.97) is called the spectral resolution of the operator T . In this resolution it is to be understood that all the λ ′is

are distinct and that the P ′i s are non-zero projections which are pairwise orthogonal and satisfy condition (1.96).

It can be shown that the spectral resolution is unique when it exists.

Now, we look for the conditions that the operator must satisfies to be decomposed as Eq. (1.97). From Eq. (1.97)we see that

T † = λ∗1P1 + . . . + λ∗mPm (1.98)

and multiplying (1.97) with (1.98) and using the fact that the P ′is are pairwise orthogonal we have

TT † =

(m∑

i=1

λiPi

)(m∑

k=1

λ∗kPk

)=

m∑

i=1

m∑

k=1

λiλ∗kPiPk =

m∑

i=1

m∑

k=1

λiλ∗kP

2i δik

TT † =

m∑

k=1

|λk|2 Pk (1.99)

and multiplying in the opposite order we obtain the same result

T †T =m∑

k=1

|λk|2 Pk (1.100)

from which we see that [T, T †

]= 0

and the operator must be normal. We have proved that I)→II)→III). To complete the proof we should show thatIII)→I) i.e. that every normal operator T on H satisfies conditions I).

This task is accomplished by the following chain of theorems

Theorem 1.57 If T is normal, x is an eigenvector of T with eigenvalue λ ⇔ x is an eigenvector of T † witheigenvalue λ∗.

Theorem 1.58 If T is normal the M ′is are pairwise orthogonal

Theorem 1.59 If T is normal, each Mi reduces T .

Theorem 1.60 If T is normal, the M ′is span H.

For most of applications theorem 1.58 is rewritten as

Page 46: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

46 CAPITULO 1. LINEAR OR VECTOR SPACES

Theorem 1.61 If T is normal, two eigenvectors of T corresponding to different eigenvalues are orthogonal. Inparticular this is valid for self-adjoint and unitary operators.

Assume that T = T †, since for a given eigenvector x there is a unique eigenvalue λ we see from theorem 1.57that λ = λ∗ so the corresponding eigenvalues are real. Now assume for a normal operator T that σ (T ) is a subsetof the real line, using the spectral resolution of T † Eq. (1.98) we find

T † = λ∗1P1 + . . .+ λ∗mPm = λ1P1 + . . .+ λmPm = T

we have the following

Theorem 1.62 Let T be a normal operator on a Hilbert space of finite dimension H with distinct eigenvaluesλ1, .., λm, then T is self-adjoint ⇔each λi is real.

It is important to emphasize that the hypothesis of real eigenvalues leads to the self-adjointness of the operatoronly if normality is part of the hypothesis (because of the use of the spectral thoerem). It does not discard thepossibility of having non-normal operators with real spectrum, in that case such operators would not be self-adjoint.In addition, it worths remembering that self-adjoint operators where constructed as the analogous of “the real linesubset” in the algebra of operators. So the fact that its eigenvalues are all real is a quite expected result.

An special type of self-adjoint operators are the positive operators for which

(x, Tx) ≥ 0 ∀x ∈ H (1.101)

applying the spectral resolution of T on xi ∈Mi, we have

Txi =

m∑

k=1

λkPkxi =

m∑

k=1

λkxiδik = λixi

and using it in Eq. (1.101) we find

(xi, Txi) = (xi, λixi) = λi (xi, xi) ≥ 0 no sum over i

λi ‖xi‖2 ≥ 0 ⇒ λi ≥ 0

on the other hand, by assuming that a normal operator T has a real non-negative spectrum we obtain

(x, Tx) =

(x,

n∑

i=1

λiPix

)=

(n∑

k=1

xk,

n∑

i=1

λixi

)=

n∑

k=1

n∑

i=1

λi (xk, xi) =

n∑

k=1

n∑

i=1

λiδki

(x, Tx) =

n∑

k=1

λk ≥ 0

we see then that

Theorem 1.63 Let T be a normal operator on a Hilbert space of finite dimension H with distinct eigenvaluesλ1, .., λm, then T is positive ⇔ λi ≥ 0.

Now, for a normal operator T , a necessary and sufficient condition for T to be unitary is that T †T = I (in finitedimension is not necessary to show that TT † = I) using Eq. (1.99) the condition for unitarity is

T †T = I ⇒m∑

k=1

|λk|2 Pk = I ⇒m∑

k=1

|λk|2 Pk =m∑

k=1

Pk

multiplying by Pi and using the pairwise orthogonality of projectors

m∑

k=1

|λk|2 PkPi =

m∑

k=1

PkPi ⇒ |λi|2 P 2i = P 2

i ⇒ |λi|2 Pi = Pi

so that |λi| = 1. This procedure also shows that if T is a normal operator in which |λi| = 1 for each i, then TT † = Iand T is unitary, then we have

Page 47: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.20. NORMAL OPERATORS AND THE SPECTRAL THEOREM 47

Theorem 1.64 Let T be a normal operator on a Hilbert space of finite dimension H with distinct eigenvaluesλ1, .., λm, then T is unitary ⇔ |λi| = 1 for each i.

Now, remembering that unitary operators where constructed as the analogous of “the unitary circle subset” inthe algebra of operators, the fact that its eigenvalues lie in the unitary circle of the complex plane is pretty natural.

Now we are prepared to discuss the canonical problem for normal matrices. We denote ni the dimension of eacheigenspace Mi it is clear that

n1 + n2 + ...+ nm = n

Mi contains ni linearly independent vectorsxi1, .., x

ini

that can be orthonormalized by a Gram Schmidt process

to sayui1, .., u

ini

. If we do this for each Mi the set form by the union of these orthonormal sets

u ≡ ∪mi=1

ui1, .., u

ini

is clearly an orthonormal set because all vectors corresponding with different M ′is are orthogonal according to

theorem 1.58. In addition, since the M ′is span H according to theorem 1.60 this orthonormal set is complete and

therefore a basis. Therefore, for any normal operator T of H we can always form an orthonormal complete set ofeigenvectors. If we use this orthonormal complete eigenvectors to form the matrix of diagonalization Eq. (1.87) wesee that the matrix obtained is a unitary matrix, it is clear that for this matrices the inverse always exists sinceλi 6= 0 for each i and therefore the diagonalization can be carried out. Then we have the following

Theorem 1.65 The diagonalization of a normal matrix T can be performed by a similarity transformation of theform T′ = UTU−1 where U is a unitary matrix.

This is of particular interest because it means that given a matrix representative of T in a basis consistingof a complete orthonormal set, there exists another complete orthonormal set for which the matrix representativeacquires its canonical form. Further, it is easy to see that the canonical form of a normal matrix is given by

λ1

. . .

λ1

λ2

. . .

λ2

. . .

λm. . .

λm

where the elements out of the diagonal are zero and each λi is repeated ni times (λi is ni−fold degenerate). It iseasily seen that the matrix representation of Pi in this orthonormal basis is

P1 =

(1n1×n1 0

0 0

); P2 =

0n1×n1 0 00 1n2×n2 00 0 0

; Pm =

(0 00 1nm×nm

)

and the matrix representation of the spectral decomposition becomes clear.

1.20.1. A qualitative discussion of the spectral theorem in infinite dimensional Hilbert spaces

The rigorous discussion of the infinite dimensional case for the spectral theorem is out of the scope of this survey.We shall only speak qualitatively about the difficulties that arises when we go to infinite dimension. For simplicitywe assume that A is a self-adjoint operator, the spectral resolution is given by

A =

m∑

i=1

λiPi

Page 48: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

48 CAPITULO 1. LINEAR OR VECTOR SPACES

since the eigenvalues are real we can order them in a natural way in the form λ1 < λ2 < .. < λm and we use theP ′is to define new projections

Pλ0 = 0

Pλ1 = P1

Pλ2 = P1 + P2

....

Pλm = P1 + ...+ Pm = I

the spectral decomposition of the self-adjoint operator A can be written as

A = λ1P1 + λ2P2 + ...+ λmPm

= λ1 (Pλ1 − Pλ0) + λ2 (Pλ2 − Pλ1) + ...+ λm(Pλm − Pλm−1

)

A =m∑

i=1

λi(Pλi − Pλi−1

)

if we define∆Pλi ≡ Pλi − Pλi−1

we can rewrite the decomposition of A as

A =

m∑

i=1

λi∆Pλi

which suggest an integral representation

A =

∫λ dPλ (1.102)

in this form, the spectral decomposition of a self-adjoint operator is valid for infinite dimensional Hilbert spaces.For normal operators we have a similar pattern

N =

∫λ dPλ (1.103)

The first problem to carry out this generalization is that an operator on H need not have eigenvalues at all. Inthis general case the spectrum of T is defined as

σ (T ) = λ : T − λI is singular

when H is finite dimensional, σ (T ) consists entirely of eigenvalues. In the infinite dimensional case we only can saythat σ (T ) is non-empty, closed and bounded. Once this difficulty is overcome we should give a precise meaning tothe integrals (1.102, 1.103) and prove the validity of those relations. We shall use this decomposition in a practicalform without any attempt of rigorous proof.

It worths emphasizing that the existence of eigenvalues in the finite dimensional case came from the fundamentaltheorem of algebra, which in turn came from the fact that the characteristic equation of a finite dimensional matrixis a polynomial equation. An extension to infinite dimension clearly does not lead to a polynomial equation.

1.21. The concept of “hyperbasis”

Suppose that the vector space that concerns us is V , which is a proper subspace of a bigger vector space W .As any vector space, W has a basis wi that generates any vector in W by linear combinations. It is obvious thatany vector of V must be generated through linear combinations of wi. However, there are at least two reasonsfor which wi is not a basis for V (a) at least one element of the set wi is not in V , and one of the conditionsfor a given set S to be a basis of a given vector space V is that S ⊆ V . (b) given a basis vi of V we have thatwi and vi does not have in general the same cardinality, and we know that different bases must have the samecardinality.

Page 49: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.22. DEFINITION OF AN OBSERVABLE 49

Let us see a simple example: let us use an orthonormal basis of R3 given by

u1 ≡ 1√3

(1, 1, 1) ; u2 ≡ 1√26

(4,−1,−3) ; u3 =1√78

(−2, 7,−5)

to generate all vector of the XY plane. The coordinates of ui are written with respect to the ordinary cartesiancoordinates. Since these vectors generate R3 it is clear that they generate the XY plane which is a proper subset ofR3. Notwithstanding, none of the vectors ui lies in the XY plane, all the elements of this “hyperbasis” are outsideof the vector space we pretend to expand. Further, any basis of XY has two elements while our hyperbasis has threeelements. Therefore, the cardinality of the hyperbasis is higher than the dimension of the space that we shall study.For our purposes however, what really matters is that any vector in XY can be generated as a linear combination ofu1,u2,u3. For instance, the vector x of the XY plane represented by (3,−2, 0) in ordinary cartesian coordinates,is represented in this hyperbasis as

x = (u1,x) u1 + (u2,x)u2 + (u3,x)u3

=

[1√3

(1, 1, 1) · (3,−2, 0)

]u1 +

[1√26

(4,−1,−3) · (3,−2, 0)

]u2 +

+

[1√78

(−2, 7,−5) · (3,−2, 0)

]u3

x =1√3u1 +

14√26

u2 −20√78

u3

note that in this case an element of the plane is given by a triple with respect to the hyperbasis, in this case

x =

(1√3,

14√26,− 20√

78

)

in quantum mechanics we shall use a similar strategy but for orthogonal dimensions instead of dimensions. TheHilbert space L2 that concerns us is of infinite countable orthogonal dimension, but we shall use frequently orthogonalbasis of a bigger space with infinite continuous orthogonal dimension. Therefore, we shall expand the vectors of L2

in terms of orthogonal hyperbases vx with continuous cardinality. In general, the elements vx of the bigger spacewill be outside of L2. However, as before a fourier expansion (instead of a linear combination) will be possible withthis hyperbasis.

Notice that for any cardinality of the orthogonal dimension of a Hilbert space, we see that the Fourier expansionEq. (1.27) is always a series. This is by virtue of theorem 1.18 that says that the non-zero fourier coefficients ofany vector are always countable, even if the complete orthonormal set belongs to a higher cardinality. However,such a theorem is valid for complete orthonormal sets in which all the elements of the set lies in the space underconsideration. If we use a hyper orthonormal complete set the elements of this hyper orthogonal basis do not lieon the space that we are expanding, thus theorem 1.18 does not necessarily hold. Consequently, when continuoushyper orthonormal basis are used, we shall obtain integrals instead of series in our Fourier expansions. Does it makeany sense to replace series by integrals? it suffices to observe that it is in general easier to solve integrals in a closedform than series in a closed form.

1.22. Definition of an observable

Measurements in Physics are always real numbers. In quantum mechanics, such measurements are related witheigenvalues of some operators on a Hilber space. It is then natural to associate measurements with eigenvalues ofself-adjoint operators since their spectra are always real.

For any finite-dimensional Hilbert space it is always possible to form a complete orthonormal set with theeigenvectors of a normal operator, and in particular with the eigenvectors of a self-adjoint operator. However, ininfinite dimensional Hilbert spaces this is not necessarily the case. Therefore, we establish the following

Definition 1.31 A given self-adjoint operator A on H is called an observable, if there exists a complete orthonormalset of eigenvectors of A.

Page 50: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

50 CAPITULO 1. LINEAR OR VECTOR SPACES

The following sets of theorems are of central importance in quantum mechanics

Theorem 1.66 If two operators A and B commute and if x is an eigenvector of A, then Bx is also an eigenvectorof A with the same eigenvalue. If λ is non-degenerate x is also an eigenvector of B. If λ is n−fold degenerate, theeigensubspace Mλ is invariant under B.

Since x is an eigenvector of A we have

Ax = λx⇒ BAx = λBx⇒ ABx = λBx

where we have used the fact that A and B commutes, hence

A (Bx) = λ (Bx)

which proves that Bx is an eigenvector of A with eigenvalue λ. Observe that if λ is non-degenerate all its eigenvectorsare “colinear” hence Bx must be colinear with x i.e. Bx = cx and x is also an eigenvector of B.

On the other hand, if λ is n−fold degenerate, we can only say that Bx lies in the n dimensional eigensubspaceMλ of A. In other words, if x ∈Mλ then Bx ∈Mλ

Another way to express the previous theorem is

Theorem 1.67 If two operators A and B commute, every eigensubspace of A is invariant under B.

Of course, the roles of A and B can be interchanged.

Theorem 1.68 If two normal operators A and B commute, and if x1, x2 are two eigenvectors of A with differenteigenvalues, then (x1, Bx2) = 0

By hypothesis we haveAx1 = λ1x1 ; Ax2 = λ2x2

but from theorem 1.66 Bx2 is an eigenvector of A with eigenvalue λ2. Now from theorem 1.61 since λ1 6= λ2 thenBx2 is orthogonal to x1 and the theorem is proved.

The previous theorems do not use the concept of observable, but the following one does

Theorem 1.69 Let A and B be two observables in a Hilbert space H. Then A and B commute⇔one can constructa complete orthonormal set in H with eigenvectors common to A and B.

Assume that A and B commute, we shall define the normalized eigenvectors of A as uin

Auin = λnuin ; i = 1, .., gn

where gn is the degree of degeneration of λn. For n 6= n′ the eigenvectors are orthogonal and for n = n′ and i 6= i′

we can always orthonormalized the vectors in each eigensubspace of A, so that

(uin, u

jk

)= δnkδij

let us write H as a decomposition of the eigenspaces of A (taking into account that A is an observable)

H = M1 ⊕M2 ⊕M3 ⊕ ...

there are two cases. For each one dimensional Mk (each non-degenerate λk) all vectors in Mk are “colinear” andthey are also eigenvectors of B.

In the other case, gp > 1 then Mp is gp dimensional. We can only say that Mp is invariant under B. Considerthe restriction of A and B to the subspace Mp. Since the vectors uip in Mp are eigenvectors of A, the restriction of

A to Mp has a matrix representative A(p)ij of the form

A(p)ij =

(vip, Av

jp

)=(vip, λpv

jp

)= λp

(vip, v

jp

)= λpδij

Page 51: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.23. COMPLETE SETS OF COMMUTING OBSERVABLES (C.S.C.O.) 51

thus the matrix representation of A(p) is λpI for any orthonormal set complete in Mp (not neccesarily the original).Now let us see the matrix representative of the restriction B (p) of B on Mp, writing this representation in ouroriginal orthonormal set

B(p)ij =

(uip, Bu

jp

)

since B is a self-adjoint operator this matrix is self-adjoint, and according to theorem 1.65 they can always bediagonalized by a unitary transformation, which in turn means that there exists an orthonormal set

vip

in Mp for

which the matrix representative of B(p) is diagonal, hence

B(p)ij =

(vip, Bv

jp

)= B

(p)i δij

which means that the new orthonormal set complete in Mp consists of eigenvectors of B

Bvip = B(p)i vip

and since Mp contains only eigenvectors of A, it is clear thatvip

is an orthonormal set complete in Mp thatare common eigenvectors of A and B. Proceeding in this way with all eigensubspaces of A with more than onedimension, we obtain a complete orthonormal set in H in which the elements of the set are common eigenvectors ofA and B.

It is important to emphasize that for a given Mp the orthonormal set chosen a priori does not in general consistof eigenvectors of B, but it is always possible to obtain another orthonormal set that are eigenvectors of B and bydefinition they are also eigenvectors of A.

Now let us prove that if A and B are observables with a complete orthonormal set of common eigenvectors thenthey commute. Let us denote the complete orthonormal set of common eigenvectors as uin,p then

ABuin,p = bpAuin,p = anbpu

in,p

BAuin,p = anBuin,p = anbpu

in,p

therefore[A,B] uin,p = 0

since uin,p form a complete orthonormal set, then [A,B] = 0.It is also very simple to show that if A and B are commuting observables with eigenvalues an and bp and with

common eigenvectors uin,p thenC = A+B

is also an observable with eigenvectors uin,p and eigenvalues cn,p = an + bp.

1.23. Complete sets of commuting observables (C.S.C.O.)

Consider an observable A and a complete orthonormal setuin

of the Hilbert space that consists of eigenvectorsof A. If none of the eigenvalues of A are degenerate then the eigenvalues determine the eigenvectors in a uniqueway (within multiplicative constant factors). All the eigensubspaces Mi are one-dimensional and the completeorthonormal set is simply denoted by un. This means that there is only one complete orthonormal set (exceptfor multiplicative phase factors) associated with the eigenvectors of the observable A. We say that A constitutes byitself a C.S.C.O.

On the other hand, if some eigenvalues of A are degenerate, specifying an is not enough to determine a completeorthonormal set for H because any orthonormal set in the eigensubspace Mn can be part of such a completeorthonormal set. Thus the complete orthonormal set determined by the eigenvectors of A is not unique and it isnot a C.S.C.O.

Now we add a second observable B that commutes with A, and construct a complete orthonormal set commonto A and B. By definition, A and B constitutes a C.S.C.O. if the complete orthonormal set common to both isunique (within constant phase factors for each of the vectors in the complete set). In other words, it means that anypair of eigenvalues an, bp determines the associated common normalized eigenvector uniquely, except for a phasefactor.

Page 52: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

52 CAPITULO 1. LINEAR OR VECTOR SPACES

In theorem 1.69 we constructed the complete orthonormal set common to A and B by solving the eigenvalueequation of B within each eigensubspace defined by A. For A and B to constitute a C.S.C.O. it is necessary andsufficient that within each Mn the gn eigenvalues of B be distinct6. In this case, since all eigenvectors vin in each

Mn have the same eigenvalue an of A, they will be distinguished by the gn distinct eigenvalues b(n)i associated with

these eigenvectors of B. Note that it is not necessary that the eigenvalues of B be non-degenerate, we can have two(or more) equal eigenvalues of B associated with two (or more) distinct eigensubspaces Mn and Mk of A. We onlyrequire not to have degeneration of the eigenvalues of B within a given eigensubspace Mn of A. Indeed, if B werenon-degenerate it would be a C.S.C.O. by itself.

On the other hand, if for at least one pair an, bp there exist two or more linearly independent eigenvectorscommon to A and B they are not a C.S.C.O.. Let us add a third observable C that commutes with both A and B,and proceeds as above. When to the pair an, bp corresponds only one eigenvector common to A and B, then it isautomatically an eigenvector of C as well. On the contrary, if the eigensubspace Mn,p is gn,p dimensional, we canconstruct within it, an orthonormal set of eigenvectors of C. Proceeding in this way with each Mn,p we can constructa complete orthonormal set with eigenvectors common to A,B,C. These three observables are a C.S.C.O. if thiscomplete orthonormal set is unique (except for multiplicative phase factors). Once again, if Mn,p has the eigenvectors

uin,p common to A and B this occurs if and only if all gn,p eigenvalues of C denoted as c(n,p)k are distinct. As before,

C can be degenerate, but as long as degenerate eigenvalues are not repeated within a single eigenspace Mn,p of Aand B. Therefore, a given triple of eigenvalues an, bp, ck of A,B,C has a unique common eigenvector within amultiplicative factor. If two or more linearly independent eigenvectors common to A,B,C can be constructed for agiven set an, bp, ck, we can add a fourth observable D that commute with those three operators and so on.

Definition 1.32 A set of observables A,B,C, .. is called a complete set of commuting observables (C.S.C.O.) if(i) All observables commute pairwise, (ii) specifying the set of eigenvalues an, bp, ck, .. of the observables determinesa unique (within phase factors) complete orthonormal set of eigenvectors common to all the observables.

An equivalent form is the following

Definition 1.33 A set of observables A,B,C, .. is called a complete set of commuting observables (C.S.C.O.) ifthere is a unique complete orthonormal set (within phase factors) of common eigenvectors.

It is obvious that if a given set is a C.S.C.O. we can add any observable that commutes with the observablesof the set and the new set is also a C.S.C.O. However, for most of our purposes we shall be interested in “minimalC.S.C.O.” in the sense that by removing any observable of the set, the new set is not complete.

If a given set A1, .., An of observables is a C.S.C.O., an eigenvector associated with a set ak1 , .., akn determinesa unique common normal eigenvector (within a phase factor) so it is natural to denote the vector as uak1 ,ak2 ,akn . Weshall see later that in quantum mechanics a global phase has no Physical information. Therefore, all normal vectorsassociated with ak1 , .., akn have the same Physical information, this fact enhance the qualification of “unique”for these vectors, although they are not unique from the mathematical point of view.

1.24. Some terminology concerning quantum mechanics

We have defined linear combinations as finite sums. A basis in a vector space is thus a set of linearly independentvectors for which any vector of the space can be written as a finite sum of elements of the basis (multiplied by theappropiate scalars). Notably, bases always exist even in an infinite-dimensional vector space. However, in practice itis not easy to find a basis in an infinite dimensional Hilbert space. In this case, it is more usual to utilize completeorthonormal sets, they make a work similar to basis in the sense that they generate any vector, but the differenceis that complete orthonormal sets expand a vector in a series (Fourier expansion) while bases do it in finite sums.

In quantum mechanics we call a basis to mean a complete orthonormal set, and the series expansion isusually call a linear combination. Since we never use basis in the mathematical sense, there is no confusion withthis terminology. Self-adjoint operators are usually called hermitian operators. The conjugate space H ∗ of H is

6If Mn is one dimensional then an eigenvector of A in Mn is automatically an eigenvector of B and it is clearly uniquely determined,except for multiplicative factors. Only the case in which Mn has more than one dimension is non-trivial.

Page 53: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.25. THE HILBERT SPACE L2 53

usually call the dual space of H. The vectors in our Hilbert space are called kets, while the correponding elementsin the dual space (the functionals) are called bras.

In addition the Hilbert space we work with, is a separable space so that its dimension is countable (countablyinfinite). We shall resort however to some hyperbases which are of continuous cardinality, the elements of thesehyperbases do not belong to our Hilbert space. Consequently, the elements of the hyperbasis will not be physicalstates, but we shall call them continuous basis. Nevertheless, they will be very useful for practical calculations.

In addition there will be a change of notation to facilitate the mathematical calculations, it is called Diracnotation

1.25. The Hilbert Space L2

We shall see later that the information of a quantum particle is described by a function of the space and timedenoted as ψ (r, t) and called the wave function. The quantity, |ψ (r, t)|2 dx dy dz will be interpreted as theprobability of finding at time t, the particle in a volume dx dy dz. Since the particle must be somewhere in thespace, we must demand that the integral over the whole volume must be equal to unity

∫dV |ψ (r, t)|2 = 1

the integration extends over all space. However, in certain cases we could assume that the particle is in a givenconfined volume and the integral will be restricted to such a volume.

The discussion above leads to the fact that the space of Physical states of one particle should be described bya square-integrable wave function. The state space is then the Hilbert space L2 of the square-integrable functionsin a given volume. For a system of several particles we will have a space with similar features, but by now we willconcentrate on the space that describes a single particle.

For several reasons we cannot specified in general the state space of a particle. First of all, several physicalconsiderations can lead us to the fact that the particl is confined to a certain bounded volume. For instance, inone dimension it is not the same the space of functions that are square integrable in the whole real line, as (say)the space of functions that are square integrable in a bounded interval. In other words, different regions of squareintegrability leads us to different L2 spaces. On the other hand, it is usual to demand as well as square integrability,that the functions accomplish additional features of regularity. For example, to be defined all along the interval, orto be continuous, derivable, etc. The specific conditions depend on the particular context, and they are required todefine the state space completely.

For example, it has no physical meaning to have a function that is discontinuous at a given point since noexperiment can measure a real phenomenon at scales below certain threshold. We could then be tempted to saythat we must demand the functions to be continuous. However, this is not necessarily the case since some non-physical functions could help us to figure out what is happening. Let us take some familiar examples in classicalmechanics, it is usual in electrostatics to assume the presence of a surface charge, which leads to a discontinuityin the electric field, in the real world a charge is distributed in a very thin but finite layer and the discontinuity isreplaced by a very slopy curve. Indeed, a surface charge is equivalent to an infinite volume density, but we have seenthat this assumption provides a simple picture of many electrostatic phenomena though it is not a real physicalstate. Classical waves represented by a single plane wave in optics are other good examples, since it is not possibleto have a real wave being totally monochromatic (a physical state is always a superposition of several plane waves),but many of the wave phenomena are easier to study with these non physical states, and indeed many real physicalphenomena such as the laws of geometric optics are predicted by using them.

In summary, depending on our purposes (and attitudes) we could demand to have only physical states or todecide to study some non-physical ones that are obtain when some physical parameters are settle at extreme values.Quantum mechanics is not the exception for this strategy, and our assumptions on the functions to work with,affects the definition of the Hilbert space of states that we should use as a framework.

Hence, given the volume V in which the particle can stay, we say that our space of states is a subspace of theHilbert space L2 of the square integrable functions in the volume V . We denote by z the subspace of states in whichz ⊆ L2. For this subspace to be a Hilbert space, it must be closed (for completeness to be maintained).

Page 54: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

54 CAPITULO 1. LINEAR OR VECTOR SPACES

1.25.1. The wave function space z

According to the discussion above, we only can say that our wave function space that describe our physicalstates is a closed subspace of L2 for a volume determined by our physical conditions. What really matters is to besure whether the additional conditions imposed to our functions keeps z as a closed vector space. For instance, if weassume continuity and/or derivability, it is easy to show that a finite linear combination preserves these conditions.Less evident is to ensure that a series preserves these conditions (for the subspace to be closed in L2), but we arenot be concern with this problem here, neither we shall discuss the aspects concerning the completeness of L2. Wethen limite ourselves to determine the vector space character of L2. Let ψ1, ψ2 ∈ L2, we show that

ψ (r) = λ1ψ1 (r) + λ2ψ2 (r)

is a square integrable function. For this, we expand |ψ (r)|2

|ψ (r)|2 = |λ1|2 |ψ1 (r)|2 + |λ2|2 |ψ2 (r)|2 + λ∗1λ2ψ∗1 (r)ψ2 (r) + λ1λ

∗2ψ1 (r)ψ∗

2 (r)

now for the last two terms we have

|λ∗1λ2ψ∗1 (r)ψ2 (r)| = |λ1λ

∗2ψ1 (r)ψ∗

2 (r)| ≤ |λ1| |λ2|[|ψ1 (r)|2 + |ψ2 (r)|2

]

hence|ψ (r)|2 ≤ |λ1|2 |ψ1 (r)|2 + |λ2|2 |ψ2 (r)|2 + 2 |λ1| |λ2|

[|ψ1 (r)|2 + |ψ2 (r)|2

]

and the integral of each of the functions on the right-hand side converges. Then the integral∫

|ψ (r)|2 dV

converges. So ψ is a square integrable function.The scalar product will be defined as

(ϕ,ψ) =

∫dV ϕ∗ (r)ψ (r)

it can be shown that this integral always converges if ϕ and ψ belong to L2. We should check that this definitionaccomplishes the properties of an inner product, the properties arise directly from the definition

(ϕ, λ1ψ1 + λ2ψ2) = λ1 (ϕ,ψ1) + λ2 (ϕ,ψ2) ; (λ1ϕ1 + λ2ϕ2, ψ) = λ∗1 (ϕ1, ψ) + λ∗2 (ϕ2, ψ)

(ϕ,ψ) = (ψ,ϕ)∗ ; (ψ,ψ) ≡ ‖ψ‖2 ≥ 0 and (ψ,ψ) = 0 ⇔ ψ = 0

let us mention some important linear oprators on functions ψ (r) ∈ z.The parity opeartor defined as

Πψ (x, y, z) = ψ (−x,−y,−z)the product operator X defined as

Xψ (x, y, z) = xψ (x, y, z)

and the differentiation operator with respect to x denoted as Dx

Dxψ (x, y, z) =∂ψ (x, y, z)

∂xit is important to notice that the operators X and Dx acting on a function ψ (r) ∈ z, can transform it into afunction that is not square integrable. Thus it is not an operator of z into z nor onto z. However, the non-physicalstates obtained are frequently useful for practical calculations.

The commutator of the product and differentiation operator is of central importance in quantum mechanics

[X,Dx]ψ (r) =

(x∂

∂x− ∂

∂xx

)ψ (r) = x

∂xψ (r) − ∂

∂x[xψ (r)]

= x∂

∂xψ (r) − x

∂xψ (r) − ψ (r)

[X,Dx]ψ (r) = −ψ (r) ∀ψ (r) ∈ z

therefore[X,Dx] = −I (1.104)

Page 55: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.26. DISCRETE ORTHONORMAL BASIS 55

1.26. Discrete orthonormal basis

The Hilbert space L2 (and thus z) has a countable infinite dimension, so that any authentic basis of z must beinfinite but discrete. A discrete orthonormal basis ui (r) with ui (r) ∈ z should follows the rules given in section1.9.1. Thus orthonormality is characterized by

(ui, uj) =

∫d3r u∗i (r) uj (r) = δij

the expansion of any wave function (vector) of this space is given by the Fourier expansion described by Eq. (1.27)

ψ (r) =∑

i

ciui (r) ; ci = (ui, ψ) =

∫d3r u∗i (r) ψ (r) (1.105)

using the terminology for finite dimensional spaces we call the series a linear combination and c i are the componentsor coordinates, which correspond to the Fourier coefficients. Such coordinates provide the representation of ψ (r) inthe basis ui (r). It is very important to emphasize that the expansion of a given ψ (r) must be unique for ui tobe a basis, in this case this is guranteen by the form of the Fourier coefficients.

Now if the Fourier expansion of two wave functions are

ϕ (r) =∑

j

bjuj (r) ; ψ (r) =∑

i

ciui (r)

The scalar product and the norm can be expressed in terms of the components or coordinates of the vectors accordingwith Eqs. (1.64, 1.65)

(ϕ,ψ) =∑

i

b∗i ci ; (ψ,ψ) =∑

i

|ci|2 (1.106)

and the matrix representation of an operator T in a given orthonormal basis ui is obtained from Eq. (1.68)

Tij ≡ (ui, Tuj)

1.26.1. Funcion delta de Dirac

Como veremos a continuacion la funcion delta de Dirac es un excelente instrumento para expresar el hecho deque un conjunto ortonormal dado sea completo. Tambien es util para convertir densidades puntuales, lineales ysuperficiales, en densidades volumetricas equivalentes. Es importante enfatizar que la funcion delta de Dirac masque una funcion es una distribucion. En el lenguaje del analisis funcional, es una uno-forma que actua en espaciosvectoriales de funciones, asignandole a cada elemento del espacio, un numero real de la siguiente forma: Sea V elespacio vectorial de las funciones definidas en el dominio (b, c) con ciertas propiedades de continuidad, derivabilidad,integrabilidad, etc. La distribucion delta de Dirac es un mapeo que asigna a cada elemento f (x) de V un numeroreal con el siguiente algoritmo7

∫ c

bf (x) δ (x− a) dx =

f (a) si a ∈ (b, c)

0 si a /∈ [b, c]

mencionaremos incidentalmente que con esta distribucion es posible escribir una densidad de carga (o masa)puntual (ubicada en r0) como una densidad volumetrica equivalente

ρ (r) = qδ(r′ − r0

)(1.107)

esta densidad reproduce adecuadamente tanto la carga total como el potencial y el campo que genera, una vez quese hagan las integrales apropiadas.

7Es usual definir la “funcion” delta de Dirac como δ (r) =

∞ si r = 00 si r 6= 0

y∫δ (x) dx = 1. Esta definicion se basa en una

concepcion erronea de la distribucion delta de Dirac como una funcion. A pesar de ello, hablaremos de ahora en adelante de la funciondelta de Dirac para estar acorde con la literatura.

Page 56: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

56 CAPITULO 1. LINEAR OR VECTOR SPACES

Hay varias sucesiones de distribuciones que convergen a la funcion Delta de Dirac, una de las mas utilizadas esla sucesion definida por

fn (x− a) =n√πe−n

2(x−a)2 (1.108)

se puede demostrar que al tomar el lımite cuando n→ ∞ se reproduce la definicion y todas las propiedades basicasde la distribucion delta de Dirac. Notese que todas las distribuciones gaussianas contenidas en esta sucesion tienenarea unidad y estan centradas en a. De otra parte, a medida que aumenta n las campanas gaussianas se vuelvenmas agudas y mas altas a fin de conservar el area, para valores n suficientemente altos, el area se concentra enuna vecindad cada vez mas pequena alrededor de a. En el lımite cuando n → ∞, toda el area se concentra en unintervalo arbitrariamente pequeno alrededor de a.

Algunas propiedades basicas son las siguientes:

1.∫∞−∞ δ (x− a) dx = 1

2.∫∞−∞ f (x) ∇δ (r − r0) dV = − ∇f |r=r0

3. δ (ax) = 1|a|δ (x)

4. δ (r − r0) = δ (r0 − r)

5. xδ (x) = 0

6. δ(x2 − e2

)= 1

2|e| [δ (x+ e) + δ (x− e)]

Vale enfatizar que debido a su naturaleza de distribucion, la funcion delta de Dirac no tiene sentido por sı sola,sino unicamente dentro de una integral. Por ejemplo cuando decimos que δ (ax) = 1

|a|δ (x), no estamos hablando deuna coincidencia numerica entre ambos miembros, sino de una identidad que se debe aplicar al espacio vectorial defunciones en que estemos trabajando, es decir

∫ c

bf (x) δ (ax) dx =

∫ c

bf (x)

1

|a|δ (x) dx ∀ f (x) ∈ V y ∀ a ∈ R

Estrictamente, el mapeo tambien se puede hacer sobre los numeros complejos con propiedades analogas. En estemismo espıritu, es necesario aclarar que la densidad volumetrica equivalente de una carga puntual (y todas lasdensidades equivalentes que se pueden formar con la delta) es realmente una distribucion. Por ejemplo, la densidaddescrita por (1.107), solo tiene realmente sentido dentro de integrales que generan la carga total, el potencial o elcampo. Las densidades ordinarias son funciones, pero las densidades equivalentes son distribuciones. En sıntesis, loque se construye con la densidad volumetrica equivalente es una distribucion que me produzca el mapeo adecuadopara reproducir la carga total, el potencial y el campo.

En mas de una dimension la delta se convierte simplemente en productos de deltas unidimensionales, la propiedad∫δ(n) (x) dnx = 1, aplicada a n dimensiones, nos dice que la delta no es adimensional, sus dimensiones son de

x−n.De momento, el uso que le daremos a la delta estara relacionado con la completez del sistema orthonormal

que usemos. Notese que en dimension finita la completez se comprueba simplemente asegurandonos de tener igualnumero de vectores linealmente independientes que la dimension del espacio. En espacios de dimension infinita encambio podrıamos tener un conjunto infinito contable que no fuera completo y que se vuelve completo al agregarleotro conjunto finito o infinito contable, pues en tal caso la cardinalidad no cambia. En dimension infinita un conjuntoortonormal puede tener la cardinalidad de la dimension ortogonal del espacio y sin embargo no ser completo. Espor esto que la prueba de completez es particularmente importante.

1.27. Closure relations

Naturalmente, para que todo vector arbitrario ψ (r) de z sea expandible en los vectores unitarios linealmenteindependientes ui (r), es necesario que el conjunto que define la base sea completo, la condicion de completez

Page 57: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.28. INTRODUCTION OF HYPERBASES 57

puede obtenerse reemplazando los coeficientes de Fourier cn en la expansion de ψ (r)

ψ (r) =∑

n

cnun (r) =∑

n

(un, ψ) un (r) =∑

n

∫ B

A

u∗n(r′)ψ(r′)un (r) d3r′

ψ (r) =

∫ B

A

ψ(r′)[∑

n

u∗n(r′)un (r)

]d3r′

donde la integral con lımites A y B significa una integral triple de volumen. Por otro lado

ψ (r) =

∫ B

A

ψ(r′)δ(r− r′

)d3r′

Igualando las dos ultimas expresiones, y teniendo en cuenta que ψ (r′) es arbitraria se obtiene

n

u∗n(r′)un (r) = δ

(r− r′

)(1.109)

retrocediendo en nuestros pasos vemos que la relacion anterior nos garantiza que cualquier funcion arbitraria dentrodel espacio se puede expandir en terminos del conjunto un (r). A su vez vemos que la expansion para una baseordenada dada un (r) es unica, lo cual se obtiene gracias a la independencia lineal del conjunto. Por tanto a laEc. (1.109), se le conoce como relacion de completez.

We shall study several complete sets that consequently accomplish property (1.109). The proof of completenessof these sets is however out of the scope of this manuscript.

1.28. Introduction of hyperbases

In the case of discrete basis each element ui (r) is square integrable and thus belong to L2 and in general to z

as well. As explained before, it is sometimes convenient to use some hyperbases in which the elements of the basisdo not belong to either L2 or z, but in terms of which a function in z can be expanded, the hyperbasis u (k, r)will have in general a continuous cardinality with k denoting the continuous index that labels each vector in thehyperbasis. According to our previous discussions the Fourier expansions made with this hyperbasis are not seriesbut integrals, these integrals will be called continuous linear combinations.

1.29. Closure relation with hyperbases

In the hyperbasis u (k, r), k is a continuous index defined in a given interval [c, d]. Such an index makes the roleof the index n in discrete bases. We shall see that a consistent way of expressing orthonormality for this continuousbasis is8

(uk, uk′) =

∫ B

A

u∗ (k, r) u(k′, r

)d3r = δ

(k − k′

)(1.110)

we show it by reproducing the results obtained with discrete bases. Expanding an arbitrary function ψ (r) of ourHilbert space as a continuous linear combination of the basis gives

ψ (r) =

∫ d

cc (k) u (k, r) dk

then we have

(uk′ , ψ) =

(uk′ ,

∫ d

cc (k) u (k, r) dk

)=

∫ d

cc (k) (uk′ , uk) dk

=

∫ d

cc (k) δ

(k − k′

)dk = c

(k′)

8From now on we shall say continuous bases, on the understanding that they are indeed hyperbases.

Page 58: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

58 CAPITULO 1. LINEAR OR VECTOR SPACES

from which the fourier coefficients of the continuous expansion are evaluated as

c(k′)

= (uk′ , ψ) (1.111)

when the Fourier coefficients are associated with continuous linear combinations (integrals) they are usually calledFourier transforms. In this case, a vector is represented as a continuous set of coordinates or components, wherethe components or coordinates are precisely the Fourier transforms.

Therefore, in terms of the inner product, the calculation of the Fourier coefficients in a continuous basis (Fouriertransforms) given by Eq. (1.111) coincides with the calculation of them with discrete bases Eq. (1.105). Eq. (1.111)in turn guarantees that the expansion for a given ordered continuous bases is unique9. Those facts in turn dependsstrongly on our definition of orthonormality in the continuous regime Eq. (1.110) showing the consistency of such adefinition. After all, we should remember that hyperbases are constructed as useful tools and not as physical states,in that sense we should not expect a “truly orthonormality relation” between them10.

Let us see the closure relation

ψ (r) =

∫ d

cc (k) u (k, r) dk =

∫ d

c(uk, ψ) u (k, r) dk

ψ (r) =

∫ d

c

[∫ B

A

u∗(k, r′

)ψ(r′)d3r′

]u (k, r) dk

ψ (r) =

∫ B

A

[∫ d

cu∗(k, r′

)u (k, r) dk

]ψ(r′)d3r′

on the other hand

ψ (r) =

∫ B

A

δ(r− r′

)ψ(r′)d3r′

from which we find ∫ d

cu∗(k, r′

)u (k, r) dk = δ

(r− r′

)(1.112)

which defines us the closure relation for a continuous basis u (k, r).From the discussion above, the closure relations for discrete or continuous basis can be interpreted as “rep-

resentations” of the Dirac delta function. Similar situation occurs with the orthonormality relation but only forcontinuous bases.

It worths emphasizing at this point that a given representation of the delta in a given space cannot be applied toanother space. For example, it is possible to have a r−dimensional vector space of functions V1 with a basis vn (r),that defines a closure relation

∑rn=1 v

∗n (r′) vn (r) = δ1 (r− r′), let us think about another r + k dimensional vector

space denoted by V2 and such that V2 ⊃ V1, such that a basis um of V2 includes the previous basis plus otherlinearly independent vectors; the closure relation is:

∑r+kn=1 u

∗n (r′)un (r) = δ2 (r− r′). What is the difference between

δ1 (r− r′) and δ2 (r− r′)?, the answer lies in the distribution nature of the badly called Dirac delta function; thefundamental property of this distribution tells us that for all functions ψ (r ′) that belongs to V1 we have that

ψ (r) =

∫ B

A

ψ(r′)[∑

n

v∗n(r′)vn (r)

]d3r′ =

∫ B

A

ψ(r′)δ1(r− r′

)d3r′

however, if the function ψ (r) does not belong to V1 but it belongs to V2 then δ1 (r− r′) is not an adequate distributionto represent this function. This is a general property of the distributions, since they are defined solely by means ofthe way in which they map the functions of a specific vector space into the scalars. A representation of the Diracdelta (and in general of any distribution) is linked to a very specific vector space of functions.

9Remember that for a given set of vectors to constitute a basis, it is important not only to be able to expand any vector with theelements of the set, it is also necessary for the expansion of each vector to be unique. In normal basis (not hyperbasis) this is guaranteedby the linear independence, in our continuous set it is guranteed by our definition of orthonormality in such a set.

10It is clear for example that with r = r′ the “orthonormality” relation diverge, so it is not a normalization in the mathematical sense.

Page 59: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.30. INNER PRODUCT AND NORM IN TERMS OF THE COMPONENTS OF A VECTOR IN A HYPERBASES59

1.30. Inner product and norm in terms of the components of a vector in a

hyperbases

Let us take two vectors ϕ and ψ that belong to z. Both can be expressed as continuous linear combinations ofa continuous basis uk

ψ (r) =

∫ d

cdk u (k, r) c (k) ; ϕ (r) =

∫ d

cdk′ u

(k′, r

)b(k′)

now the idea is to write the scalar product of them in terms of the continuous set of components of each vector i.e.in terms of their Fourier transforms c (k) and b (k ′). The scalar product is

(ϕ,ψ) =

∫ B

A

d3r ϕ∗ (r) ψ (r) =

∫ d

cdk′

∫ d

cdk b∗

(k′)c (k)

∫ B

A

d3r u∗(k′, r

)u (k, r)

now using the orthonormality relation Eq. (1.110) we have

(ϕ,ψ) =

∫ B

A

d3r ϕ∗ (r) ψ (r) =

∫ d

cdk′

∫ d

cdk b∗

(k′)c (k) δ

(k − k′

)

(ϕ,ψ) =

∫ d

cdk b∗ (k) c (k) (1.113)

the norm is obtained simply by taking ϕ = ψ then

(ψ,ψ) = ‖ψ‖2 =

∫ d

cdk |c (k)|2 (1.114)

Eqs. (1.113, 1.114) are clearly the continuous analogs of Eq. (1.106) for discrete basis.

In summary, the basic relations obtained in discrete bases (inner products, norms, fourier coefficients, orthonor-mality, completeness etc.) possses the same structure in continuous bases but with the following replacements

i(discrete) ↔ k(continuous) ,∑

i

↔∫dk , δij ↔ δ

(k − k′

)

1.31. Some specific continuous bases

1.31.1. Plane waves

We shall use a continuous basis represented by the set

zeip·r/~

; z ≡

(1

2π~

)3/2

where p is the continuous index that labels the different vectors of the basis. Indeed, p represents three continuousindices px, py, pz. By now ~ is simply a mathematical constant, but it will become highly relevant in Physics. Weconsider the space of square integrable functions over the whole space, all integrals are undestood to be tripleintegrals. The continuous linear combination of a given square integrable function is given by

ψ (r) =

(1

2π~

)3/2 ∫ ∞

−∞d3p ψ (p) eip·r/~

it is clear thatψ (p)

provides the continuous set of coordinates of the vector ψ (r) under our continuous basis.

They are thus the Fourier transforms of ψ (r) with respect to the basis of plane waves. It is useful to define

vp (r) ≡ zeip·r/~ (1.115)

Page 60: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

60 CAPITULO 1. LINEAR OR VECTOR SPACES

from which the fourier transforms can be calculated by Eq. (1.111)

c (k) = (uk, ψ) ⇒ ψ (p) = (vp, ψ) =

(1

2π~

)3/2 ∫ ∞

−∞d3r e−ip·r/~ ψ (r)

the basic relation in Fourier analysis1

(2π)3

∫ ∞

−∞d3k eik·u = δ3 (u) (1.116)

can be used by assigning k → zp and u → (r− r′) to show that

∫ ∞

−∞d3p v∗p

(r′)vp (r) =

1

(2π~)3

∫ ∞

−∞d3p ei

p

~(r−r′) = δ3

(r − r′

)(1.117)

by comparing it with Eq. (1.112), we see that (1.117) expresses the completeness relation for the continuous basisvp in the space of functions that are square-integrable in the whole physical space. The orthonormality relationcan also be obtained from the property (1.116) but with the assignments k → zr and u → p− p ′

(vp, vp′

)=

1

(2π~)3

∫ ∞

−∞d3r e−i

r

~(p−p′) = δ3

(p′ − p

)= δ3

(p− p′) (1.118)

by using p = p′ in Eq. (1.118) it is clear that ‖vp‖2 = (vp, vp) is divergent. Thus, the plane waves are not square-integrable in the whole space. Therefore, the elements of this continuous basis do not belong to the Hilbert spaceunder study.

1.31.2. “Delta functions”

We shall use a continuous basis of “highly improper” functions defined by

ξr0 (r) ≡ δ (r − r0) (1.119)

ξr0 (r) represents the set of delta functions centered at each of the points r0 of the whole space. These functionsare not square-integrable so ξr0 (r) /∈ z. Nevertheless, the following relations are valid for functions that belongto z

ψ (r) =

∫d3r0 ψ (r0) δ (r− r0)

ψ (r0) =

∫d3r ψ (r) δ (r0 − r)

rewritten them appropiately we have

ψ (r) =

∫d3r0 ψ (r0) ξr0 (r) (1.120)

ψ (r0) =

∫d3r ξ∗r0

(r) ψ (r) = (ξr0 , ψ) (1.121)

Eq. (1.120) gives ψ (r) ∈ z as a continuous linear combination of the set ξr0, where ψ (r0) are the fouriertransforms. On the other hand, (1.121) indicates that the fourier transforms are evaluated as usual.

By using the properties of the Dirac delta function, it is possible to prove that the set ξr0 accomplishesorthonormality and completeness relations

(ξr0 , ξr′0

)=

∫d3r δ (r− r0) δ

(r− r′0

)= δ

(r0 − r′0

)

and ∫d3r0 ξ

∗r0

(r′)ξr0 (r) =

∫d3r0 δ

(r′ − r0

)δ (r− r0) = δ

(r− r′

)

Page 61: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.32. TENSOR PRODUCTS OF VECTOR SPACES, DEFINITION AND PROPERTIES 61

note that the non-physical functions that constitute a continuous basis can usually be seen as limits in which oneor more parameters of a physically realizable state are taken at extreme (non-physical) values.

As an example the Dirac function can be taken as the limit of gaussians given by Eq. (1.108)

fn (x− a) =n√πe−n

2(x−a)2

for each value of n these functions are square integrable, continuous, and derivable, they could describe a physicalsystem. Notwithstanding, by taking n→ ∞, the functions are no longer square-integrable and lose all properties ofwell-behavior.

Concerning plane waves, physical states (in both classical and quantum mechanics) consists of a superposition ofplane waves with a finite width spectrum of frecuencies ∆ν, by taking the limit ∆ν → 0 we obtain a monochromatic(non-physical) wave, corresponding to a single plane wave.

1.32. Tensor products of vector spaces, definition and properties

Let V1 and V2 be two vector spaces of dimension n1 and n2. Vectors and operators on each of them will bedenoted by labels (1) and (2) respectively.

Definition 1.34 The vector space V is called the tensor product of V1 and V2

V ≡ V1 ⊗ V2

if there is associated with each pair of vectors x (1) ∈ V1 and y (2) ∈ V2 a vector in V denoted by x (1) ⊗ y (2) andcalled the tensor product of x (1) and y (2), and in which this correspondence satisfies the following conditions: (a)It is linear with respect to multiplication by a scalar

[αx (1)] ⊗ y (2) = α [x (1) ⊗ y (2)] ; x (1) ⊗ [βy (2)] = β [x (1) ⊗ y (2)] (1.122)

(b) It is distributive with respect to addition

[x (1) + x′ (1)

]⊗ y (2) = x (1) ⊗ y (2) + x′ (1) ⊗ y (2)

x (1) ⊗[y (2) + y′ (2)

]= x (1) ⊗ y (2) + x (1) ⊗ y′ (2) (1.123)

(c) When a basis is chosen in each space, say ui (1) in V1 and vj (2) in V2, the set of vectors ui (1) ⊗ vj (2)constitutes a basis in V . If n1 and n2 are finite, the dimension of the tensor product space V is n1n2.

An arbitrary couple of vectors x (1), y (2) can be written in terms of the bases ui (1) and vj (2) respectively,in the form

x (1) =∑

i

aiui (1) ; y (2) =∑

j

bjvj (2)

Using Eqs. (1.122, 1.123) we see that the expansion of the tensor product is given by

x (1) ⊗ y (2) =∑

i

j

aibjui (1) ⊗ vj (2)

so that the components of the tensor product of two vectors are the products of the components of the two vectors ofthe product. It is clear that the tensor product is commutative i.e. V1⊗V2 = V2⊗V1 and x (1)⊗y (2) = y (2)⊗x (1)

On the other hand, it is important to emphasize that there exist in V some vectors that cannot be written astensor products of a vector in V1 with a vector in V2. Nevertheless, since ui (1) ⊗ vj (2) is a basis in V any vectorin V can be expanded in it

ψ =∑

i

j

cijui (1) ⊗ vj (2) (1.124)

in other words, given a set of n1n2 coefficients of the form cij it is not always possible to write them as productsof the form aibj of n1 numbers ai and n2 numbers bj, we cannot find always a couple of vectors in V1 and V2 suchthat ψ = x (1) ⊗ y (2).

Page 62: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

62 CAPITULO 1. LINEAR OR VECTOR SPACES

1.32.1. Scalar products in tensor product spaces

If there are inner products defined in the spaces V1 and V2 we can define an inner product in the tensor productspace V . For a couple of vectors in V of the form x (1) ⊗ y (2) the inner product can be written as

(x′ (1) ⊗ y′ (2) ,x (1) ⊗ y (2)

)=(x′ (1) ,x (1)

)(1)

(y′ (2) ,y (2)

)(2)

where the symbols (, )(1) and (, )(2) denote the inner product of each of the spaces of the product. From this, we cansee that if the bases ui (1) and vj (2) are orthonormal in V1 and V2 respectively, then the basis ui (1) ⊗ vj (2)also is

(ui (1) ⊗ vj (2) ,uk (1) ⊗ vm (2)) = (ui (1) ,uk (1))(1) (vj (2) ,vm (2))(2) = δikδjm

Now, for an arbitrary vector in V , we use the expansion (1.124) and the basic properties of the inner product

(ψ, φ) =

i

j

cijui (1) ⊗ vj (2) ,∑

k

m

bkmuk (1) ⊗ vm (2)

=∑

i,j

c∗ij∑

k,m

bkm (ui (1) ⊗ vj (2) , uk (1) ⊗ vm (2)) =∑

i,j

c∗ij∑

k,m

bkmδikδjm

(ψ, φ) =∑

i,j

c∗ijbij

it is easy to show that with these definitions the new product accomplishes the axioms of an inner product.

1.32.2. Tensor product of operators

Consider a linear transformation A (1) defined in V1, we associate with it a linear operator A (1) acting on V asfollows: when A (1) is applied to a tensor of the type x (1) ⊗ y (2) we define

A (1) [x (1) ⊗ y (2)] = [A (1)x (1)] ⊗ y (2)

when the operator is applied to an arbitrary vector in V , this definition is easily extended because of the linearityof the transformation

A (1)ψ = A (1)∑

i

j

cijui (1) ⊗ vj (2) =∑

i

j

cijA (1) [ui (1) ⊗ vj (2)]

A (1)ψ =∑

i

j

cij [A (1)ui (1)] ⊗ vj (2) (1.125)

the extension B (2) of a linear transformation in V2 is obtained in a similar way

B (2)ψ =∑

i

j

cijui (1) ⊗ [B (2)vj (2)]

finally, if we consider two operators A (1) , B (2) defined in V1 and V2 respectively, we can define their tensor productA (1) ⊗B (2) as

[A (1) ⊗B (2)]ψ =∑

i

j

cij [A (1)ui (1)] ⊗ [B (2)vj (2)] (1.126)

it is easy to show that A (1) ⊗ B (2) is also a linear operator. From Eqs. (1.125, 1.126) we can realize that theextension of the operator A (1) on V1 to an operator A (1) on V can be seen as the tensor product of A (1) with theidentity operator I (2) on V2. A similar situation occurs with the extension B (2)

A (1) = A (1) ⊗ I (2) ; B (2) = I (1) ⊗B (2) (1.127)

Page 63: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.32. TENSOR PRODUCTS OF VECTOR SPACES, DEFINITION AND PROPERTIES 63

Now let us put the operators A (1)⊗B (2) and A (1) B (2) to act on an arbitrary element of a basis ui (1) ⊗ vj (2)of V

[A (1) ⊗B (2)]ui (1) ⊗ vj (2) = [A (1)ui (1)] ⊗ [B (2)vj (2)][A (1) B (2)

]ui (1) ⊗ vj (2) = A (1) ui (1) ⊗ [B (2)vj (2)] = [A (1)ui (1)] ⊗ [B (2)vj (2)]

therefore, the tensor product A (1)⊗B (2) coincides with the ordinary product of two operators A (1) and B (2) onV

A (1) ⊗B (2) = A (1) B (2)

additionally, it can be shown that operators of the form A (1) and B (2) commute in V . To see it, we put theirproducts in both orders to act on an arbitrary vector of a basis ui (1) ⊗ vj (2) of V

[A (1) B (2)

]ui (1) ⊗ vj (2) = A (1) ui (1) ⊗ [B (2)vj (2)] = [A (1)ui (1)] ⊗ [B (2)vj (2)]

[B (2) A (1)

]ui (1) ⊗ vj (2) = B (2) [A (1)ui (1)] ⊗ vj (2) = [A (1)ui (1)] ⊗ [B (2)vj (2)]

therefore we have [A (1) , B (2)

]= 0 or A (1) ⊗B (2) = B (2) ⊗A (1)

an important special case of linear operators are the projectors, as any other linear operator, the projector in V isthe tensor product of the projectors in V1 and V2. Let M1 and N1 be the range and null space of a projector in V1

and M2, N2 the range and null space of a projector in V2

V1 = M1 ⊕N1 ; x (1) = xM (1) + xN (1) ; xM (1) ∈M1, xN (1) ∈ N1 ; P1 (x (1)) = xM (1)

V2 = M2 ⊕N2 ; y (2) = yM (2) + yN (2) ; yM (2) ∈M2, yN (2) ∈ N2 ; P2 (y (2)) = yM (2)

(P1 ⊗ P2) (x (1) ⊗ y (2)) = [P1x (1)] ⊗ [P2y (2)] = xM (1) ⊗ yM (2)

for an arbitrary vector we have

(P1 ⊗ P2)ψ = (P1 ⊗ P2)∑

i

j

cijui (1) ⊗ vj (2) =∑

i

j

cij [P1ui (1)] ⊗ [P2vj (2)]

(P1 ⊗ P2)ψ =∑

i

j

cijui,M (1) ⊗ vj,M (2)

finally, as in the case of vectors, there exists some operators on V that cannot be written as tensor products of theform A (1) ⊗B (2).

1.32.3. The eigenvalue problem in tensor product spaces

Let us assume that we have solved the eigenvalue problem for an operator A (1) of V1. We want to seek forinformation concerning the eigenvalue problem for the extension of this operator to the tensor product space V . Forsimplicity, we shall assume a discrete spectrum

A (1)xin (1) = anxin (1) ; i = 1, 2, . . . , gn ; xin (1) ∈ V1

where gn is the degeneration associated with an. We want to solve the eigenvalue problem for the extension of thisoperator in V = V1 ⊗ V2

A (1)ψ = λψ ; ψ ∈ V1 ⊗ V2

from the definition of such an extension, we see that a vector of the form xin (1) ⊗ y (2) for any y (2) ∈ V2 is aneigenvector of A (1) with eigenvalue an

A (1)[xin (1) ⊗ y (2)

]=

[A (1)xin (1)

]⊗ y (2) = anx

in (1) ⊗ y (2) ⇒

A (1)[xin (1) ⊗ y (2)

]= an

[xin (1) ⊗ y (2)

]

Page 64: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

64 CAPITULO 1. LINEAR OR VECTOR SPACES

it is natural to ask whether any eigenvector of A (1) can be generated in this way. We shall see that it is true ifA (1) is an observable in V1. Assuming it, the set of orthonormal eigenvectors

xin (1)

forms a basis in V1. If we

now take an orthonormal basis ym (2) in V2, then the set of vectors

ψi,mn

≡xin (1) ⊗ ym (2)

forms an orthonormal basis in V . It is clear that the setψi,mn

consists of eigenvectors of A (1) with eigenvalues

an, and since they are a basis, a complete orthonormal set of eigenvectors of A (1) have been generated with theprocedure explained above. This in turn means that if A (1) is an observable in V1, its extension A (1) is also anobservable in V . Further, the spectrum of A (1) coincides with the spectrum of A (1). Notwithstanding, it worths tosay that if N2 is the dimension of V2, if an is gn−fold degenerate in V1, it will be gn ·N2−degenerate in V . This isbecause for a given eigenvector xin (1) in V1, there are N2 eigenvectors ψi,mn ≡ xin (1) ⊗ ym (2) since m = 1, . . . , N2.

We know that each eigenvalue an of A (1) in V1 defines an eigensubspace V1,an in V1 with gn dimension. Thecorresponding eigensubspace generated by an in V is a N2 · gn subspace Van . The projector onto V1,an is written by

V1 = V1,an ⊕ V ⊥1,an ; x (1) = xan (1) + x⊥

an (1) ; xan (1) ∈ V1,an , x⊥an (1) ∈ V ⊥

1,an

P an1 (x (1)) = xan (1)

and its extension to V is defined as

P an1 ≡ P an1 ⊗ I2 ; P an1 ψi,mn ≡ P an1

[xin (1) ⊗ ym (2)

]=[P an1 xin (1)

]⊗ ym (2)

P an1 ψi,mn = xan (1) ⊗ ym (2)

Now assume that we have a sum of operators of both spaces

C = A (1) + B (2)

where A (1) and B (2) are observables in their corresponding spaces, with the following eigenvalues and eigenvectors

A (1)xin (1) = anxin (1) ; i = 1, 2, . . . , gn ; xin (1) ∈ V1

B (2)ykm (2) = bmykm (2) ; k = 1, 2, . . . , hm ; ykm (2) ∈ V2

we have seen that A (1) and B (2) commute, so they should have a commom basis of eigenvectors in V . This basisis precisely, the tensor product of their eigenvectors

A (1)[xin (1) ⊗ ykm (2)

]= an

[xin (1) ⊗ ykm (2)

]

B (2)[xin (1) ⊗ ykm (2)

]= bm

[xin (1) ⊗ ykm (2)

]

and they are also eigenvectors of C = A (1) + B (2)

[A (1) + B (2)

] [xin (1) ⊗ ykm (2)

]= (an + bm)

[xin (1) ⊗ ykm (2)

]

C[xin (1) ⊗ ykm (2)

]= cnm

[xin (1) ⊗ ykm (2)

]; cnm = an + bm

So that if C = A (1) + B (2) the eigenvalues of C are the sums of the eigenvalues of A (1) and B (2). Besides, wecan form a basis of eigenvectors of C by taking the tensor product of the basis of A (1) and B (2).

It is important to emphasize that even if an and bm are non-degenerate, it is posible that cnm be degenerate. As-sume that an and bm are non-degenerate, and for a given cnm let us define all the sets of pairs (nj,mj) : j = 1, . . . , qsuch that anj+bmj = cnm. In that case, the eigenvalue cnm is q−fold degenerate, and every eigenvector correspondingto this eigenvalue can be written as

q∑

j=1

cj[xnj (1) ⊗ ymj (2)

]

in this case there are eigenvectors of C that are not tensor products.

Page 65: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.33. RESTRICTIONS TO AN OPERATOR TO A SUBSPACE 65

1.32.4. Complete sets of commuting observables in tensor product spaces

For simplicity assume that A (1) forms a C.S.C.O. by itself in V1, while B (2) , C (2) constitute a C.S.C.O. inV2. We shall show that by gathering the operators of the C.S.C.O. in V1 with the operators of C.S.C.O. in V2, weform a C.S.C.O. in V with their corresponding extensions.

Since A (1) is a C.S.C.O. in V1, all its eigenvalues are non-degenerate in V1

A (1)xn (1) = anx (1)

the ket x (1) is then unique within a constant factor. In V2 the set of two operators B (2) , C (2) defines commomeigenvectors ymp (2) that are unique in V2 within constant factors

B (2)ymp (2) = bmymp (2) ; C (2)ymp (2) = cpymp (2)

In V , the eigenvalues are N2−fold degenerate. Similarly, there are N1 linearly independent eigenvectors of B (2) andC (2) associated with two given eigenvalues of the form (bm, cp). However, the eigenvectors that are common to the

three commuting observables A (1) , B (2) , C (2) are unique within constant factors

A (1) [xn (1) ⊗ ymp (2)] = an [x (1) ⊗ ymp (2)]

B (2) [xn (1) ⊗ ymp (2)] = bm [x (1) ⊗ ymp (2)]

C (2) [xn (1) ⊗ ymp (2)] = cp [x (1) ⊗ ymp (2)]

since xn (1) and ymp (2) were bases in V1 and V2, we see that xn (1) ⊗ ymp (2) is a basis in V constituted by

commom eigenvectors of the three operators. Thus the setA (1) , B (2) , C (2)

is a C.S.C.O. in V .

1.33. Restrictions to an operator to a subspace

It is useful in many applications to be able to restrict an operator to a certain subspace Vq of a given vectorspace V . Let us assume

V = V1 ⊕ . . .⊕ Vq ⊕ . . .

x = x1 + . . .+ xq + . . . xi ∈ ViProjectors, which are the natural operators to “restrict” a vector by extracting the components that are orthonormalto a given subspace, will be also the natural operators to rectrict operators. Let Pq the projector onto a subspaceVq. A priori, we could think in defining a restriction by “restricting the vector” in which the operator will act on.This is done by substracting all components orthogonal to the subspace Vq by applying a projection, and then letthe operator A act on this projection so we have

A = APq ⇒ Ax = APqx = Axq

in this case we have restricted the domain of A appropiately, but once the operator A is applied, the image couldbe outside of the subspace too. Hence, the projector must be applied again after the application of A in order torestrict the image appropiately. We then define the restriction A of the operator A to the subspace Vq as

Aq ≡ PqA = PqAPq

so that both the domain and the range are restricted to Vq. It can be easily checked that the matrix representation

of Aq is reduced to a submatrix in the Vq space. Let qk be the dimension of Vq. Let us use an ordered basis suchthat the first qk terms expand Vq. Using such a basis we have

(Aq

)ij

=(ui, Aquj

)= (ui, PqAPquj) = (Pqui, APquj)

(Pqui, APquj) =

(ui, Auj) if i, j ≤ qk

0 if i > qk and/or j > qk

observe that the submatrix associated with i, j ≤ qk (i.e. assocaited with the Vq subspace), remains the same withrespect to the non-restricted matrix. But the elements outside of such a submatrix are zeros, showing that the newoperator only acts in Vq.

Page 66: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

66 CAPITULO 1. LINEAR OR VECTOR SPACES

1.34. Functions of operators

Let A be an arbitrary operator. The operator An with n being a non-negative integer is easily defined as

A0 ≡ I , An = AA · · ·A (n times)

similarly for negative integers a consistent definition is

A−n ≡(A−1

)nwith AA−1 = A−1A = I

it is useful to define functions of operators. Assume that a function F can be expanded in certain domain in thefollowing way

F (z) =

∞∑

n=0

fnzn (1.128)

by definition, the function F (A) of the operator A corresponds to an expansion of the form (1.128) with the samecoefficients fn

F (A) =

∞∑

n=0

fnAn (1.129)

for instance, the function eA of the operator A reads

eA =

∞∑

n=0

An

n!= I +A+

A2

2!+A3

3!+ . . .

the convergence of series of the type (1.129) depends on the eigenvalues of A and the radius of convergence of thefunction (1.128). We shall not treat this topic in detail.

If F (z) is a real function the coefficients fn are real. On the other hand, if A is hermitian then F (A) also is,as can be seen from (1.129). Owing to the analogy between real numbers and hermitian operators this relation isquite expected. Now, assume that xi,k is an eigenvector of A with eigenvalue ai we then have

Axi,k = aixi,k ⇒ Anxi,k = ani xi,k

and applying the eigenvector in Eq. (1.129) we find

F (A)xi,k =

∞∑

n=0

fnani xi,k = xi,k

∞∑

n=0

fnani

F (A)xi,k = F (ai)xi,k

so that if xi,k is an eigenvector of A with eigenvalue ai, then xi,k is also eigenvector of F (A) with eigenvalue F (ai).On the other hand, if the operator is diagonalizable (this is the case for observables), we can find a basis in which

the matrix representative of A is diagonal with the eigenvalues ai in the diagonal. In such a basis, the operatorF (A) has also a diagonal representation with elements F (ai) in the diagonal. For example let σz be an operatorthat in certain basis has the matrix representation

σz =

(1 00 −1

)

in the same basis we have

eσz =

(e1 00 e−1

)=

(e 00 1/e

)

if A and B do not commute, we have that in general the operators F (A) and F (B) do not commute either. Forinstance

eAeB =

∞∑

n=0

An

n!

∞∑

m=0

Bm

m!=

∞∑

n=0

∞∑

m=0

An

n!

Bm

m!(1.130)

eBeA =∞∑

m=0

Bm

m!

∞∑

n=0

An

n!=

∞∑

m=0

∞∑

n=0

Bm

m!

An

n!(1.131)

eA+B =

∞∑

n=0

(A+B)n

n!(1.132)

Page 67: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.35. DIFFERENTIATION OF OPERATORS 67

these three expressions are in general different from each other unless [A,B] = 0. We see by direct inspection ofEqs. (1.130, 1.131, 1.132) that if A and B commute, then F (A) and F (B) also do. Notice that when A,B commutethey can be diagonalized simultaneously and so F (A) and F (B), which is another way to see that if [A,B] = 0then [F (A) , F (B)] = 0.

1.34.1. Some commutators involving functions of operators

Theorem 1.70 Suppose we have two operators A and B such that B commutes with their commutator, that is

[B,C] = 0 ; C ≡ [A,B] (1.133)

if F (B) is a function of the operator B then we have

[A,F (B)] = [A,B]F ′ (B) (1.134)

where F ′ (B) is the derivative of F (B) “with respect to B” defined as

F (B) =

∞∑

n=0

fnBn ⇒ F ′ (B) ≡

∞∑

n=0

nfnBn−1 (1.135)

Proof : The commutator [A,F (B)] is given by

[A,F (B)] =

[A,

∞∑

n=0

fnBn

]=

∞∑

n=0

fn [A,Bn] (1.136)

we show by induction that[A,Bn] = [A,B]nBn−1 (1.137)

for n = 0 we have Bn = I and both sides clearly vanish. Now let us assume that it works for n and show that it issatisfied by n+ 1. Applying Eq. (1.40), and taking into account Eqs. (1.137, 1.133) we have

[A,Bn+1

]= [A,BBn] = [A,B]Bn +B [A,Bn] = [A,B]BBn−1 +B [A,B]nBn−1

= CBBn−1 +BCnBn−1 = CBn + nCBBn−1 = C (n+ 1)Bn

[A,Bn+1

]= [A,B] (n+ 1)Bn

which shows the validity of Eq. (1.137). Replacing Eq. (1.137) in Eq. (1.136), we find

[A,F (B)] = [A,B]

∞∑

n=0

fnnBn−1 = [A,B]F ′ (B)

Corollary 1.71 It is straightforward to show that if both operators commute with their commutator we see thatequations

[A,F (B)] = [A,B]F ′ (B) ; [G (A) , B] = [A,B]G′ (B) (1.138)

are satisfied simultaneously. A very important case in Physics occurs when [A,B] = αI. In that case, we have

[A,B] = αI ⇒ [A,F (B)] = αF ′ (B) ; [G (A) , B] = αG′ (B) (1.139)

1.35. Differentiation of operators

Let A (z) an operator that depends on the arbitrary variable z. We define the derivative of A (z) with respectto z as

dA

dz= lım

∆z→0

A (z + ∆z) −A (z)

∆z(1.140)

provided that this limit exists. Operating A on an arbitrary vector x and using a basis ui independent of z, wehave

A (z)x = A (z) xiui = xiA (z)ui = xiujAji (z) (1.141)

Page 68: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

68 CAPITULO 1. LINEAR OR VECTOR SPACES

since dA/dz is another operator, it makes sense to talk about its matrix representation

dA (z)

dzx =

dA (z)

dzxiui = xi

dA (z)

dzui = xiuj

(dA (z)

dz

)

ji

(1.142)

Applying the derivative on both extremes of Eq. (1.141), and taking into account that the basis u i is independentof z, we have

d

dzA (z) x = xiuj

dAji (z)

dz(1.143)

comparing Eqs. (1.142, 1.143) we obtain (dA (z)

dz

)

ji

=dAji (z)

dz

so the matrix representative of the derivative of A is obtained by taking the derivative of each of its elements11.The differentiation rules are similar to the ones in ordinary calculus

d

dz(F +G) =

dF

dz+dG

dz;

d

dz(FG) =

dF

dtG+ F

dG

dt(1.144)

except that care must be taken with the order of appearance for the operators involved. Let us examine the secondof this equations, applying FG to an arbitrary vector x and using a basis ui we have

(FG) x = xiuj (FG)ji

taking the derivative on both sides we have

(d (FG)

dz

)

ji

=d

dz(FG)ji =

d

dz[FjkGki] =

[(d

dzFjk

)Gki + Fjk

(d

dzGki

)]

=

[(dF

dz

)

jk

Gki + Fjk

(dG

dz

)

ki

]

in matrix form we see thatd (FG)

dz=dF

dzG + F

dG

dz

since there is a one-to-one isomorphism from the operators onto the matrices, we see that this relation is also validfor the operators.

1.35.1. Some useful formulas

Applying the derivation rules we can develop some identities for functions of operators. Let us calculate thederivative of the operator eAt. By definition we have

eAt =∞∑

n=0

(At)n

n!

differentiating the series term by term we have

d

dteAt =

∞∑

n=0

ntn−1An

n!= 0 +

∞∑

n=1

ntn−1An

n!= A

∞∑

n=1

(At)n−1

(n− 1)!

d

dteAt = A

[ ∞∑

k=0

(At)k

k!

]=

[ ∞∑

k=0

(At)k

k!

]A

11Care must be taken to distinguish between the derivative in Eq. (1.135) and the derivative in Eq. (1.140). In Eq. (1.135) the derivativeis taken with respect to B as the “variable of derivation”. On the other hand, in Eq. (1.140) the variable to derive with, is a parameterz from which our matrix depend on.

Page 69: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.36. STATE SPACE AND DIRAC NOTATION 69

where we have used the assignment k = n− 1. The series in the brackets is eAt once again, so we have

d

dteAt = AeAt = eAtA (1.145)

in this case eAt and A commutes because only one operator is involved. Suppose that we want to differentiate eAteBt.Applying Eqs. (1.144, 1.145) we have

d

dt

[eAteBt

]=d(eAt)

dteBt + eAt

d(eBt)

dt= AeAteBt + eAtBeBt

the operator A can pass over eAt if desired but not over eBt unless that A and B commute. Similarly, B can passover eBt but not over eAt.

However, even if a single operator appears we should be careful with the order sometimes. For instance, if A (t)is an arbitrary function of time then

d

dteA(t) 6= dA

dteA(t) (1.146)

it could be checked that A (t) and dA (t) /dt must commute with each other for the equality to be valid.Consider again two operators that commute with their commutator, we shall show that

[A, [A,B]] = [B, [A,B]] = 0 ⇒ eAeB = eA+Be12[A,B] (Glauber′s formula) (1.147)

let define F (t) with t real as

F (t) ≡ eAteBt ;dF (t)

dt= AeAteBt + eAtBeBt = A

(eAteBt

)+ eAtBe−At

(eAteBt

)

dF (t)

dt=

[A+ eAtBe−At

]F (t) (1.148)

since A,B commute with their commutator, we can apply Eq. (1.138), so that

[eAt, B

]= t [A,B] eAt ⇒ eAtB = BeAt + t [A,B] eAt

⇒ eAtBe−At = B + t [A,B]

substituting this expression in Eq. (1.148) we get

dF (t)

dt= A+B + t [A,B]F (t) (1.149)

by hypothesis, A+B commutes with [A,B], so that the differential equation (1.149) can be integrated as if A+Band [A,B] were numbers

F (t) = F (0) e(A+B)t+ 12[A,B]t2

setting t = 0 we see that F (0) = I, thus we obtain

F (t) = e(A+B)t+ 12[A,B]t2

setting t = 1 and taking into account again that A+B commutes with [A,B], we obtain (1.147). It is necessary toemphasize that this equation is valid only if A and B commutes with [A,B].

1.36. State space and Dirac notation

We have defined the space of Physical states as the one constituted by functions ψ (r) square-integrable in a givenvolume. The space with these characteristics is denoted by L2, but since in general with add some requirements tothese functions, we actually work in a subspace z ⊆ L2. On the other hand, we have seen that several bases can beconstructed to represent those functions. Therefore, the Physical system will be described by either the functionsψ (r) or by the sete of its coordinates in a given representation. When the representation is discrete we have a

Page 70: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

70 CAPITULO 1. LINEAR OR VECTOR SPACES

numerable set of coordinates (Fourier coefficients) while in the case of continuous bases, the set of coordinates iscontinuous as well (Fourier transforms). In particular, the continuous basis denoted as ξr0 (r) shows that the functionψ (r) can be considered as a coordiante system as well, because in this basis, each coordinate is defined as ψ (r0)i.e. the value of ψ at each fixed point r0 of the volume12.

We have now a situation similar to the one obtained in R3, we can define a vector by a triple of coordinates inany basis defined by a set of coordinate axes. However, vectors in R3 can be defined geometrically (intrinsically),and its algebra can be performed in a coordinate-free form.

In the same way, we wish to define our state vector in a coordinate free (or intrinsic) way. The abstract space ofstate vectors of a particle is denoted as Er which should be isometrically isomorphic with z. We should also definethe notation and algebra on the Er space.

Though we initially start with Er as identical to z, we shall see that it permits a generalization of the formalismwhen the states in zdo not contain all the Physical information of the system, as is the case when spin degrees offreedom are introduced in the formalism. Hence, the algebra that we shall develop now will be valid when thesegeneralizations are carried out. In developing this algebra we are going to present the Dirac notation which is usefulin practical calculations

1.37. Dirac notation

We are going to establish a one-to-one correspondence between the states of z and the states of Er, though thelatter will be extended later. Thus to every square-integrable function ψ (r) in z we make to correspond an abstractvector in Er in the form

ψ (r) ↔ |ψ〉an abstract vector in the notation |ψ〉 will be called a ket. Notice that no r−dependence appears in |ψ〉. Indeed,ψ (r) is interpreted in this framework as a representation of |ψ〉 in which each ψ (r) is a coordinate in the basis givenby ξr (r′). Therefore, r plays the role of index (three continuous indices) for the particular basis used.

The space of states of a particle in one dimension is denoted as Ex, while in three dimensions is Er.

1.37.1. Elements of the dual or conjugate space E ∗r

In section 1.9.2 we defined a one-to-one correspondence between vectors (kets) of a Hilbert space and functionals(bras) in the conjugate (dual) space in the following way (see Eqs. 1.29, 1.30)

|ψ〉 ↔ f|ψ〉 ; f|ψ〉 (|ϕ〉) ≡ (|ψ〉 , |ϕ〉)

Dirac notation designates f|ψ〉 as 〈ψ| which is called a bra. The correspondence above and the inner product willbe written as

|ψ〉 ∈ Er ↔ 〈ψ| ∈ E∗r ; 〈ψ| (|ϕ〉) ≡ (|ψ〉 , |ϕ〉)

it induces a natural notation for the inner product

((|ψ〉 , |ϕ〉)) ≡ 〈ψ|ϕ〉

this is also called a bracket (i.e. the union of a bra with a ket). Let us now write the properties developed in section1.9.2 Eq. (1.31), with this new notation

fα|ψ〉+β|ϕ〉 = α∗f|ψ〉 + β∗f|ϕ〉α |ψ〉 + β |ϕ〉 ∈ Er ↔ α∗ 〈ψ| + β∗ 〈ϕ| ∈ E∗

r

which is consistent with the properties of the inner product

(α |ψ〉 + β |ϕ〉 , |χ〉) = (α∗ 〈ψ| + β∗ 〈ϕ|) |χ〉 ⇒〈αψ + βϕ|χ〉 = α∗ 〈ψ|χ〉 + β∗ 〈ϕ|χ〉

12Notice that this is a simple way of defining an scalar field. A scalar field is completely delimited by defining its value at each pointof the space in which the field is defined (at a given time). In this case the number of coordinates is cleraly the number of points in ourspace.

Page 71: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.37. DIRAC NOTATION 71

since the functionals (bras) are linear by definition, a linear combination of kets gives

f|ψ〉 (α |ϕ〉 + β |χ〉) ≡ αf|ψ〉 (|ϕ〉) + βf|ψ〉 (|χ〉)

in Dirac notation it reads

〈ψ|αϕ+ βχ〉 = α 〈ψ|ϕ〉 + β 〈ψ|χ〉from these facts it is clear that for any scalar α

|αψ〉 = α |ψ〉 ; 〈αψ| = α∗ 〈ψ| (1.150)

now since

(|ψ〉 , |ϕ〉) = (|ϕ〉 , |ψ〉)∗ ⇒〈ψ|ϕ〉 = 〈ϕ|ψ〉∗

1.37.2. The correspondence between bras and kets with hyperbases

We have seen that hyperbases are sets of elements from which any element of the space can be expanded despitethose elements do not belong to the space under study. On the other, hand we have seen that the correspondencebetween vectors and functionals (kets and bras) is one-to-one and onto. However, when hyperbases are used we shallsee that some linear functionals (bras) can be well-defined while there is not a well-defined corresponding vector(ket)

Assume for example that we have a ket in z given by a sufficiently regular function ξ(ε)x0 (x) such that

∫ ∞

−∞dx ξ(ε)

x0(x) = 1

with the form of a peak of height ∼ 1/ε and width ∼ ε centered at x = x0. If ε 6= 0 then∣∣∣ξ(ε)x0

⟩∈ Ex. Let

⟨ξ(ε)x0

∣∣∣ ∈ E∗x

be its associated bra. The idea is to have a function that conveeges to the Dirac delta function when ε → 0. Foreach |ψ〉 ∈ Ex we have that

〈ξ(ε)x0|ψ〉 =

(ξ(ε)x0

, ψ)

=

∫ ∞

−∞dx ξ(ε)

x0(x) ψ (x) (1.151)

now we let ε to approach zero, and we find that

lımε→0

ξ(ε)x0/∈ zx

since the square of its norm tend to 1/ε and diverges. Nevertheless, in the limit ε→ 0 the expression (1.151) is still

well-defined, so that⟨ξ(ε)x0

∣∣∣ is still associated with a functional that can be applied to any element of the state space,

we shall denote this bra as 〈ξx0 | and this functional associates with each vector |ψ〉 ∈ Ex the value ψ (x0) taken onby the associated wave function in zx at the point x0

lımε→0

⟨ξ(ε)x0

∣∣∣ = 〈ξx0 | ∈ E∗x if |ψ〉 ∈ Ex ⇒ 〈ξx0 |ψ〉 = ψ (x0)

then the bra 〈ξx0 | ∈ E∗x exists but there is not a ket associated with it in the hyperbasis.

This dissymetry is associated with the use of a hyperbasis. The elements of the hyperbasis do not belong to zx

and so has no elements associated in Ex either. However, the inner product of it with any element of zx is well-defined and it permits to associate a bra belonging to E ∗

x. Indeed, by the theory of Hilbert spaces the correspondingket must exists, what really happens is that we cannot construct it as an element of our hyperbasis, this is perfectlyundestandable since such elements are out of our Hilbert space.

Notice that we have indeed extended the concept of inner product and we have applied it to elements out of ourHilbert space. For practical reasons it is usual to associate the bras 〈ξx0 | ∈ E∗

x to the “generalized ket” |ξx0〉 thatare not physical states but are advantageous from the practical point of view.

Page 72: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

72 CAPITULO 1. LINEAR OR VECTOR SPACES

Another example is the continuous basis consisting of plane waves truncated outside an interval of width L

v(L)p0 (x) =

1√2π~

eip0x/~ ; −L2≤ x ≤ L

2

with the function v(L)p0 (x) going rapidly to zero outside of that interval, but keeping continuity and differentiability.

The ket associated is denoted as∣∣∣v(L)p0

v(L)p0 (x) ∈ zx ↔

∣∣∣v(L)p0

⟩∈ Ex

the square of the norm is ∼ L/2π~, diverges if L→ ∞. Therefore

lımL→∞

∣∣∣v(L)p0

⟩/∈ Ex

now we consider the limit of the bra⟨v(L)p0

∣∣∣ associated with∣∣∣v(L)p0

⟩and applied to an arbitrary vector |ψ〉 ∈ Ex

⟨v(L)p0

∣∣∣ψ〉 =(v(L)p0 , ψ

)' 1√

2π~

∫ L/2

−L/2dx e−ip0x/~

in the limit L → ∞ we find ψ (p0) i.e. the Fourier transform of ψ (x) evaluated at p = p0. From which we see thatthe inner product converges and is well-defined

lımL→∞

⟨v(L)p0

∣∣∣ ≡ 〈vp0 | ∈ E∗x

but it does not correspond to the ket associated with the limit of kets of the form∣∣∣v(L)p0

⟩.

We could take the results above with the following point of view, the ket |ξx0〉 means the ket given by∣∣∣ξ(ε)x0

⟩with

ε much smaller than any other length involved in the problem, so we are really working in Ex. The results obtainedat the end depends very little on ε as long as it is much smaller than any other length in the problem. Certainly,∣∣∣ξ(ε)x0

⟩does not form an orthonormal basis, and do not satisfy a closure realtion with ε 6= 0, but it aproaches the

orthonormality and closure conditions as ε becomes very small.

The introduction of generalized kets, will ensure that we balance bras and kets in the limits concerned above.Generalized kets do not have finite norm, but they can acquire a finite inner product with kets of our space of states.

1.38. The action of linear operators in Dirac notation

Linear operators are characterized easily in Dirac notation

∣∣ψ′⟩ = A |ψ〉 ; |ψ〉 ,∣∣ψ′⟩ ∈ Ex

A (α |ψ〉 + β |ϕ〉) = αA |ψ〉 + βA |ϕ〉

the product of operators writes

AB |ψ〉 = A (B |ψ〉)

it is also important to calculate the inner product between |ϕ〉 and |ψ ′〉 = A |ψ〉 in the form

(|ϕ〉 ,

∣∣ψ′⟩) = (|ϕ〉 , A |ψ〉) = 〈ϕ| (A |ψ〉)

this is usually denoted simply as

〈ϕ| (A |ψ〉) ≡ 〈ϕ|A |ψ〉

Page 73: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.38. THE ACTION OF LINEAR OPERATORS IN DIRAC NOTATION 73

1.38.1. Projectors

The simplest of all projectors are the ones in which the range are one dimensional subspaces of the Hilbertspace. Let |ψ〉 be the one dimensional space spanned by the single non-zero ket |ψ〉. The projector P |ψ〉 takes anarbitrary ket |ϕ〉 ∈ Ex and maps it into |ψ〉 i.e.

P|ψ〉 |ϕ〉 = α |ψ〉 ; α ≡ 〈ψ|ϕ〉

in Dirac notation it could be written as

P|ψ〉 ≡ |ψ〉 〈ψ| ; P|ψ〉 |ϕ〉 = (|ψ〉 〈ψ|) |ϕ〉 = |ψ〉 〈ψ|ϕ〉 = α |ψ〉 (1.152)

the most important property of a projector is the idempotence so that

P 2|ψ〉 ≡ (|ψ〉 〈ψ|) (|ψ〉 〈ψ|) = |ψ〉 〈ψ|ψ〉 〈ψ| = P|ψ〉

⇒ 〈ψ|ψ〉 = 1

so the definition of P|ψ〉 Eq. (1.152) as a projector is consistent only if |ψ〉 is normalized.Now we can write the projector onto a subspace of more than one dimension. If nj is the dimension of the

subspace M(nj)j ⊆ Ex we can define the projector from a complete orthonormal set

∣∣uij⟩

; i = 1, .., nj (1.153)

that spans such a subspace

Ex = M(n1)1 ⊕ . . . ⊕M

(nj)j ⊕ . . .

x = x1 + . . .+ xj + . . .

x =

n1∑

i=1

α(1)i ui1 + . . . +

nj∑

i=1

α(j)i uij + . . .

α(n)k ≡

(ukn, x

)

PMjx = xj =

nj∑

i=1

α(j)i uij

PMjx =

nj∑

i=1

(uij, x

)uij

in Dirac notation it is

PMj |x〉 =

nj∑

i=1

〈uij |x〉∣∣uij⟩

=

nj∑

i=1

(∣∣uij⟩ ⟨uij∣∣) |x〉

thus a direct notation for the projector is

PMj ≡nj∑

i=1

∣∣uij⟩ ⟨uij∣∣ (1.154)

it is clear that this is a projector as long as Eq. (1.153) defines an orthonormal set that spans M(nj)j of dimension

nj.

P 2Mj

=

( nj∑

i=1

∣∣uij⟩ ⟨uij∣∣)( nj∑

k=1

∣∣∣ukj⟩⟨

ukj

∣∣∣)

=

nj∑

i=1

nj∑

k=1

∣∣uij⟩〈uij∣∣∣ukj⟩⟨

ukj

∣∣∣

P 2Mj

=

nj∑

i=1

nj∑

k=1

∣∣uij⟩δik

⟨ukj

∣∣∣ =

nj∑

i=1

∣∣uij⟩ ⟨uij∣∣ = PMj

Page 74: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

74 CAPITULO 1. LINEAR OR VECTOR SPACES

If we have an observable A, its spectrum of eigenvectors forms a basis and we can construct a complete orthonormalset. In that case, the spectral theorem (assuming it can be extended to infinite dimension for observables) says thatthe identity and the observable A itself can be decomposed by means of the projectors built on each eigensubspaceof the observable, if Mi is the eigensubspace generated by the eigenvalue λi of A we have that

Ex = M1 ⊕ . . . ⊕Mi ⊕ . . .

x = x1 + . . .+ xi + . . .

Pix = xi

in Dirac notation we have

Pi =

ni∑

j=1

∣∣∣uji⟩⟨

uji

∣∣∣

the spectral theorem says that

∞∑

i=1

Pi =∞∑

i=1

ni∑

j=1

∣∣∣uji⟩⟨

uji

∣∣∣ = I (1.155)

∞∑

i=1

λiPi =

∞∑

i=1

ni∑

j=1

λi

∣∣∣uji⟩⟨

uji

∣∣∣ = A (1.156)

these forms will be applied frequently in quantum mechanics. Notice that Eq. (1.155) is valid if and only ifuji

is a complete orthonormal set. Thus the decomposition of the identity in projectors is usually taken as the closurerelation for the basis (or hyperbasis) in which we are working.

It is also usual to work with a more general type of projector of the form

P = |ψ〉 〈ϕ| (1.157)

applying an arbitrary vector on it we find

|ψ〉 〈ϕ|χ〉 = α |ψ〉 ;α ≡ 〈ϕ|χ〉

this is a projector on the one dimensional subspace |ψ〉. This operator is idempotent only if 〈ϕ| is normal, howeverit defines a non-orthogonal projection, since we shall see later that this operator is not self-adjoint or hermitian.

1.39. Hermitian conjugation

We have defined the action of a linear operator on a ket. We see that it induces a natural action of the operatoron the bra

f|ϕ〉 (A |ψ〉) = (|ϕ〉 , A |ψ〉) ≡ gA|ϕ〉 (|ψ〉) ∀ |ψ〉 ∈ Ex (1.158)

the definition of the new functional gA|ϕ〉 from a given f|ϕ〉 and a given A is written in Dirac notation as13

f|ϕ〉 ≡ 〈ϕ| A→ gA|ϕ〉 ≡ 〈ϕ|A (1.159)

and Eq. (1.158) is written as

〈ϕ| (A |ψ〉) = (〈ϕ|A) (|ψ〉) (1.160)

so it is written simply as

〈ϕ|A |ψ〉13Notice that gA|ψ〉 is a new functional induced from f|ϕ〉 and A. Of course gA|ψ〉 must be associated to some vector i.e. gA|ψ〉 = f|χ〉

for some |χ〉 in our vector space, but it does not concern us. In particular, it is very important to observe that gA|ψ〉 6= fA|ψ〉.

Page 75: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.39. HERMITIAN CONJUGATION 75

we should check that g is indeed a functional i.e. that it is a continuous linear mapping of the vectors into thecomplex numbers, the basic properties of functionals are reproduced

gαA|ϕ〉+βA|χ〉 (ψ) = α∗gA|ϕ〉 (|ψ〉) + β∗gA|χ〉 (|ψ〉)gA|ϕ〉 (α |ψ〉 + β |χ〉) = αgA|ϕ〉 (|ψ〉) + βgA|ϕ〉 (|χ〉)

Further, the association (1.159) is linear, to see it, we write a linear combination of bras

〈ϕ| = λ1 〈ϕ1| + λ2 〈ϕ2|which means that

〈ϕ|ψ〉 = λ1 〈ϕ1|ψ〉 + λ2 〈ϕ2|ψ〉 ; ∀ |ψ〉 ∈ Exthen

(〈ϕ|A) (|ψ〉) = 〈ϕ| (A |ψ〉) = (λ1 〈ϕ1| + λ2 〈ϕ2|) (A |ψ〉)= λ1 〈ϕ1| (A |ψ〉) + λ2 〈ϕ2| (A |ψ〉)= λ1 (〈ϕ1|A) |ψ〉 + λ2 (〈ϕ2|A) |ψ〉

since ψ is arbitrary we find〈ϕ|A = λ1 〈ϕ1|A+ λ2 〈ϕ2|A

notice that is different to start with a linear combination of kets from starting with a linear combination of bras,because the linear combination of a ket corresponds to a linear combination with conjugate coefficients in the bras(antilinearity). The order is important, the new bra induced from 〈ϕ| by the operator A is written as 〈ϕ|A and notin the form A 〈ϕ|. For instance if we apply this relations to a ket the first expression 〈ϕ|A |ψ〉 is a complex number,while the second A 〈ϕ|ψ〉 = αA is another operator.

1.39.1. The adjoint operator A† in Dirac notation

In Dirac notation we write |ψ′〉 = A |ψ〉 ≡ |Aψ〉. We now want to know what is the corresponding bra |ψ ′〉 ↔〈ψ′| ≡ 〈Aψ|. In mathematical notation the question is

|ψ〉 → f|ψ〉 ;∣∣ψ′⟩ = A |ψ〉 ≡ |Aψ〉 ⇒

∣∣ψ′⟩ ?→ f|ψ′〉

to elucidate the answer we apply an arbitrary vector |ϕ〉 to the functional we want to find

fA|ψ〉 (|ϕ〉) = f|ψ′〉 (|ϕ〉) = 〈ψ′ |ϕ〉 = 〈Aψ|ϕ〉 = 〈ψ|A†ϕ〉where we have applied property (1.35). Now we apply property (1.160) to get

f|ψ′〉 (|ϕ〉) = 〈ψ|(∣∣∣A†ϕ

⟩)=(〈ψ|A†

)(|ϕ〉)

since this is valid for |ϕ〉 arbitrary we findf|ψ′〉 ≡

⟨ψ′∣∣ = 〈ψ|A†

in Dirac notation we have then∣∣ψ′⟩ = A |ψ〉 ≡ |Aψ〉⟨ψ′∣∣ = 〈ψ|A† ≡ 〈Aψ|

notice that as before, the mapping of the dual space into itself is denoted with the operator defined on the right-handside and not on the left14. Further by assigning A = λI and taking into account that A† = λ∗I we have that

⟨ψ′∣∣ = 〈λψ| = 〈λIψ| = 〈ψ| (λI)† = 〈ψ| λ∗I ⇒

〈λψ| = λ∗ 〈ψ|14Stricktly speaking, a mapping of the dual (or conjugate) space into itself is carried out by the conjugate operator instead of the

adjoint operator since the latter maps the Hilbert space into itself and not the dual. Notwithstanding, from the practical point of viewthis subtlety is irrelevant.

Page 76: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

76 CAPITULO 1. LINEAR OR VECTOR SPACES

in agreement with Eq. (1.150). On the other hand since

⟨ψ′∣∣ϕ〉 = 〈ϕ|ψ′〉∗

we see that〈ψ|A† |ϕ〉 = 〈ϕ|A |ψ〉∗ (1.161)

and we remember the most important properties of the adjoint operators (see Eqs. (1.34))

(A†)†

= A , (αA+ βB)† = α∗A† + β∗B† (1.162)

(AB)† = B†A† (1.163)

1.39.2. Mathematical objects and hermitian conjugation in Dirac notation

In general, the order of bras, kets and operators is of major importance, the only objects we can put in anyorder are scalars, for instance the mathematical objects

λ 〈ϕ|B |ψ〉 ; λ 〈ψ|B |ϕ〉 ; λ 〈ψ|ϕ〉B ; λ |ψ〉 〈ϕ|B (1.164)

are all distinct each other, the first and second are complex numbers, while the last two are operators, as can beverified by applying an arbitrary vector on the right-hand side of these objects. However, expressions like

λ |ψ〉 〈ϕ|B ; |ψ〉 λ 〈ϕ|B ; |ψ〉 〈ϕ| λB ; |ψ〉 〈ϕ|Bλ

are all equal, indeed we could think about the multiplication by a scalar as equivalent to the operator λI whichcommutes with everything.

We shall now define a useful operation that we call hermitian conjugation. Our basic objects are kets, bras,operators and scalars. In general words, hermitian conjugations are mappings induced by the existence of the dualE∗ of our Hilbert space E .

A ket |ψ〉 ∈ E is naturally mapped into a bra 〈ψ| ∈ E ∗.A bra 〈ψ| ∈ E∗ is naturally mapped into an element of the conjugate space of E ∗, i.e on E∗∗. However, for Hilbert

spaces it can be shown that E∗∗ = E hence the bra is mapped into its corresponding ket15.An operator A in ß(E) is mapped naturally into the conjugate vector A∗ in ß(E∗) but the inner product structure

permits in turn to define another operator A† in ß(E) from A∗ and from the practical point of view we regard A∗

and A† as identical. Thus the hermitian conjugation in this case will be the mapping A→ A†.Now finally for scalars. Taking into account that for all practical uses scalars λ can be considered as operators

in ß(E) of the form λI we see that the natural hermitian conjugation gives λI → (λI)† = λ∗. Therefore, the naturalconjugation operation is λ→ λ∗.

We notice now that the hermitian conjugation reverses the order of the objects to which it is applied. We haveseen that (A |ψ〉)† = 〈ψ|A†, Eq. (1.163) shows that the order of a product of operators is reversed when we applythe “adjointness” (or hermitian conjugation) on that product, when scalars are involved the place in which scalarsare located is irrelevant.

By the same token, let us see what is the conjugate of the non orthogonal projection defined in (1.157)

P = |ψ〉 〈ϕ| ; P † = (|ψ〉 〈ϕ|)†

applying Eq. (1.161) we find

〈χ| (|ψ〉 〈ϕ|)† |η〉 = [〈η| (|ψ〉 〈ϕ|) |χ〉]∗ = 〈η|ψ〉∗ 〈ϕ|χ〉∗ = 〈χ|ϕ〉 〈ψ| η〉〈χ| (|ψ〉 〈ϕ|)† |η〉 = 〈χ| (|ϕ〉 〈ψ|) |η〉 ; ∀ |η〉 , |χ〉 ∈ E

then we have(|ψ〉 〈ϕ|)† = |ϕ〉 〈ψ| (1.165)

15In Banach spaces, the property B∗∗ = B is called reflexibity and is not in general satisfied. For Hilbert spaces, reflexibity is automaticfrom which we can assign the dual element of a dual element to the original vector. This is another satisfying property of Hilbert spaces,not accomplished by general Banach spaces.

Page 77: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.40. THEORY OF REPRESENTATIONS OF E IN DIRAC NOTATION 77

once again, the hermitian conjugation converts each object in its hermitian conjugate and reverse the order of suchobjects.

These observations permit to give a rule to obtain the hermitian conjugate of a mathematical object composedby a juxtaposition of bras, kets, operators and scalars. The rule is (a) replace each object by its hermitian conjugate

|ψ〉 → 〈ψ| , 〈ϕ| → |ϕ〉 , A→ A† , λ→ λ∗

and (b) reverse the order of the factors, taking into account that the position of the scalars are not relevant.

The hermitian conjugate of the objects defined in (1.164) are given by

[λ 〈ϕ|B |ψ〉]† = 〈ψ|B† |ϕ〉 λ∗ = λ∗ 〈ψ|B† |ϕ〉 = [λ 〈ϕ|B |ψ〉]∗

[λ 〈ψ|B |ϕ〉]† = 〈ϕ|B† |ψ〉 λ∗ = λ∗ 〈ϕ|B† |ψ〉 = [λ 〈ψ|B |ϕ〉]∗

[λ 〈ψ|ϕ〉B]† = B† 〈ϕ|ψ〉λ∗ = λ∗ 〈ϕ|ψ〉B† = (λ 〈ψ|ϕ〉)∗B†

[λ |ψ〉 〈ϕ|B]† = B† |ϕ〉 〈ψ| λ∗ = λ∗B† |ϕ〉 〈ψ| = λ∗B† [|ψ〉 〈ϕ|]†

in the first two expressions the original mathematical objects are scalars and hence the hermitian conjugates are alsoscalars (the complex conjugates of the original scalars). In the third expression the original object is an operatorand its hermitian conjugate is also an operator (the adjoint of the original operator). In the fourth expression, theoriginal object is a product of two operators and a scalar (a scalar times a projection times the operator B) and theadjoint is the product of the scalar and adjoint of each of the operators in reverse order. In each case, the scalarsare located in the most convenient place since their positions are unimportant. Indeed, we can put the conjugate ofthe scalars in any place, for instance in the case

[λ |χ〉 〈ψ|B |ϕ〉]† = [λ 〈ψ|B |ϕ〉 |χ〉]† = λ∗ 〈ψ|B |ϕ〉∗ 〈χ|

that coincides with the rules when we take into account Eq. (1.161).

It is important to see that according to (1.165) the projectors given by (1.152) are hermitian, thus according totheorem 1.44, they are orthogonal projectors (i.e. projectors in the sense of a Hilbert space), this in turn says thatthe sums in (1.154) are also orthogonal projectors (see theorem 1.50). On the other hand, the projectors describedby (1.157) with |ϕ〉 6= |ψ〉 are non-hermitian and consequently they are non-orthogonal projections.

1.40. Theory of representations of E in Dirac notation

For most of our purposes we shall use a representation with respect to orthonormal bases. The particular problemsuggests the particular basis to work with. Most of the developments here are not new but gives us a very goodopportunity of using the Dirac notation and be aware of its great advantages as a tool for calculations. We are goingto describe the representation theory in both discrete and continuous bases.

1.40.1. Orthonormalization and closure relation

In Dirac notation, the orthonormality of a set of discrete |ui〉 or continuous |wα〉 orthonormal kets isexpressed by

〈ui |uj〉 = δij ; 〈wα |wα′〉 = δ(α− α′)

we emphasize once again that 〈wα |wα〉 diverges so that |wα〉 does not have a bounded norm and thus it does notbelong to our state space. We call |wα〉 generalized kets because they can be used to expand any ket of our statespace.

A discrete set ui or a continuous one wα constitutes a basis if each ket |ψ〉 of our state space can be expandedin a unique way on each of these sets

|ψ〉 =∑

i

ci |ui〉 ; |ψ〉 =

∫dα c (α) |wα〉 (1.166)

Page 78: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

78 CAPITULO 1. LINEAR OR VECTOR SPACES

the problem is considerably simplified if we asume that the bases are orthonormal, because in that case we canextract the coefficients by applying a bra 〈uk| or 〈wα′ | on both sides of these equations

〈uk |ψ〉 = 〈uk|∑

i

ci |ui〉 ; 〈wα′ |ψ〉 = 〈wα′ |∫dα c (α) |wα〉

〈uk |ψ〉 =∑

i

ci 〈uk|ui〉 =∑

i

ciδki = ck

〈wα′ |ψ〉 =

∫dα c (α) 〈wα′ |wα〉 =

∫dα c (α) δ

(α− α′) = c

(α′)

from which we obtain the familiar result

ck = 〈uk |ψ〉 ; c(α′) = 〈wα′ |ψ〉 (1.167)

replacing the Fourier coefficients (1.167) in the expansions (1.166) we find

|ψ〉 =∑

i

〈ui |ψ〉 |ui〉 =∑

i

|ui〉 〈ui |ψ〉 =

(∑

i

|ui〉 〈ui|)|ψ〉

|ψ〉 =

∫dα 〈wα |ψ〉 |wα〉 =

∫dα |wα〉 〈wα |ψ〉 =

(∫dα |wα〉 〈wα|

)|ψ〉

since this is valid for any ket |ψ〉 ∈ E the operators in parenthesis must be the identity operator on E

Pui ≡∑

i

|ui〉 〈ui| = I ; Pwα ≡∫dα |wα〉 〈wα| = 1 (1.168)

we can reverse the steps and show that applying the identity in the form given by Eqs. (1.168) we obtain that any|ψ〉 ∈ E must be a unique linear combination of |ui〉 or |wα〉

|ψ〉 = I |ψ〉 = Pui |ψ〉 =

(∑

i

|ui〉 〈ui|)|ψ〉 =

i

|ui〉 〈ui|ψ〉

|ψ〉 =∑

i

ci |ui〉 ; ci ≡ 〈ui|ψ〉 (1.169)

|ψ〉 = I |ψ〉 = Pwα |ψ〉 =

[∫dα |wα〉 〈wα|

]|ψ〉 =

∫dα |wα〉 〈wα|ψ〉

|ψ〉 =

∫dα c (α) |wα〉 ; c (α) ≡ 〈wα|ψ〉

these facts show that Eqs. (1.168) manifest a closure relation in Dirac notation. This is consistent with our discussionin Sec. 1.38.1 that led to Eq. (1.155), in which we saw that each element of the form |ui〉 〈ui| is a projector operatorand Eqs. (1.168) are decompositions of the identity in projectors16. In other words, the projector given by the sumsin (1.168) has the whole space as its range. In the case of the continuous basis, they are “hyperprojectors” but weshall call them projectors from now on.

Hence the representation of a ket |ψ〉 in a discrete basis is given by the set of its fourier coefficients 〈u i|ψ〉 itis usually written in matrix form as a column matrix

|ψ〉 =

〈u1|ψ〉〈u2|ψ〉

...〈ui|ψ〉

...

=

c1c2...ci...

16In Eq. (1.155) the lower index labels the eigenvalue and the upper index indicates the degree of degeneracy of the given eigenvalue.In Eq. (1.168) the single index runs over all different eigenvectors.

Page 79: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.40. THEORY OF REPRESENTATIONS OF E IN DIRAC NOTATION 79

the representation of a ket |ψ〉 in a continuous basis is given by the set of its fourier transforms 〈u i|ψ〉 it is usuallywritten in continuous matrix form as a column matrix

|ψ〉 =

...〈wα|ψ〉

...

=

...c (α)

...

the representation of a bra can be obtain by the same insertion of the identity as follows

〈ψ| = 〈ψ| I = 〈ψ|Pui =∑

i

〈ψ| ui〉 〈ui|

〈ψ| =∑

i

c∗i 〈ui| ; ci = 〈ui|ψ〉

which can also be obtained by taking the hermitian conjugation of Eq. (1.169) and applying (1.150). For continuousbasis the process is similar

〈ψ| = 〈ψ| I = 〈ψ|Pwα =

∫dα 〈ψ|wα〉 〈wα|

〈ψ| =

∫dα c∗ (α) 〈wα| ; c (α) = 〈wα|ψ〉

in matrix notation the bra is represented as a one row matrix of the coefficients, in both the discrete and continuouscases

〈ψ| =(〈ψ| u1〉 〈ψ| u2〉 · · · 〈ψ| ui〉 · · ·

)

〈ψ| =(c∗1 c∗2 · · · c∗3 · · ·

)

〈ψ| =(· · · c∗ (α) · · ·

)

by comparing the representation of the corresponding ket |ψ〉 we see that the representation of the bra is obtainedby transposing the matrix representative of the ket (i.e. converting the column in a row) and taking the conjugateof each element.

Let us reproduce the inner product expressions (1.106) and (1.113) by insertion of the identity with projectors

〈ϕ|ψ〉 = 〈ϕ| I |ψ〉 = 〈ϕ|Pui |ψ〉 =∑

i

〈ϕ| ui〉〈ui |ψ〉

〈ϕ|ψ〉 =∑

i

b∗i ci ; bi = 〈ui|ϕ〉 ; ci = 〈ui |ψ〉

〈ϕ|ψ〉 = 〈ϕ| I |ψ〉 = 〈ϕ|Pwα |ψ〉 =

∫dα 〈ϕ|wα〉〈wα |ψ〉

〈ϕ|ψ〉 =

∫dα b∗ (α) c (α) ; b (α) = 〈wα|ϕ〉 ; c (α) = 〈wα |ψ〉

in matrix form we can see the inner product as the product of a row vector times a column vector

〈ϕ|ψ〉 =(b∗1 b∗2 · · · b∗3 · · ·

)

c1c2...ci...

=∑

i

b∗i ci

Page 80: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

80 CAPITULO 1. LINEAR OR VECTOR SPACES

in continuum form we have

〈ϕ|ψ〉 =(· · · b∗ (α) · · ·

)

...c (α)

...

=

∫dα b∗ (α) c (α)

and the norms are obtained with ϕ = ψ i.e. bi = ci or b (α) = c (α)

〈ψ|ψ〉 = ‖ψ‖2 =∑

i

|ci|2 =

∫dα |c (α)|2

1.40.2. Representation of operators in Dirac notation

Let us see the representation of an operator A under a basis ui or wα. We have seen that a matrix repre-sentative of A under the basis ui is

Aij = 〈ui|Auj〉 = 〈ui|A |uj〉and in a continuous basis

A(α, α′) = 〈wα|A |wα′〉

they are arranged in a square matrix with infinite countable or continuous numbers of columns and rows

A =

A11 A12 · · · A1j · · ·A21 A22 · · · A2j · · ·...

......

Ai1 Ai2 · · · Aij · · ·...

......

A =

...· · · A (α, α′) · · ·

...

it is interesting to see the matrix representative of a product of operators by insertion of the identity

(AB)ij = 〈ui|AB |uj〉 = 〈ui|AIB |uj〉 = 〈ui|APuiB |uj〉 =∑

k

〈ui|A |uk〉 〈uk|B |uj〉

(AB)ij =∑

k

AikBkj

which coincides with the algorithm for matrix multiplication developed in Sec. 1.14.1, Eq. (1.49). We can developeasily the matrix multiplication algorithm with continuum matrices

(AB) (α, β) = 〈wα|AB |wβ〉 = 〈wα|AIB |wβ〉 = 〈wα|APuiB |wβ〉

(AB) (α, β) =

∫dγ 〈wα|A |wγ〉 〈wγ |B |wβ〉

(AB) (α, β) =

∫dγ A (α, γ)B (γ, β) (1.170)

now let us see the matrix representative of the ket |ψ ′〉 given by

A |ψ〉 =∣∣ψ′⟩

from the knowledge of the components of |ψ〉 and A, in a given representation ui. The coordinates of |ψ′〉 in thisbasis is

c′i = 〈ui∣∣ψ′⟩ = 〈ui|A |ψ〉 = 〈ui|AI |ψ〉 = 〈ui|APui |ψ〉 =

k

〈ui|A |uk〉 〈uk|ψ〉

c′i =∑

k

Aikck

Page 81: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.40. THEORY OF REPRESENTATIONS OF E IN DIRAC NOTATION 81

that explicitly can be illustrated as

c′1c′2...c′i...

=

A11 A12 · · · A1j · · ·A21 A22 · · · A2j · · ·...

......

Ai1 Ai2 · · · Aij · · ·...

......

c1c2...ci...

with a continuous basis wα we have

c′ (α) = 〈wα|ψ′〉 = 〈wα|A |ψ〉 = 〈wα|AI |ψ〉 = 〈wα|APwα |ψ〉 =

∫dβ 〈wα|A |wβ〉 〈wβ |ψ〉

c′ (α) =

∫dβ A (α, β) c (β)

which is the continuous extension of multiplication of a matrix with a column vector.Let us see the representation of the bra 〈ψ|A

〈ψ|A = 〈ψ| IAI =∑

i

j

〈ψ| ui〉 〈ui|A |uj〉 〈uj|

=∑

i

j

c∗iAij 〈uj|

Therefore, the bra 〈ψ|A is represented by the product of the row matrix that represents 〈ψ| times the squarematrix representing A respecting the order

〈ψ|A =(c∗1 c∗2 · · · c∗3 · · ·

)

A11 A12 · · · A1j · · ·A21 A22 · · · A2j · · ·...

......

Ai1 Ai2 · · · Aij · · ·...

......

observe that the matrix product is not defined in the opposite order, thus we cannot give meaning to A 〈ψ|.In many cases, it is also interesting to calculate the element 〈ϕ|A |ψ〉 in terms of the coordinates of the bra and

the ket and in terms of the components of A. To do it, we insert an expansion of the identity twice

〈ϕ|A |ψ〉 = 〈ϕ| IAI |ψ〉 = 〈ϕ|PuiAPui |ψ〉 =∑

i

j

〈ϕ| ui〉 〈ui|A |uj〉 〈uj |ψ〉

〈ϕ|A |ψ〉 =∑

i

j

b∗iAijcj ; bi = 〈ui|ϕ〉, Aij = 〈ui|A |uj〉 , cj = 〈uj |ψ〉

which in matrix form is written as a bilinear form

〈ϕ|A |ψ〉 =(b∗1 b∗2 · · · b∗3 · · ·

)

A11 A12 · · · A1j · · ·A21 A22 · · · A2j · · ·...

......

Ai1 Ai2 · · · Aij · · ·...

......

c1c2...ci...

(1.171)

this is the natural way of superposing the representations of 〈ϕ|, A, and |ψ〉 respecting the order. The result is ofcourse a number. The extension for continuous bases is

〈ϕ|A |ψ〉 = 〈ϕ|PwαAPwβ |ψ〉 =

∫dα

∫dβ 〈ϕ|wα〉 〈wα|A |wβ〉 〈wβ |ψ〉

Page 82: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

82 CAPITULO 1. LINEAR OR VECTOR SPACES

and we obtain

〈ϕ|A |ψ〉 =

∫ ∫dα dβ b∗ (α) A (α, β) c (β)

b (α) = 〈wα|ϕ〉 ; A (α, β) = 〈wα|A |wβ〉 ; c (β) = 〈wβ |ψ〉

notice that Eq. (1.160) expresses the associativity of the matrix expressions given by Eq. (1.171).

Finally, the projection operator P = |ψ〉 〈ψ| has matrix representative given by

Pij = 〈ui|P |uj〉 = 〈ui|ψ〉〈ψ |uj〉 = cic∗j

in matrix language it is written as

|ψ〉 〈ψ| =

c1c2...ci...

(c∗1 c∗2 · · · c∗3 · · ·

)=

c1c∗1 c1c

∗2 · · · c1c

∗j · · ·

c2c∗1 c2c

∗2 · · · c2c

∗j · · ·

......

...cic

∗1 cic

∗2 · · · cic

∗j · · ·

......

...

this representation is particularly simple when P = |uk〉 〈uk| i.e. when the ket that forms the projector is part ofthe basis.

The matrix representation of the adjoint operator is obtained by using property (1.161)

(A†)ij

= 〈ui|A† |uj〉 = 〈uj |A |ui〉∗ = A∗ji

(A†)

(α, β) = 〈wα|A† |wβ〉 = 〈wβ |A |wα〉∗ = A∗ (β, α)

these results coincide with the one obtained in Eq. (1.69). If A is hermitian then A = A† and

Aij = A∗ji ; A (α, β) = A∗ (β, α) (1.172)

in particular applying these conditions for i = j or α = β we see that the diagonal elements of an hermitian matrixare real. These facts are valid only if the basis is orthonormal, otherwise the matrix representative of the adjoint ofthe matrix takes another form.

1.41. Change of representations

In a representation characterized by a given orthonormal basis |ui〉 the kets, bras and operators have somespecific matrix representatives. We want to write the matrix representative of these objects in a new orthonormalbasis |tk〉 using the Dirac notation17. For future purposes we define the matrix S in the form

Sik ≡ 〈ui| tk〉 ;(S†)ki

= S∗ik = 〈tk| ui〉

To give a geometrical meaning to S, let define V(k)i ≡ Sik and V(k) the k−th column vector with components Sik.

Then, it is clear that V(k) is the matrix representative (column matrix) of the element |tk〉 in the basis |ui〉. Wethen construct a square matrix by putting these column vectors side by side

S =(

V(1) V(2) · · ·)

=

S11

S21...

S12

S22...

· · ·

=

S11 S12 · · ·S21 S22 · · ·...

...

17This problem is a bit lees general that the one treated in Sec. (1.14), because in that section the bases involved are non necessarilyorthonormal. However, in this case we are treating the problem in infinite dimension.

Page 83: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.41. CHANGE OF REPRESENTATIONS 83

We can also see that S is a unitary matrix(S†S

)km

=∑

i

S†kiSim =

i

〈tk| ui〉 〈ui| tm〉 = 〈tk|Pui |tm〉 = 〈tk| tm〉 = δkm

(SS†

)ij

=∑

k

SikS†kj =

k

〈ui| tk〉 〈tk|uj〉 = 〈ui|Ptk |uj〉 = 〈ui|uj〉 = δij

consequentlyS†S = SS† = I

On the other hand, we will also require the closure and orthonormalization relations with both bases

Pui =∑

i

|ui〉 〈ui| = I ; 〈ui|uj〉 = δij

Ptk =∑

k

|tk〉 〈tk| = I ; 〈tk| tm〉 = δkm

1.41.1. Transformation of the coordinates of a ket

The coordinates of a ket |ψ〉 in the basis |ui〉 are 〈ui|ψ〉 ≡ |ψ〉(ui). To know the coordinates in the new basis〈tk|ψ〉, in terms of the old ones, we insert the closure relation for |uk〉 in the element 〈tk|ψ〉

〈tk|ψ〉 =∑

i

〈tk|ui〉 〈ui|ψ〉 =∑

i

S†ki 〈ui|ψ〉

c(t)k =

i

S†kic

(u)i ; c(t) = S†c(u)

The inverse relation can be obtained by taking into account that S † = S−1

c(t) = S−1c(u) ⇒ c(u) = Sc(t)

or alternatively by inserting an identity in the element 〈ui|ψ〉

〈ui|ψ〉 =∑

k

〈ui| tk〉 〈tk|ψ〉 =∑

k

Sik 〈tk|ψ〉

c(u)i =

k

Sikc(t)k ; c(u) = Sc(t)

1.41.2. Transformation of the coordinates of a bra

We insert the identity in the element 〈ψ| tk〉

〈ψ| tk〉 =∑

i

〈ψ| ui〉 〈ui| tk〉 =∑

i

〈ψ| ui〉Sik

c∗(t)k =

i

c∗(u)i Sik ⇒ c∗(t) = c∗(u)S

similarlyc∗(u) = c∗(t)S†

1.41.3. Transformation of the matrix elements of an operator

We start with 〈tk|A |tm〉 and insert two identities

〈tk|A |tm〉 = 〈tk| IAI |tm〉 =∑

i

j

〈tk| ui〉 〈ui|A |uj〉 〈uj |tm〉 =∑

i,j

S†kiA

(u)ij Sjm

A(t)km =

i,j

S†kiA

(u)ij Sjm ; A(t) = S†A(u)S (1.173)

Page 84: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

84 CAPITULO 1. LINEAR OR VECTOR SPACES

and the inverse relation is obtained from

〈uk|A |um〉 =∑

i,j

〈uk| ti〉 〈ti|A |tj〉 〈tj |um〉 =∑

i,j

SkiA(t)ij S

†jm

A(u)km =

i,j

SkiA(t)ij S

†jm ; A(u) = SA(t)S† (1.174)

or taking into account that S† = S−1.

1.42. Representation of the eigenvalue problem in Dirac notation

For a given observable A the eigenvalue problem reads

A |ψ〉 = λ |ψ〉

we want to construct its matrix representation in a basis ui. We first multiply by a bra of the form 〈ui| on bothsides

〈ui|A |ψ〉 = λ〈ui |ψ〉and insert an identity

j

〈ui|A |uj〉 〈uj |ψ〉 = λ〈ui |ψ〉∑

j

Aijcj = λci ; ci ≡ 〈ui |ψ〉 ; Aij ≡ 〈ui|A |uj〉

with ci and Aij the matrix elements of |ψ〉 and A in the basis ui. This expression can be rewritten as

j

[Aij − λδij ] cj = 0

which is the well known expression for the eigenvalue problem in matrix form.

1.42.1. C.S.C.O. in Dirac notation

Assume that a given set of observables A1, ..., Am forms a C.S.C.O. Then a given set of eigenvaluesa

(1)n1 , ..., a

(m)nm

defines a unique normalized eigenvector common to all the observables (within a phase factor). We shall see laterthat any set of kets that differ in a global phase factor

|ψ〉 , eiθ1 |ψ〉 , ..., eiθk |ψ〉

have the same physical information. Thus, the normalized ket associated with the seta

(1)n1 , ..., a

(m)nm

is unique from

the physical pointof view. Therefore, it is usual to denote the corresponding ket in the form |ψn1,...,nm〉 or simply as|n1, n2, ..., nm〉 and the set of eigenvalues are called quantum numbers.

Ai |n1, . . . , ni, ..., nm〉 = a(i)ni |n1, . . . , ni, ..., nm〉 ; i = 1, ..,m

1.43. The continuous bases |r〉 and |p〉From the wave functions space z we have constructed the abstract space Er such that there is an isometric

isomorphism of z onto Er, therefore they are abstractly identical as Hilbert spaces. Consequently, an elementψ (r) ∈ z has a unique image |ψ〉 ∈ Er and vice versa. In particular, the inner product must be preserved by thiscorrespondence

|ψ〉 ↔ ψ (r) ; |ϕ〉 ↔ ϕ (r) ; 〈ψ| ↔ ψ∗ (r) ; 〈ϕ| ↔ ϕ∗ (r)

(|ϕ〉 , |ψ〉) = (ϕ,ψ) ≡ 〈ϕ|ψ〉 =

∫d3r ϕ∗ (r) ψ (r)

Page 85: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.43. THE CONTINUOUS BASES |R〉 AND |P〉 85

Er will describe the state space of a spinless particle. We have discussed before that ψ (r) can also be interpretedas a representation of the abstract ket |ψ〉 in the continuous basis ξr (r′) defined in Eq. (1.119). We also saw thatξr (r′) are not elements of z, but they can be used to expand any element of z in a unique way. We call ξr (r′)“generalized wave functions” and it is natural to associate with them some “generalized kets” denoted as |r〉 thatdo not belong to Er but can expand any element of Er in such a way that if ψ (r) ↔ |ψ〉 then the expansion of ψ (r)under ξr (r′) has the same coefficients as the expansion of |ψ〉 under |r〉

ψ (r) =

∫dr′ c

(r′)ξr′ (r) ; |ψ〉 =

∫dr′ c

(r′) ∣∣r′

We denote this association as ξr ↔ |r〉. Similarly, for the continuous basis defined in Eq. (1.115) by vp (r) whichhas plane waves as “generalized wave functions”, we shall have a continuous basis of Er denoted as |p0〉

ξr(r′)↔ |r〉 ; vp (r) ↔ |p〉

therefore, using the bases ξr (r′) and vp (r) of z we have defined two continuous basis in Er denoted as|r〉 and |p〉. Consequently, all bras, kets and operators in Er will have a continuous matrix representationin these bases. The basis |r〉 is labeled by three continuous indices x, y, z which are the coordinates of a pointin three dimensional space. Similarly, the basis |p〉 is labeled by three continuous indices px, py, pz which arecomponents of a cartesian vector.

1.43.1. Orthonormalization and closure relations

We shall calculate 〈r |r′〉 using the definition of the scalar product in Er

〈r∣∣r′⟩

=

∫d3r′′ ξ∗r

(r′′)ξr′(r′′)

=

∫d3r′′ δ

(r′′ − r

)δ(r′′ − r′

)

〈r∣∣r′⟩

= δ(r − r′

)(1.175)

similarly

〈p∣∣p′⟩ =

∫d3r v∗p (r) vp′ (r) =

(1

2π~

)3 ∫d3r e−ip·r/~ eip

′·r =

(1

2π~

)3 ∫d3r e−i(p−p′)·r/~

〈p∣∣p′⟩ = δ

(p − p′)

where we have used property (1.116). The closure relations for |r〉 and |p〉 are written according with the secondof Eqs. (1.168) integrating over three indices instead of one. The orthonormality and closure relations for these basesare then

〈r∣∣r′⟩

= δ(r− r′

); 〈p

∣∣p′⟩ = δ(p − p′) (1.176)∫

d3r |r〉 〈r| = I ;

∫d3p |p〉 〈p| = I (1.177)

1.43.2. Coordinates of kets and bras in |r〉 and |p〉Consider an arbitrary ket |ψ〉 corresponding to a wave function ψ (r). The closure relations for |r〉 and |p〉

permits to expand |ψ〉 as

|ψ〉 =

∫d3r |r〉 〈r|ψ〉 =

∫d3r c (r) |r〉 ; |ψ〉 =

∫d3p |p〉 〈p|ψ〉 =

∫d3p c (p) |p〉 (1.178)

the coefficients c (r) = 〈r|ψ〉 and c (p) = 〈p|ψ〉 are calculated as follows

〈r|ψ〉 =

∫d3r′ ξ∗r

(r′)ψ(r′)

=

∫d3r′ δ

(r′ − r

)ψ(r′)

= ψ (r)

〈p|ψ〉 =

∫d3r v∗p (r) ψ (r) =

(1

2π~

)3/2 ∫d3r e−ip·r/~ψ (r) = ψ (p)

Page 86: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

86 CAPITULO 1. LINEAR OR VECTOR SPACES

hence

c (r) = 〈r|ψ〉 = ψ (r) ; c (p) = 〈p|ψ〉 = ψ (p) (1.179)

the coefficients c (r) of the expansion of |ψ〉 under |r〉 are the wave functions evaluated at the point r, this factreinforces the interpretation of the wave function as the representation of |ψ〉 under the basis |r〉. The coefficientsc (p) are the fourier transforms of the wave function, this coefficients ψ (p) are usually called “wave functions inmomentum space”, since they represent the same abstract vector |ψ〉 it is clear that ψ (r) and ψ (p) contain thesame physical information, this can also be seen by taking into account that given ψ (r) then ψ (p) is uniquelydetermined and vice versa. On the other hand, by comparing Eqs. (1.178, 1.179) with Eqs. (1.120, 1.121) we seethat if ψ (r) ↔ |ψ〉 then the expansion of ψ (r) under ξr (r′) has the same coefficients as the expansion of |ψ〉 under|r〉 as we demanded. Similar situation occurs with the basis vp in z and the basis |p〉 in Er.

An important particular case arises when |ψ〉 = |p〉 which is indeed a generalized ket. Assuming that all therelations above are also valid for generalized kets, and taking into account that |p〉 ↔ vp (r), then Eq. (1.179) gives

〈r|p〉 = vp (r) =

(1

2π~

)3/2

eip·r/~ (1.180)

the same result is obtained by taking into account the equality of the inner product of vectors in z and vectors inEr when this equality is extended to generalized vectors

〈r|p〉 = (|r〉 , |p〉) = (ξr, vp) =

∫d3r′ ξ∗r

(r′)vp(r′)

=

∫d3r′ δ

(r′ − r

)vp(r′)

= vp (r)

applying Eq. (1.179) for |ψ〉 = |r′〉 ↔ ψ (r) = ξr′ (r) we find

〈r| r′〉 = ξr′ (r) = δ(r − r′

)

which is consistent with the orthonormalization relation. Similar arguments leads to

〈p| r〉 = v∗p (r) =

(1

2π~

)3/2

e−ip·r/~ ; 〈p|p′〉 = δ(p− p′)

Assume that we have an orthonormal basis ui (r) in z and an orthonormal basis |ui〉 in Er such thatui (r) ↔ |ui〉. Starting with the closure relation for |ui〉 in Er

i

|ui〉 〈ui| = I

and evaluating the matrix element of it between |r〉 and |r′〉 we have

i

〈r |ui〉 〈ui| r′〉 = 〈r| I∣∣r′⟩

= 〈r| r′〉

and using Eqs. (1.179, 1.176) we find ∑

i

ui (r)u∗i

(r′)

= δ(r− r′

)

which is the closure relation as it was expressed in Eq. (1.109) for ui (r) in z, reversing the steps we can obtainthe closure relation for |ui〉 in Er starting from the closure relation for ui (r) in z18.

Notice that the inner product of two kets in terms of their coordinates under the basis |r〉 is a particular caseof Eq. (1.113). Equivalently, we obtain it by insertion of the identity

〈ϕ |ψ〉 =

∫d3r 〈ϕ |r〉 〈r |ψ〉

18Notice that I (r, r′) = 〈r′| I |r〉 = 〈r′| r〉 = δ (r − r′) shows that the Dirac delta can be seen as the representation of the identityunder the continuous hyperbasis |r〉.

Page 87: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.43. THE CONTINUOUS BASES |R〉 AND |P〉 87

and interpreting the components 〈ϕ |r〉 and 〈r |ψ〉 as in Eq. (1.179)

〈ϕ |ψ〉 =

∫d3r ϕ∗ (r)ψ (r)

a similar procedure can be done for the basis |p〉

〈ϕ |ψ〉 =

∫d3p 〈ϕ |p〉 〈p |ψ〉 =

∫d3p ϕ∗ (p) ψ (p)

from which it is obtained ∫d3r ϕ∗ (r)ψ (r) =

∫d3p ϕ∗ (p) ψ (p)

this is a well-known property of the Fourier trasnforms.

1.43.3. Changing from the |r〉 representation to |p〉 representation and vice versa

The procedure is similar to the one in section 1.41 but for continuous basis. If we consider the change from|r〉 to |p〉, the unitary matrix S of changing the basis is

S (r,p) = 〈r |p〉 =

(1

2π~

)3/2

eip·r/~ (1.181)

a ket |ψ〉 is represented as ψ (r) in |r〉 and we know well that in |p〉 it is given by ψ (p). Here we see that it isconsistent with the formalism developed in Sec. 1.41

〈p |ψ〉 =

∫d3r 〈p |r〉 〈r |ψ〉 =

∫d3r S† (r,p) 〈r |ψ〉

ψ (p) =

(1

2π~

)3/2 ∫d3r e−ip·r/~ψ (r) (1.182)

similarly

〈r |ψ〉 =

∫d3p 〈r |p〉 〈p |ψ〉 =

∫d3p S (r,p) 〈p |ψ〉

ψ (r) =

(1

2π~

)3/2 ∫d3p eip·r/~ψ (p) (1.183)

the representation of bras can be obtained by hermitian conjugation of the relations with kets.Now for a given operator, the matrix elements in |p〉 read A (p′,p) = 〈p′|A |p〉 inserting two identities we get

⟨p′∣∣A |p〉 =

∫d3r′

∫d3r

⟨p′∣∣ r′〉

⟨r′∣∣A |r〉 〈r |p〉

⟨p′∣∣A |p〉 =

∫d3r′

∫d3r S† (r′,p′) A

(r′, r

)S (r,p)

which is the continuous generalization of (1.173). Using (1.181) we find

A(p′,p

)=

(1

2π~

)3 ∫d3r′

∫d3r e−ip

′·r′/~ A(r′, r

)eip·r/~

A(p′,p

)=

(1

2π~

)3 ∫d3r′

∫d3r e−i(p

′·r′−p·r)/~ A(r′, r

)

the inverse relation is obtained from

⟨r′∣∣A |r〉 =

∫d3p′

∫d3p

⟨r′∣∣p′〉

⟨p′∣∣A |p〉 〈p |r〉

⟨r′∣∣A |r〉 =

∫d3p′

∫d3p S

(r′,p′) A

(p′,p

)S† (r,p)

Page 88: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

88 CAPITULO 1. LINEAR OR VECTOR SPACES

this is the continuous generalization of (1.174). From (1.181) we find

A(r′, r

)=

(1

2π~

)3 ∫d3p′

∫d3p eip

′·r′/~ A(p′,p

)e−ip·r/~

A(r′, r

)=

(1

2π~

)3 ∫d3p′

∫d3p ei(p

′·r′−p·r)/~ A(p′,p

)

1.43.4. The R and P operators

Let |ψ〉 be an arbitrary ket of Er and ψ (r) = ψ (x, y, z) the corresponding wave function. We define an operatorX in the form19

∣∣ψ′⟩ = X |ψ〉such that in the |r〉 representation the associated wave function ψ ′ (r) = ψ (x, y, z) is given by

ψ′ (x, y, z) = xψ (x, y, z) (1.184)

so in the |r〉 representation, it corresponds to the operator that multiplies the wave function by x. We shouldemphasize however, that the operator X is defined on the Er state space. Eq. (1.184) can be expressed by

〈r|X |ψ〉 = 〈r|ψ′〉 = ψ′ (r) = xψ (r) = x〈r |ψ〉

Of course, we can introduce the operators Y and Z in a similar way

〈r|X |ψ〉 = x〈r |ψ〉 , 〈r|Y |ψ〉 = y〈r |ψ〉 , 〈r|Z |ψ〉 = z〈r |ψ〉 ; |r〉 = |x, y, z〉 (1.185)

we can consider X,Y,Z as the “components” of a “vector operator” R, by now it only means a condensed notationinspired in the fact that x, y, z are the components of the ordinary vector r.

These operators can be easily manipulated in the |r〉 representation. For instance, the element 〈ϕ|X |ψ〉 canbe calculated as

〈ϕ|X |ψ〉 =

∫d3r 〈ϕ| r〉 〈r|X |ψ〉 =

∫d3r ϕ∗ (r) x ψ (r)

similarly, we define the operators Px, Py, Pz that forms the “vector operator” P, such that their action in the |p〉representation is given by

〈p|Px |ψ〉 = px〈p |ψ〉 , 〈p|Py |ψ〉 = py〈p |ψ〉 , 〈p|Pz |ψ〉 = pz〈p |ψ〉 ; |p〉 = |px, py, pz〉 (1.186)

however, when we require to work with both operators simultaneously, we should choose only one basis. Hence, it isimportant to know how the operator P acts in the |r〉 representation, and how the operator R acts in the |p〉representation.

Let us first look for the way in which the operator P acts in the |r〉 representation. For this, we use Eqs.(1.179, 1.180, 1.186) to evaluate

〈r|Px |ψ〉 =

∫d3p 〈r|p〉 〈p|Px |ψ〉 =

∫d3p 〈r|p〉px 〈p|ψ〉 =

(1

2π~

)3/2 ∫d3p eip·r/~pxψ (p) (1.187)

to evaluate this term we start with the expression of the Fourier transform Eq. (1.183)

ψ (r) =

(1

2π~

)3/2 ∫ ∞

−∞d3p eip·r/~ψ (p)

∂ψ (r)

∂x=

(1

2π~

)3/2 ∫ ∞

−∞d3p

[∂

∂x

(eip·r/~

)]ψ (p)

∂ψ (r)

∂x=

(1

2π~

)3/2 ∫ ∞

−∞d3p

[i

~pxe

ip·r/~]ψ (p)

19The operator X does not belong to ß(Er), because for some square integrable functions ψ (r), the function ψ′ (r) defined in Eq.(1.184) is not square integrable.

Page 89: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.43. THE CONTINUOUS BASES |R〉 AND |P〉 89

we have that~

i

∂ψ (r)

∂x=

(1

2π~

)3/2 ∫ ∞

−∞d3p pxe

ip·r/~ψ (p) (1.188)

if we continue derivating this expression we find

∂nψ (r)

∂xn=

(1

2π~

)3/2 ∫ ∞

−∞d3p

[(i

~px

)neip·r/~

]ψ (p)

replacing (1.188) in (1.187) we obtain

〈r|Px |ψ〉 =~

i

∂ψ (r)

∂x

and similarly for Py, Pz . In vector form we summarize it as

〈r|P |ψ〉 =~

i∇〈r |ψ〉 (1.189)

in the |r〉 representation, the operator P coincides with the differential operator acting on the wave functions.Let us calculate 〈ϕ|Px |ψ〉 in the |r〉 representation

〈ϕ|Px |ψ〉 =

∫d3r 〈ϕ |r〉 〈r|Px |ψ〉 =

∫d3r ϕ∗ (r)

[~

i

∂x

]ψ (r) (1.190)

of great importance are the commutators among the components Pi, Ri. We shall calculate them in the |r〉representation, for instance

〈r| [X,Px] |ψ〉 = 〈r| (XPx − PxX) |ψ〉 = 〈r| (XPx) |ψ〉 − 〈r| (PxX) |ψ〉

= 〈r|X |Pxψ〉 − 〈r|Px |Xψ〉 = x 〈r|Pxψ〉 −~

i

∂x〈r|Xψ〉

= x 〈r|Px |ψ〉 −~

i

∂x〈r|X |ψ〉 =

~

ix∂

∂x〈r|ψ〉 − ~

i

∂x[x 〈r|ψ〉]

=~

ix∂

∂x〈r|ψ〉 − ~

ix∂

∂x[〈r|ψ〉] − ~

i〈r|ψ〉

so that

〈r| [X,Px] |ψ〉 = i~ 〈r|ψ〉

since this is valid for any ket |ψ〉 and any generalized ket |r〉 of the basis, we conclude that

[X,Px] = i~I

it is usual to omit the identity operator since it is not important for practical calculations. In a similar way, we cancalculate the other commutators, to condense notation it is convenient to define

R1 ≡ X, R2 ≡ Y, R3 ≡ Z, P1 ≡ Px, P2 ≡ Py, P3 ≡ Pz

to write

[Ri, Rj ] = [Pi, Pj ] = 0 ; [Ri, Pj ] = i~δij (1.191)

they are called canonical commutation relations. These relations are intrinsic and should not depend on the basisin which we derive them.

We can show that R and P are hermitian operators. For example let us show that X is hermitian

〈ϕ|X |ψ〉 =

∫d3r 〈ϕ |r〉 〈r|X |ψ〉 =

∫d3r ϕ∗ (r) x ψ (r) =

[∫d3r ψ (r)∗ x ϕ (r)

]∗

〈ϕ|X |ψ〉 = 〈ψ|X |ϕ〉∗

Page 90: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

90 CAPITULO 1. LINEAR OR VECTOR SPACES

since this is valid for arbitrary kets |ψ〉 and |ϕ〉, and taking into account Eq. (1.161) we conclude that X = X †. ForPx we see that

〈ϕ|Px |ψ〉 =

∫d3p 〈ϕ |p〉 〈p|Px |ψ〉 =

∫d3p ϕ∗ (p) px ψ (p) =

[∫d3p ψ (p)∗ px ϕ (p)

]∗

〈ϕ|Px |ψ〉 = 〈ψ|Px |ϕ〉∗

and Px = P †x . The procedure is the same for the other components of R and P

R = R† , P = P†

There is an alternative proof of the hermiticity of P by using its action in the |r〉 representation given by Eq.(1.189). Integrating Eq. (1.190) by parts we have

〈ϕ|Px |ψ〉 =~

i

∫dy dz

∫ ∞

−∞dx ϕ∗ (r)

[∂

∂x

]ψ (r)

=~

i

∫dy dz

[ϕ∗ (r) ψ (r)]x=∞

x=−∞ −∫ ∞

−∞dx ψ (r)

∂xϕ∗ (r)

since the scalar product 〈ϕ|ψ〉 is convergent, ϕ∗ (r) ψ (r) approaches zero when x → ±∞. Hence the first term onthe right-hand side vanishes and we find

〈ϕ|Px |ψ〉 = −~

i

∫d3r ψ (r)

∂xϕ∗ (r) =

[~

i

∫d3r ψ∗ (r)

∂xϕ (r)

]∗

〈ϕ|Px |ψ〉 = 〈ψ|Px |ϕ〉∗

two things deserve attention, first the presence of the i factor is essential because i∂/∂x is hermitian but ∂/∂x isnot. Second, we have used explicitly the fact that |ψ〉 and |ϕ〉 belong to Er by assuming that the scalar product〈ϕ|ψ〉 is convergent, so this proof is not valid for generalized kets.

1.43.5. The eigenvalue problem for R and P

Let us calculate the matrix element X (r′, r) of the operator X in the basis |r〉

X(r′, r

)=

⟨r′∣∣X |r〉 = x′

⟨r′∣∣ r〉 = x′δ

(r− r′

)= xδ

(r− r′

)= x

⟨r′∣∣ r〉⟨

r′∣∣Xr〉 = x

⟨r′∣∣ r〉

so the components of the ket X |r〉 in the |r′〉 representation are equal to the ones of the ket |r〉 = |x, y, z〉multiplied by x

X |r〉 = x |r〉we proceed in the same way for Y and Z

X |r〉 = x |r〉 , Y |r〉 = y |r〉 , Z |r〉 = z |r〉 ; |r〉 = |x, y, z〉

the kets |r〉 are eigenkets common to X,Y,Z. The set |r〉 of common eigenvectors of X,Y,Z forms a basisshowing that X,Y,Z is a complete set of commuting observables. On the other hand, the specification of thethree eigenvalues x0, y0, z0 determines uniquely the “normalized” eigenvector |r0〉 except for a phase eiθ. In the |r〉representation the coordinates of |r0〉 are δ (x− x0) δ (y − y0) δ (z − z0). Therefore, the set X,Y,Z constitutes aC.S.C.O. in Er.

Analogous reasoning shows that for the commuting observables Px, Py, Pz the eigenvalues and eigenvectorsare

Px |p〉 = px |p〉 , Py |p〉 = py |p〉 , Pz |p〉 = pz |p〉 ; |p〉 = |px, py, pz〉since |p〉 is a basis the operators Px, Py, Pz are observables. Because the set of eigenvalues (p0x, p0y, p0z) determinesuniquely the vector |p0〉 the set Px, Py , Pz constitutes as C.S.C.O. in Er.

Page 91: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.44. GENERAL PROPERTIES OF TWO CONJUGATE OBSERVABLES 91

It worths pointing out that X is not a C.S.C.O. by itself in the Er state space because when x0 is specified y0

and z0 can take any real values. Therefore, x0 is an infinitely degenerate eigenvalue. Notwithstanding in the statespace Ex of a particle in one dimension, X constitutes a C.S.C.O. since the eigenvalue x0 determines uniquely theeigenvector |x0〉, and its coordinates in the |x〉 representation are given by δ (x− x0).

It can also be shown that the set X,Py, Pz constitutes a C.S.C.O. since they commute with each other, andfor a set of eigenvalues x0, p0y, p0z there is a unique eigenvector whose associated wave function is

ψx0,p0y,p0z (x, y, z) = δ (x− x0)1

2π~ei(p0yy+p0zz)/~

of course, similar C.S.C.O. are built from the sets

Y, Px, Pz , Z,Px, Py

1.44. General properties of two conjugate observables

Two arbitrary observables Q and P are called conjugate if they obey the conmutation rule

[Q,P ] = i~ (1.192)

such couples of observables are frequently encountered in quantum mechanics. The position and momentum ob-servables are good examples. However, in what follows all properties are derived from the commutation rule (1.192)regardless the specific form of the operators. Let us define the operator S (λ) that depends on a real parameter λ as

S (λ) = e−iλP/~ (1.193)

since P is observable and so hermitian this operator is unitary

S† (λ) = eiλP/~ = S−1 (λ) = S (−λ) (1.194)

since P obviously commute with itself, Eq. (1.147) leads to

S (λ)S (µ) = S (λ+ µ) (1.195)

now we calculate the commutator [Q,S (λ)]. To do it, we take into account that [Q,P ] = i~ clearly commutes withQ and P , therefore we can apply theorem 1.70, Eq. (1.134) to obtain

[Q,S (P )] = [Q,P ]S ′ (P ) = i~

(− iλ

~

)e−iλP/~ = λS (P )

where we have written S (P ) instead of S (λ) to emphasize that when applying Eq. (1.134) we are considering S asa function of the operator P (so the derivative is with respect to P ). Rewriting it in the old notation we have

[Q,S (λ)] = λS (λ) ⇒ QS (λ) − S (λ)Q = λS (λ)

QS (λ) = S (λ) [Q+ λ] (1.196)

1.44.1. The eigenvalue problem of Q

Suppose that Q has a non-zero eigenvector |q〉, with eigenvalue q

Q |q〉 = q |q〉 (1.197)

applying Eq. (1.196) on the vector |q〉 we have

QS (λ) |q〉 = S (λ) [Q+ λ] |q〉 = S (λ) [q + λ] |q〉Q [S (λ) |q〉] = [q + λ] [S (λ) |q〉] (1.198)

Page 92: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

92 CAPITULO 1. LINEAR OR VECTOR SPACES

therefore, S (λ) |q〉 is also an eigenvector of Q with eigenvalue q + λ. Note that S (λ) |q〉 is non-zero because S (λ)is unitary so the norm of |q〉 is preserved. On the other hand, since λ can take any real value, we conclude that bystarting with an eigenvector of Q, we can construct another eigenvector of Q with any real eigenvalue by applyingthe appropiate S (λ). Consequently, the spectrum of Q is continuous and consists of all real values.

Note that this result shows in particular that conjugate operators Q,P cannot exist in finite dimensional vectorspaces since for the latter the spectrum must be finite. Even they do not exist strictly in spaces of denumerabledimension such as L2, (for which the spectrum must be at most denumerable), so the eigenvectors |q〉 will formhyperbasis in L2.

Let us now show that if any given q is non-degenerate, then all the other eigenvalues of Q are also non-degenerate.For this we assume that the eigenvalue q+λ is at least two-fold degenerate and arrive to a contradiction. From thishypothesis, there are at least two orthogonal eigenvectors |q + λ, α〉 and |q + λ, β〉 associated with the eigenvalueq + λ

〈q + λ, β |q + λ, α〉 = 0 (1.199)

now consider the two vectors S (−λ) |q + λ, α〉 and S (−λ) |q + λ, β〉 from Eq. (1.198) we see that

QS (−λ) |q + λ, α〉 = [q + λ+ (−λ)]S (−λ) |q + λ, α〉 = qS (−λ) |q + λ, α〉QS (−λ) |q + λ, β〉 = [q + λ+ (−λ)]S (−λ) |q + λ, β〉 = qS (−λ) |q + λ, β〉

so S (−λ) |q + λ, α〉 and S (−λ) |q + λ, β〉 are two eigenvectors associated with the eigenvalue q. Calculating theinner product of them

〈q + λ, β|S† (−λ)S (−λ) |q + λ, α〉 = 〈q + λ, β |q + λ, α〉 = 0

where we have used Eq. (1.199) and the fact that S (λ) is unitary. Thus, we arrive to the fact that S (−λ) |q + λ, α〉and S (−λ) |q + λ, β〉 are two orthogonal (and so linearly independent) eigenvectors associated with q, contradictingthe hypothesis that q is non-degenerate. This result can be extended to find that the eigenvalues of Q must all havethe same degree of degeneracy.

We now look for the eigenvectors. We fix the relative phses of the diffrent eigenvectors of Q with respect to theeigenvector |0〉 associated with the eigenvalue 0, by setting

|q〉 ≡ S (q) |0〉 (1.200)

applying S (λ) on both sides of (1.200) and using (1.195), we get

S (λ) |q〉 = S (λ)S (q) |0〉 = S (λ+ q) |0〉 = |q + λ〉

and the corresponding bra gives〈q|S† (λ) = 〈q + λ|

now using Eq. (1.194) we see that S† (λ) = S (−λ) from which

〈q|S (−λ) = 〈q + λ| ⇒ 〈q|S (λ) = 〈q − λ|

where we have replaced λ → −λ in the last step. In summary the action of S (λ) on the eigenvectors |q〉 of Q aregiven by

S (λ) |q〉 = |q + λ〉 ; 〈q|S (λ) = 〈q − λ| (1.201)

now we can characterize the action of the operators P,Q and S (λ) in either the |q〉 basis or the |p〉 basis.

1.44.2. The action of Q, P and S (λ) in the |q〉 basis

Since Q is an observables the set of eigenvectors |q〉 of Q forms a basis. A given ket |ψ〉 in our Hilbert spacecan be written in the |q〉 basis as

ψ (q) ≡ 〈q |ψ〉let us calculate the representation of Q |ψ〉 in this basis

〈q|Q |ψ〉 = q〈q |ψ〉 = qψ (q)

Page 93: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.44. GENERAL PROPERTIES OF TWO CONJUGATE OBSERVABLES 93

where we have used (1.197) and the hermiticity of Q. The action of Q on |ψ〉 reduces to a simple multiplicationwith its associated eigenvalue. The action of S (λ) on |ψ〉 in this basis is also simple

〈q|S (λ) |ψ〉 = 〈q − λ|ψ〉 = ψ (q − λ) ; S (λ) ≡ e−iλP/~ (1.202)

where we have used (1.201). Note that a function f (x− a) is the function that at the point x = x0 +a, takes on thevalue f (x0), so that it is the function obtained from f (x)by a translation of +a. Therefore, Eq. (1.202, shows thatthe action of S (λ) on |ψ〉 in the basis |q〉 , can be described as a translation of the wave function over a distance+λ parallel to the q−axis. So S (λ) is usually called the translation operator.

The action of P on |ψ〉 in the |q〉 basis is a bit longer to obtain. Let ε be an infinitesimal quantity such that

S (−ε) = eiεP/~ = I + iε

~P +O

(ε2)

therefore

〈q|S (−ε) |ψ〉 = 〈q|[I + i

ε

~P +O

(ε2)]

|ψ〉 = 〈q |ψ〉 + iε

~〈q|P |ψ〉 +O

(ε2)

〈q|S (−ε) |ψ〉 = ψ (q) + iε

~〈q|P |ψ〉 +O

(ε2)

(1.203)

on the other hand, from Eq. (1.202) we have

〈q|S (−ε) |ψ〉 = ψ (q + ε) (1.204)

and comparing (1.203) with (1.204) we have

ψ (q + ε) = ψ (q) + iε

~〈q|P |ψ〉 +O

(ε2)⇒

~〈q|P |ψ〉 = ψ (q + ε) − ψ (q) −O

(ε2)

solving for 〈q|P |ψ〉 and taking into account that ε is infinitesimal we have

〈q|P |ψ〉 =~

ilımε→0

ψ (q + ε) − ψ (q)

ε

〈q|P |ψ〉 =~

i

d

dqψ (q) (1.205)

so the action of P on a ket in the |q〉 basis is that of ~

iddq .

1.44.3. Representation in the |p〉 basis and the symmetrical role of P and Q

From Eq. (1.205), we can obtain the wave function vp (q) associated in the |q〉 basis, with the eigenvector |p〉of P with eigenvalue p

vp (q) = 〈q |p〉 =1√2π~

eipq/~

we can then write

|p〉 =1√2π~

∫ ∞

−∞dqeipq/~ |q〉

a wave function in the |p〉 representation is given by

ψ (p) = 〈p |ψ〉 = 〈p|∫

|q〉 〈q|ψ〉 =

∫〈p |q〉 〈q|ψ〉

ψ (p) =1√2π~

∫ ∞

−∞dqeipq/~ψ (q)

which is the Fourier transform of ψ (q).

Page 94: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

94 CAPITULO 1. LINEAR OR VECTOR SPACES

It can be shown that the action of the P operator in the |p〉 repesentation is associated with multiplicationby p, while the representation of X corresponds to the operations i~d/dp. Therefore, the results are symmetrical inthe |q〉 and |p〉 bases. It comes from the fact that we can interchange Q and P with no more cost than changingthe sign of the conmutator in (1.192). The analogous of the translation operation in the |p〉 basis is the operatordefined by

T (α) = eiαQ/~

which acts as a translation in the momentum space. The arguments developed for the basis |q〉 can be repeated inthe basis |p〉 by interchanging P by Q and i by −i everywhere. As a matter of curiosity, in Classical Mechanics,the Hamilton equations are also symmetrical in the conjugate variables (Q,P ) and we can interchange them withno more cost that a change in sign.

We emphasize again that the results obtained in this section only depend on the canonica rule of commutation(1.192) and not on the explicit form of the Q and P operators.

1.45. Diagonalization of a 2 × 2 hermitian matrix

This example illustrates many concepts introduced in the eigenvalue problem in a quite simple way. Further,it is useful in many practical calculations involving systems of two states in quantum mechanics. The eigenvalueproblem is very easy but the determination of eigenvectors could lead easily to complicated expressions. We shalldetermine the eigenvalues and find the eigenvectors in a way easy to handle.

1.45.1. Formulation of the problem

Consider an hermitian operator R in a two dimensional Hilbert space. Its matrix representation in a givenorthonormal basis |ϕ1〉 , |ϕ2〉 reads

H ≡(

〈ϕ1|R |ϕ1〉 〈ϕ1|R |ϕ2〉〈ϕ2|R |ϕ1〉 〈ϕ2|R |ϕ2〉

)=

(H11 H12

H21 H22

)(1.206)

an hermitian operator is described by an hermitian matrix when the basis used is orthonormal. Therefore,

H11 = H∗11 ; H22 = H∗

22 ; H12 = H∗21

so that diagonal elements are real. Let us express the matrix in Eq. (1.206) in the equivalent form

H =

(12 (H11 +H22) 0

0 12 (H11 +H22)

)+

(12 (H11 −H22) H12

H21 −12 (H11 −H22)

)

H =1

2(H11 +H22)

(1 00 1

)+

1

2(H11 −H22)

(1

2H∗21

(H11−H22)2H21

(H11−H22) −1

)

H =1

2(H11 +H22) I +

1

2(H11 −H22) K ; K ≡

(1

2H∗21

(H11−H22)2H21

(H11−H22) −1

)(1.207)

and I is the identity matrix. Let |ψ±〉 be two linearly independent eigenvectors of K

K |ψ±〉 = κ± |ψ±〉 (1.208)

applying the ket |ψ±〉 on Eq. (1.207) we have

H |ψ±〉 =1

2(H11 +H22) I |ψ±〉 +

1

2(H11 −H22) K |ψ±〉

H |ψ±〉 =1

2[(H11 +H22) + (H11 −H22) κ±] |ψ±〉

therefore |ψ±〉 are also eigenvectors of H with eigenvalues

H |ψ±〉 = E± |ψ±〉 ; E± ≡ 1

2[(H11 +H22) + (H11 −H22) κ±] (1.209)

Page 95: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.45. DIAGONALIZATION OF A 2 × 2 HERMITIAN MATRIX 95

note that the problem reduces to find the eigenvectors of K (which coincide with the ones of H) and also itseigenvalues (which are related with the eigenvalues of H through Eq. 1.209). Solving the problem for K is equivalentto choose the origin of the eigenvalues in (H11 +H22) /2 = (TrH)/2. Note that this shift is independent of the basischosen to write H.

1.45.2. Eigenvalues and eigenvectors of K

For simplicity we define the angles θ, ϕ in terms of the matrix elements Hij as follows

tan θ =2 |H21|

H11 −H22, 0 ≤ θ < π (1.210)

H21 = |H21| eiϕ , 0 ≤ ϕ < 2π (1.211)

so ϕ is the argument of the term H21. Matrix K in Eq. (1.207) can be written as

K =

(1 2|H21|e−iϕ

(H11−H22)2|H21|eiϕ

(H11−H22) −1

)=

(1 tan θ e−iϕ

tan θ eiϕ −1

)(1.212)

the characteristic equation of matrix (1.212) yields

det [K − λI] = 0 = (1 − κ) (−1 − κ) − tan2 θ ⇒κ2 − 1 − tan2 θ = 0 ⇒ κ2 = 1 + tan2 θ =

1

cos2 θ

the eigenvalues of K read

κ+ =1

cos θ, κ− = − 1

cos θ(1.213)

and they are real as expected. We can express 1/ cos θ in terms of the matrix elements Hij by using Eqs. (1.210)and the fact that cos θ and tan θ are both of the same sign since 0 ≤ θ < π.

1

cos θ=

√1 + tan2 θ =

√1 +

4 |H21|2

(H11 −H22)2 =

√(H11 −H22)

2 + 4 |H21|2

(H11 −H22)2

κ± = ± 1

cos θ= ±

√(H11 −H22)

2 + 4 |H21|2

(H11 −H22)2 (1.214)

let us find the eigenvectors of K. We denote as a and b the components of |ψ+〉 in the basis |ϕ1〉 , |ϕ2〉. FromEqs. (1.212, 1.213) this eigenvector must satisfy

(1 tan θ e−iϕ

tan θ eiϕ −1

)(ab

)=

1

cos θ

(ab

)

of course only one of the two equations is linearly independent since only quotients between the coefficients can bedetermined, therefore

a+ b tan θ e−iϕ =a

cos θ⇒ b tan θ e−iϕ = a

(1

cos θ− 1

)

multiplying by eiϕ/2 and defining 2α ≡ θ this equation yields

bsin 2α

cos 2αe−iϕ/2 = a

(1 − cos 2α

cos 2α

)eiϕ/2

b sin 2α e−iϕ/2 = a (1 − cos 2α) eiϕ/2

b (2 sinα cosα) e−iϕ/2 = a[1 −

(1 − 2 sin2 α

)]eiϕ/2

2b sinα cosα e−iϕ/2 = 2a sin2 α eiϕ/2

b(cosα e−iϕ/2

)= a sinα eiϕ/2

Page 96: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

96 CAPITULO 1. LINEAR OR VECTOR SPACES

in terms of θ we get

b cosθ

2e−iϕ/2 = a sin

θ

2eiϕ/2 (1.215)

we demand normalization with the additional requirement of positivity for the coefficient a, so we have

|a|2 + |b|2 = 1 ⇒ |a|2 +

∣∣∣∣∣a sin θ

2 eiϕ/2

cos θ2 e−iϕ/2

∣∣∣∣∣

2

= 1

|a|2 +

∣∣∣∣a tanθ

2eiϕ∣∣∣∣2

= 1 ⇒ |a|2 + |a|2 tan2 θ

2= 1

|a|2[1 + tan2 θ

2

]= 1 ⇒ |a|2 = cos2

θ

2

so that

a = cosθ

2≥ 0 since 0 ≤ θ < π (1.216)

replacing (1.216) in (1.215) we get

b cosθ

2e−iϕ/2 = cos

θ

2sin

θ

2eiϕ/2 ⇒ b = sin

θ

2eiϕ

so that the eigenvector |ψ+〉′ associated with the eigenvalue κ+ reads

|ψ+〉′ = a |ϕ1〉 + b |ϕ2〉 = cosθ

2|ϕ1〉 + sin

θ

2eiϕ |ϕ2〉

it is clear that |ψ+〉 ≡ e−iϕ/2 |ψ+〉′ is also an eigenvector of K with the same eigenvalue κ+ and this vector looksmore symmetrical. Thus, we define the eigenvector |ψ+〉 as20

|ψ+〉 = cosθ

2e−iϕ/2 |ϕ1〉 + sin

θ

2eiϕ/2 |ϕ2〉 (1.217)

an analogous calculation gives the eigenvector of K corresponding to κ− = −1/ cos θ

|ψ−〉 = − sinθ

2e−iϕ/2 |ϕ1〉 + cos

θ

2eiϕ/2 |ϕ2〉 (1.218)

the eigenvalues of H are obtained by combining Eqs. (1.209, 1.214)

E± ≡ 1

2[(H11 +H22) + (H11 −H22) κ±]

=1

2

[(H11 +H22) ± (H11 −H22)

√(H11 −H22)

2 + 4 |H21|2

(H11 −H22)2

]

E± ≡ 1

2

[(H11 +H22) ±

√(H11 −H22)

2 + 4 |H21|2]

it worths saying that the eigenvalue problem can be solved directly without resorting to the angles θ and ϕ definedin Eq. (1.210, 1.211). This procedure is advantageous only if we have to calculate the eigenvectors as well.

1.45.3. Eigenvalues and eigenvectors of H

Let us summarize our results. We consider an hermitian operator R in a two dimensional Hilbert space, and itsmatrix representation in the orthonormal basis |ϕ1〉 , |ϕ2〉

H ≡(

〈ϕ1|R |ϕ1〉 〈ϕ1|R |ϕ2〉〈ϕ2|R |ϕ1〉 〈ϕ2|R |ϕ2〉

)=

(H11 H12

H21 H22

)(1.219)

20This is equivalent to define the phase of the coefficient a as −ϕ/2 instead of zero, in the process of normalization.

Page 97: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

1.45. DIAGONALIZATION OF A 2 × 2 HERMITIAN MATRIX 97

its eigenvalues and eigenvectors are given by

E± ≡ 1

2

[(H11 +H22) ±

√(H11 −H22)

2 + 4 |H21|2]

(1.220)

|ψ+〉 = cosθ

2e−iϕ/2 |ϕ1〉 + sin

θ

2eiϕ/2 |ϕ2〉 (1.221)

|ψ−〉 = − sinθ

2e−iϕ/2 |ϕ1〉 + cos

θ

2eiϕ/2 |ϕ2〉 (1.222)

tan θ =2 |H21|

H11 −H22, H21 = |H21| eiϕ ; 0 ≤ θ < π , 0 ≤ ϕ < 2π (1.223)

as a matter of consistence we can see that

E+ +E− = H11 +H22 = TrH , E+E− = H11H22 − |H12|2 = detH

in agreement with Eq. (1.92, 1.93). From Eq. (1.220), the spectrum becomes degenerate i.e. E+ = E− when(H11 −H22)

2 + 4 |H21|2 = 0. That is when H11 = H22 and H12 = H21 = 0. So a 2 × 2 hermitian matrix has adegenerate spectrum if and only if it is proportional to the identity.

It worths remarking that although functions of θ are expressed simply in terms of the Hij elements by means ofEqs. (1.223), it is not the case when functions of θ/2 appears. Thus, when we do calculations with the eigenvectors(1.221, 1.222), it is convenient to keep the results in terms of θ/2 up to the end of the calculation instead of replacingit in terms of the Hij quantities.

Page 98: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 2

Construccion fenomenologica de lospostulados de la mecanica cuantica

Nuestro presente entendimiento de la naturaleza requiere reevaluar las leyes de la mecanica clasica, especialmenteen lo referente a los fenomenos atomicos y subatomicos. No obstante, existen manifestaciones macroscopicas de losprocesos cuanticos. A manera de ejemplo, la existencia misma de los solidos solo se puede explicar en un contextocuantico, y los modelos sobre calor especıfico de los solidos no se pueden explicar con un modelo clasico.

A finales del siglo diecinueve, se identificaban en la fısica dos tipos de entidades bien diferenciadas: la materia yla radiacion. Las leyes de Newton permitıan explicar los fenomenos relativos a la materia en la escala macroscopicay las ecuaciones de Maxwell proporcionaban una excelente descripcion de la dinamica de la radiacion1. Finalmente,la interaccion de la materia con la radiacion la proporcionaba la ley de fuerza de Lorentz. Es notable el hecho de quela teorıa de Maxwell habia logrado la unificacion de fenomenos que antes se consideraban separados: la electricidad,el magnetismo y la optica.

No obstante, a finales del siglo diecinueve y principios del veinte una serie de experimentos condujeron a reevaluarla estructura fundamental de la materia y ademas a replantear las leyes que rigen a estas estructuras fundamentales.La mecanica cuantica es entonces el resultado de estos replanteamientos. Vale decir por supuesto que al menos enprincipio, el mundo macroscopico tambien se rige por la leyes de la cuantica, si bien para la mayorıa de fenomenos aescala humana, la Fısica clasica representa una descripcion mucho mas simple y al mismo tiempo bastante adecuada.

A continuacion se realizara una breve descripcion de los experimentos que dieron lugar a las nuevas ideas sobreel mundo microscopico, con el fin de dejar claros los puntos que es necesario reevaluar en la mecanica clasica. Ladescripcion de estos experimentos no pretende ser completa ni exhaustiva, solo pretende mostrar las ideas que estosexperimentos nos arrojan sobre el comportamiento de la naturaleza a nivel microscopico (atomico y subatomico)

2.1. La radiacion del cuerpo negro

???????????

2.2. El efecto fotoelectrico

????????????????

2.3. El efecto compton

???????????????????

1Las ondas mecanicas podıan explicarse en ultimo termino con las leyes de Newton.

98

Page 99: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

2.4. EL PROBLEMA ESPECTROSCOPICO Y LA TEORIA DE BOHR 99

2.4. El problema espectroscopico y la teorıa de Bohr

2.4.1. La teorıa de Wilson y Sommerfeld

2.5. Los postulados de De Broglie

2.6. Sıntesis de los resultados experimentales

Newton considero que la luz era un haz de corpusculos que podıan reflejarse en un espejo cuando “rebotan”.Sin embargo, los experimentos que mostraron fenomenos como la interferencia y la difraccion, establecieron lanaturaleza ondulatoria de la luz a mediados del siglo XIX, lo cual permitio la fusion de la optica con la electricidady el magnetismo. Los fenomenos de polarizacion de la luz pueden interpretarse como una manifestacion del caractervectorial del campo electrico.

No obstante, el estudio de la radiacion del cuerpo negro sugirio la hipotesis de la cuantizacion de la energıa delas ondas electromagneticas estacionarias (osciladores armonicos) que se generaban al interior del cuerpo negro. Laenergıa de estos osciladores es de la forma E = nhν con n = 0, 1, 2, ...; siendo ν la frecuencia de cada oscilador.Esta cuantizacion permite predecir adecuadamente el espectro de emision del cuerpo negro empleando la estadısticade Boltzmann. Por otra parte, el estudio del efecto fotoelectrico sugirio que las ondas electromagneticas libres quese propagaban tambien estaban constituıdas por paquetes de energıa que indican valores discretos de esta. Cadapaquete denominado foton tendra una energıa dada por E = hν. Esto permitio a Einstein comprender porque laenergıa maxima adquirida por los electrones era independiente de la intensidad de la onda electromagnetica incidentey porque este energıa se adquirıa en tiempos tan cortos. Para ello era necesario ademas que el paquete estuvieralocalizado en una pequena region del espacio y que permaneciera localizado a medida que se aleja de la fuente, adiferencia de las ondas clasicas que se extienden cuando se alejan de la fuente. Mas adelante, mediante la irradiacionde una placa metalica con rayos X, compton muestra que estos cuantos pueden dispersarse mediante la colision conun electron libre estacionario, emulando una colision tipo “bolas de billar”. De esta forma pudo predecir el pico enel espectro asociado a una longitud de onda mayor que la incidente.

En sıntesis, estos experimentos estan mostrando la naturaleza discreta de la energıa que se propaga en una ondaelectromagnetica y el hecho de que el cuanto asociado se puede comportar como partıcula. Adicionalmente, tantola cuantizacion como la colision de fotones con electrones libres pudo explicarse satisfactoriamente relacionando losparametros de partıcula (energıa E y momento p del foton) con los parametros de onda (frecuencia ν y numero deonda k del foton) de la radiacion, en la forma

E = hν ; p = ~k ; ~ ≡ h

2π; h ' 6,62 × 10−34Joul × seg (2.1)

De otra parte, los experimentos espectroscopicos nos muestran que la radiacion emitida o absorbida debida atransiciones electronicas en los atomos solo nos arroja ciertos valores dicretos de la energıa fundamental del cuanto.Esto implica que los niveles de energıa permitidos para un electron ligado a un atomo tambien estan cuantizados.Lo anterior llevo a Bohr a postular la cuantizacion del momento angular asociado al electron junto con la hipotesisde ausencia de radiacion en contraste con las predicciones de la mecanica clasica. La cuantizacion de los estados deenergıa atomicos fue corroborada por los experimentos de Franck y Hertz, en tanto que las reglas de cuantizacionfueron perfeccionadas por Wilson y Sommerfeld.

Una vez caracterizada la dualidad onda partıcula de la radiacion, es natural preguntarse si esta dualidad esta tam-bien presente en los objetos fısicos que tradicionalmente llamamos materia, por ejemplo en los electrones. Estapregunta condujo a De Broglie a postular que el movimiento de una partıcula esta gobernado por la propagacionondulatoria de ciertas ondas piloto asociadas con la partıcula. Asumiendo que la energıa E y el momento p de lapartıcula tambien cumplen las relaciones (2.1) dadas para el foton, De Broglie estimo la frecuencia y la longitud deonda de las ondas piloto

λ = h/p ; ν = E/h (2.2)

Este postulado fue confirmado por los experimentos de Davidson y Germer sobre difraccion de electrones.

Naturalmente, el momento y la energıa totales se deben conservar en cada proceso, en donde los momentos yenergıas de la radiacion y la materia estan dados por los postulados anteriores.

Page 100: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

100CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS DE LA MECANICA CUANTICA

Vamos ahora a examinar en mas detalle el experimento de Young de la doble rendija. Veremos que este analisisaportara ideas adicionales con respecto al comportamiento de la naturaleza a nivel subatomico

2.7. El experimento de Young de la doble rendija

Figura 2.1: (a) Montaje del experimento de Young con doble rendija. (b) Patron de intensidades asociado a laexposicion por una sola rendija. La lınea punteada indica la suma de los dos patrones de intensidad. (c) Patronde intensidades obtenido con la apertura simultanea de las dos rendijas. El contraste con la grafica punteada nosmuestra que la intensidad resultante no es la suma de las intensidades obtenidas con la apertura de una sola rendija,revelando la existencia de un patron de interferencia.

Hemos visto que es necesario incorporar aspectos corpusculares al comportamiento de la radiacion electro-magnetica, la pregunta es si debemos abandonar la teorıa ondulatoria de la radiacion electromagnetica. Veremosque no es posible con una teorıa puramente corpuscular explicar todos los fenomenos relacionados con los fotones,de manera que tendremos que incorporar tanto los aspectos ondulatorios como corpusculares de la radiacion.

El dispositivo utilizado se muestra en la Fig. 2.1, y consiste en una fuente aproximadamente monocromaticafrente a la cual se coloca una placa opaca P con dos rendijas pequenas F1 y F2 (pequenas con respecto a la longitudde onda emitida), detras de esta placa opaca se ubica una pantalla de observacion O que es usualmente una placafotografica. Es importante que las dimensiones de las rendijas sean menores que la longitud de onda, ya que de locontrario las intensidades recogidas en la pantalla O seran compatibles con la optica geometrica que puede explicarse

Page 101: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

2.7. EL EXPERIMENTO DE YOUNG DE LA DOBLE RENDIJA 101

con una teorıa corpuscular. En contraste, el fenomeno de difraccion que se presenta cuando las rendijas son pequenasnos muestra la naturaleza ondulatoria del fenomeno.

Cuando obstruımos la rendija F2 obtenemos sobre la pantalla O una distribucion de intensidades I1 (x) que esel patron de difraccion generado por la rendija F1. Analogamente, al cerrar F1 obtenemos el patron de intensidadesI2 (x). Si ahora abrimos las dos rendijas simultaneamente obtendremos un nuevo patron de intensidades I (x). Laprimera observacion es que la intensidad resultante NO es la suma de las intensidades obtenidas con una sola rendija

I (x) 6= I1 (x) + I2 (x)

¿como podrıan explicarse estos resultados a la luz de una teorıa corpuscular?. Es bien conocido que el patron deDifraccion generado por una sola rendija no puede ser explicado con una teorıa corpuscular cuando la rendija tieneuna dimension menor que la longitud de onda incidente. Sin embargo, veremos que aun cuando pudiesemos explicarel fenomeno de una rendija con una teorıa corpuscular, el patron de interferencia que se forma cuando se abrenlas dos rendijas entra en conflicto con una teorıa puramente corpuscular. Asumamos que el patron de interferenciaque se observa, es generado por la interaccion de tipo corpuscular entre los fotones que pasan por la rendija F1 conaquellos que pasan por la rendija F2. De ser ası, tendrıamos que si regulamos la potencia de la fuente de tal maneraque los fotones salgan practicamente uno por uno, se eliminarıan estas interacciones y por tanto deberıa desaparecereste patron de interferencia, incluso si se espera mucho tiempo para que se depositen mucho fotones sobre O.

Veamos ahora cual serıa la prediccion de una teorıa puramente ondulatoria. La teorıa ondulatoria predice quela intensidad en un punto dado I (x) es proporcional a la amplitud al cuadrado del campo electrico evaluado en talpunto. Cuando las dos rendijas estan abiertas es claro que el campo total resultante en tal punto es la superposicionde los dos campos generados por la onda que pasa por cada rendija

E (x) = E1 (x) +E2 (x)

la intensidad es entonces proporcional a la amplitud del campo electrico total al cuadrado

I (x) ∝ |E (x)|2 = |E1 (x) +E2 (x)|2

I1 (x) ∝ |E1 (x)|2 ; I2 (x) ∝ |E2 (x)|2 ⇒ I (x) 6= I1 (x) + I2 (x)

si E1 (x) y E2 (x) se escriben en notacion compleja, el termino de interferencia resultante dependera de la diferenciaen las fases complejas asociadas a E1 (x) y E2 (x). Esta interferencia explica el patron de franjas que ocurre enel fenomeno de difraccion por dos rendijas. Si disminuımos la potencia de la fuente, las franjas de interferenciadisminuiran en intensidad pero no desapareceran. De por sı este fue uno de los experimentos determinantes en favorde la teorıa ondulatoria en el siglo XIX.

Sin embargo, los resultados obtenidos cuando la potencia de la fuente es tal que los fotones se liberan uno a uno,son realmente sorprendentes y entran en conflicto con la teorıa puramente corpuscular pero tambien con la teorıapuramente ondulatoria.

Por una parte, si hacemos que el tiempo de exposicion sea muy largo de manera que una gran cantidad de fotonesimpactan la placa fotografica, vemos que las franjas de interferencia no desaparecen a pesar de haber eliminado lainteraccion entre los fotones. Por tanto, la teorıa corpuscular no puede predecir este fenomeno. La teorıa ondulatoriaen cambio ofrece una explicacion satisfactoria al respecto.

De otra parte, si el tiempo de exposicion lo hacemos muy corto de modo que solo unos pocos fotones impactenla pantalla, vemos que los impactos sobre la placa son muy localizados como se esperarıa de un comportamientocorpuscular, y no se observa el patron de interferencia con baja intensidad que predecirıa la teorıa ondulatoria.

Mas aun si el experimento para tiempos cortos de exposicion se repite muchas veces para las mismas condicionesiniciales (el mismo dispositivo con fotones de la misma energıa y momento, ası como igual tiempo de exposicion),vemos que los pocos impactos localizados en cada experimento pueden tener una distribucion muy diferente. Estoindica que el proceso tiene un caracter altamente aleatorio que no es atribuıble al desconocimiento o falta de controlen las condiciones iniciales.

Si en cambio repetimos el experimento muchas veces bajo las mismas condiciones iniciales pero para tiemposde exposicion muy grandes, en los cuales muchos fotones han impactado la placa, vemos que el patron contınuo deintensidades se forma segun lo indicado en la teorıa ondulatoria, es decir con los patrones adecuados de interferencia.Para este caso el fenomeno es altamente reproducible, es decir la distribucion de intensidades es esencialmente lamisma en cada experimento.

Page 102: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

102CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS DE LA MECANICA CUANTICA

Si se hacen experimentos para tiempos de exposicion especıficos y estos tiempos de exposicion se van incre-mentando gradualmente, vemos que a medida que el tiempo de exposicion aumenta el experimento se vuelve masreproducible, pasando desde resultados muy aleatorios para tiempos de exposicion cortos (pocos fotones incidentes)hasta resultados altamente reproducibles para tiempos muy largos de exposicion (muchos fotones incidentes). Estorevela que la ley fundamental que rige al fenomeno debe ser de naturaleza probabilıstica, ya que un modelo prob-abilıstico en general falla en sus predicciones cuando una muestra posee muy pocos elementos o eventos, pero esaltamente predictivo cuando la muestra consta de un enorme numero de elementos o de eventos. En nuestro casolos eventos son los impactos de los fotones sobre la placa y lo que vemos es que el patron de interferencia se vaconstruyendo a medida que los fotones van impactando la placa.

Un aspecto que no hemos tocado hasta aquı, es el referente a la determinacion de la rendija por la cual pasacada foton. Si queremos determinar por cual rendija pasa cada uno de los fotones que se emiten uno por uno,podemos colocar dos detectores (digamos dos fotomultiplicadores) sobre cada rendija F1 y F2, en tal caso podemosdeterminar completamente la rendija a traves de la cual pasa cada foton, ya que cuando se emite un foton unasenal es registrada en uno de los detectores pero no en ambos al tiempo. Sin embargo, en este caso todos los fotonesdetectados son absorbidos por los detectores y no alcanzan la pantalla. En otras palabras, la completa determinacionde la rendija por la cual pasa cada foton destruyo completamente la informacion sobre el patron de difraccion. Porotro lado, si dejamos un detector solo en F1 y dejamos abierto F2 veremos que cuando han pasado muchos fotonescerca del 50 % han sido detectados (con respecto al experimento anterior). Concluımos que los demas han pasadopor F2 pero entonces el patron de difraccion que se construira gradualmente sobre la pantalla sera el correspondientea la difraccion por una rendija, no se observara entonces el fenomeno de interferencia inherente al experimento condos rendijas. Una vez mas el proceso de medicion (determinacion de la rendija de paso) ha alterado la evolucionposterior del sistema.

En lo referente al caracter probabilıstico cuantico, es necesario distinguirlo de los aspectos probabilısticos que seemplean usualmente en mecanica clasica. En la termodinamica y especialmente en la mecanica estadıstica clasica, seutilizan conceptos de probabilidad y estadıstica debido a que en la practica (experimental) no es posible determinaro controlar las condiciones iniciales de muchas partıculas, aunado con la dificultad practica (teorica) de resolver ungran numero de ecuaciones diferenciales acopladas. Se asume sin embargo en las teorıas clasicas que si conozco todaslas condiciones iniciales puedo al menos en principio predecir las trayectorias exactas de las partıculas y por tantode mi sistema como un todo. En cuantica nos vemos avocados a usar la probabilidad incluso con el conocimientoy/o control de las condiciones iniciales del sistema, estamos hablando entonces de un comportamiento probabilısticoesencial e inherente a las leyes de la naturaleza, al menos en nuestra presente interpretacion de los fenomenos.

2.7.1. Interpretacion mecano-cuantica de la dualidad onda partıcula

Hemos visto que tanto los aspectos corpusculares como los ondulatorios son indispensables para un correctoentendimiento de los experimentos de Young con doble rendija. Dado que en mecanica clasica estos aspectos sonmutuamente excluyentes, sera necesario replantearse las ideas de la mecanica clasica, las cuales despues de todotuvieron su semilla en los fenomenos macroscopicos. Veamos a la luz de los resultados anteriores que aspectos debenser revaluados

De la discusion anterior hemos visto que cuando colocamos un fotomultiplicador (o dos) para detectar por cualrendija van a pasar los electrones, afectamos de manera fundamental al sistema produciendo un cambio drastico enel resultado final debido a que los fotones detectados se absorben y no alcanzan la pantalla. Vemos entonces que elproceso de medicion afecta de forma fundamental al sistema que se mide. En mecanica clasica, si bien es necesarioperturbar al sistema para poder medirlo, esta implıcito que esta perturbacion se puede hacer arbitrariamentepequena al menos en principio. En mecanica cuantica este y otros experimentos nos indicaran que cuando se realizaun proceso de medicion existe una cierta “perturbacion fundamental” que no puede ser minimizada y que altera demanera considerable al sistema que se mide.

Por otro lado, hemos visto que aunque los fotones se envıen uno por uno, eliminando de esta forma la interaccionentre fotones, un foton parece comportarse diferente si estan abiertas las dos rendijas con respecto al caso en queuna sola de ellas esta abierta, de no ser ası la intensidad resultante cuando las dos estan abiertas serıa la suma delas intensidades obtenidas cuando se abre cada una. Adicionalmente, ya hemos visto que si intentamos determinarpor cual rendija pasan los fotones, evitamos que estos alcancen la pantalla. Esto se puede replantear diciendo quees imposible observar el patron de interferencia y al mismo tiempo conocer por cual rendija paso cada foton. Esta

Page 103: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

2.7. EL EXPERIMENTO DE YOUNG DE LA DOBLE RENDIJA 103

afirmacion sera reforzada mas adelante cuando discutamos el principio de incertidumbre de Heisenberg. Para resolveresta paradoja es necesario abandonar la idea de que cada foton pasara inevitablemente por una rendija especıfica,lo cual nos lleva a su vez a cuestionar el concepto de trayectoria, tan firmemente establecido en la mecanica clasica.

Ahora bien, hemos visto que cuando unos pocos fotones han impactado la pantalla, la distribucion de estosfotones no es reproducible a pesar de que los experimentos se repitan bajo las mismas condiciones iniciales. Estoimplica que para un foton dado no podemos predecir con total certeza en que punto golpeara a la pantalla inclusosi conocemos sus condiciones iniciales. En consecuencia, el conocimiento de las condiciones iniciales de un sistemano determina completamente el movimiento subsecuente de este. No obstante, el hecho de que el mismo patron deinterferencia se construya cuando el numero de fotones es muy alto, nos indica que las condiciones iniciales nospueden determinar una distribucion de probabilidad que sı puede ser especificada por alguna ecuacion dinamica. Eneste caso especıfico, la probabilidad de que un foton golpee la pantalla dentro de un intervalo entre el punto x y elpunto x+dx, es proporcional a I (x) dx calculado con la teorıa ondulatoria, es decir sera proporcional a |E (x)|2 dx.Notese que el principio de superposicion que rige el comportamiento de los fenomenos opticos clasicos esta basadoen el hecho de que las ecuaciones de Maxwell sin fuentes son ecuaciones lineales y homogeneas, para las cuales valeel principio de superposicion, si E1 y E2 son soluciones de las Ecs. de Maxwell sin fuentes, una combinacion linealde ellas tambien lo es.

Los anteriores hechos se pueden entonces postular en la siguiente forma:

Los aspectos corpusculares y ondulatorios de la luz son inseparables. De modo que la luz se comporta simultanea-mente como onda y como flujo de partıculas. Las predicciones sobre el comportamiento del foton son solo de caracterprobabilıstico. El comportamiento ondulatorio nos dictamina la distribucion de probabilidad de su manifestacion co-mo partıcula (foton). La informacion fısica sobre el foton en un momento dado esta determinada por la componenteE (r, t) de la onda electromagnetica que es solucion de las ecuaciones de Maxwell. El campo E (r, t) caracteriza alestado de los fotones en el tiempo t. Dicho campo se interpreta como la amplitud de probabilidad de que un fotonaparezca en el punto r en el tiempo t. Esto implica que la correspondiente probabilidad de que un foton este en elvolumen d3r centrado r esta dada por |E (r, t)|2 d3r.

Mas adelante veremos que la amplitud de probabilidad E (r, t) tendra su analogo para la materia en la denom-inada funcion de onda ψ (r, t). Si bien existen muchas analogıas entre E (r, t) y ψ (r, t) tambien existen algunasdiferencias importantes, por ejemplo E (r, t) no caracteriza completamente al estado de un foton, en tanto que lafuncion de onda caracteriza completamente el estado de una partıcula sin espın. La funcion de onda es esencial-mente compleja en tanto que E se hace complejo solo por conveniencia. La teorıa cuantica completa para los fotones(electrodinamica cuantica) debe tener en cuenta el caracter eminentemente relativista de las ecuaciones de Maxwelly ademas corresponde a la cuantizacion de un medio que es clasicamente contınuo (campos electromagneticos).En contraste, la mecanica cuantica para partıculas corresponde a la cuantizacion de un medio que clasicamentese considera discreto (partıculas puntuales) y que en muchos casos se puede tratar como no-relativista. Aquı solotrabajaremos la mecanica cuantica no relativista de medios clasicamente discretos y por tanto no trabajaremos elproblema concerniente al proceso matematico de cuantizacion del foton.

2.7.2. Proceso de medicion, preparacion de un sistema y el principio de la descomposicionespectral

Vamos a examinar otro experimento de optica que arrojara muchas luces sobre las ideas relativas al proceso demedicion en cuantica.

La Fig. 2.2, muestra el montaje que queremos estudiar. Asumamos que hacemos incidir una onda plana monocromaticade una fuente sobre un polarizador P , elegiremos el eje z como el eje de propagacion de la onda electromagneticay asumiremos que el polarizador P se ubica en el plano xy. Paralelo al plano xy colocaremos un analizador A quetransmitira luz polarizada a lo largo de ux y absorbera luz polarizada a lo largo de uy.

Asumiremos que el experimento se realizara en condiciones en donde sea valida la optica clasica, es decir cuandoel haz de luz es muy intenso. En este caso, cuando la onda pasa por P queda polarizada en una direccion especıficaup caracterizada por

up = cos θ ux + sin θ uy

la onda plana monocromatica que sale del polarizador P esta caracterizada por el campo electrico

E (r, t) = E0upei(kz−ωt) = E0 cos θei(kz−ωt) ux +E0 sin θ ei(kz−ωt) uy (2.3)

Page 104: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

104CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS DE LA MECANICA CUANTICA

Figura 2.2: (a) Montaje experimental para medidas de polarizacion. En z < 0 tenemos luz no polarizada que enz = 0 se polariza en la direccion up. El analizador A suprimira la componente uy del campo electrico polarizado.

E0 es la amplitud (constante) de la onda polarizada. La intensidad es proporcional a |E0|2. Cuando la onda polarizadapasa por el analizador su campo electrico vendra dado por

E′ (r, t) = E′0uxe

i(kz−ωt) = E0 cos θ uxei(kz−ωt)

que surge basicamente de la eliminacion de la componente a lo largo de uy en la Ec. (2.3). La intensidad de la onda

que paso el analizador esta dada por |E ′0|2 es decir

I ′ = I cos2 θ

resultado conocido como la ley de Malus.Nos preguntamos ahora por lo que ocurre a nivel cuantico. Es decir, cuando la intensidad de la fuente es tan

baja que los fotones se emiten uno a uno, de manera que la cuantizacion de la radiacion se hace manifiesta. Podemoscolocar un detector de fotones detras del analizador para mirar los resultados. Retomaremos para ello los resultadosde las discusiones anteriores.

En primera instancia, debido a la existencia de un cuanto indivisible (el foton) el detector no registra una fraccionde foton. O bien el foton cruza el analizador o bien es absorbido completamente por el.

Adicionalmente, no podemos predecir con total certeza si un cierto foton incidente sobre el analizador cruzara osera absorbido por este. Solo podremos conocer la probabilidad de que un evento especıfico de estos ocurra. Veremossin embargo que en ciertos casos especıficos, podremos hacer predicciones con total certeza.

Cuando el numero total de fotones es muy grande, es decir cuando ha pasado suficiente tiempo, se construira unpatron reproducible de probabilidad equivalente al que se obtiene para tiempos cortos con un haz de alta intensidad.En sıntesis debe generarse un patron reproducible (y por tanto predecible) que corresponda ademas al lımite clasico.Es decir, si N es el numero (grande) de fotones entonces un numero dado por N cos2 θ de fotones cruzara elanalizador.

Notese que el aparato de medida (analizador) solo puede dar algunos resultados especıficos que llamaremosresultados propios o autoresultados. En este experimento solo hay dos resultados posibles: el foton pasa elanalizador o es absorbido por el. Hay entonces una cuantizacion del resultado, lo cual es muy diferente al escenarioclasico en el cual la intensidad puede variar de manera contınua desde 0 hasta I cuando el angulo θ se varıa deforma contınua.

Page 105: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

2.7. EL EXPERIMENTO DE YOUNG DE LA DOBLE RENDIJA 105

El experimento muestra ademas el siguiente resultado, si el foton esta polarizado a lo largo de ux dicho fotonpasara con toda certeza el analizador (con probabilidad 1). Analogamente, si el foton esta polarizado a lo largo de uy

hay una certeza total de que este foton sera absorbido (probabilidad cero para pasar). Estas aseveraciones requierennaturalmente de una repeticion de una gran cantidad de experimentos que muestren la naturaleza probabilısticapara fotones con estas polarizaciones. Adicionalmente, se observa que estos son los unicos estados de polarizacionque conducen a una total certeza en la medida. Por esta razon llamaremos a estos estados de polarizacion estadospropios o autoestados. Vemos ademas que a cada resultado propio le corresponde un estado propio, el resultadopropio “foton que cruza” esta asociado con el estado propio de polarizacion a lo largo de ux. El resultado propio“foton que se absorbe” esta asociado a fotones con polarizacion uy. En otras palabras, para un estado propio tenemostotal certeza de obtener su correspondiente resultado propio. Matematicamente podemos describir nuestros dosestados propios como

u(1)p = ux ; u(2)

p = uy

La siguiente pregunta obvia es ¿cual es la probabilidad de obtener un resultado propio dado, cuando el estadoes una superposicion de los estados propios? es decir cuando el estado de polarizacion del foton es arbitrario i.e.

up = cos θ ux + sin θ uy = cos θ u(1)p + sin θ u(2)

p (2.4)

para obtener la distribucion de probabilidad es necesario tener una gran cantidad de eventos para cada estado depolarizacion. Esto se logra midiendo muchos fotones que poseen las mismas condiciones iniciales2 y se encuentraexperimentalmente que para un numero N (grande) de fotones con polarizacion dada por un angulo θ en (2.4) unnumero N cos2 θ de ellos pasara, y N sin2 θ de ellos sera absorbido. Por tanto, un foton especıfico con polarizaciondefinida por θ tiene una probabilidad cos2 θ de ser transmitido y una posibilidad sin2 θ de ser absorbido. Estocoincide con la ley clasica de Malus como esperabamos cuando el numero de fotones es grande.

Lo anterior nos indica que la probabilidad de obtener un cierto resultado propio es proporcional al cuadrado delvalor absoluto del coeficiente del estado propio asociado, al coeficiente lo llamamos la amplitud de probabilidad, lasamplitudes de probabilidad A (i) y las probabilidades P (i) para cada resultado propio son en este caso

A (1) = cos θ =⟨u(1)p

∣∣∣up〉 ; P (1) = cos2 θ =∣∣∣⟨u(1)p

∣∣∣up〉∣∣∣2

A (2) = sin θ =⟨u(2)p

∣∣∣up〉 ; P (2) = sin2 θ =∣∣∣⟨u(2)p

∣∣∣up〉∣∣∣2

P (1) + P (2) = cos2 θ + sin2 θ = 1

en algunos casos sera necesario colocar una constante de proporcionalidad para garantizar que la suma de lasprobabilidades de todos los resultados propios sea uno.

Esto nos induce a postular que si tenemos un conjunto de autoresultados Ri asociados a autoestados ψi unestado arbitrario se escribira como superposicion de los autoestados

ψ =∑

i

ciψi (2.5)

y la probabilidad de obtener un autoresultado Rk sera

P (Rk) =|ck|2∑i |ci|2

(2.6)

o equivalentemente

P (Rk) =|〈ψk|ψ〉|2〈ψ|ψ〉 (2.7)

donde el denominador me asegura la conservacion de la probabilidad

i

P (Ri) = 1

2Notese que el polarizador tiene el papel de reproducir las mismas condiciones iniciales en cada conjunto de experimentos.

Page 106: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

106CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS DE LA MECANICA CUANTICA

puesto que el conjunto de todos los autoresultados es por definicion el conjunto de todos los resultados experimentalesque podemos obtener al medir el sistema. Esta afirmacion se denomina el principio de descomposicion espectral.

El ejemplo de los fotones polarizados nos indica ademas que la descomposicion espectral especıfica depende deltipo de instrumento de medicion dado que hay que utilizar los autoestados que corresponden a este aparato. Porejemplo, si el analizador (aparato de medicion) tiene una orientacion diferente, los autoestados estaran definidossegun esta nueva direccion. Si en vez de un analizador tenemos un medidor de otra variable fısica (por ejemplo elespın) los autoresultados deben definirse correspondientemente y por lo tanto los autoestados.

Supongamos que dos fotones poseen la misma polarizacion pero se diferencian en otros observables fısicos (mo-mento, espın, etc.), un aparato que mide polarizacion solo puede dicernir los diferentes valores de este observable,por tanto si existen otros observables que caracterizan a mi partıcula, al autovalor de polarizacion a, le corre-sponde mas de un autoestado ya que todos los autoestados con polarizacion a estan asociados a este autovalorsin importar cuales sean los valores de los otros observables. Decimos que los autoestados estan degenerados conrespecto al observable o autovalor a lo cual segun la presente discusion indica que solo tenemos una informacionparcial sobre el sistema. Volveremos sobre el tema de la degeneracion mas adelante.

La consistencia de estos resultados se puede analizar poniendo un segundo analizador A ′ despues de A y quepermita el paso de fotones con polarizacion en ux. Dado que todos los fotones que pasaron por A quedaron “prepara-dos” en el estado de polarizacion ux, todos estos fotones estan en un solo autoestado del nuevo analizador A′ conautoresultado “el foton pasa”. Por tanto, todos los fotones que pasaron por A deben pasar por A ′. Similarmente, siA′ esta orientado segun uy, todos los fotones que vienen de A deben ser absorbidos en A′. Estas predicciones estanconfirmadas por los experimentos.

Analicemos ahora un aspecto de la medicion directamente asociado con la naturaleza cuantica de la radiacion.Al ser el foton un cuanto indivisible solo existe la posibilidad de transmision o absorcion, esto desemboco en elhecho de que a partir de un estado arbitrario de polarizacion, hay un cambio abrupto luego de la medicion paralos fotones que pasan, pues estos pasan de la polarizacion up a la polarizacion ux que corresponde a un autoestadode mi aparato. Existe entonces una perturbacion fundamental que altera el estado del sistema y que no puede serdisminuıda. Notese que despues de la medicion (preparacion del foton en un autoestado) tenemos una informacionadicional “el foton ha pasado el analizador”.

Lo anterior es entonces una confirmacion de que el proceso de medicion perturba de manera fundamental el estadodel sistema. Podrıamos en este punto postular que luego del proceso de medicion, el sistema queda preparado enun estado propio definido por el sistema mismo y por el aparato de medicion.

2.8. Dualidad onda partıcula para la materia

Hemos visto que de acuerdo con los postulados de De Broglie, la materia al igual que los fotones exhibe uncomportamiento dual onda partıcula. La corroboracion experimental de estos postulados se realizo a traves de losexperimentos de Davidsson y Germer, ası como los experimentos de G. P. Thomson (ambos sobre difraccion deelectrones), y los experimentos de Estermann, Frisch y Stern concernientes a la difraccion de atomos de Helio.

Adicionalmente, De Broglie postulo que si bien la onda asociada a una partıcula libre era una onda viajera(nodos en movimiento), para un electron en un atomo que este ligado al nucleo atomico y que recorre su orbitaperiodicamente, su onda piloto debe estar asociada a una onda estacionaria (nodos fijos). Esta interpretacion per-mitio dar una explicacion a las reglas de cuantizacion de Bohr, demostrando que las orbitas permitidas en un atomoson aquellas que corresponden a un perımetro circular con un numero entero de longitudes de ondas estacionarias.Ademas para orbitas no circulares la exigencia de ondas estacionarias resulto equivalente a las reglas de cuanti-zacion de Wilson y Sommerfeld, en donde los niveles permitidos de energıa aparecen como los analogos de los modosnormales de una cuerda vibrante.

Recordemos ademas que dentro de sus postulados De Broglie asume que la energıa E y el momento p de unapartıcula material posee la siguiente relacion con sus parametros de onda

E = hν = ~ω ; p = ~k (2.8)

siendo ν, ω,k la frecuencia, frecuencia angular y numero de onda respectivamente. La correspondiente longitud deonda es

λ =2π

|k| =h

|p| (2.9)

Page 107: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

2.8. DUALIDAD ONDA PARTICULA PARA LA MATERIA 107

una estimacion de la longitud de onda de la materia ordinaria nos permite comprender porque no observamos lanaturaleza ondulatoria de la materia ordinaria en el mundo macroscopico.

En virtud de la gran simetrıa que parece existir entre la radiacion y la materia, vamos a incorporar las ideasya recogidas de los experimentos opticos para incorporarlas a la naturaleza de las partıculas materiales. Estasextrapolaciones estan soportadas en el hecho de que experimentos similares a los opticos se pueden realizar conlos electrones y otras partıculas materiales, y observar que el comportamiento es muy similar al mostrado por losfotones.

Comenzaremos entonces por mencionar que el concepto clasico de trayectoria sera sustituıdo por el concepto deuna distribucion dinamica (dependiente del tiempo) de probabilidad de que la partıcula este en cierta region delespacio. Para ello sera necesario encontrar una amplitud de probabilidad ψ (r, t) que estara asociada a un campoescalar. A esta amplitud de probabilidad se le conoce como funcion de onda y me define el estado de una partıculaen un instante dado, es decir contiene toda la informacion posible sobre la partıcula. La probabilidad de encontrara la partıcula en un volumen d3r esta dada por

dP (r, t) = C |ψ (r, t)|2 d3r

donde C es una constante de normalizacion. Puesto que los experimentos muestran que esta distribucion de proba-bilidad presenta las propiedades ondulatorias, es necesario que la ecuacion de movimiento que la genera sea lineal yhomogenea para que se cumpla el principio de superposicion que se requiere para los fenomenos de interferencia. Esclaro que estos fenomenos de interferencia se veran reflejados en la probabilidad (al igual que en la intensidad en losfenomenos opticos), al elevar al cuadrado la cantidad ψ (r) (el analogo a E (r, t) en optica). Dado que la partıculadebe estar siempre en algun lugar, es claro que la probabilidad total debe ser igual a la unidad

∫C |ψ (r, t)|2 d3r = 1 (2.10)

esto nos indica entonces que los estados fısicos ψ (r, t) deben ser funciones de cuadrado integrable en todas lasregiones accesibles a la partıcula (es posible que ciertas condiciones fısicas hagan que algunas regiones no seanaccesibles). En otras palabras, la integral sobre el volumen accesible de la partıcula debe ser convergente.

Asumiremos ademas que se cumple el principio de descomposicion espectral aplicado a la medida de una cantidadfısica arbitraria. Esto significa que (a) El resultado de la medida debe pertenecer a un conjunto de autoresultadosa. (b) Con cada autovalor a se asocia un autoestado, es decir una autofuncion ψa (r). Esta autofuncion cumple lacondicion de que si ψ (r, t0) = ψa (r) siendo t0 el instante en el cual se realiza la medida, el resultado de tal medidanos dara con toda certeza el autovalor a. (c) Para todo estado ψ (r, t) la probabilidad Pa de obtener el autovalora cuando se realiza una medida en el tiempo t0, se encuentra descomponiendo ψ (r, t) en los autoestados ψa (r, t)

ψ (r, t0) =∑

a

caψa (r) ; Pa =|ca|2∑b |cb|2

;∑

a

Pa = 1

en virtud de la arbitrariedad del estado inicial ψ (r, t0), lo anterior implica que los autoestados ψa (r) deben sercompletos, es decir deben formar una base para el conjunto de todos los estados fısicos posibles, esto nos llevara demanera natural al concepto de observable. (d) Si la medida nos arroja un autovalor a, la partıcula quedara en suautoestado asociado ψa (r). (e) La ecuacion que describe la evolucion del sistema (evolucion temporal de la amplitudde probabilidad) debe ser lineal y homogenea en ψ. Debe tener soluciones de naturaleza ondulatoria compatiblescon las relaciones de De Broglie, en la siguiente seccion estudiaremos con mas detalle estas propiedades.

Es importante observar que cuando realizamos el paso de suplantar la trayectoria de una partıcula (clasicamentepuntual), por una distribucion dinamica de probabilidad (un campo) estamos reemplazando un estado clasico departıcula puntual de seis parametros en cada tiempo (tres coordenadas de posicion y tres de velocidad), por unestado cuantico determinado por un numero infinito de parametros: el valor de la funcion de onda en cada puntodel espacio (y en el tiempo dado). El hecho de que la distribucion de probabilidad dependa del tiempo nos llevara alconcepto de propagacion de la onda asociada con la partıcula. A manera de ejemplo, en el experimento de la doblerendija de Young cuando se observa el patron de interferencia no poseemos informacion sobre la rendija por la cualpaso cada foton (tambien vale para electrones u otras partıculas materiales), en realidad la onda asociada para porambas rendijas y solo podemos calcular la probabilidad de que pase por una de ellas.

Page 108: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

108CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS DE LA MECANICA CUANTICA

Es importante mencionar sin embargo, que la simetrıa materia radiacion exhibida hasta el momento poseeuna excepcion importante: los fotones son en general emitidos (creados) o absorbidos (destruıdos) durante unexperimento. En contraste, las partıculas materiales no se crean ni se destruyen en los experimentos tıpicos. Porejemplo, un electron emitido por un filamento caliente ya existıa previamente en el filamento. De la misma formaun electron absorbido en un detector no desaparece, simplemente se vuelve parte de un atomo del detector o de unacorriente en este. En realidad la teorıa de la relatividad predice que es posible la creacion y aniquilacion de partıculasmateriales: por ejemplo un foton de alta energıa que pasa cerca a un atomo puede crear un par electron positron(partıcula antipartıcula). Recıprocamente, una colision electron positron aniquila a ambas partıculas emitiendo unfoton, esta conversion radiacion materia o viceversa es posible gracias a la equivalencia energetica de la masa. Sinembargo, en el lımite no relativista la materia no se puede crear ni destruır, lo cual nos lleva a una ley importante deconservacion del numero de partıculas. En particular, para sistemas de una partıcula podemos hacer la afirmacionde que la partıcula esta en alguna parte para todo tiempo, lo cual nos indica una conservacion de la probabilidad(la integral de volumen 2.10 debe ser la unidad para todo tiempo).

Resumamos entonces las diferencias importantes entre materia y radiacion que nos conducen a que la teorıacuantica para la materia es mas sencilla. (a) Los fotones son irremediablemente relativistas, la materia en cambiopuede estar en un regimen no relativista y de hecho para solidos a temperaturas normales los electrones y nucleostienen velocidades mucho menores que la de la luz. Por tanto, para la materia tiene sentido una teorıa cuantica norelativista pero no para la radiacion. (b) La naturaleza relativista de los fotones (y de la materia a altas energıas)conduce a que el numero de fotones no se conserva en el tiempo, por tanto la distribucion de probabilidad debecolapsar para tiempos anteriores a la emision y posteriores a la absorcion, la Ec. (2.10) no es valida para todotiempo y debe incorporarse una ecuacion o ecuaciones que me den cuenta de la dinamica en el numero de partıculas(dinamica de creacion y destruccion). (c) Desde el punto de vista clasico las partıculas suelen modelarse como mediosdiscretos (partıculas puntuales), en tanto que el escenario clasico del foton corresponde a medios contınuos (camposelectromagneticos). La cuantizacion de la materia se asocia entonces a menudo con la cuantizacion de un medioclasicamente discreto (teorıa cuantica “ordinaria”), en tanto que la cuantizacion de la radiacion esta necesariamenteasociada a la cuantizacion de un medio clasicamente contınuo (teorıa cuantica de campos).

2.9. Aspectos ondulatorios de una partıcula material

Hemos visto que la distribucion de probabilidad esta asociada con las propiedades ondulatorias de la materia (ola radiacion). Por tanto, la generacion de la ecuacion dinamica para esta distribucion de la probabilidad requerira deestudiar las propiedades ondulatorias que dicha ecuacion debe generar. En general, la mayor parte de la discusion quese desarrollara en esta seccion es tambien valida para ondas clasicas, los desarrollos matematicos son basicamenteidenticos pero la interpretacion difiere en ambos casos. Si seguimos los postulados de De Broglie, el punto de partidanatural sera el estudio de las ondas viajeras libres. Dentro de la ecuacion de onda clasica libre (i.e. homogenea) lasolucion mas simple (monocromatica) es la solucion tipo onda plana

ψ (r, t) = Aei(k·r−ωt) (2.11)

es inmediato ver que la onda plana es tal que

|ψ (r, t)|2 = |A|2

de modo que si efectivamente representa a la onda asociada a una partıcula libre, nos predice que la distribucion deprobabilidad de una partıcula libre es uniforme en el espacio, lo cual es compatible con la homogeneidad e isotropıadel espacio. Podrıa argumentarse que las ondas planas no son de cuadrado integrable de modo que no representanestrictamente un estado fısico. Sin embargo, nuestra experiencia con la optica en la cual las ondas planas tampocoson estados fısicos nos muestra que el estudio de sus propiedades es muy provechoso, por un lado porque se puedeconsiderar como el lımite de un estado fısico y por otro lado porque los estados fısicos se podran escribir comosuperposicion de tales funciones en virtud de su completez (ver seccion 1.31.1).

Tomaremos entonces la solucion (2.11) como el prototipo de una onda piloto. Nuestro objetivo sera realizar unateorıa no relativista que sea compatible con los postulados de De Broglie. Partiremos entonces de la relacion norelativista entre E y p para una partıcula

E =p2

2m(2.12)

Page 109: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

2.9. ASPECTOS ONDULATORIOS DE UNA PARTICULA MATERIAL 109

y utilizando las relaciones de De Broglie (2.8) llegamos a

ω =~k2

2m(2.13)

la relacion de dispersion (2.13) nos dice que la ecuacion de onda NO es la ecuacion dinamica que gobierna a lateorıa cuantica no relativista de una partıcula, ya que es facil demostrar que insertando (2.11) en la ecuacion deonda clasica se obtiene la relacion de dispersion

ω2 = k2v2 (2.14)

siendo v la velocidad de la onda. Volveremos sobre este problema mas adelante, de momento asumiremos que laonda viajera libre (2.11) es solucion de la ecuacion de movimiento para el estado cuantico ψ de una partıcula librecon relacion de dispersion dada por (2.13). Puesto que las ondas piloto deben generar los fenomenos ondulatorios,es necesario que la combinacion lineal de soluciones sea solucion de la ecuacion dinamica para generar los fenomenosde interferencia.

2.9.1. Estados cuanticos arbitrarios como superposicion de ondas planas

De acuerdo con lo anterior, y dado que las ondas planas pueden generar cualquier funcion de cuadrado inte-grable (completez) cualquier estado cuantico de una partıcula (no necesariamente libre) se puede escribir como unasuperposicion de la forma

ψ (r, t) =1

(2π)3/2

∫ψ (k) ei[k·r−ωt]d3k (2.15)

donde d3k = dkx dky dkz representa un diferencial de volumen en el espacio de las k′s (usualmente denominadoespacio recıproco). La transformada de Fourier ψ (k) puede ser compleja pero debe ser bien comportada parapermitir derivar la solucion dentro de la integral. Por supuesto, las transformadas de Fourier especıficas dependerandel problema especıfico.

Una funcion de onda que es superposicion de ondas planas como la descrita en (2.15) se denomina un paquetede ondas tridimensional. Por simplicidad, tomaremos el caso unidimensional

ψ (x, t) =1√2π

∫ψ (k) ei[kx−ωt]dk (2.16)

y estudiaremos mas adelante el caso tridimensional. En primer lugar estudiaremos el perfil del paquete de onda enun instante dado

2.9.2. Perfil instantaneo del paquete de onda

Por simplicidad elegimos el instante como t = 0. La Ec. (2.16) se simplifica a

ψ (x, 0) =1√2π

∫ψ (k, 0) eikxdk (2.17)

y su inversa es

ψ (k, 0) =1√2π

∫ψ (x, 0) e−ikxdx (2.18)

la forma instantanea del paquete estara dada por la dependencia x de ψ (x, 0) definida en (2.17). Imaginemos que∣∣ψ (k, 0)∣∣ esta dada por una curva cuyo perfil es similar a una campana de Gauss simetrica centrada en k = k0 con

un pico bien pronunciado en k0 y un ancho ∆k. En realidad, no hay una sola forma de parametrizar este ancho,pero tomaremos por convencion que el ancho lo definimos a la mitad de la altura del pico.

Ahora trataremos de definir el comportamiento cualitativo de ψ (x, 0) por medio de ejemplos sencillos. Supong-amos que ψ (x, t) esta dado por una superposicion de tres ondas planas eikx (en t = 0), caracterizadas por losnumeros de onda k0, k0 − ∆k

2 , k0 + ∆k2 con amplitudes g (k0), g (k0) /2 y g (k0) /2

ψ (x) =g (k0)√

[eik0x +

1

2ei(k0−

∆k2 )x +

1

2ei(k0+∆k

2 )x]

(2.19)

ψ (x) =g (k0)√

2πeik0x

[1 + cos

(∆k

2x

)](2.20)

Page 110: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

110CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS DE LA MECANICA CUANTICA

Figura 2.3: (a) Partes reales de cada una de las tres ondas dadas por (2.19). (b) Superposicion de las tres ondas. Lalınea punteada es la envolvente dada por

[1 + cos

(∆x2 x)], que le da forma al paquete de ondas. La lınea contınua

describe las oscilaciones.

La Fig. 2.3 muestra la forma de cada una de estas tres ondas (sus partes reales) y de la superposicion. La Ec.(2.20) muestra que |ψ (x)| es maximo cuando x = 0, lo cual se aprecia en la Fig. 2.3 en virtud de que en x = 0las tres ondas estan en fase y por lo tanto interfieren constructivamente. A medida que nos movemos desde x = 0(hacia la izquierda o la derecha) las ondas estan cada vez mas en desfase de modo que |ψ (x)| va disminuyendo,hasta que la interferencia se vuelve totalmente destructiva en ciertos puntos xn (posiciones de los nodos), cuando ladiferencia de fase entre eik0x y ei(k0±∆k/2)x es igual a (2n+ 1) π, siendo n un entero no negativo. Los nodos xn mascercanos a x = 0 estan asociados a una diferencia de fase π

k0xn −(k0xn ±

∆k

2xn

)= π ⇒ ∓∆k

2xn = π

∆k

2xn = ∓π ⇒ xn = ∓ 2π

∆k

Dado que el paquete es simetrico y esta centrado en x = 0, el ancho del paquete es ∆x = 2 |xn|

∆x =4π

∆k⇒ (∆x) (∆k) = 4π (2.21)

esto nos muestra que a medida que el ancho ∆k de la funcion∣∣ψ (k)

∣∣ decrece, el ancho ∆x de la funcion |ψ (x)|aumenta, siendo ∆x la distancia entre dos ceros de |ψ (x)|. Similarmente, si el ancho del paquete ∆x disminuye(paquete mas localizado), el ancho ∆k de

∣∣ψ (k)∣∣ debe aumentar a fin de mantener la relacion (2.21).

Si asumimos que k0 >> ∆k entonces la frecuencia del termino eik0x es mucho mayor a la frecuencia del termino1 + cos

(∆k2 x). Por lo tanto, la parte oscilante en x para la Ec. (2.20) esta dada por la funcion eik0x y la envolvente

(modulacion de la amplitud de oscilacion) esta dada por

|ψ (x)| =g (k0)√

∣∣∣∣1 + cos

(∆k

2x

)∣∣∣∣

Page 111: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

2.9. ASPECTOS ONDULATORIOS DE UNA PARTICULA MATERIAL 111

esta amplitud de la envolvente o funcion moduladora de la amplitud se ilustra como lınea punteada en la Fig. 2.3.En este caso, vemos que la envolvente dada por |ψ (x)| es periodica en x de modo que tenemos un tren infinito depaquetes de onda con una serie de nodos y maximos. Este hecho se debe a que la superposicion es de un numerofinito de ondas planas. Para una superposicion contınua de un numero infinito de ondas como el dado en (2.17), estefenomeno no ocurre y tendremos en general un solo maximo para el perfil |ψ (x, 0)|. En realidad, lo que esperamosde una onda piloto asociada a una partıcula es un solo paquete relativamente “localizado” alrededor del maximodel paquete (region de mayor probabilidad de localizar a la partıcula).

Retornemos ahora al caso general de una superposicion contınua de la forma (2.17), aquı el fenomeno de in-terferencia es mas complejo pero de nuevo tendremos un maximo en |ψ (x, 0)| cuando las diferentes ondas viajerasinterfieran constructivamente.

Escribamos, ψ (k, 0) en notacion polar con α (k) el argumento y∣∣ψ (k, 0)

∣∣ la longitud del fasor

ψ (k, 0) =∣∣ψ (k, 0)

∣∣ eiα(k) (2.22)

ahora asumamos que α (k) varıa lentamente en el intervalo [k0 − ∆k/2, k0 + ∆k/2] donde la longitud del fasor∣∣ψ (k, 0)∣∣ es apreciable. Cuando ∆k es suficientemente pequeno, podemos expandir a α (k) en las vecindades de

k = k0

α (k) ' α (k0) + (k − k0)

[dα

dk

]

k=k0

reemplazando esta expansion en (2.17) se obtiene

ψ (x, 0) =1√2π

∫ ∞

−∞ψ (k) eikxdk =

1√2π

∫ ∞

−∞

∣∣ψ (k)∣∣ eiα(k) eikxdk (2.23)

' 1√2π

∫ k0+∆k2

k0−∆k2

∣∣ψ (k)∣∣ ei

[α(k0)+(k−k0)[ dαdk ]k=k0+kx

]

dk

=1√2π

∫ k0+∆k2

k0−∆k2

∣∣ψ (k)∣∣ ei

[α(k0)+(k−k0)[ dαdk ]k=k0+kx−k0x+k0x

]

dk

=1√2π

∫ k0+∆k2

k0−∆k2

∣∣ψ (k)∣∣ ei

[α(k0)+(k−k0)[ dαdk ]k=k0+(k−k0)x+k0x

]

dk

=ei[α(k0)+k0x]

√2π

∫ k0+∆k2

k0−∆k2

∣∣ψ (k)∣∣ ei

(k−k0)

([ dαdk ]k=k0

+x)

dk (2.24)

quedando finalmente

ψ (x, 0) ' ei[k0x+α(k0)]

√2π

∫ k0+∆k2

k0−∆k2

∣∣ψ (k)∣∣ ei(k−k0)(x−x0)dk (2.25)

x0 ≡ −[dα

dk

]

k=k0

(2.26)

La expresion (2.25) es util para un analisis cualitativo de las variaciones de |ψ (x, 0)| con x. Partiendo de k = k0 elsiguiente valor kb para el cual se ha ejecutado una oscilacion es

(kb − k0) (x− x0) = 2π ⇒ (kb − k0) =2π

(x− x0)

De modo que el valor de |x− x0| nos dice si |kb − k0| es mayor o menor que ∆k/2 o en otras palabras, si en elintervalo de integracion definido en (2.25) el integrando ha logrado o no completar una oscilacion. Cuando |x− x0|es grande i.e. cuando |x− x0| >> 2π/∆k, se tiene que

(kb − k0) =2π

(x− x0)<< ∆k

Page 112: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

112CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS DE LA MECANICA CUANTICA

Figura 2.4: Variaciones con respecto a k, de la parte real del integrando en la Ec. (2.25) (a) cuando x es fijo en unvalor tal que |x− x0| > 1/∆k, en tal caso la funcion oscila varias veces en el intervalo ∆k. (b) Cuando x es fijo enun valor tal que |x− x0| < 1/∆k, en tal caso la funcion oscila muy poco en tal intervalo y la funcion ψ (x, 0) tomavalores grandes. Por tanto, el centro del paquete de ondas (punto donde |ψ (x, 0)| es maximo) se ubica en x=x0.En todo el analisis se ha supuesto que

∣∣ψ (k)∣∣ es una funcion simetrica centrada en k 0, con un perfil similar a una

campana de Gauss.

de modo que una oscilacion en el integrando de (2.25) se realiza en un intervalo mucho menor que el ancho deintegracion. En consecuencia, la funcion de k que se integra en (2.25) oscila muchas veces dentro del intervalo ∆ky las contribuciones de las sucesivas oscilaciones se cancelan entre sı (Fig. 2.4a); por tanto, la integral sobre k sevuelve muy pequena. Es decir que cuando x esta fijo en un valor lejano a x0 las fases de las diversas ondas queconstituyen a ψ (x, 0) varıan muy rapidamente en el dominio ∆k, y forman entre ellas una interferencia destructiva.Por otra parte, cuando x ' x0, o en otras palabras cuando

|x− x0| << 1/∆k

se tiene que

|kb − k0| >> 2π∆k > ∆k

la funcion que se integra sobre k solo realiza una pequena fraccion de la oscilacion a partir de k0 y dado que|k − k0| < ∆k para un k que este en el intervalo de integracion, se tiene que

|k − k0| |x− x0| < <1

∆k∆k = 1 , k ∈

[k0 −

∆k

2, k0 +

∆k

2

]

∣∣ψ (k)∣∣ ei(k−k0)(x−x0) '

∣∣ψ (k)∣∣ (2.27)

de modo que la exponencial apenas modifica un poco el perfil de∣∣ψ (k)

∣∣ (Fig. 2.4b), y en el proceso de integracionla fase se mantiene casi constante, por tanto la interferencia es constructiva y |ψ (x, 0)| es maximo.

De otra parte, la Ec. (2.27) se convierte en una igualdad para la posicion xM tal que xM = x0, en cuyo caso nohay oscilacion y la interferencia es completamente constructiva. Por tanto, la posicion xM (0) = x0 corresponde alcentro del paquete de onda (maximo del modulo del paquete) que de acuerdo con la Ec. (2.26) viene dada por:

xM (0) = x0 = −[dα

dk

]

k=k0

(2.28)

alternativamente, se puede ver que (2.28) nos da la posicion del centro del paquete teniendo en cuenta que la Ec.(2.17) adquiere su maximo en valor absoluto cuando las ondas de mayor amplitud (aquellas con k cercano a k0)interfieren constructivamente. Esto ocurre cuando las fases que dependen de k de estas ondas varıan lentamente

Page 113: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

2.9. ASPECTOS ONDULATORIOS DE UNA PARTICULA MATERIAL 113

alrededor de k0. Para obtener el centro del paquete se impone que la derivada con respecto a k de la fase sea ceropara k = k0, esta fase se puede ver en la segunda igualdad de la Ec. (2.23) y se obtiene

d

dk[kx+ α (k)]k=k0 = 0 ⇒

[x+

dk

]

k=k0

= 0 (2.29)

vemos entonces que la condicion de fase estacionaria (2.29) se reduce a (2.28).

Cuando x se aleja de x0, el valor de |ψ (x, 0)| decrece. El proposito ahora es definir un ancho ∆x dependiendodel decrecimiento de |ψ (x, 0)| alrededor de x0. Notese que este decrecimiento es apreciable si ei(k−k0)(x−x0) oscilauna vez o mas cuando k recorre el dominio desde k0 − ∆k

2 hasta k0 + ∆k2 es decir cuando

∆k · |x− x0| & 2π

donde hemos definido el “umbral” para |x− x0| como el valor para el cual se ejecuta una oscilacion. Si definimos∆x ≡ |x− x0| /2π como el ancho tıpico del paquete, tenemos

∆k ∆x & 1 (2.30)

lo cual nos da una relacion entre los anchos de dos funciones que son transformadas de Fourier una de otra.Observemos de nuevo que no hay una unica manera de definir el ancho ∆x, por ejemplo podemos definir este anchocon dos oscilaciones, con tres etc, entre mayor sea el numero de oscilaciones mayor es el efecto de cancelacion, elancho sera mayor y estaremos tomando una mayor porcion del area bajo la curva. De la misma forma, puedo tomarel ancho ∆k cuando la altura

∣∣ψ (k)∣∣ es 1/2, 1/e, 1/3 etc, es decir puedo ensanchar ∆k para tomar una porcion mas

grande del area bajo la curva y tener mejores aproximaciones. En vista de lo anterior, el hecho importante es queeste producto tiene una cota inferior, ya que el valor preciso de esta cota depende de la definicion de los anchos ∆ky ∆x. Esta es la razon para utilizar el sımbolo & en la Ec. (2.30) en lugar de ≥.

La relacion (2.30) nos dice ademas que no es posible construır paquetes cuyo producto de anchos sea muchomenor que uno, pero en cambio sı es posible construır paquetes cuyo producto de anchos sea mucho mayor que uno.

Notese que este analisis ha sido completamente matematico, k y x pueden ser variables arbitrarias siempreque ψ (x, 0) y ψ (k) sean transformadas de Fourier la una de la otra. No existe ninguna suposicion fısica en estosargumentos.

El presente analisis se utiliza en ondas clasicas asignando a k el numero de onda y a x la variable espacial enuna dimension. La Ec. (2.30) demuestra que a medida que un paquete de ondas se hace mas monocromatico (amedida que se reduce ∆k) el ancho ∆x del paquete de onda espacial se hace mayor. En un paquete estrictamentemonocromatico ∆k → 0 y por tanto ∆x → ∞, por lo cual las ondas monocromaticas no corresponden a estadosfısicos. Este mismo principio nos muestra que no existe un tren de ondas electromagneticas para el cual se puedadefinir la posicion y la longitud de onda con infinita precision al mismo tiempo.

2.9.3. El principio de incertidumbre de Heisenberg

En nuestro contexto de la mecanica cuantica, el paquete de onda ψ (x, t) dado por (2.16) representa el estado deuna partıcula cuya probabilidad en t = 0 de estar fuera del paquete centrado en x0 y de ancho ∆x es practicamentecero.

El resultado (2.30) posee una interesante interpretacion a la luz de la mecanica cuantica. Por ejemplo, hemosvisto que cuando nuestro estado se describe por una sola onda plana del tipo dado en la Ec. (2.11) (que no esestrictamente un estado fısico), la probabilidad de estar en cualquier punto del eje x es la misma para todos losvalores de t, no hay propagacion de la probabilidad. Por otro lado, el ancho ∆x del paquete de onda se puedeconsiderar infinito (la amplitud no se modula), lo cual se traduce en la maxima incertidumbre posible en la posicionde la partıcula (igual probabilidad en todas partes). Por otra parte, esta onda tiene solo una frecuencia angular ω0

y un solo numero de onda k0 (onda monocromatica) y de acuerdo con las relaciones de De Broglie su energıa y sumomento estan perfectamente definidos E = ~ω0, p = ~k0. Esta onda plana pura se puede considerar como un casoparticular del paquete de ondas (2.16) con

ψ (k) = δ (k − k0) ; ∆k → 0

Page 114: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

114CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS DE LA MECANICA CUANTICA

donde el hecho de que ∆k → 0 se ve claramente si vemos a la delta de Dirac como el lımite de Gaussianas cada vezmas altas y agudas. La relacion ∆k → 0 junto con la Ec. (2.30) nos lleva a que ∆x→ ∞ como ya se dijo.

A la luz del principio de descomposicion espectral este resultado se puede ver de la siguiente forma: A lapartıcula en t = 0 le hemos asignado una funcion de onda ψ (x, 0) = Aeikx y hemos visto que posee un momentobien determinado. Es decir que una medida del momento en t = 0 dara definitivamente el valor p = ~k 3. De esto sededuce que Aeikx caracteriza al autoestado correspondiente al autovalor p = ~k. Puesto que existen ondas planaspara todos los valores de k, los autovalores de p que se pueden obtener en una medicion del momento sobre un estadoarbitrario son todos los valores reales. En este caso no hay cuantizacion de los autoresultados, todos los valores delmomento son permitidos como en la mecanica clasica. Ahora bien, la total determinacion de p viene acompanadapor una completa incertidumbre en x.

Volvamos ahora al caso de un paquete como el dado por (2.17). Como ψ (x, 0) es una superposicion lineal deautofunciones del momento eikx con coeficientes ψ (k, 0), el principio de descomposicion espectral nos conduce a

interpretar a∣∣ψ (k, 0)

∣∣2 dk (con un posible factor de normalizacion) como la probabilidad de encontrar un valor demomento entre p = ~k y p+ dp = ~ (k + dk), cuando hacemos una medida en t = 0 del momento de una partıculacuyo estado es descrito por ψ (x, 0) en (2.17). Esta interpretacion es necesaria cuando el autovalor tiene un espectrocontınuo ya que en este caso la probabilidad de estar en un punto matematico especıfico serıa cero y solo es finita laprobabilidad de estar en un intervalo dado. En este caso

∣∣ψ (k, 0)∣∣2 serıa una densidad de probabilidad (probabilidad

por unidad de volumen unidimensional), y no una probabilidad como ocurre en el caso discreto.Ahora bien, dado que para una partıcula es mas usual hacer medidas de momento y energıa que de frecuencia

angular y numero de onda, es mas adecuado escribir las expresiones en terminos de E y p usando las relaciones deDe Broglie Ecs. (2.8)4. En particular, la Ec. (2.17) se reescribe como

ψ (x, 0) =1√2π~

∫ψ (p, 0) eipx/~ dp

dado que las transformadas de Fourier satisfacen la relacion de Bessel parseval (invarianza de la norma)

〈ψ|ψ〉 (0) =

∫ ∞

−∞|ψ (x, 0)|2 dx =

∫ ∞

−∞

∣∣ψ (p, 0)∣∣2 dp ≡ C

tendremos entonces que

dP (x, 0) =1

C|ψ (x, 0)|2 dx ; dP (p, 0) =

1

C

∣∣ψ (p, 0)∣∣2 dp

dP (x, 0) representa la probabilidad de encontrar a la partıcula en t = 0 en el intervalo [x, x+ dx]. Similarmente,dP (p, 0) es la probabilidad de obtener una medida del momento de la partıcula en t = 0 que este dentro del intervalo[p, p+ dp].

Ahora escribamos la desigualdad (2.30) en terminos de E y p usando la relaciones de De Broglie (2.8)

∆x ∆p & ~ (2.31)

para dar una interpretacion fısica a (2.31), supongamos que el estado de una partıcula esta definido por el paquetede onda (2.16). En tal caso, la probabilidad de encontrar la partıcula en t = 0 dentro del intervalo [x0 − ∆x/2,x0 + ∆x/2] es practicamente uno. Decimos entonces que ∆x es la incertidumbre en la medida de la posicion de lapartıcula. Similarmente, si medimos el momento de la partıcula en el mismo tiempo (t = 0) tal probabilidad es casiuno dentro del intervalo [p0 − ∆p/2, p0 + ∆p/2]. Es decir que ∆p mide la incertidumbre en la determinacion delmomento de la partıcula.

A la luz de lo anterior la Ec. (2.31) expresa que es imposible medir al mismo tiempo la posicion y el momentode la partıcula con grado arbitrario de exactitud. Cuando alcanzamos el lımite inferior en (2.31) una disminucion en∆x (es decir un aumento en la exactitud de la medicion de la posicion) conduce a un aumento en ∆p (es decir unaumento en la incertidumbre de la medida del momento, o equivalentemente una disminucion en la exactitud de tal

3Este punto es quizas el mas adecuado para decir que siempre hemos tratado con medidas ideales. Decir que la medida del momentoesta completamente definida no es experimentalmente cierto. Lo que en realidad se quiere decir es que en este caso no hay una perturbacionfundamental que cambie drasticamente el sistema y por tanto las demas perturbaciones se puede hacer cada vez mas pequenas.

4En otras palabras, es mas usual medir parametros de materia que parametros de onda.

Page 115: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

2.10. EL PRINCIPIO DE COMPLEMENTARIEDAD PARA LA DUALIDAD ONDA PARTICULA Y SU RELACION CON EL PRINCIPIO DE INCERTIDUMBRE DE HEISENBERG115

medida) y viceversa. Este enunciado se conoce como el principio de incertidumbre de Heisenberg. Notemosque el valor del termino de la derecha en (2.31) nos expresa mas bien un orden de magnitud que un lımite inferiorpreciso.

Es de anotar que si bien hay un analogo clasico del principio de incertidumbre para las ondas, no hay un analogoclasico para las partıculas. En realidad hemos visto que el principio de incertidumbre esta asociado inicialmente alos parametros de onda, que se conectan a los parametros de partıcula por medio de las relaciones de De Broglie,estas a su vez estan asociadas a la dualidad onda partıcula que es una caracterıstica cuantica. La pequenez de ~

hace que este principio de incertidumbre no se manifieste en los sistemas macroscopicos.

2.10. El principio de complementariedad para la dualidad onda partıcula y

su relacion con el principio de incertidumbre de Heisenberg

Figura 2.5: Variante del experimento de Young de la doble rendija, para el cual la placa opaca P, puede desplazarseverticalmente.

La discusion sobre el experimento de la doble rendija nos ha mostrado que si bien la dualidad onda partıculaes necesaria para explicar los resultados, ambas manifestaciones parecen ser mutuamente excluyentes. La perfectadeterminacion de las propiedades ondulatorias (patron de interferencia con doble rendija) nos conduce a una totalignorancia sobre la rendija por la cual pasa cada foton (propiedad de “trayectoria” asociada a una partıcula). Porotro lado, la perfecta determinacion de la rendija por la cual pasa cada foton (determinacion de sus propiedades departıcula) conduce a la completa destruccion del patron de interferencia (i.e. de sus propiedades ondulatorias). Sedice entonces que los aspectos ondulatorio y material de la partıcula son complementarios.

Vamos ahora a reconsiderar el experimento de la doble rendija para demostrar la profunda relacion entre elprincipio de complementariedad y el principio de incertidumbre de Heisenberg. Para ello analizaremos una variantedel experimento de la doble rendija ilustrada en la Fig. 2.5.

Asumamos que la placa opaca P sobre la cual se perforan las rendijas esta montada sobre cojinetes que permitensu desplazamiento vertical. Asumiremos que el foco de los fotones esta muy lejos, de modo que podemos suponer

Page 116: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

116CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS DE LA MECANICA CUANTICA

que todos los fotones inciden perpendicularmente sobre la placa P. Un foton que golpea la placa de observacion O

en el punto M (de coordenada x respecto al origen O), tuvo que sufrir un cambio de momento que fue absorbidopor P a fin de mantener el momento conservado. Notese que si el foton de momento p = hν/c pasa por la rendijaF1, el momento transferido a P es

p1 = −hνc

sin θ1 (2.32)

y si pasa por la rendija F2, tal momento transferido es

p2 = −hνc

sin θ2 (2.33)

Siendo θ1 el angulo de deflexion del foton cuando cruza la rendija F1 e impacta en el punto M . El angulo θ2 sedefine similarmente con la rendija F2. Por tanto, el momento transferido a P depende de la trayectoria del foton,puesto que depende de la rendija por la que pase.

Enviando los fotones uno por uno podemos construir el patron de interferencia gradualmente sobre la pantallade observacion. Aparentemente, este dispositivo nos permite construir tal patron de interferencia asociado a la doblerendija al tiempo que permite determinar la rendija por la cual pasa cada foton. A priori pareciera que podemosdeterminar completamente las caracterısticas corpusculares y ondulatorias de los fotones en forma simultanea.

Sin embargo, las franjas de interferencia no son visibles con este montaje. El error consiste en asumir que sololos fotones poseen un caracter cuantico. Sin embargo, la placa P aunque es un objeto macroscopico tambien poseeun caracter cuantico. Si queremos discriminar por cual rendija paso el foton, la incertidumbre ∆p en la medida delmomento vertical de P debe ser suficientemente pequena para determinar la diferencia entre p1 y p2

∆p << |p2 − p1|aplicando las relaciones de incertidumbre, la posicion de la placa P se puede conocer a lo mas dentro de un intervalode incertidumbre dado por

∆x &~

∆p>>

h

|p2 − p1|(2.34)

si denotamos a la distancia entre las rendijas y d la distancia entre la placa P y la pantalla O, y si asumimos queθ1 y θ2 son pequenos (i.e. a/d << 1 y x/d << 1) obtenemos

θ1 ' tan θ1 =x− a/2

d; θ2 ' tan θ2 =

x+ a/2

d

|θ2 − θ1| ' a

d

los momentos p1 y p2 dados en las Ecs. (2.32, 2.33) nos dan

|p2 − p1| =hν

c|sin θ2 − sin θ1| '

c|θ2 − θ1| '

c

a

d=h

λ

a

d

siendo λ la longitud de onda asociada al foton. Sustituyendo esta relacion en (2.34) se obtiene

∆x >>λd

a(2.35)

pero (λd) /a es precisamente la separacion entre franjas que se espera encontrar en el patron de difraccion sobrela pantalla O. Ahora bien, si la posicion vertical de las rendijas solo se puede determinar en un intervalo deincertidumbre mayor a la separacion de las franjas, es imposible observar el patron de interferencia.

La discusion anterior nos muestra que la construccion de una teorıa cuantica de la radiacion requiere de laconstruccion de una teorıa cuantica de la materia para evitar contradicciones. En el ejemplo anterior, si trabajamosla placa P como un sistema clasico material, invalidamos el principio de complementariedad de los dos aspectoscorpuscular y ondulatorio de la luz y por tanto, la teorıa cuantica de la radiacion. Se puede demostrar que dificultadesanalogas surgen cuando se considera que solo la materia posee caracter cuantico. Por tanto, la consistencia delprincipio de complementariedad requiere que tanto la materia como la radiacion tengan caracterısticas cuanticas.

Otro aspecto que vale la pena discutir, es que en este ejemplo la naturaleza cuantica de P es esencial para unadecuado entendimiento del fenomeno, a pesar de ser un sistema macroscopico. La razon estriba es que si bien elsistema es macroscopico, las incertidumbres combinadas para el momento y la posicion que se requieren en dichosistema para soslayar el principio de complementariedad, estan en un umbral no permitido por las relaciones deincertidumbre.

Page 117: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

2.11. EVOLUCION TEMPORAL DE PAQUETES DE ONDAS LIBRE 117

2.11. Evolucion temporal de paquetes de ondas libre

Asumamos un paquete de ondas como el descrito por (2.15), la forma especıfica del paquete en t = 0 esta dadapor las condiciones iniciales. La evolucion del paquete estara entonces dictaminada por las relaciones de dispersionque dependen de la interaccion de la partıcula con el resto del universo. Puesto que no hemos generado una ecuaciondinamica para la partıcula no podemos en general resolver la evolucion temporal de una partıcula interactuante,sin embargo la relacion de dispersion (2.13) nos permitira resolver el problema de la evolucion temporal para unapartıcula libre.

En el caso mas simple, un paquete unidimensional esta constituıdo por una sola onda plana

ψ (x, t) = Aei(kx−ωt) = Aeik(x−ωkt) = f

(x− ω

kt)

su parte real es

ψ (x, t) = A cos[k(x− ω

kt)]

su velocidad de propagacion (velocidad de propagacion del frente de onda i.e. de un punto con fase constante)esta dada por la velocidad con que se propaga el maximo correspondiente a xM = 0 en t = 0 (que corresponde afase total cero). Para cualquier tiempo la posicion de este maximo corresponde a fase total cero

xM (t) − ω

kt = 0 ⇒ xM (t) =

ω

kt

la velocidad de este maximo es entoncesdxM (t)

dt= Vf (k) =

ω

k(2.36)

como esta es la velocidad de un punto que define una fase total constante para todo tiempo (fase cero), llamaremosa este termino velocidad de fase de la onda plana, la cual solo depende de x y t por medio de

(x− ω

k t).

Es bien sabido que para ondas electromagneticas en el vacio Vf es independiente de k e igual a c. Todas las ondasque constituyen el paquete viajan a la misma velocidad de modo que el paquete mantiene su forma. Sin embargo,en un medio dispersivo la velocidad de fase esta dada por

Vf (k) =c

n (k)

siendo n (k) el ındice de refraccion relativo entre el vacıo y el medio. En este caso cada onda componente viaja adistinta velocidad, lo cual produce un cambio de forma del paquete con el tiempo. A medida que se propaga elpaquete se ensancha, fenomeno conocido como dispersion. Fısicamente, esto se debe a que el material responde deforma distinta para cada longitud de onda componente.

Volviendo a nuestro caso de onda monocromatica cuantica, si usamos las Ecs. (2.36, 2.13) vemos que la velocidadde fase esta dada por

Vf (k) =ω

k=

~k2

2mk=

~k

2m(2.37)

de modo que Vf es funcion explıcita de k. Notese que si usaramos la relacion de dispersion dada por la ecuacionde onda, Ec. (2.14) entonces Vf no presentarıa dispersion (Vf no depende de k) como ocurre efectivamente con lasondas clasicas libres (como las ondas electromagneticas libres).

Ahora analizaremos el caso de ondas que son superposicion de ondas planas. Veremos a continuacion que cuandolas diferentes ondas tienen diferentes velocidades de fase, la velocidad del maximo xM del paquete de onda no es lavelocidad de fase promedio dada por

ω0

k0=

~k0

2m

como antes, comencemos con el ejemplo simple de la superposicion de tres ondas planas similares a las descritas en(2.19) pero ahora con variacion temporal

ψ (x, t) =g (k0)√

ei(k0x−ω0t) +

1

2ei[(k0−

∆k2 )x−(ω0−∆ω

2 )t] +1

2ei[(k0+

∆k2 )x−(ω0+∆ω

2 )t]

(2.38)

=g (k0)√

2πei(k0x−ω0t)

[1 + cos

(∆k

2x− ∆ω

2t

)]

ψ (x, t) =g (k0)√

2πeik0(x−ω0

k0t)

1 + cos

[∆k

2

(x− ∆ω

∆kt

)](2.39)

Page 118: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

118CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS DE LA MECANICA CUANTICA

puesto que las tres ondas tiene numeros de onda k0 y k0 ± ∆k, es claro que k0 es el numero de onda promedio.Similarmente, ω0 es la frecuencia angular promedio.

De la Ec. (2.39) se ve claramente que el maximo de |ψ (x, t)| que estaba en x = 0 cuando t = 0 esta ahora en elpunto

xM (t) =∆ω

∆kt (2.40)

y no en el punto x = ω0t/k0. El origen de este resultado se puede apreciar en la Fig. 2.6, en (a) se representa la

Figura 2.6: Posicion de tres maximos consecutivos (1) (2) (3) para cada una de las tres ondas planas de la super-posicion en la Ec. (2.39). (a) Configuracion de los maximos en t = 0, para el cual hay interferencia constructivaen x = 0, que se da con los maximos rotulados por (2). (b) Configuracion en un instante posterior en el cual lainterferencia totalmente constructiva se da a la derecha de x con los maximos (3).

posicion en t = 0 de tres maximos consecutivos de cada una de las partes reales de las tres ondas. Puesto que losmaximos denotados con (2) coinciden en x = 0, hay una interferencia constructiva en este punto lo cual nos da elmaximo de |ψ (x, t = 0)|. Puesto que la velocidad de fase aumenta con k segun (2.37), tenemos que el maximo (3) dela onda k0 + ∆k

2 termina alcanzando al maximo de la onda k0 tambien denotado por tres. Similarmente el maximo

(3) de k0 alcanzara al maximo de k0 − ∆k2 denotado por (3). Un analisis detallado muestra que todos coinciden

en cierto tiempo t, determinando entonces el maximo xM (t) de |ψ (x, t)| por interferencia constructiva. El calculodetallado del punto donde esto ocurre reproduce la Ec. (2.40).

Analicemos finalmente el caso en el cual el paquete de ondas es arbitrario y consta de una superposicion contınuade ondas planas como en la Ec. (2.16). El corrimiento del centro del paquete se encuentra aplicando de nuevo elmetodo de fase estacionaria. Comparando la forma de ψ (x, t) con la de ψ (x, 0) Ecs. (2.16, 2.17) vemos que ψ (x, t)se obtiene a partir de ψ (x, 0) con la asignacion ψ (k) → ψ (k) e−iω(k)t. Por tanto, el razonamiento dado en la pag.112 se mantiene valido reemplazando el argumento α (k) de ψ (k) en la Ec. (2.22), por el argumento

α (k) → α (k) − ω (k) t

la condicion de fase estacionaria (2.29) se escribe ahora de la forma

d

dk[kxM + α (k) − ω (k) t]k=k0 = 0 ⇒

[xM +

dk− dω (k)

dkt

]

k=k0

= 0

Y la dinamica del centro del paquete estara dada por

xM (t) =

[dω

dk

]

k=k0

t−[dα

dk

]

k=k0

que nos reproduce una vez mas el resultado (2.40) solo que en este caso ∆ω y ∆k tienden a cero ya que hay unbarrido contınuo en estas variables. La velocidad del maximo del paquete de ondas es

Vg (k0) =dxM (t)

dt=

[dω

dk

]

k=k0

Page 119: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

2.12. CARACTERIZACION DE PAQUETES DE ONDA GAUSSIANOS 119

conocida como velocidad de grupo del paquete. Con la relacion de dispersion (2.13) para partıcula libre tenemosque

Vg (k0) =~k0

m= 2Vf (k0) (2.41)

Notamos entonces dos diferencias importantes entre la onda asociada a la partıcula libre cuantica y la solucionondulatoria proveniente de la ecuacion de onda. Las ondas clasicas libres no presentan dispersion y su velocidad degrupo es menor que su velocidad de fase5.

Notese que el resultado (2.41) reproduce adecuadamente el lımite clasico ya que si ∆x y ∆p son ambos despre-ciables, podemos hablar de la posicion xM (t) y del momento p0 de la partıcula. Pero entonces su velocidad debe serp0/m segun la mecanica clasica, esto es compatible con la Ec. (2.41) obtenida en el marco cuantico con p0 = ~k0,siempre que ∆x y ∆p sean ambos despreciables Vg se puede asociar a la velocidad de la partıcula, que es la velocidaddel maximo del paquete.

Es posible tambien estudiar la forma en que evoluciona la forma del paquete. Si por ejemplo ∆p es una constantede movimiento entonces ∆x se incrementa con el tiempo, (dipersion del paquete).

2.12. Caracterizacion de paquetes de onda gaussianos

Estudiaremos perfiles de paquetes de onda ψ (x, 0) para los cuales la transformada de Fourier ψ (k, 0) es gaussiana.Este ejemplo especıfico es de amplio uso en fısica y tiene la ventaja de permitir ilustrar los conceptos asociados apaquetes de onda con calculos exactos. Estudiaremos ademas la evolucion temporal de estos paquetes.

2.12.1. Integrales basicas para paquetes gaussianos

El calculo del paquete de onda (y muchos otros calculos relativos a paquetes de onda gaussianos) requiere evaluaruna integral del tipo

I (α, β) =

∫ ∞

−∞e−α

2(ξ+β)2dξ

donde α y β son numeros complejos. Es necesario que Re(α2)> 0 para que la integral converja. El teorema del

residuo nos permite encontrar que

I (α, β) = I (α, 0)

de modo que la integral no depende de β. Si se satisface la condicion |Arg (α)| < π/4 (lo cual siempre es posible siRe(α2)> 0), esta integral se puede escribir como

I (α, 0) =1

αI (1, 0)

y solo resta calcular I (1, 0), lo cual se puede hacer como una integral doble en el plano XY usando coordenadaspolares

I (1, 0) =

∫ ∞

−∞e−ξ

2dξ =

√π

de lo cual se obtiene

I (α, β) =

∫ ∞

−∞e−α

2(ξ+β)2dξ =

√π

α(2.42)

2.12.2. Perfiles de paquetes de onda gaussianos

Consideremos el modelo unidimensional de una partıcula libre cuya funcion de onda en t = 0 tiene el perfil

ψ (x, 0) =

√a

(2π)3/4

∫ ∞

−∞e−

a2

4(k−k0)2eikx dk (2.43)

5Notese que el hecho de que la velocidad de grupo sea mayor a la de fase no entra en contradiccion con la relatividad, puesto quenuestros resultados solo son validos en un regimen no relativista, ya que la relacion de dispersion (2.13) proviene de la ecuacion (2.12),la cual es no relativista.

Page 120: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

120CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS DE LA MECANICA CUANTICA

el cual resulta de superponer ondas planas eikx con coeficientes de Fourier de la forma

1√2πψ (k, 0) =

√a

(2π)3/4e−

a2

4(k−k0)2 (2.44)

para calcular ψ (x, 0) es conveniente reescribir la exponencial en (2.43) de modo que los terminos en k queden comoun cuadrado perfecto a fin de compararlos con (2.42)

−a2

4(k − k0)

2 + ikx = −a2

4

[k − k0 −

2ix

a2

]2

+ ik0x− x2

a2

con lo cual la Ec. (2.43) queda

ψ (x, 0) =

√a

(2π)3/4eik0xe−

x2

a2

∫ ∞

−∞e−a2

4

[k−k0− 2ix

a2

]2dk

comparando con (2.42) vemos que α = a/2 de modo que

ψ (x, 0) =

√a

(2π)3/4eik0xe−

x2

a22√π

a

ψ (x, 0) =

(2

πa2

)1/4

eik0xe−x2

a2 (2.45)

vemos entonces que la transformada de Fourier de un paquete gaussiano es tambien gaussiana. El modulo al cuadradodel paquete en t = 0 (que estara relacionado con la densidad de probabilidad asociada a la posicion para una partıculaen t = 0) es

|ψ (x, 0)|2 =

√2

πa2e−

2x2

a2

y la curva asociada a este modulo es una tıpica campana de Gauss. El centro del paquete de onda corresponde almaximo de |ψ (x, 0)|2 y se situa en x = 0. Esto resultado tambien se puede obtener por aplicacion de la Ec. (2.28).

2.12.3. Relaciones de incertidumbre para paquetes gaussianos

Al igual que para todo paquete que no posee nodos, el ancho de una funcion gaussiana f (x) = e−x2/b2 no puede

ser definido en forma unıvoca. Sin embargo, es costumbre definir tal ancho de modo que cuando x varıa entre ±∆xla funcion f (x) se haya reducido en un factor de 1/

√e (de modo que el modulo al cuadrado se reduzca a 1/e), esto

conduce a un ancho

f (x) = e−x2/b2 → ∆x =

b√2

(2.46)

esta definicion tiene la ventaja de coincidir con la definicion de la raız de la desviacion media cuadratica, comoveremos mas adelante. Con esta convencion podemos definir el ancho asociado al paquete de onda ψ (x, 0) de la Ec.(2.45) y de su transformada de Fourier ψ (k, 0) en la Ec. (2.44)

∆x =a

2; ∆k =

1

a⇒ ∆p =

~

a

con lo cual se obtiene

(∆x) · (∆p) =~

2

relacion que es compatible con el principio de incertidumbre. Notese ademas que el principio de incertidumbre seescribe en general en la forma (∆x) · (∆p) & ~/2. Esto implica que el principio de incertidumbre permite en general,que el producto del ancho de la funcion con el ancho de su transformada de Fourier adquiera un valor mayor allımite inferior. Si aceptamos a ~/2 como el lımite inferior, vemos que los paquetes de onda gaussianos predicen unaigualdad, es decir que los productos de las incertidumbres siempre tienen el menor valor posible. En tal sentidodecimos que los paquetes de onda gaussianos son paquetes de “mınima incertidumbre”.

Page 121: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

2.13. EVOLUCION TEMPORAL DE PAQUETES DE ONDA GAUSSIANOS (OPCIONAL) 121

2.13. Evolucion temporal de paquetes de onda gaussianos (opcional)

La Ec. (2.15) junto con la relacion de dispersion (2.13) nos dan la forma del perfil de un paquete de onda asociadoa partıcula libre, donde el paquete inicial tiene forma arbitraria. Aplicando estas ecuaciones al paquete gaussianose tiene que

ψ (x, t) =

√a

(2π)3/4

∫ ∞

−∞e−

a2

4(k−k0)2ei[kx−ω(k)t]dk ; ω (k) =

~k2

2m(2.47)

veremos que el paquete permanece gaussiano para todo tiempo t. Se puede agrupar la parte dependiente de k delos exponentes para formar un cuadrado perfecto, con el fin de comparar (2.47) con (2.42) y obtener

ψ (x, t) =

(2a2

π

)1/4eiϕ

(a4 + 4~2t2

m2

)1/4eik0x exp

[x− ~k0

m t]2

a2 + 2i~tm

ϕ ≡ −θ − ~k20

2mt ; tan 2θ =

2~

ma2t

el modulo al cuadrado del paquete (densidad de probabilidad) en el tiempo t esta dado por

|ψ (x, t)|2 =

√2

πa2

1√1 + 4~2t2

m2a4

exp

2a2(x− ~k0

m t)2

a4 + 4~2t2

m2

(2.48)

debemos ahora calcular ∫ ∞

−∞|ψ (x, t)|2 dx (2.49)

una forma serıa empleando (2.42) para integrar (2.48). No obstante, es mas simple observar de la expresion (2.47)que la transformada de Fourier de ψ (x, t) viene dada por

ψ (k, t) = e−iω(k)tψ (k, 0) (2.50)

se ve entonces que∣∣ψ (k, t)

∣∣ =∣∣ψ (k, 0)

∣∣. Por otro lado, es bien conocido del analisis de Fourier, que∣∣ψ (k, t)

∣∣ =|ψ (x, t)| (ecuacion de Parseval-Plancherel) para todo tiempo, con lo cual se obtiene

|ψ (x, t)| =∣∣ψ (k, t)

∣∣ =∣∣ψ (k, 0)

∣∣ = |ψ (x, 0)|

por tanto, la norma del paquete es independiente del tiempo y por tanto tambien la integral (2.49). Este resultado esimportante para la conservacion de la probabilidad y de hecho para la consistencia de la interpretacion de |ψ (x, t)|2como una densidad de probabilidad. Veremos mas adelante que esto resulta del hecho de que el Hamiltoniano de lapartıcula libre es hermıtico.

Ahora bien, la Ec. (2.48) nos dice que la densidad de probabilidad es gaussiana centrada en

xM = V0t ; V0 ≡ ~k0

m

donde V0 es la velocidad del paquete. Esta expresion es consistente con la velocidad de grupo dada por la Ec. (2.41).

2.13.1. Dispersion del paquete de onda gaussiano (opcional)

Tomando la expresion (2.46) para el ancho ∆x (t) del paquete de onda, y teniendo en cuenta el perfil del paqueteEc. (2.48), tenemos que

∆x (t) =a

2

√1 +

4~2t2

m2a4(2.51)

esta ecuacion nos muestra que la evolucion del paquete no consiste simplemente en una propagacion con velocidadV0. El paquete tambien sufre deformacion. Cuando t se incrementa desde −∞ hasta cero, el ancho del paquete

Page 122: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

122CAPITULO 2. CONSTRUCCION FENOMENOLOGICA DE LOS POSTULADOS DE LA MECANICA CUANTICA

Figura 2.7: Dispersion de un paquete de onda Gaussiano libre. El ancho del paquete se reduce a medida que sepropaga desde t = −∞ hasta t=0. Posteriormente, el paquete comienza a ensancharce indefinidamente a medidaque se propaga.

decrece y alcanza su valor mınimo en t = 0, a partir de entonces el paquete se ensancha indefinidamente (dispersiondel paquete de onda). Esta situacion se ilustra en la Fig. 2.7.

Adicionalmente, la Ec. (2.48) para el perfil del paquete nos muestra que la altura tambien varıa, pero de formaopuesta al ancho, de tal manera que la norma de ψ (x, t) permanece constante.

Es natural ahora preguntarse por el comportamiento de la forma del “paquete de ondas en el espacio de losmomentos (o espacio recıproco)” con el tiempo. Las propiedades de la transformada de Fourier ψ (k, t) son totalmentedistintas, vemos por ejemplo que de acuerdo a la Ec. (2.50) se tiene que

∣∣ψ (k, t)∣∣ =

∣∣ψ (k, 0)∣∣

de modo que el momento promedio del paquete ~k0 y la dispersion del momento ~∆k son constantes en el tiempo.Veremos mas adelante que esto es una consecuencia de que el momento lineal es una constante de movimiento parala partıcula libre. En virtud de la ausencia de interaccion, la distribucion de momentos de una partıcula libre nocambia.

Figura 2.8: Comparacion entre el comportamiento con el tiempo de un ∆x cuantico (hiperbola) y su analogo clasico∆xcl (rectas).

Cuanticamente, la existencia de una dispersion del momento ∆p = ~∆k significa que la velocidad de la partıculasolo se conoce en un intervalo ∆v = ∆p/m = ~/ma. Este hecho posee un interesante analogo clasico: imaginemosun conjunto de partıculas clasicas que en t = 0 estan localizadas en x = 0 y que tienen una dispersion ∆v de susvelocidades. Es claro que en el tiempo t la dispersion de sus posiciones sera

∆xcl = |t|∆v =~ |t|ma

(2.52)

Page 123: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

2.13. EVOLUCION TEMPORAL DE PAQUETES DE ONDA GAUSSIANOS (OPCIONAL) 123

donde estamos asumiendo que se calcula su dispersion tambien para tiempos negativos anteriores a t = 0. Ladispersion decrece linealmente para la evolucion temporal desde un t < 0 y crece linealmente con t a partir det = 0. La Fig. 2.8, muestra una comparacion entre el comportamiento temporal de los anchos clasico ∆xcl ycuantico ∆x dados por las Ecs. (2.51, 2.52). Vemos que cuando |t| → ∞ las dos graficas coinciden, dado que lasrectas correspondientes al ancho clasico son las asıntotas de la hiperbola cuantica. Por tanto, para |t| muy grandepodemos decir que hay un comportamiento cuasi-clasico del ancho cuantico ∆x. Sin embargo, cuando |t| → 0, elcomportamiento cuantico difiere cada vez mas del clasico. Esto se debe a que la partıcula cuantica debe siempresatisfacer el principio de incertidumbre de Heisenberg ∆x ∆p ≥ ~/2 y dado que ∆p es fijo, este impone un lımiteinferior para ∆x que el sistema clasico no tiene que obedecer (efectivamente nuestro sistema clasico no poseıadispersion en t = 0 ya que todas las partıculas estaban en x = 0). No obstante, este analogo clasico debe tomarsecon cuidado. Por ejemplo, en nuestro sistema clasico la dispersion se genero con un conjunto de partıculas, en tantoque la dispersion cuantica esta asociada a un conjunto de ondas asociadas a UNA SOLA partıcula.

Vale la pena anotar que aunque hemos analizado la dispersion de un paquete de ondas libres cuya condicioninicial consta de componentes gaussianas, la dispersion se presenta para un paquete libre bajo cualquier forma inicialdel paquete, y la variacion del ancho del paquete con el tiempo tiene la forma mostrada en la Fig. 2.8.

????????????????????????????????

Page 124: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 3

Ecuacion de Schrodinger y sus propiedades

Hemos estudiado la dualidad onda partıcula partiendo de los postulados de De Broglie y hemos analizado elcomportamiento de la onda asociada a una partıcula libre. Sin embargo, si consideramos un sistema de una o maspartıculas interactuantes sera necesario generar una ecuacion de movimiento que gobierne la dinamica de la ondaasociada. Si bien esta ecuacion de movimiento se postulara, existen ciertos argumentos de plausibilidad para suconstruccion.

3.1. Plausibilidad de la ecuacion de Schrodinger

Si aceptamos la validez de los postulados de De Broglie, debemos encontrar una ecuacion de movimiento quenos describa la propagacion de las ondas piloto y su relacion con la dinamica de la partıcula, para el caso en que lapartıcula interactue con su entorno. Por simplicidad asumiremos un caso unidimensional en esta seccion.

El punto de partida seran entonces las ecuaciones de De Broglie

λ = h/p ; ν = E/h (3.1)

ahora bien, a pesar de que las relaciones de De Broglie son consistentes con la teorıa de la relatividad (de hecho,fueron empleadas primero en los fotones), vamos a plantear una formulacion no relativista, esto con el fin de evitarel problema del manejo de la probabilidad que surge de la posibilidad de creacion y aniquilacion de partıculasmateriales. Tomaremos entonces la relacion no relativista (corpuscular) entre energıa y momento

E =p2

2m+ V (3.2)

siendo m = m0 la masa en reposo de la partıcula. La Ec. (3.1) nos muestra que un cambio en la definicion de energıa(por ejemplo si tomaramos la relacion relativista) nos cambiarıa el valor de ν. Los experimentos descritos hastaahora no han explorado la validez de la relacion (3.2), de modo que las predicciones que la ecuacion dinamica hagasobre una partıcula interactuante deben ser corroboradas por los experimentos.

Es claro que para una partıcula libre, los resultados deben poder obtenerse con cualquier potencial constante (nonecesariamente cero) aplicado a la Ec. (3.2). Es facil verificar que un potencial constante predice que la velocidadde grupo de la onda piloto corresponde a p/m y por tanto a la velocidad de la partıcula, combinando (3.1) con (3.2)se tiene que

ν =E

h=

p2

2mh+V

h; K ≡ 1

λ=p

h

teniendo en cuenta que V es constante, tenemos

dν =2p dp

2mh, dK =

dp

h

Ahora bien, teniendo en cuenta que

k ≡ 2πK ; ω ≡ 2πν

124

Page 125: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.1. PLAUSIBILIDAD DE LA ECUACION DE SCHRODINGER 125

la velocidad de grupo queda

Vg =dω

dk=

dK=p dp

mh

h

dp=

p

m= vpartıcula

y podemos reescribir las relaciones de De Broglie en la forma

p = ~k ; E = ~ω (3.3)

si insertamos estas relaciones en (3.2) obtenenemos la siguiente relacion de Dispersion

~2k2

2m+ V (x, t) = ~ω (3.4)

tomaremos como prototipo la ecuacion para la partıcula libre con potencial constante. Las consideraciones anterioresnos dicen que la ecuacion de movimiento que genere la funcion de onda ψ (x, t) (i.e. la dinamica de las ondas piloto),debe cumplir las siguientes propiedades

1. Debe ser consistente con las Ecs. (3.1, 3.2). Es decir debe cumplir los postulados de De Broglie y la relacionno relativista entre E y p.

2. Debe ser lineal y homogenea en ψ (x, t) con el fin de que sea valido el principio de superposicion que a su veznos genera los fenomenos ondulatorios de interferencia. Esto implica que si ψ1 (x, t) y ψ2 (x, t) son solucionesde la ecuacion una combinacion lineal de ellas tambien es solucion.

3. En general, consideraremos potenciales que solo dependen de la posicion y el tiempo V = V (x, t). Cuando elpotencial es constante la partıcula es libre y por tanto se deben conservar E y p, lo cual a su vez implica quese conservan λ = 2π/k y ν de acuerdo con las relaciones (3.1).

4. Las soluciones para partıcula libre son funcionalmente identicas a las soluciones homogeneas de la ecuacion deonda, pero deben cumplir con una relacion de dispersion que sea consistente con la Ec. (3.4) con V constante,en vez de la relacion de dispersion para ondas libres dada por (2.14), lo cual nos dice que la ecuacion de ondano es la ecuacion dinamica para la funcion de onda ψ (r, t). Entonces la ecuacion de movimiento para partıculalibre debe tener soluciones en forma de ondas viajeras con numero de onda y frecuencia constantes.

La linealidad y homogeneidad prohibe terminos del tipo [ψ (x, t)]2 (no lineales) o terminos independientes deψ (x, t) (terminos inhomogeneos o fuentes). Puesto que la mayorıa de ecuaciones dinamicas de la Fısica son a lo masde segundo orden, postularemos que los terminos lineales son a lo mas de segundo orden en el espacio y el tiempo,y posiblemente un termino lineal en ψ (x, t). Parametrizaremos a la ecuacion en la forma siguiente

a1∂ψ (x, t)

∂x+ a2

∂2ψ (x, t)

∂x2− b1

∂ψ (x, t)

∂t− b2

∂2ψ (x, t)

∂t2+ c ψ (x, t) = 0

asumamos que la solucion de partıcula libre es ψ (x, t) = Aei(kx−ωt), ademas se debe cumplir la relacion de dispersion(3.4) con V constante. Esta relacion de dispersion contiene un termino proporcional a k2 que se obtendrıa de unasegunda derivada espacial de la onda plana, y un termino lineal en ω que se puede extraer de una primera derivadatemporal de la onda plana. La ausencia de un termino lineal en k y de un termino cuadratico en ω sugiere la ausenciade primeras derivadas espaciales y de segundas derivadas temporales. Finalmente, la presencia del potencial en (3.4)sugiere la presencia de un termino lineal en ψ de la forma V ψ. El ansatz para la solucion se reduce a

a2∂2ψ (x, t)

∂x2+ V ψ (x, t) = b1

∂ψ (x, t)

∂t(3.5)

ahora debemos ajustar los parametros a2 y b1 de manera que exista una solucion tipo onda plana que reproduzcala relacion de dispersion (3.4). Recordemos que en mecanica clasica, el caracter complejo de las soluciones de laecuacion de onda se introduce solo por conveniencia y la solucion Fısica es la parte real de la solucion compleja.Por este motivo si bien podemos insertar una solucion tipo onda plana en (3.5), es razonable intentar primero usarla solucion real para la ecuacion de onda clasica como prototipo de solucion, insertaremos entonces una funcion deonda de la forma

ψ (x, t) = cos (kx− ωt) (3.6)

Page 126: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

126 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

teniendo en cuenta que k, ω y V son constantes, se tiene que

∂2ψ (x, t)

∂x2= −k2 cos (kx− ωt) ;

∂ψ

∂t= ω sin (kx− ωt)

y al insertar estos resultados en (3.5) obtenemos

−a2k2 cos (kx− ωt) + V cos (kx− ωt) = b1ω sin (kx− ωt)(

V − a2k2)cos (kx− ωt) = b1ω sin (kx− ωt)

pero no es posible ajustar los parametros para que esta relacion sea valida para todo x, t, de modo que la solucionclasica dada por (3.6) no es compatible con la relacion de dispersion de la teorıa. Aun podemos tratar de encontraruna solucion real si agregamos una fase adicional en la forma cos (kx− ωt+ δ) que es equivalente a escribir unasolucion de la forma

ψ (x, t) = cos (kx− ωt) + γ sin (kx− ωt) (3.7)

lo cual tambien se puede postular observando que en tal caso ambas derivadas tendran senos y cosenos que permitiranigualar coeficientes adecuadamente

∂2ψ (x, t)

∂x2= −k2 cos (kx− ωt) − γk2 sin (kx− ωt)

∂ψ

∂t= ω sin (kx− ωt) − γω cos (kx− ωt)

que al insertarlos en (3.5) nos da

−a2k2 [cos (kx− ωt) + γ sin (kx− ωt)] + V [cos (kx− ωt) + γ sin (kx− ωt)]

= b1ω [sin (kx− ωt) − γ cos (kx− ωt)]

quedando

(−a2k

2 + V + b1ωγ)cos (kx− ωt) +

(−a2k

2γ + V γ − b1ω)sin (kx− ωt) = 0

Los coeficientes de seno y coseno deben anularse para que esta relacion sea valida para todo x, t. Tenemosentonces dos ecuaciones con tres incognitas (a2, b1, γ) que junto con la relacion de dispersion (3.4), nos da

−a2k2 + V + b1ωγ = 0 ; −a2k

2γ + V γ − b1ω = 0 ;~2k2

2m+ V = ~ω (3.8)

las dos primeras ecuaciones se pueden reescribir como

−a2k2 + V = −b1ωγ ; −a2k

2 + V =b1γω ⇒ −b1ωγ =

b1γω

⇒ −γ =1

γ⇒ γ2 = −1

tenemos entoncesγ = ±

√−1 = ±i

sustituyendo en la primera de las Ecs. (3.8)

−a2k2 + V ± iωb1 = 0 ⇒ −a2k

2 + V = ∓iωb1al comparar esta expresion con la tercera de las Ecs. (3.8)

−a2 =~2

2m; ∓ib1 = ~

tenemos entonces dos soluciones que dependen de la eleccion del signo de γ, la eleccion mas usual es

γ = i ; a2 = − ~2

2m; b1 = i~

Page 127: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.2. ECUACION DE SCHRODINGER PARA UNA PARTICULA SOMETIDA A UN POTENCIAL ESCALAR INDEPENDIENTE DEL TIEMPO: ESTADOS ESTACIONARIOS127

que al reemplazarlo en (3.5) nos da

− ~2

2m

∂2ψ

∂x2+ V ψ = i~

∂ψ

∂t

que se ha derivado para un potencial constante V . Ahora postularemos que la relacion se mantiene valida para unpotencial arbitrario de la forma V (x, t). Se obtiene entonces

− ~2

2m

∂2ψ

∂x2+ V (x, t) ψ = i~

∂ψ

∂t(3.9)

expresion conocida como la ecuacion de Schrodinger. Por supuesto podemos postular su extension a tres dimensionescomo

− ~2

2m∇2ψ (r, t) + V (r, t) ψ (r, t) = i~

∂ψ (r, t)

∂t(3.10)

Notese que γ = ±i, lo cual indica que la pretendida solucion real (3.7) nos proporciona inevitablemente unasolucion compleja tipo onda plana. Vemos que hay una diferencia con las soluciones de onda clasica que se tomancomplejas solo por conveniencia, para la ecuacion de Schrodinger en cambio, no pudimos encontrar una solucionreal consistente para partıcula libre, el caracter de la solucion es en esencia complejo. Esto se refleja en el factorimaginario que aparece a la derecha de la ecuacion (3.9) de Schrodinger.

3.2. Ecuacion de Schrodinger para una partıcula sometida a un potencialescalar independiente del tiempo: estados estacionarios

Supongamos que una partıcula de masa m esta sometida a un potencial V (r). La ecuacion de Schrodinger (3.10)se escribe entonces

− ~2

2m∇2ψ (r, t) + V (r) ψ (r, t) = i~

∂ψ (r, t)

∂t(3.11)

plantearemos una separacion de variables para la solucion

ψ (r, t) = χ (t)ϕ (r)

al introducirlo en la Ec. (3.11) se obtiene

− ~2

2mχ (t)∇2ϕ (r) + V (r) χ (t)ϕ (r) = i~ϕ (r)

∂χ (t)

∂t

dividiendo a ambos lados por χ (t)ϕ (r) se escribe

− ~2

2m

∇2ϕ (r)

ϕ (r)+ V (r) = i~

1

χ (t)

∂χ (t)

∂t

el miembro izquierdo solo depende de la posicion en tanto el derecho depende solo del tiempo. Por tanto ambosmiembros deben ser iguales a una constante que por comodidad la tomaremos como ~ω, de momento ω es solo unaconstante a ajustar, aunque es claro que debe tener dimensiones de frecuencia angular. Tenemos entonces que

i~1

χ (t)

∂χ (t)

∂t= ~ω ⇒ ∂χ (t)

∂t= −iωχ (t)

χ (t) = Ae−iωt

y la ecuacion para la parte espacial es

− ~2

2m

∇2ϕ (r)

ϕ (r)+ V (r) = ~ω ⇒

− ~2

2m∇2ϕ (r) + V (r)ϕ (r) = ~ωϕ (r) (3.12)

Page 128: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

128 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

De modo que la solucion para la ecuacion de Schrodinger es

ψ (r, t) = ϕ (r) e−iωt (3.13)

donde hemos absorbido el factor A en la solucion ϕ (r) de la ecuacion (3.12).Notese que la solucion (3.13) nos conduce a una densidad de probabilidad independiente del tiempo, aunque

inhomogenea

|ψ (r, t)|2 = |ϕ (r)|2

razon por la cual se conoce como solucion estacionaria de la ecuacion de Schrodinger. Ahora bien, la Ec. (3.13) nosmuestra que la constante de integracion ω corresponde efectivamente a la frecuencia angular asociada a la funcionde onda estacionaria. Notese que en la solucion estacionaria, solo aparece un valor de frecuencia angular ω que a suvez nos conduce a un valor bien definido de la energıa de acuerdo con la relacion de Planck Einstein E = ~ω. Enmecanica clasica un potencial independiente del tiempo nos lleva a la conservacion de la energıa total. En mecanicacuantica, lo que podemos decir es que para potenciales independientes del tiempo existen estados de energıa biendeterminada. La Ec. (3.12) se puede escribir entonces como

[− ~2

2m∇2 + V (r)

]ϕ (r) = Eϕ (r) (3.14)

que se puede reescribir como

Hϕ (r) = Eϕ (r) ; H ≡ − ~2

2m∇2 + V (r) (3.15)

siendo H un operador diferencial que es claramente lineal

H [λ1ϕ1 (r) + λ2ϕ2 (r)] = λ1Hϕ1 (r) + λ2Hϕ2 (r)

y vemos que (3.15) es una ecuacion de valores propios para el operador H en la cual ϕ (r) son las funciones propias(vectores propios) y las energıas E son los valores propios. Las energıas permitidas para la partıcula son entonceslos valores propios del operador H. Notese que no cualquier solucion ϕ (r) de la ecuacion de Schrodinger es unasolucion fısica, debemos imponer que sea de cuadrado integrable, esta imposicion restringira los valores permitidosde energıa y nos llevara a una cuantizacion de esta cantidad.

A la Ec. (3.15) se le llama usualmente ecuacion de Schrodinger independiente del tiempo, en tanto que a (3.11)se le denomina ecuacion de Schrodinger dependiente del tiempo. La Ec. (3.11) nos da la evolucion de la funcion deonda para un estado arbitrario de la partıcula, en tanto que la Ec. (3.15) solo nos da los estados estacionarios deesta.

Dado que tenemos un conjunto de valores permitidos de la energıa (autoresultados o autovalores), vamos arotular las energıas y las autofunciones de la forma

Hϕn,m (r) = Enϕn,m (r)

donde tanto n como m pueden simbolizar un ındice contınuo o discreto o incluso varios ındices. El ındice m meindica la posibilidad de degeneracion, es decir de varias autofunciones linealmente independientes que pertenecen almismo valor propio En. Los estados estacionarios de la partıcula son de la forma

ψn,m (r, t) = ϕn,m (r) e−iEnt/~

ψn,m (r, t) es una solucion de la ecuacion de Schrodinger Ec. (3.11), y en virtud de la linealidad de esta ecuacion,una superposicion de las soluciones estacionarias es tambien solucion

ψ (r, t) =∑

n

m

cnmϕn,m (r) e−iEnt/~ (3.16)

en realidad es usual que se requiera la superposicion puesto que soluciones arbitrarias no satisfacen en generallas condiciones iniciales y de frontera que pide un problema especıfico. La superposicion garantiza que podemosobtener cualquier estado siempre que las funciones ϕnm (r) sean completas como funciones espaciales (las funciones

Page 129: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.3. PROPIEDADES GENERALES DE LA ECUACION DE SCHRODINGER 129

temporales son ondas planas y por tanto completas), esto requiere a su vez que el operador H tenga el caracter deobservable.

Para t = 0 la Ec. (3.16) nos da

ψ (r, 0) =∑

n

m

cnmϕn,m (r) (3.17)

de modo que si conocemos el estado inicial del sistema (el cual es en principio arbitrario) podemos descomponerloen la base de las autofunciones ϕn,m de H (siempre que H sea un observable). Para obtener la evolucion temporalbasta con multiplicar cada termino en (3.17) por e−iEnt/~, debe aclararse que cada termino corresponde a una fasediferente y por tanto la superposicion ya no corresponde en general a un estado estacionario.

3.3. Propiedades generales de la ecuacion de Schrodinger

Retornaremos ahora a la forma general de la ecuacion de Schrodinger Ec. (3.10)

[− ~2

2m∇2 + V (r, t)

]ψ (r, t) = i~

∂ψ (r, t)

∂t

H (r, t)ψ (r, t) = i~∂ψ (r, t)

∂t(3.18)

en la cual el potencial puede depender del espacio y del tiempo. La primera observacion relevante es que el operadorH es hermıtico. Para ver esto, basta con tener en cuenta que desde el punto de vista de los kets, las funciones deonda son kets escritos en la representacion de coordenadas, y en tal representacion el operador H se puede escribircomo

H =(−i~∇) (−i~∇)

2m+ V (r, t) =

P 2

2m+ V (r, t) (3.19)

siendo P el operador definido por las Ecs. (1.186), que en representacion de la base |r〉 esta dado por la Ec.(1.189). Ya vimos en la seccion 1.43.4 que este operador es Hermıtico, y como V (r, t) es una funcion real, tambienes hermıtica1. En consecuencia H tambien es hermıtico. Notese que esto es indispensable para que el espectro deeste operador (la energıa) sea real (ver teorema 1.62).

Ahora bien, recordemos que a cada funcion de onda en el espacio z le asociamos un ket en el espacio E en laforma ψ (r, t) ↔ |ψ (t)〉 es conveniente escribir la ecuacion de Schrodinger como una ecuacion dinamica de los kets(en lugar de la funcion de onda), debido a que una ecuacion planteada para el vector abstracto se puede tomar demanera muy sencilla en cualquier representacion. Es facil ver que la Ec. de Schrodinger para kets de la forma

i~d

dt|ψ (t)〉 = H (t) |ψ (t)〉 (3.20)

conduce a la Ec. de Schrodinger (3.18) cuando usamos la representacion de la base |r〉, siempre que H (t) sea eloperador (abstracto) que en representacion de la base |r〉 este dado por (3.19). Para verlo aplicamos el bra 〈r| aambos lados de (3.20)

i~ 〈r| ddt

|ψ (t)〉 = 〈r|H (t) |ψ (t)〉

dado que |ψ (t)〉 no depende de r, la derivada total o parcial en el tiempo coinciden para el ket. Adicionalmente,cuando el ket se transforma en funcion de onda la cual es un campo, debe tenerse en cuenta que las coordenadas ren ψ (r, t) son lugares geometricos y no variables dinamicas, por tanto las variables r y t son todas independientes,de modo que2

i~ 〈r| ddt

|ψ (t)〉 = i~ 〈r| ∂∂t

|ψ (t)〉 =∂

∂t〈r |ψ (t)〉

i~ 〈r| ddt

|ψ (t)〉 =∂ψ (r, t)

∂t1Visto de otro modo el potencial es un operador del tipo V (r, t) I, siendo I la identidad. Si V (r, t) es real, este operador es hermıtico.2En una teorıa clasica de campos, las coordenadas generalizadas se convierten en parametros y la nuevas coordenadas generalizadas

son los campos. Tenemos entonces cuatro parametros: 3 posiciones y el tiempo, siendo la posiciones lugares geometricos en la “grilla”del espacio euclidiano. Los cuatro parametros son totalmente independientes unos de otros.

Page 130: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

130 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

y de la condicion establecida para H (t) se tiene que

〈r|H (t) |ψ (t)〉 = H (r, t) 〈r |ψ (t)〉 = H (r, t)ψ (r, t)

con lo cual se reproduce la Ec. de Schrodinger (3.18) en representacion de coordenadas. Veamos las principalespropiedades de la ecuacion de Schrodinger.

3.3.1. Determinismo en las soluciones

Puesto que la ecuacion es de primer orden en el tiempo, dado un estado inicial |ψ (t0)〉 el estado |ψ (t)〉 en untiempo t subsequente esta determinado, esto se debe a que la ecuacion no es invariante ante t→ −t (como si ocurrecon la ecuacion de onda). No hay indeterminacion en la evolucion del estado del sistema. La indeterminacion seproduce es con el proceso de medida de una cantidad Fısica, en cuyo caso el vector de estado sufre un cambioabrupto y parcialmente impredecible (ya que se puede evaluar una probabilidad para cada cambio abrupto posible).Sin embargo, en el tiempo comprendido entre dos medidas, el vector de estado evoluciona en forma perfectamentedeterminista segun la Ec. (3.20).

3.3.2. Principio de superposicion

Puesto que la Ec. (3.20) es lineal y homogenea (por construccion), si |ψ1 (t)〉 y |ψ2 (t)〉 son soluciones, tambienlo sera |ψ (t)〉 = λ1 |ψ1 (t)〉 + λ2 |ψ2 (t)〉. Esto implica que si el estado inicial es de la forma |ψ (t0)〉 = λ1 |ψ1 (t0)〉 +λ2 |ψ2 (t0)〉 entonces el estado en un tiempo t posterior sera |ψ (t)〉 = λ1 |ψ1 (t)〉+λ2 |ψ2 (t)〉 con lo cual tenemos unacorrespondencia lineal entre |ψ (t0)〉 y |ψ (t)〉. Por tanto, hay un operador lineal conocido como operador evoluciontemporal que conecta a estas dos funciones

|ψ (t)〉 = U (t, t0) |ψ (t0)〉 (3.21)

analizaremos este operador mas en detalle en la Sec. 7.1.

3.3.3. Conservacion de la probabilidad

En virtud de la interpretacion de |ψ (r, t)|2 como una densidad de probabilidad es necesario que

〈ψ (t)|ψ (t)〉 = ‖ψ‖2 =

∫|ψ (r, t)|2 d3r = 1

para todo tiempo, i.e. en cualquier instante la partıcula debe encontrarse en algun lugar del espacio (excepto cuandohay procesos de creacion y destruccion de partıculas que no incluımos en el presente formalismo). Esto significa quela norma de un ket |ψ (t)〉 debe ser constante en el tiempo. Es necesario por tanto que la ecuacion de Schrodingermantenga invariante en el tiempo la norma de los vectores, con el fin de dar una interpretacion probabilısticacoherente.

Para mirar la conservacion de la probabilidad debemos evaluar la derivada total de la norma en el tiempo

d

dt〈ψ (t)|ψ (t)〉 =

[d

dt〈ψ (t)|

]|ψ (t)〉 + 〈ψ (t)|

[d

dt|ψ (t)〉

](3.22)

la derivada temporal del ket se obtiene directamente de la ecuacion de Schrodinger Ec. (3.20)

d

dt|ψ (t)〉 =

1

i~H (t) |ψ (t)〉 (3.23)

para obtener la derivada temporal del bra, sacamos el hermıtico conjugado de dicha ecuacion

d

dt〈ψ (t)| = − 1

i~〈ψ (t)|H† (t) = − 1

i~〈ψ (t)|H (t) (3.24)

donde hemos usado la hermiticidad de H. Reemplazando (3.23) y (3.24) en (3.22) se obtiene

d

dt〈ψ (t)|ψ (t)〉 =

[− 1

i~〈ψ (t)|H (t)

]|ψ (t)〉 + 〈ψ (t)|

[1

i~H (t) |ψ (t)〉

]= 0

esto implica entonces que si normalizamos el estado inicial, el estado en cualquier tiempo continuara normalizado.Notese la importancia de la hermiticidad deH para lograr la conservacion de la norma y por tanto, de la probabilidad.

Page 131: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.3. PROPIEDADES GENERALES DE LA ECUACION DE SCHRODINGER 131

3.3.4. La ecuacion de continuidad para la probabilidad

Por simplicidad trabajaremos el caso de una sola partıcula (sin espın). Asumiremos que la funcion de ondaψ (r, t) esta normalizada, en tal caso |ψ (r, t)|2 representa la densidad de probabilidad de que la partıcula este en laposicion r en el tiempo t

dp (r, t) = ρ (r, t) dV = |ψ (r, t)|2 dV (3.25)

tenemos que

PT ≡∫ρ (r, t) dV = 1

para todo tiempo, de modo que PT representa una “carga generalizada” que se conserva. Por supuesto esto nosignifica que la distribucion de esta “carga” (distribucion de probabilidad), permanezca igual en el tiempo para cadapunto r, las variaciones de ρ (r, t) con el tiempo generan una propagacion de la distribucion de carga generalizada(corriente de probabilidad). Recordemos que el volumen no es necesariamente todo el espacio si existen regiones conprobabilidad cero. Lo importante es que no cruce corriente de probabilidad en la superficie que delimita al volumende integracion, ya que si esto ocurre, habra probabilidad diferente de cero en regiones que en tiempos anterioreseran inaccesibles. Esta situacion es analoga al caso en que ρ (r, t) simbolizaba una densidad de carga electrica a lacual le podemos asociar una densidad de corriente J (r, t).

Es bien conocido que la conservacion global de la carga generalizada proviene de una ley de conservacion localque prohibe la creacion espontanea de carga generalizada neta. Esto implica que si tomamos un volumen por cuyasuperficie limitadora cruza corriente de carga generalizada, el flujo neto de carga por la superficie hacia afuera(adentro) debe estar compensado por una disminucion (aumento) en la carga interior al volumen, el enunciadopreciso de esta ley local de conservacion es

∂tρ (r, t) + ∇ · J (r, t) = 0 (3.26)

siendo ρ la densidad de carga generalizada y J la densidad de corriente generalizada, esta expresion es conocidacomo ecuacion de continuidad. Puesto que hemos encontrado la carga conservada (probabilidad total) y definido yala densidad de probabilidad, debemos encontrar una densidad de corriente de probabilidad que nos de una ecuacionde la forma (3.26), en este caso estamos tratando a la probabilidad como un fluıdo o medio contınuo.

Volveremos a la ecuacion de Schrodinger en representacion de coordenadas dado por (3.10)

− ~2

2m∇2ψ (r, t) + V (r, t) ψ (r, t) = i~

∂ψ (r, t)

∂t(3.27)

el potencial V (r, t) debe ser real para que H sea hermıtico (lo cual es esencial para la conservacion de la probabilidadcomo ya vimos). La ecuacion compleja conjugada de la Ec. de Schrodinger es

− ~2

2m∇2ψ∗ (r, t) + V (r, t) ψ∗ (r, t) = −i~∂ψ

∗ (r, t)

∂t(3.28)

multiplicamos (3.27) por ψ∗ (r, t) y (3.28) por −ψ (r, t) y sumamos

− ~2

2mψ∗ (r, t)∇2ψ (r, t) + V (r, t) ψ∗ (r, t)ψ (r, t) = i~ψ∗ (r, t)

∂ψ (r, t)

∂t~2

2mψ (r, t)∇2ψ∗ (r, t) − V (r, t) ψ (r, t)ψ∗ (r, t) = i~ψ (r, t)

∂ψ∗ (r, t)

∂t

quedando

− ~2

2m

[ψ∗∇2ψ − ψ∇2ψ∗] = i~

[ψ∗ ∂ψ

∂t+ ψ

∂ψ∗

∂t

]

− ~

2mi

[ψ∗∇2ψ − ψ∇2ψ∗] =

∂t[ψ∗ψ]

Page 132: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

132 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

sumando y restando un termino a la izquierda

− ~

2mi

[ψ∗∇2ψ + (∇ψ∗) · (∇ψ) − (∇ψ∗) · (∇ψ) − ψ∇2ψ∗] =

∂t[ψ∗ψ]

− ~

2mi∇ · [ψ∗∇ψ − ψ∇ψ∗] =

∂ρ

∂t

quedando finalmente∂ρ

∂t+ ∇ ·

~

2mi[ψ∗∇ψ − ψ∇ψ∗]

= 0 (3.29)

y comparando (3.29) con la ecuacion (3.26) de continuidad se tiene que

J =~

2mi[ψ∗∇ψ − ψ∇ψ∗]

esta ecuacion se puede reescribir definiendo

J =~

m

1

2i[Z − Z∗]

; Z ≡ ψ∗∇ψ

J =1

m

1

2

[~Z

i+

(~Z

i

)∗]=

1

mRe

[~Z

i

]

de modo que

J (r, t) =~

2mi[ψ∗∇ψ − ψ∇ψ∗] =

1

mRe

[ψ∗(

~

i∇ψ)]

(3.30)

hemos probado entonces la conservacion local de la probabilidad y encontramos la forma explıcita de la densidadde corriente, la cual es real como era de esperarse.

Vale la pena calcular la corriente de probabilidad para el caso especial de estados estacionarios de la forma(3.13), en tal caso al reemplazar (3.13) en (3.30) resulta

J =~

2mi[ψ∗∇ψ − ψ∇ψ∗] =

~

2mi

[ϕ (r) e−iωt

]∗ ∇[ϕ (r) e−iωt

]−[ϕ (r) e−iωt

]∇[ϕ (r) e−iωt

]∗

J =~

2mi

ϕ∗ (r) eiωte−iωt∇ϕ (r) − ϕ (r) e−iωteiωt∇ϕ∗ (r)

quedando finalmente

J (r) =~

2miϕ∗ (r)∇ϕ (r) − ϕ (r)∇ϕ∗ (r) estados estacionarios (3.31)

comparando, (3.30) con (3.31), vemos que para estados estacionarios, la corriente se puede calcular reemplazandoψ (r, t) por ϕ (r), es decir omitiendo la componente temporal de ψ. Efectivamente, (3.31) corresponde a una corrienteestacionaria tal como se usa en mecanica clasica, i.e. una corriente que depende de la posicion pero que no dependeexplıcitamente del tiempo.

3.3.5. Expresion polar de la corriente de probabilidad

Consideremos una funcion de onda arbitraria ψ (r), utilizando su descomposicion compleja polar tenemos

ψ (r) = α (r) eiξ(r) ; α (r) ≥ 0 , 0 ≤ ξ (r) < 2π

si sustituımos esta expresion polar en la Ec. (3.30) para la densidad de corriente de probabilidad encontramos que3

J (r) =~

2mi

α (r) e−iξ(r)∇

[α (r) eiξ(r)

]− α (r) eiξ(r)∇

[α (r) e−iξ(r)

]

=~

2mi

α (r) e−iξ(r)eiξ(r) [∇α (r) + i∇ξ (r)] − α (r) eiξ(r)e−iξ(r) [∇α (r) − i∇ξ (r)]

J (r) =~

mα (r) ∇ξ (r) (3.32)

3Por simplicidad hemos omitido la posible dependencia explıcita del tiempo pero esto no altera los resultados.

Page 133: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.4. APLICACION DE LA ECUACION DE SCHRODINGER A POTENCIALES DISCONTINUOS 133

y la densidad de probabilidad esta dada por

ρ (r) = |ψ (r)|2 = α2 (r) (3.33)

vemos que ρ (r) solo depende del modulo del complejo ψ (r), en tanto que J (r) depende del modulo y del gradientede la fase. Por ejemplo, si la fase es constante en el espacio, J (r) es cero, aunque la densidad no lo sea. Las Ecs.(3.32, 3.33) nos dan a J (r) y ρ (r) cuando conocemos ψ (r), vale preguntarse si inversamente podemos determinarunıvocamente a ψ (r) con base en el conocimiento de J (r) y ρ (r). La Ec. (3.33) nos da a ρ (r) en funcion del modulode ψ (r). Por otro lado, dividiendo las Ecs. (3.32, 3.33) resulta

∇ξ (r) =m

~

J (r)

ρ (r)

esta ecuacion solo tiene solucion si

∇× J (r)

ρ (r)= 0 (3.34)

que tiene un conjunto infinito de soluciones que solo diferen en una constante (o en una funcion solo del tiempo),que corresponderıa a una fase global irrelevante en ψ (r). Por tanto, si conocemos a ρ (r) y J (r) entonces ψ (r)esta bien especificada siempre y cuando se satisfaga la condicion (3.34). Si dicha condicion no se satisface, no existeuna funcion de onda asociada a ρ (r) y J (r).

3.4. Aplicacion de la ecuacion de Schrodinger a potenciales discontınuos

Hemos visto que los efectos cuanticos no son evidentes cuando se considera a h como muy pequena. En particular,si la longitud de onda λ = h/p asociada a la partıcula es mucho menor que todas las demas longitudes involucradasen el problema, la naturaleza ondulatoria de la materia quedara apantallada y el comportamiento de la partıculasera esencialmente clasico. Esto es analogo a lo que ocurre entre la optica geometrica y la optica ondulatoria. Cuandola longitud de la onda es mucho menor que las demas longitudes involucradas en el problema, la optica geometricanos predice muy bien los fenomenos opticos, el comportamiento de los rayos es esencialmente corpuscular. Cuandoesto no se cumple, los aspectos ondulatorios de la luz se vuelven importantes para una adecuada descripcion de losfenomenos.

De la misma forma, cuando un potencial actua sobre una partıcula, los efectos cuanticos debidos a esta interaccionsolo seran significativos si el potencial varıa significativamente sobre una distancia menor a la longitud de onda deDeBroglie asociada a la partıcula. Es por esta razon que estudiaremos potenciales discontınuos en donde la variacionsera finita para una distancia basicamente cero (es decir menor que cualquier longitud de onda). Es claro que estoconstituye una idealizacion ya que los potenciales fısicos deben ser contınuos si bien pueden exhibir una enormependiente. Este lımite solo correspondera aproximadamente a la realidad si la distancia δx en que ocurre estafuerte variacion, es mucho menor que la longitud de onda de De Broglie asociada a la partıcula y mucho menorque cualquier otra longitud tıpica del problema. Estos potenciales se podran definir adecuadamente a traves de lafuncion paso definida por

θ (x− x0) =

0 si x < x0

1 si x > x0

3.5. Potenciales rectangulares, analogo optico

Definamos un potencial de la forma

V (x) =

V0 si −∞ < x < x0

V1 si x0 < x < x1

V2 si x1 < x <∞; V1 < V2 < V0 (3.35)

la fuerza F (x) = −dV (x) /dx serıa del tipo

F (x) = F0δ (x− x0) − F1δ (x− x1)

Page 134: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

134 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

En primer lugar las predicciones de la mecanica clasica son inmediatas, por ejemplo si V (x) es una energıapotencial gravitacional, el perfil del potencial representa el perfil de la superficie sobre la cual se mueve la partıcula,los valores de x para los cuales E < V estaran prohibidos. En las regiones de potencial constante la velocidad de lapartıcula es constante ya que es libre, solo en las discontinuidades experimenta una fuerza y si pasa a la otra region(si E > V ) su energıa cinetica se vera aumentada (disminuıda) si pasa a una zona de menor (mayor) potencial.

Como el potencial no depende del tiempo podemos encontrar soluciones estacionarias para la ecuacion deSchrodinger. En la region de potencial constante V , la ecuacion de Schrodinger independiente del tiempo nosda

[− ~2

2m

d2

dx2+ V

]ϕ (x) = Eϕ (x)

[d2

dx2+

2m

~2(E − V )

]ϕ (x) = 0 (3.36)

escrita en esta forma la ecuacion tiene un interesante analogo optico. Consideremos un medio transparente de ındicede refraccion n independiente de la posicion y el tiempo. En tal medio puede haber ondas electromagneticas concampo electrico independiente de y y z

E (r, t) = uE (x) e−iΩt (3.37)

siendo u un vector unitario perpendicular al eje x, teniendo en cuenta que E satisface la ecuacion de onda y lasecuaciones de Maxwell, resulta [

d2

dx2+n2Ω2

c2

]E (x) = 0 (3.38)

las Ecs. (3.36) y (3.38) son identicas si hacemos la asignacion

2m

~2(E − V ) =

n2Ω2

c2(3.39)

adicionalmente, en los lugares en donde V (y por tanto n) son discontınuos las condiciones de frontera para ϕ (x) yE (x) son las mismas: las soluciones y sus primeras derivadas deben permanecer contınuas (lo veremos mas adelantepara las ϕ (x)). Esta analogıa permite asociar al problema de una partıcula en un potencial del tipo (3.35) unproblema optico asociado a la propagacion de una onda electromagnetica de frecuencia angular Ω en un medio cuyoındice de refraccion n tiene discontinuidades del mismo tipo. En la Ec. (3.39) podemos despejar para n (Ω) y obtener

n (Ω) =1

√2mc2 (E − V ) (3.40)

notese que para la onda electromagnetica, la region con E > V corresponde a un medio transparente con ındice derefraccion real y la onda es de la forma eikx. Por otro lado, cuando E < V corresponde a un medio con un ındice derefraccion imaginario de modo que n2 < 0 y al reemplazar esto en (3.38) se obtiene una solucion de la forma e−ρx

que es del tipo de onda evanescente.Debe tenerse en cuenta que si bien obtendremos un comportamiento funcional analogo al optico, la interpretacion

probabilıstica es muy diferente a la interpretacion clasica para onda electromagnetica.

3.5.1. Estrategia de solucion para potenciales acotados con discontinuidades de salto

Veamos ahora la estrategia especıfica de solucion para los estados estacionarios de la partıcula sometidas apotenciales discontınuos. En las regiones de energıa potencial constante usamos la Ec. (3.36)

[d2

dx2+

2m

~2(E − V )

]ϕ (x) = 0 (3.41)

es util distinguir tres casos(a) E > V , introduzcamos por conveniencia una constante positiva k definida por

E − V ≡ ~2k2

2m(3.42)

Page 135: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.5. POTENCIALES RECTANGULARES, ANALOGO OPTICO 135

al reemplazar en (3.41) queda [d2

dx2+ k2

]ϕ (x) = 0 (3.43)

que es la ecuacion de un oscilador armonico y la solucion de la Ec. (3.43) se puede escribir como

ϕ (x) = Aeikx +A′e−ikx (3.44)

donde A y A′ son complejos constantes.

(b) E < V , esta condicion corresponde a regiones del espacio que estan clasicamente prohibidas. En este casointroducimos la constante positiva ρ dada por

V −E ≡ ~2ρ2

2m(3.45)

y la Ec. (3.41) queda [d2

dx2− ρ2

]ϕ (x) = 0 (3.46)

con solucion

ϕ (x) = Beρx +B′e−ρx (3.47)

siendo B y B ′ constantes complejas.

(c) E = V , en este caso

d2ϕ (x)

dx2= 0 ⇒ ϕ (x) = Cx+ C ′

Ahora veamos el comportamiento de las soluciones en la discontinuidad. La primera tentacion es pensar que lafuncion de onda debe ser discontınua en un punto donde el potencial lo sea, veremos sin embargo que tanto ϕ (x)como dϕ (x) /dx deben ser contınuas y solo es la segunda derivada d2ϕ (x) /dx2 la que es discontınua en el punto.Para ver esto, recordemos que un potencial con una discontinuidad de salto en x1 representa en fısica el lımitecuando ε→ 0 de un potencial Vε (x) que es igual a V (x) fuera del intervalo [x1 − ε, x1 + ε], pero que varıa de formacontınua en dicho intervalo. Consideremos la ecuacion

d2

dx2ϕε (x) +

2m

~2[E − Vε (x)]ϕε (x) = 0 (3.48)

asumimos que Vε (x) esta acotado en el intervalo [x1 − ε, x1 + ε], y que esta cota no depende del parametro ε. Estose cumple en la mayorıa de los casos, ya que usualmente Vε estara definido dentro de los valores [V0, V1] que se tienenen la discontinuidad de salto a la izquierda y la derecha de x1. Escogemos una solucion ϕε (x) que para x < x1 − εy para x > x1 + ε coincida con una solucion dada de la Ec. (3.41). La idea es demostrar que cuando ε→ 0 entoncesϕε (x) tiende a una funcion ϕ (x) contınua y diferenciable a primer orden en x1. Es posible probar a traves de laspropiedades de la ecuacion diferencial (3.41) que ϕε (x) permanece acotada para cualquier valor de ε con una cotaindependiente de ε, en la vecindad de x = x1. Esto fısicamente implica que la densidad de probabilidad permanecefinita. Integrando la Ec. (3.48) en el intervalo [x1 − η, x1 + η] resulta

∫ x1+η

x1−η

d

dx

[d

dxϕε (x)

]dx+

2m

~2

∫ x1+η

x1−η[E − Vε (x)]ϕε (x) dx = 0

dϕε (x1 + η)

dx− dϕε (x1 − η)

dx=

2m

~2

∫ x1+η

x1−η[Vε (x) −E]ϕε (x) dx (3.49)

y dado que Vε (x) y ϕε (x) permanecen acotados con cotas independientes de ε, la integral a la derecha de la Ec.(3.49) tiende a cero cuando η tiende a cero. Por lo tanto

lımη→0

[dϕε (x1 + η)

dx− dϕε (x1 − η)

dx

]= 0

Page 136: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

136 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

por tanto, en este lımite, dϕ/dx es contınua en x = x1 y por tanto tambien ϕ (x) ya que es la integral de una funcioncontınua. Por otro lado, d2ϕ/dx2 es discontınua en x = x1 puesto que en la Ec. (3.41) vemos que

lımη→0+

d2ϕ (x1 + η)

dx2+

2m

~2[E − V (x1 + η)]ϕ (x1 + η)

= 0

lımη→0+

[d2ϕ (x1 + η)

dx2

]= lım

η→0+

2m

~2[V (x1 + η) −E]ϕ (x1 + η)

lımη→0+

[d2ϕ (x1 + η)

dx2

]=

2m

~2[V1 −E]ϕ (x1)

siendo V1 el valor del potencial a la derecha de x1, similarmente

lımη→0−

[d2ϕ (x1 + η)

dx2

]=

2m

~2[V0 −E]ϕ (x1)

siendo V0 el valor del potencial a la izquierda de x1. Tenemos entonces que en x1 la segunda derivada presenta unsalto dado por

lımη→0+

[d2ϕ (x1 + η)

dx2

]− lımη→0−

[d2ϕ (x1 + η)

dx2

]=

2m

~2(V1 − V0)ϕ (x1)

esto es una discontinuidad de salto para la segunda derivada ya que V1 6= V0. Notese sin embargo, que la segundaderivada permanece acotada. Es importante resaltar la importancia de que Vε (x) permanezca acotado. Por ejemplo,si V (x) = aδ (x) tenemos una funcion cuya integral permanece finita pero que no es acotada. En tal caso, ϕ (x)permanece contınua pero no la primera derivada.

Por tanto, para encontrar la solucion de los estados estacionarios cuando el potencial es contınuo a trozos condiscontinuidades de salto finito, calculamos primero las soluciones para las regiones en donde el potencial es constante(con E > V o E < V segun el caso), y hacemos el “empalme” en los puntos donde hay discontinuidades exigiendola continuidad de la solucion y de su primera derivada.

3.5.2. Expresion para la corriente en regiones de potencial constante

Por simplicidad consideraremos un problema unidimensional de una partıcula colocada en un potencial constanteV0. Aunque este caso corresponde a partıcula libre, resulta interesante obtener la corriente en terminos de V0 ya quedespues consideraremos la posibilidad de regiones con potencial constante pero diferente en cada region. Como lacorriente (3.31) depende de la solucion para la funcion de onda estacionaria debemos considerar varios casos segunla seccion 3.5.1

(a) E > V0, en tal caso la solucion estacionaria viene dada por la Ec. (3.44)

ϕ (x) = Aeikx +A′e−ikx (3.50)

donde hemos usado la definicion (3.42)

E − V0 ≡ ~2k2

2m

y sustituyendo (3.50) en la expresion (3.31) para la corriente

Page 137: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.6. EL POTENCIAL ESCALON 137

Jx =~

2mi[ϕ∗∂xϕ− ϕ∂xϕ

∗]

Jx =~

2mi

[(A∗e−ikx +A′∗eikx

)∂x

(Aeikx +A′e−ikx

)−(Aeikx +A′e−ikx

)∂x

(A∗e−ikx +A′∗eikx

)]

Jx =~

2mi

[(A∗e−ikx +A′∗eikx

)(ikAeikx − ikA′e−ikx

)−(Aeikx +A′e−ikx

)(−ikA∗e−ikx + ikA′∗eikx

)]

Jx =~k

2m

[(A∗e−ikx +A′∗eikx

)Aeikx −

(A∗e−ikx +A′∗eikx

)A′e−ikx

+(Aeikx +A′e−ikx

)A∗e−ikx −

(Aeikx +A′e−ikx

)A′∗eikx

]

Jx =~k

2m

[A∗A+A′∗Ae2ikx −A∗A′e−2ikx −A′∗A′ +AA∗ +A′A∗e−2ikx −AA′∗e2ikx −A′A′∗

]

Jx =~k

2m

[2 |A|2 +A′∗Ae2ikx −AA′∗e2ikx −A∗A′e−2ikx +A′A∗e−2ikx − 2

∣∣A′∣∣2]

Jx =~k

m

[|A|2 −

∣∣A′∣∣2]

(3.51)

el signo relativo se puede entender teniendo en cuenta que la funcion de onda (3.50) representa dos ondas conmomentos opuestos p = ±~k con densidades de probabilidad |A|2 y |A′|2, ademas ~k

m = pm = vg nos dice que Jx es

de la forma ρvg como era de esperarse.(b) Cuando E < V0 la solucion esta dada por las Ecs. (3.45, 3.47)

ϕ (x) = Beρx +B′e−ρx (3.52)

V0 −E ≡ ~2ρ2

2m(3.53)

sustituyendo (3.52) en (3.31) nos da

Jx =~

2mi[ϕ∗∂xϕ− ϕ∂xϕ

∗]

Jx =~

2mi

[(B∗eρx +B′∗e−ρx

)∂x(Beρx +B′e−ρx

)−(Beρx +B′e−ρx

)∂x(B∗eρx +B′∗e−ρx

)]

Jx =~

2mi

[(B∗eρx +B′∗e−ρx

) (ρBeρx − ρB′e−ρx

)−(Beρx +B′e−ρx

) (ρB∗eρx − ρB′∗e−ρx

)]

Jx =~ρ

2mi

[(B∗eρx +B′∗e−ρx

)Beρx −

(B∗eρx +B′∗e−ρx

)B′e−ρx

−(Beρx +B′e−ρx

)B∗eρx +

(Beρx +B′e−ρx

)B′∗e−ρx

]

Jx =~ρ

2mi

[B∗Be2ρx +B′∗B −B∗B′ −B′∗B′e−2ρx −BB∗e2ρx −B′B∗ +BB′∗ +B′B′∗e−2ρx

]

Jx =~ρ

2mi

[B∗Be2ρx −BB∗e2ρx + 2B′∗B − 2B∗B′ −B′∗B′e−2ρx +B′B′∗e−2ρx

]

Jx =~ρ

2mi

[2B′∗B − 2B∗B′]

Jx =~ρ

2mi

[BB′∗ −B∗B′] =

mIm[BB′∗] (3.54)

vemos que es necesario que en la funcion de onda (3.52) ambos coeficientes sean no nulos para que la corriente deprobabilidad sea diferente de cero.

3.6. El potencial escalon

Definamos un potencial en la forma

V (x) = V0θ (x) =

0 si x < 0 (Region I)V0 si x > 0 (Region II)

Page 138: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

138 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

Figura 3.1: Perfil de un potencial escalon con discontinuidad en x = 0 y altura V0.

cuyo perfil se ilustra en la Fig. 3.1. Asumiremos que la partıcula viene desde x = −∞ en t = −∞ de modo queinicialmente solo hay una onda viajera que se propaga hacia la derecha. Distinguiremos dos casos

3.6.1. E > V0, reflexion parcial

Como la energıa es mayor que el potencial en ambas regiones, la Ec. (3.43) y la definicion (3.42) son validaspara las dos regiones I y II

[d2

dx2+ k2

1

]ϕ (x) = 0 ; k1 ≡

√2mE

~2(region I) (3.55)

[d2

dx2+ k2

2

]ϕ (x) = 0 ; k2 ≡

√2m (E − V0)

~2(region II) (3.56)

ası mismo las soluciones en las dos regiones son de la forma (3.44)

ϕI (x) = A1eik1x +A′

1e−ik1x ; ϕII (x) = A2e

ik2x +A′2e

−ik2x (3.57)

dϕI (x)

dx= ik1

(A1e

ik1x −A′1e

−ik1x)

;dϕII (x)

dx= ik2

(A2e

ik2x −A′2e

−ik2x)

(3.58)

y puesto que la ecuacion (3.41) es homogenea, si ϕ es solucion tambien lo sera ϕ/A, siendo A una constante. Estoimplica que solo podemos determinar los cocientes entre las amplitudes pero no todas las amplitudes. Ahora bien,puesto que la amplitud de entrada es la de la onda incidente, es decir la de la onda que viaja hacia la derechaen la region I, tenemos que A1 es el parametro de entrada y todos los demas deben compararse con el. Por tantodeterminaremos los cocientes

A′1

A1,A2

A1,A′

2

A1.

Veamos la informacion que nos dan las condiciones de empalme, la continuidad de la funcion en x = 0 nos da

lımx→0−

ϕ (x) = lımx→0+

ϕ (x) ⇒ ϕI (x = 0) = ϕII (x = 0)

A1 +A′1 = A2 +A′

2 (3.59)

y la continuidad de la primera derivada en x = 0 nos da

lımx→0−

dϕ (x)

dx= lım

x→0+

dϕ (x)

dx⇒ dϕI (x = 0)

dx=dϕII (x = 0)

dx

k1

(A1 −A′

1

)= k2

(A2 −A′

2

)(3.60)

Page 139: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.6. EL POTENCIAL ESCALON 139

como solo tenemos dos ecuaciones (3.59) y (3.60) para los tres cocientes, debemos fijar una amplitud para poderdeterminar los cocientes. Para ello tengamos en cuenta que cuando la funcion de onda penetra la region II vuelvea ser una funcion de onda libre (potencial constante) y ya hemos visto que la funcion de onda libre es una ondaviajera en una sola direccion, de modo que no es de esperarse que surja una onda reflejada en el interior de la regionII (solo en el lımite entre I y II donde sı hay interaccion). En consecuencia, no habra onda reflejada en la region II,por lo cual segun la Ec. (3.57) vemos que

A′2 = 0 (3.61)

notese que esto esta relacionado con el hecho de que hayamos tomado el caso de una partıcula incidente que provienede x = −∞ (condiciones iniciales)4. Las Ecs. (3.59, 3.60) se simplifican a

A1 +A′1 = A2 ; k1

(A1 −A′

1

)= k2A2 (3.62)

A1 +A′1

A1=

A2

A1;k1 (A1 −A′

1)

A1= k2

A2

A1

1 +A′

1

A1=

A2

A1;k1

k2

(1 − A′

1

A1

)=A2

A1(3.63)

igualando las dos Ecs. (3.63)

1 +A′

1

A1=

k1

k2

(1 − A′

1

A1

)⇒ 1 − k1

k2= −

(1 +

k1

k2

)A′

1

A1⇒ k2 − k1

k2= −

(k2 + k1

k2

)A′

1

A1

A′1

A1=

k1 − k2

k1 + k2

y reemplazando en la primera de las Ecs. (3.63)

1 +k1 − k2

k1 + k2=A2

A1⇒ 2k1

k1 + k2=A2

A1

tenemos entonces que las condiciones iniciales y de empalme nos llevan a

A′2 = 0 ;

A′1

A1=k1 − k2

k1 + k2> 0 ;

A2

A1=

2k1

k1 + k2> 0 (3.64)

donde el hecho de que el primer cociente es positivo proviene de las expresiones para k1 y k2 Ecs. (3.55, 3.56).Ahora bien, para E > V0, la funcion ϕI (x) en la Ec. (3.57) representa dos ondas con momentos opuestos, es decirpropagandose en direcciones opuestas. La onda proporcional a A1 se propaga de izquierda a derecha de modo querepresenta una partıcula incidente (p = ~k1), la onda proporcional a A′

1 tiene momento p = −~k1 por lo cualrepresenta una partıcula reflejada. Puesto que A′

2 = 0 tenemos que ϕII (x) en la Ec. (3.57) representa solo unaonda que corresponde a una partıcula transmitida. Es natural entonces preguntarse por la probabilidad de que unapartıcula que incide desde x = −∞ pase el escalon de potencial o rebote en el. A tales cantidades las llamaremoscoeficientes de transmision T y de reflexion R respectivamente. Para calcular estas cantidades debemos calcularprimero la corriente asociada a cada region de potencial constante. Para el caso E > V0 esta corriente viene dadapor las Ecs. (3.50, 3.51), que aplicadas a las soluciones (3.57) y con la condicion A ′

2 = 0 Ec. (3.61) nos da

JI (x) =~k1

m

[|A1|2 −

∣∣A′1

∣∣2]

(3.65)

JII (x) =~k2

m|A2|2 (3.66)

JI es la superposicion entre la corriente incidente y la corriente reflejada, en tanto que JII es la corriente transmitida,por lo tanto

JI (x) = Jinc + Jrefl ; Jinc =~k1

m|A1|2 ; Jrefl = −~k1

m

∣∣A′1

∣∣2

JII (x) = Jtr =~k2

m|A2|2

4Si la partıcula proviniera de x = +∞ y viajara hacia la izquierda, esperarıamos onda incidente y reflejada en la region II y solo ondatransmitida en la region I.

Page 140: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

140 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

Ahora bien, la corriente incidente Jinc se divide en dos terminos cuando incide sobre la discontinuidad: la corrientereflejada y la transmitida

Jinc = Jtr + Jrefl

El coeficiente de reflexion del escalon es entonces el cociente entre la corriente reflejada sobre la corriente incidente

R =

∣∣∣∣JreflJinc

∣∣∣∣ =

∣∣∣∣A′

1

A1

∣∣∣∣2

(3.67)

y el coeficiente de transmision es el cociente entre la corriente transmitida sobre la corriente incidente

T =

∣∣∣∣JtrJinc

∣∣∣∣ =k2

k1

∣∣∣∣A2

A1

∣∣∣∣2

(3.68)

podemos escribir R y T en terminos de k1 y k2. Para hacerlo con R reemplazamos (3.64) en (3.67)

R =

∣∣∣∣A′

1

A1

∣∣∣∣2

=

∣∣∣∣k1 − k2

k1 + k2

∣∣∣∣2

=(k1 − k2)

2

(k1 + k2)2 =

(k1 + k2)2 − 4k1k2

(k1 + k2)2

R = 1 − 4k1k2

(k1 + k2)2

para el caso de T , reemplazamos (3.64) en (3.68)

T =k2

k1

∣∣∣∣A2

A1

∣∣∣∣2

=k2

k1

∣∣∣∣2k1

k1 + k2

∣∣∣∣2

=k2

k1

4k21

(k1 + k2)2 =

4k1k2

(k1 + k2)2

los coeficientes R y T quedan finalmente

R = 1 − 4k1k2

(k1 + k2)2 , T =

4k1k2

(k1 + k2)2 (3.69)

ahora bien, en un experimento concreto es claro que la partıcula debe reflejarse o transmitirse, y esto se traduce enque necesariamente

R+ T = 1

lo cual es consistente con las Ecs. (3.69). Es de enfatizar que contrario a las predicciones de la mecanica clasica,tenemos una probabilidad diferente de cero de que la partıcula se devuelva.

Ahora estamos preparados para la analogıa optica: De las Ecs. (3.40) vemos que un escalon de potencial conV = 0 para x < x1 (region I) y V = V0 < E para x > x1 (region II), corresponde a una onda electromagnetica quese propaga de izquierda a derecha desde una region I de ındice real n1 dado por

n1 =c

√2mE

hacia una region II (separada de la region I por el punto x = x1) de ındice de refraccion real n2

n2 =c

√2m (E − V0)

de modo que tenemos una interfase plana en x = x1 con n1 > n2 (la region I podrıa ser vidrio y la region II podriaser aire o el vacıo). Ambos medios son transparentes. En este caso la onda incidente (con direccion de propagacionnormal a la interfase) se parte en una onda transmitida (o refractada) y una onda reflejada. Ahora bien, las Ecs.(3.64) muestran que los cocientes A′

1/A1 y A2/A1 son reales positivos, i.e. A′1 y A2 tienen la misma fase que A1

5.Fısicamente, esto significa que no hay corrimiento de fase en la onda reflejada ni en la transmitida, con respecto ala onda incidente. Por tanto, la partıcula cuantica no es retardada por su reflexion o transmision.

5Para el cociente de dos amplitudes complejas podemos escribir tales cocientes en forma polar i.e A1/A2 =(|A1| eiδ1

)/ |A2| eiδ2 . De

modo que si el cociente es positivo entonces δ1 = δ2, si el cociente es negativo hay una diferencia de fase π y si el cociente es complejohay una diferencia de fase arbitraria diferente a cero y π.

Page 141: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.6. EL POTENCIAL ESCALON 141

Es interesante ver lo que ocurre en el lımite cuando E >> V0. De las definiciones de k1 y k2 en las Ecs. (3.55,3.56), junto con las Ecs. (3.69) es facil ver que

T =4k1k2

(k1 + k2)2 =

4(√

2mE~2

)(√2m(E−V0)

~2

)

(√2mE

~2 +√

2m(E−V0)~2

)2 =8m(√

E)(√

(E − V0))

(√2mE +

√2m (E − V0)

)2

T =8m[√

E (E − V0)]

[√2m(√

E +√E − V0

)]2 =4[√

E (E − V0)]

[(√E +

√E − V0

)]2 =

4[√

E(E−V0)]

E

[(√E+

√E−V0)]

2

E

T =

4

[√1 − V0

E

]

[(√E+

√E−V0)√E

]2 =

4

[√1 − V0

E

]

[1 +

√1 − V0

E

]2 ≈ 4

[1 + 1]2= 1

por tanto si E >> V0 entonces R ∼= 0 y T ∼= 1, de modo que para energıas suficientemente grandes comparadas conla altura del potencial, la partıcula saltara el escalon practicamente con toda certeza.

La diferencia en la interpretacion en optica y en cuantica se puede apreciar con el proceso de medicion. Si justodespues de que la onda incidente se parte en dos, colocamos dos detectores en la regiones I y II, en un experimentooptico los dos aparatos detectaran una onda cada una con intensidad menor a la incidente (siendo la suma de lasdos intensidades la intensidad incidente). En un experimento cuantico solo uno de los detectores detectara unapartıcula, pero si repetimos el experimento muchas veces, la partıcula sera detectada en uno u otro detector en cadaexperimento, en una proporcion dada por el patron de probabilidad.

3.6.2. E < V0; reflexion total

Asumiendo E ≥ 0 se tiene que en la region I son validas la Ec. (3.43) y la definicion (3.42), en tanto que en laregion II son validas la Ec. (3.46) y la definicion (3.45)

[d2

dx2+ k2

1

]ϕ (x) = 0 ; k1 ≡

√2mE

~2(region I) (3.70)

[d2

dx2− ρ2

2

]ϕ (x) = 0 ; ρ2 ≡

√2m (V0 −E)

~2(region II) (3.71)

De modo que la solucion en la region I es del tipo armonico Ec. (3.44) y en la region II es del tipo exponencialEc. (3.47)

ϕI = A1eik1x +A′

1e−ik1x ; ϕII (x) = B2e

ρ2x +B′2e

−ρ2x (3.72)

dϕIdx

= ik1

(A1e

ik1x −A′1e

−ik1x)

;dϕIIdx

= ρ2

(B2e

ρ2x −B′2e

−ρ2x) (3.73)

para que la solucion se mantenga acotada cuando x→ +∞ es necesario que6

B2 = 0 (3.74)

y las condiciones de empalme nos dan

lımx→0−

ϕ (x) = lımx→0+

ϕ (x) ; lımx→0−

dϕ (x)

dx= lım

x→0+

dϕ (x)

dx⇒

ϕI (x = 0) = ϕII (x = 0) ;dϕIdx

(x = 0) =dϕIIdx

(x = 0) (3.75)

6En x→ −∞ la solucion es oscilante ya que estamos en la region I. Por lo tanto, no hay problemas de divergencia.

Page 142: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

142 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

y reemplazando (3.74, 3.75) en (3.72, 3.73) resulta

A1 +A′1 = B′

2 ; ik1

(A1 −A′

1

)= −ρ2B

′2 (3.76)

Debido a la nulidad de B2, podremos encontrar todos los cocientes de la forma A′1/A1 y B′

2/A1 sin ninguna suposicionadicional. Dividiendo las Ecs. (3.76) por A1 queda

1 +A′

1

A1=

B′2

A1; ik1

(1 − A′

1

A1

)= −ρ2

B′2

A1

1 +A′

1

A1=

B′2

A1; − ik1

ρ2

(1 − A′

1

A1

)=B′

2

A1(3.77)

igualando estas ecuaciones

1 +A′

1

A1= − ik1

ρ2

(1 − A′

1

A1

)⇒ A′

1

A1− ik1

ρ2

A′1

A1= − ik1

ρ2− 1

(1 − ik1

ρ2

)A′

1

A1= −

(ik1

ρ2+ 1

)⇒ (ρ2 − ik1)

A′1

A1= −ik1 − ρ2

(iρ2 + k1)A′

1

A1= k1 − iρ2 ;

A′1

A1=k1 − iρ2

k1 + iρ2

y reemplazando este cociente en la primera de las Ecs. (3.77)

1 +k1 − iρ2

k1 + iρ2=B′

2

A1⇒ B′

2

A1=

2k1

k1 + iρ2

tenemos que los cocientes estan dados por

A′1

A1=k1 − iρ2

k1 + iρ2;B′

2

A1=

2k1

k1 + iρ2(3.78)

Las expresiones finales para ϕI (x) y ϕII (x) estan dadas por las Ecs. (3.72, 3.73, 3.74)

ϕI = A1eik1x +A′

1e−ik1x ; ϕII (x) = B′

2e−ρ2x (3.79)

dϕIdx

= ik1

(A1e

ik1x −A′1e

−ik1x)

;dϕII (x)

dx= −ρ2B

′2e

−ρ2x (3.80)

reemplazando la primera de las Ecs. (3.79) en (3.51)

JI =~k

m

[|A1|2 −

∣∣A′1

∣∣2]

Por otro lado, usando la segunda de las Ecs. (3.79) en la Ec. (3.54) y teniendo en cuenta que en la Ec. (3.54)los dos coeficientes deben ser no nulos para que exista corriente, se tiene que

JII = 0

de modo que el flujo transmitido es cero.En el analogo optico, cuando E < V0 el ındice n2 correspondiente a la region II (x > x1) se vuelve puramente

imaginario y la onda se refleja completamente. Sin embargo, la onda evanescente para la region II muestra que unafraccion de la intensidad de la onda cruza la frontera (onda sobreamortiguada i.e. sin oscilacion). Similarmente enel caso cuantico la partıcula es siempre reflejada (reflexion total) pero hay una probabilidad diferente de cero deque la partıcula pase a la region II7, esto difiere sin embargo del comportamiento clasico de una partıcula para lacual esta region estarıa estrictamente prohibida. No obstante, en el caso cuantico, esta probabilidad disminuye conx exponencialmente de modo que se vuelve despreciable cuando x es mayor a la “longitud de penetracion” 1/ρ2 de

7Hablamos de reflexion total en el sentido de que solo las funciones de onda incidente y reflejada oscilan. La onda transmitida esta encambio sobreamortiguada.

Page 143: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.7. BARRERA DE POTENCIAL 143

la onda evanescente. Adicionalmente, las Ecs. (3.78) nos dicen que el coeficiente A ′1/A1 es complejo de modo que

hay cierto corrimiento de fase en la reflexion que fısicamente se debe a que la partıcula es retardada cuando penetrala region II. Este fenomeno es parcialmente analogo al efecto piel de penetracion de una onda en un metal, aunqueen el efecto piel hay una parte oscilante y una de amortiguamiento (subamortiguamiento), en tanto que en el casopresente solo hay termino amortiguado (sobreamortiguamiento).

Surge una aparente paradoja teniendo en cuenta que en la region II, la corriente de probabilidad es cero en tantoque la probabilidad de que la partıcula este en esta region es no nula. Un analisis mas detallado del paquete deonda incidente muestra que parte del paquete de onda incidente entra en la region II clasicamente prohibida para lapartıcula y se refleja despues de haber penetrado, esta onda reflejada desde la region II interfiere destructivamentecon la onda incidente que esta penetrando de modo que se anula la corriente en la region II.

Vale decir que esta interferencia perfectamente destructiva solo aparece en el caso unidimensional. Un analisisdel caso bidimensional muestra que efectivamente aparece una corriente no nula en la region II cuando la incidenciaes oblıcua.

Es interesante analizar el caso en el cual V0 → ∞, de la definicion para ρ2 en (3.71) vemos que ρ2 → ∞ demodo que la segunda de las Ecs. (3.78) nos da B ′

2 → 0, y usando esto en la primera de las Ecs. (3.78) se obtieneA′

1/A1 → −1 es decir

A′1 → −A1 ; B′

2 → 0 (3.81)

y la segunda de las Ecs. (3.79) muestra que en la region II la funcion de onda tiende a cero, ası como el rango depenetracion 1/ρ2 de esta8. Aplicando los lımites (3.81) a las Ecs. (3.79)

lımx→0−

ϕ (x) = ϕI (0) = A1 +A′1 → 0 , lım

x→0+ϕ (x) = ϕII (0) = B′

2 → 0 (3.82)

la funcion de onda ϕ (x) se va para cero en x = x1 de manera que se mantiene contınua en el punto de discontinuidaddel potencial. Veamos ahora los lımites laterales en la derivadas, Ecs. (3.80)

lımx→0−

dϕ (x)

dx=

dϕI (0)

dx= ik1

(A1 −A′

1

)→ 2ik1A1

lımx→0+

dϕ (x)

dx= lım

x→0+

dϕII (x)

dx= − lım

x→0+ρ2B

′2e

−ρ2x

usando la segunda de las Ecs. (3.77) se obtiene

lımx→0+

dϕ (x)

dx= − lım

x→0+ρ2

[− ik1

ρ2

(A1 −A′

1

)]e−ρ2x = 2ik1A1 lım

x→0+e−ρ2x (3.83)

el valor de este lımite dependera del crecimiento comparativo entre ρ2 y x. Por ejemplo si suponemos que el potencialV0 crece como x−3 tenemos que

ρ2 →√

2m

~2V0 →

√2m

~2x−3/2 ≡ kx−3/2

con lo cual la Ec. (3.83) queda

lımx→0+

dϕ (x)

dx= 2ik1A1 lım

x→0+e−ρ2x = 2ik1A1 lım

x→0+e−kx

−1/2= 0

Vemos entonces que la derivada puede cambiar abruptamente del valor 2ikA1 a cero, en cuyo caso no serıacontınua. Esto se debe a que el potencial no es acotado (requisito para la validez del desarrollo en la seccion 3.5.1)de modo que la integral en la Ec. (3.49) no necesariamente tiende a cero cuando η → 0.

3.7. Barrera de potencial

La barrera de potencial se describe a traves de la siguiente expresion

8En otras palabras, el escalon se vuelve un obstaculo totalmente rıgido, como era de esperarse.

Page 144: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

144 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

Figura 3.2: Perfil de una barrera de potencial de altura V0, con discontinuidades en x = 0 y x = L.

V (x) =

0 si x < 0 (region I)V0 > 0 si 0 < x < L (region II)0 si L < x (region III)

Para E > V0 veremos que la transmision es total para ciertos valores del ancho de la barrera, fenomeno conocidocomo resonancia en la transmision. Tambien hay ciertos anchos especıficos de la barrera para los cuales la reflexiones maxima, aunque la transmision nunca se anula completamente.

Para E < V0, una partıcula clasica debe rebotar. Si el ancho de la barrera no es mucho mayor que la longitudde penetracion 1/ρ de la onda evanescente, veremos que parte de la onda incidente se transmite a la region III. Enconsecuencia, incluso para E < V0 la probabilidad de que la partıcula cruce la barrera es diferente de cero. Estehecho se conoce como efecto tunel.

3.7.1. E > V0, resonancias

En el analogo optico tenemos una capa transparente de ancho L (en 0 < x < L) con ındice de refraccion realn2 rodeado de un medio transparente (en x < 0 y x > L) de ındice de refraccion real n1 > n2. Como la energıa esmayor que el potencial, la Ec. (3.43) y la definicion (3.42) son validas para las tres regiones

[d2

dx2+ k2

1

]ϕ (x) = 0 ; k1 ≡

√2mE

~2(region I) (3.84)

[d2

dx2+ k2

2

]ϕ (x) = 0 ; k2 ≡

√2m (E − V0)

~2(region II) (3.85)

[d2

dx2+ k2

3

]ϕ (x) = 0 ; k3 = k1 ≡

√2mE

~2(region III) (3.86)

ası mismo las soluciones en las tres regiones son de la forma (3.44)

ϕI (x) = A1eik1x +A′

1e−ik1x ; ϕII (x) = A2e

ik2x +A′2e

−ik2x ; ϕIII (x) = A3eik1x +A′

3e−ik1x (3.87)

dϕI (x)

dx= ik1

(A1e

ik1x −A′1e

−ik1x)

;dϕII (x)

dx= ik2

(A2e

ik2x −A′2e

−ik2x)

dϕIII (x)

dx= ik1

(A3e

ik1x −A′3e

−ik1x)

(3.88)

donde hemos usado la segunda de las Ecs. (3.86). Como antes se tiene que

A′3 = 0 (3.89)

Page 145: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.7. BARRERA DE POTENCIAL 145

ya que asumimos una onda incidente desde x→ −∞ y no es de esperarse una onda reflejada desde el interior de laregion III. Usando (3.89), las condiciones de empalme aplicadas a las Ecs. (3.87) en x = 0 y en x = L quedan

lımx→0+

ϕ (x) = lımx→0−

ϕ (x) ⇒ ϕI (0) = ϕII (0) ⇒ A1 +A′1 = A2 +A′

2

lımx→L+

ϕ (x) = lımx→L−

ϕ (x) ⇒ ϕII (L) = ϕIII (L) ⇒ A2eik2L +A′

2e−ik2L = A3e

ik1L

lımx→0+

dϕ (x)

dx= lım

x→0−

dϕ (x)

dx⇒ dϕI (0)

dx=dϕII (0)

dx⇒ k1

(A1 −A′

1

)= k2

(A2 −A′

2

)

lımx→L+

dϕ (x)

dx= lım

x→L−

dϕ (x)

dx⇒ dϕII (L)

dx=dϕIII (L)

dx⇒ k2

(A2e

ik2L −A′2e

−ik2L)

= k1A3eik1L

una vez mas podemos determinar los cocientes A′1/A1, A2/A1, A

′2/A1, A3/A1. Es decir, normalizados con respecto

a la amplitud de la onda incidente. Con respecto a estos cocientes las ecuaciones quedan

1 +A′

1

A1=

A2

A1+A′

2

A1;A2

A1eik2L +

A′2

A1e−ik2L =

A3

A1eik1L (3.90)

(1 − A′

1

A1

)=

k2

k1

(A2

A1− A′

2

A1

);

k2

k1

(A2

A1eik2L − A′

2

A1e−ik2L

)=A3

A1eik1L (3.91)

despejando A′1/A1 en la primera de las Ecs. (3.90) y en la primera de las Ecs. (3.91) e igualando resulta

A2

A1+A′

2

A1− 1 = 1 − k2

k1

(A2

A1− A′

2

A1

)⇒ A2

A1

(1 +

k2

k1

)+A′

2

A1

(1 − k2

k1

)= 2

A2

A1(k1 + k2) +

A′2

A1(k1 − k2) = 2k1 ⇒ A′

2

A1=

2k1

(k1 − k2)− A2

A1

(k1 + k2)

(k1 − k2)(3.92)

igualando la segunda de las Ecs. (3.90) con la segunda de las Ecs. (3.91), resulta

A2

A1eik2L +

A′2

A1e−ik2L =

k2

k1

(A2

A1eik2L − A′

2

A1e−ik2L

)⇒ A′

2

A1e−ik2L

(1 +

k2

k1

)=A2

A1eik2L

(k2

k1− 1

)(3.93)

reemplazando (3.92) en (3.93) queda

[2k1

(k1 − k2)− A2

A1

(k1 + k2)

(k1 − k2)

]e−ik2L

(k1 + k2

k1

)=

A2

A1eik2L

(k2 − k1

k1

)

[2k1 (k1 + k2) −

A2

A1(k1 + k2)

2

]e−ik2L = −A2

A1eik2L (k1 − k2)

2

A2

A1

[(k1 + k2)

2 e−ik2L − (k1 − k2)2 eik2L

]= 2k1 (k1 + k2) e

−ik2L (3.94)

reescribamos el termino en parentesis cuadrados en la Ec. (3.94)

(k1 + k2)2 e−ik2L − (k1 − k2)

2 eik2L =(k21 + 2k1k2 + k2

2

)e−ik2L −

(k21 − 2k1k2 + k2

2

)eik2L

= −k21

(eik2L − e−ik2L

)+ 2k1k2

(eik2L + e−ik2L

)− k2

2

(eik2L − e−ik2L

)

= −2ik21 sin k2L+ 4k1k2 cos k2L− 2ik2

2 sin k2L

(k1 + k2)2 e−ik2L − (k1 − k2)

2 eik2L = −2i(k21 + k2

2

)sink2L+ 4k1k2 cos k2L

con lo cual la Ec. (3.94) queda

A2

A1

[−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

]= k1 (k1 + k2) e

−ik2L

A2

A1=

k1 (k1 + k2) e−ik2L

[−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

] (3.95)

Page 146: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

146 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

reemplazando (3.95) en la Ec. (3.92) resulta

A′2

A1=

2k1

(k1 − k2)− A2

A1

(k1 + k2)

(k1 − k2)=

2k1

(k1 − k2)− k1 (k1 + k2) e

−ik2L[−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

] (k1 + k2)

(k1 − k2)

=2k1

[−i(k21 + k2

2

)sink2L+ 2k1k2 cos k2L

]− k1 (k1 + k2)

2 e−ik2L[−i(k21 + k2

2

)sink2L+ 2k1k2 cos k2L

](k1 − k2)

A′2

A1=

[−2i

(k21 + k2

2

)sink2L+ 4k1k2 cos k2L

]−(k21 + k2

2 + 2k1k2

)e−ik2L[

−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

](k1 − k2)

k1

≡ Z k1[−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

](k1 − k2)

la cantidad Z se evalua como

Z ≡[−2i

(k21 + k2

2

)sin k2L+ 4k1k2 cos k2L

]−(k21 + k2

2 + 2k1k2

)e−ik2L

= −k21

[2i sin k2L+ e−ik2L

]− k2

2

[2i sin k2L+ e−ik2L

]+ 2k1k2

[2 cos k2L− e−ik2L

]

= −(k21 + k2

2

) [2i sin k2L+ e−ik2L

]+ 2k1k2

[(eik2L + e−ik2L

)− e−ik2L

]

= −(k21 + k2

2

) [(eik2L − e−ik2L

)+ e−ik2L

]+ 2k1k2e

ik2L

= −(k21 + k2

2

)eik2L + 2k1k2e

ik2L = −[k21 + k2

2 − 2k1k2

]eik2L

Z = − (k1 − k2)2 eik2L

con lo cual el cociente A′2/A1 queda finalmente

A′2

A1= − k1 (k1 − k2) e

ik2L

[−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

] (3.96)

despejando A′1/A1 en la primera de las Ecs. (3.90) y reemplazando las Ecs. (3.95,3.96) en la ecuacion resultante se

obtiene

A′1

A1=

A2

A1+A′

2

A1− 1 =

k1 (k1 + k2) e−ik2L

[−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

] − k1 (k1 − k2) eik2L

[−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

] − 1

=−k2

1

(eik2L − e−ik2L

)+ k1k2

(eik2L + e−ik2L

)[−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

] − 1 =−2ik2

1 sink2L+ 2k1k2 cos k2L[−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

] − 1

=−2ik2

1 sin k2L+ 2k1k2 cos k2L−[−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

][−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

]

A′1

A1=

−2ik21 sin k2L+ 2k1k2 cos k2L+ i

(k21 + k2

2

)sink2L− 2k1k2 cos k2L[

−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

]

A′1

A1=

i(k22 − k2

1

)sin k2L[

−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

] ≡ M

N(3.97)

reemplazando las Ecs. (3.95,3.96) en la ecuacion segunda de las Ecs. (3.90) resulta

A3

A1eik1L =

A2

A1eik2L +

A′2

A1e−ik2L

A3

A1eik1L =

k1 (k1 + k2) e−ik2L

[−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

]eik2L − k1 (k1 − k2) eik2L

[−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

]e−ik2L

A3

A1eik1L =

k1 (k1 + k2) − k1 (k1 − k2)[−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

] =2k1k2[

−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

]

Page 147: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.7. BARRERA DE POTENCIAL 147

A3

A1=

2k1k2 e−ik1L

[−i(k21 + k2

2

)sin k2L+ 2k1k2 cos k2L

] ≡ P

N(3.98)

ahora calculamos los coeficientes de reflexion y transmision por medio de las Ecs. 3.97

R =

∣∣∣∣JreflJinc

∣∣∣∣ =

∣∣∣∣A′

1

A1

∣∣∣∣2

=M

N

M∗

N∗ =|M |2

|N |2=

(k22 − k2

1

)2sin2 k2L

|N |2(3.99)

T =

∣∣∣∣JtransJinc

∣∣∣∣ =∣∣∣∣A3

A1

∣∣∣∣2

=|P |2

|N |2=

4k21k

22

|N |2(3.100)

calculamos ahora la magnitud al cuadrado del denominador N

|N |2 = NN∗ =[2k1k2 cos k2L− i

(k21 + k2

2

)sin k2L

] [2k1k2 cos k2L+ i

(k21 + k2

2

)sin k2L

]

= 4k21k

22 cos2 k2L+

(k21 + k2

2

)2sin2 k2L = 4k2

1k22

(1 − sin2 k2L

)+(k41 + k4

2 + 2k21k

22

)sin2 k2L

= 4k21k

22 +

(k41 + k4

2 − 2k21k

22

)sin2 k2L

|N |2 = 4k21k

22 +

(k22 − k2

1

)2sin2 k2L (3.101)

reemplazando (3.101) en las Ecs.(3.99, 3.100), los coeficientes de reflexion y transmision quedan

R =

∣∣∣∣A′

1

A1

∣∣∣∣2

=

(k22 − k2

1

)2sin2 k2L

4k21k

22 +

(k22 − k2

1

)2sin2 k2L

(3.102)

T =

∣∣∣∣A3

A1

∣∣∣∣2

=4k2

1k22

4k21k

22 +

(k22 − k2

1

)2sin2 k2L

(3.103)

se ve inmediatamente que R+ T = 1. Es mas util escribir a R y T en terminos de cantidades Fısicas mas directascomo E y V0. Para ello reemplazamos las expresiones (3.84, 3.85) en la Ec. (3.103)

T =4k2

1k22

4k21k

22 +

(k22 − k2

1

)2sin2 k2L

=4(

2mE~2

) [2m(E−V0)~2

]

4(

2mE~2

) [2m(E−V0)~2

]+[

2mE~2 − 2m(E−V0)

~2

]2sin2

[√2m(E−V0)

~L

]

=4E (E − V0)

4E (E − V0) + [E − (E − V0)]2 sin2

[√2m(E−V0)

~L

]

T =4E (E − V0)

4E (E − V0) + V 20 sin2

[√2m(E−V0)

~L

] (3.104)

si hacemos una grafica de T contra L con valores fijos de E, V0 y m (ver Fig 3.3), y tenemos en cuenta que sin2 xes periodica en x con periodo π, entonces T es periodica en L con periodo

∆L =π

k2=

π~√2m (E − V0)

(3.105)

El mınimo de T se obtiene cuando el seno al cuadrado adquiere el valor 1 y el maximo se obtiene cuando el seno alcuadrado adquiere el valor cero. Es claro entonces que

Tmın =4E (E − V0)

4E (E − V0) + V 20

> 0 ; Tmax = 1 (3.106)

vemos que se obtienen valores de L para los cuales la transmision es total (T = 1), lo cual ocurre cuando Ln =n∆L = nπ/k2 o equivalentemente

Ln =nπ

k2=

nπ~√2m (E − V0)

(3.107)

Page 148: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

148 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

Figura 3.3: Grafica de T vs L, con E, V0 y m fijos, para una barrera de potencial como la indicada en la Fig. 3.2con la condicion E > V0.

decimos entonces que se obtienen resonancias en la transmision para estos valores de Ln, los cuales correspondena multiplos enteros de la semilongitud de onda de la partıcula en la region II9. Estos hechos se ilustran en la Fig.3.3. Este es el analogo cuantico de la transmision en un interferometro de Fabry-Perot en optica, en el cual tambiense observan estas resonancias en la transmision. Cuando E > V0, se tiene que la reflexion de la partıcula en cadadiscontinuidad del potencial (i.e. en x = 0, L) ocurre sin corrimiento de fase de la funcion de onda. Por esta razon,la condicion de resonancia k2L = nπ coincide con los valores de L para los cuales pueden existir ondas estacionariasen la region II. Por otro lado, cuando L 6= Ln surge un corrimiento de fase en las reflexiones que genera interferenciadestructiva, la cual se maximiza lejos de la resonancia, es decir cuando L = (n+ 1/2) π, como se aprecia en la Fig.3.3 esto genera el valor mınimo de T . Notese que en L = (n+ 1/2) π tendrıamos una resonancia en la reflexion,pero la reflexion no es total ya que la transmision nunca es nula10.

Un estudio del comportamiento del paquete de onda en una barrera de potencial con E > V0 muestra que cuandose cumple la condicion de resonancia, el paquete de onda pasa un tiempo relativamente grande en la region II. Enmecanica cuantica esto se denomina resonancia en el scattering, ya que en un problema de dispersion por estetipo de potencial el paquete de onda estarıa pasando un tiempo relativamente largo en la region de colision (queserıa la region II).

3.7.2. Caso E < V0: Efecto tunel

En el analogo optico, tenemos una capa de ancho L con ındice de refraccion imaginario (region II) rodeado deun medio transparente (regiones I y III). En este caso las regiones I y III poseen ondas oscilantes en tanto que la

9El hecho de que sean multiplos enteros de semilongitudes de onda (y no de las longitudes de onda) proviene del hecho de que la Ec.(3.104), depende de sin2 x cuyo periodo π es la mitad del periodo de la funcion sin x.

10Naturalmente, la condicion de resonancia en la transmision Ec. (3.107) puede interpretarse para L fijo como los valores k2n de numerode onda que producen dicha resonancia. Si asumimos por ejemplo que L, V0 y m son fijos, lo que estamos obteniendo son las energıas deresonancia En, que implicaran unas frecuencias de resonancia En = hνn.

Page 149: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.7. BARRERA DE POTENCIAL 149

region II corresponde a ondas evanescentes lo cual se escribe como

[d2

dx2+ k2

1

]ϕ (x) = 0 ; k1 ≡

√2mE

~2(region I) (3.108)

[d2

dx2− ρ2

2

]ϕ (x) = 0 ; ρ2 ≡

√2m (V0 −E)

~2(region II) (3.109)

[d2

dx2+ k2

3

]ϕ (x) = 0 ; k3 = k1 ≡

√2mE

~2(region III) (3.110)

comparando las Ecs. (3.108, 3.109, 3.110) con las Ecs. (3.84, 3.85, 3.86), vemos que podemos utilizar las solucionesanteriores reemplazando k2 por −iρ2 con lo cual se obtiene

T =

∣∣∣∣A3

A1

∣∣∣∣2

=4E (V0 −E)

4E (V0 −E) + V 20 sinh2

[√2m(V0−E)

~L

] ; R = 1 − T (3.111)

para una partıcula clasica que en t → −∞ esta en x → −∞, es decir en la region I, las regiones II y III estanprohibidas. Contrario a las predicciones para una partıcula clasica, vemos que en el caso cuantico las probabilidadesen las regiones II y III son distintas de cero. En particular esto implica una probabilidad diferente de cero de que lapartıcula cruce la barrera de potencial, fenomeno conocido como efecto tunel. En la region II el comportamiento esde onda evanescente de rango 1/ρ2. Cuando L . 1/ρ2 la partıcula tiene una probabilidad considerable de cruzar labarrera por efecto tunel. Este efecto tiene muchas aplicaciones en Fısica tales como el efecto Josephson, la inversionde la molecula de amonio, el diodo tunel etc.

Es natural entonces comparar la longitud o rango de penetracion 1/ρ2 de la onda evanescente, con el ancho L dela barrera. Si el ancho de la barrera es mucho mayor que el rango de la onda evanescente tenemos que L >> 1/ρ2

de modo que ρ2L >> 1, usando la Ec. (3.109) esta condicion queda

ρ2L =

√2m (V0 −E)

~2L >> 1 ; sinhx ' ex

2; x >> 1

con estas aproximaciones, la Ec. (3.111) queda

T =

∣∣∣∣A3

A1

∣∣∣∣2

' 4E (V0 −E)

4E (V0 −E) + V 20

(eρ2L

2

)2 ' 4E (V0 −E)

V 20e2ρ2L

4

=16E (V0 −E)

V 20

e−2ρ2L

T ' 16E

V0

(1 − E

V0

)e−2ρ2L << 1 (3.112)

en tal caso la atenuacion es muy fuerte y la probabilidad de transmision muy baja.

Para tener una idea de los ordenes de magnitud del efecto, pensemos en un electron con energıa E = 1eV (electron-

voltio) que cruzara una barrera de potencial V0 = 2eV, de ancho L = 1oA. Usando V0 = 2E = 2eV ası como los

valores de la masa del electron y de la constante de Planck en la Ec. (3.109), vemos que el rango 1/ρ2 ' 1,96oA, es

decir del orden de magnitud de la ancho de la barrera, por lo cual se espera una probabilidad considerable de queel electron cruce la barrera, evaluando esta probabilidad con la Ec. (3.111) se obtiene T ' 0,78 un resultado muydiferente al clasico ya que en este caso es de hecho mas probable la transmision que la reflexion.

Si reemplazamos al electron por un proton solo hay que cambiar la masa asociada (unas 1840 veces la del

electron), permaneciendo iguales los demas datos. En tal caso el rango es 1/ρ2 ' 4,6 × 10−2oA de modo que la

barrera es mucho mas ancha que el rango de la onda evanescente. Usando la Ec. (3.111) o la Ec. (3.112) tenemosque T ' 4×10−19. Esta tremenda diferencia con respecto al electron se debe a la gran sensibilidad de la exponencialdecreciente en la Ec. (3.112) con la masa, o del seno hiperbolico en (3.111) con la masa. Esto tambien explicaporque el efecto tunel no es observable en sistemas macroscopicos.

Page 150: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

150 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

3.8. Pozo de potencial

El pozo de potencial se describe con el perfil

V (x) =

0 si x < x1 (region I)−V0 < 0 si x1 < x < x2 (region II)0 si x2 < x (region III)

3.8.1. Partıcula con energıa −V0 < E < 0

Figura 3.4: Perfil de un pozo de potencial de profundidad V0, con discontinuidades en x = −a/2 y x = a/2.

Para esta situacion, definiremos el pozo de potencial en la forma (ver Fig. 3.4)

V (x) =

0 si x < −a2 (region I)

−V0 < 0 si −a2 < x < a

2 (region II)0 si a

2 < x (region III)

donde hemos elegido colocar el origen de tal modo que V (x) = V (−x).Una partıcula clasica en un pozo de potencial como este, y con energıa E negativa (pero mayor que −V0) solo

puede oscilar entre −a/2 y a/2 con energıa cinetica Ek = E+V0. En el analogo optico, para la situacion −V0 < E < 0los ındices de refraccion n1 y n3 en las regiones I y III son imaginarios, en tanto que n2 es real. Esto es equivalentea una capa de aire de ancho “a” entre dos medios reflectivos. Las diferentes ondas que se reflejan sucesivamente enx = −a/2 y x = a/2 se destruyen unas a otras excepto para ciertas frecuencias muy especıficas (modos normales)

Page 151: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.8. POZO DE POTENCIAL 151

que permiten la formacion de ondas estacionarias. Desde el punto de vista cuantico, esto significa que las energıasnegativas de la partıcula estan cuantizadas. En contraste, para la partıcula clasica todos los valores de energıa entre−V0 y cero son posibles. Vale la pena mencionar que los valores permitidos de la energıa no estan dados por la bienconocida condicion a = kλ2/2, ya que existen ondas evanescentes que generan un corrimiento de fase en los puntosde reflexion x = −a/2 y x = a/2.

En las regiones I, II y III las soluciones de la ecuacion de Schrodinger independiente del tiempo son

ϕI (x) = B1eρx +B′

1e−ρx ; ρ =

√−2mE

~2> 0 (3.113)

ϕII (x) = A2eikx +A′

2e−ikx ; k =

√2m (E + V0)

~2> 0 (3.114)

ϕIII (x) = B3eρx +B′

3e−ρx ; ρ =

√−2mE

~2> 0 (3.115)

asumiremos de nuevo la condicion inicial de que la onda viaja inicialmente desde la region I. A fin de que estasfunciones sean acotadas en la region I (x→ −∞) y en la region III (x→ ∞) se requiere que

B′1 = B3 = 0 (3.116)

con lo cual las ecuaciones se simplifican a

ϕI (x) = B1eρx ; ϕII (x) = A2e

ikx +A′2e

−ikx ; ϕIII (x) = B′3e

−ρx (3.117)

las condiciones de empalme resultan

ϕI

(−a

2

)= ϕII

(−a

2

);

dϕI(−a

2

)

dx=dϕII

(−a

2

)

dx

ϕII

(a2

)= ϕIII

(a2

);

dϕII(a2

)

dx=dϕIII

(a2

)

dx

estas condiciones aplicadas sobre las Ecs. (3.117) nos dan

B1e−ρa

2 = A2e−ik a

2 +A′2eik a

2 ; ρB1e−ρa

2 = ik(A2e

−ik a2 −A′

2eik a

2

)

B′3e

−ρa2 = A2e

ik a2 +A′

2e−ik a

2 ; −ρB′3e

−ρa2 = ik

(A2e

ik a2 −A′

2e−ik a

2

)(3.118)

en este caso la amplitud incidente es B1 (aunque de una onda evanescente) y por tanto los cocientes se normalizancon esta cantidad. Las Ecs. (3.118) quedan

1 =A2

B1e(ρ−ik)

a2 +

A′2

B1e(ρ+ik)

a2 ; 1 =

ik

ρ

[A2

B1e(ρ−ik)

a2 − A′

2

B1e(ρ+ik)

a2

](3.119)

B′3

B1=

A2

B1e(ρ+ik)

a2 +

A′2

B1e(ρ−ik)

a2 ;

B′3

B1=ik

ρ

[A′

2

B1e(ρ−ik)

a2 − A2

B1e(ρ+ik)

a2

](3.120)

de la primera de las ecuaciones (3.119) tenemos

−A′2

B1e(ρ+ik)

a2 =

A2

B1e(ρ−ik)

a2 − 1 (3.121)

y reemplazando esta cantidad en la segunda de las ecuaciones (3.119) se obtiene

1 =ik

ρ

[A2

B1e(ρ−ik)

a2 +

A2

B1e(ρ−ik)

a2 − 1

]⇒ ρ

ik= 2

A2

B1e(ρ−ik)

a2 − 1 ⇒ 1

2

( ρik

+ 1)e(−ρ+ik)

a2 =

A2

B1

A2

B1=

(ρ+ ik

2ik

)e(−ρ+ik)

a2 (3.122)

Page 152: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

152 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

reemplazando (3.122) en (3.121) tenemos

−A′2

B1e(ρ+ik)

a2 =

[(ρ+ ik

2ik

)e(−ρ+ik)

a2

]e(ρ−ik)

a2 − 1 ⇒ A′

2

B1= −

[(ρ+ ik

2ik

)− 1

]e−(ρ+ik)a

2

A′2

B1= −

(ρ− ik

2ik

)e−(ρ+ik)a

2 (3.123)

reemplazando (3.122, 3.123) en la primera Ec. (3.120) tenemos

B′3

B1=

[(ρ+ ik

2ik

)e(−ρ+ik)

a2

]e(ρ+ik)

a2 −

[(ρ− ik

2ik

)e−(ρ+ik)a

2

]e(ρ−ik)

a2 =

(ρ+ ik

2ik

)eika −

(ρ− ik

2ik

)e−ika

2ik

(eika − e−ika

)+

1

2

[eika + e−ika

]

B′3

B1=

ρ

ksin ka+ cos ka (3.124)

igualando las Ecs. (3.120) y usando las expresiones (3.122, 3.123), obtenemos

A2

B1e(ρ+ik)

a2 +

A′2

B1e(ρ−ik)

a2 =

ik

ρ

[A′

2

B1e(ρ−ik)

a2 − A2

B1e(ρ+ik)

a2

]⇒

[(ρ+ ik

2ik

)e(−ρ+ik)

a2

]e(ρ+ik)

a2 +

[−(ρ− ik

2ik

)e−(ρ+ik)a

2

]e(ρ−ik)

a2 =

ik

ρ

[−(ρ− ik

2ik

)e−(ρ+ik)a

2

]e(ρ−ik)

a2

−[(

ρ+ ik

2ik

)e(−ρ+ik)

a2

]e(ρ+ik)

a2

(ρ+ ik

2ik

)eika −

(ρ− ik

2ik

)e−ika =

−ik2ikρ

(ρ− ik) e−ika + (ρ+ ik) eika

(ρ+ ik) eika − (ρ− ik) e−ika =−ikρ

(ρ− ik) e−ika + (ρ+ ik) eika

(ρ+ ik

2ik

)eika −

(ρ− ik

2ik

)e−ika =

−ik2ikρ

(ρ− ik) e−ika + (ρ+ ik) eika

(ρ+ ik) eika − (ρ− ik) e−ika =−ikρ

(ρ− ik) e−ika + (ρ+ ik) eika

dividiendo ambos miembros por ρ+ ik resulta

eika − (ρ− ik)

(ρ+ ik)e−ika =

−ikρ

(ρ− ik)

(ρ+ ik)e−ika + eika

⇒ eika

[1 +

ik

ρ

]=

(ρ− ik)

(ρ+ ik)e−ika

[1 − ik

ρ

]

e2ika[ρ+ ik

ρ

]=

(ρ− ik)

(ρ+ ik)

[ρ− ik

ρ

]

e2ika =(ρ− ik)2

(ρ+ ik)2(3.125)

vale la pena discutir la estrategia de solucion antes de seguir adelante. A priori podrıa pensarse que las Ecs. (3.118)nos pueden dar solucion para todas las amplitudes B1, A2, A

′2 y B3, puesto que tenemos cuatro ecuaciones. Sin

embargo, no es logico fısicamente que la amplitud de entrada B1 pueda ser determinada por las condiciones deempalme ya que esta amplitud tiene relacion con las condiciones iniciales, las cuales puedo acomodar en principioarbitrariamente. Por esta razon la estrategia de solucion se interpreta diciendo que las cuatro ecuaciones (3.118) nosbrindan soluciones para los tres cocientes A2/B1, A

′2/B1, B

′3/B1 mas una ligadura entre las cantidades ρ y k dada

por la Ec. (3.125).

Page 153: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.8. POZO DE POTENCIAL 153

Por otro lado, las Ecs. (3.113, 3.114) nos muestran que ρ y k estan relacionadas con la energıa E de la partıcula.Esto implica que la ligadura (3.125) solo se satisface para ciertos valores de la energıa. Por tanto, al imponer elacotamiento de ϕ (x) hemos llegado a una cuantizacion de la energıa. Esto se puede ver teniendo en cuenta quela ligadura (3.125) provino del hecho de que el sistema de cuatro ecuaciones (3.119, 3.120) esta sobredeterminadopara el conjunto de tres cocientes A2/B1, A

′2/B1, B

′3/B1; pero esto a su vez ocurre debido a la eliminacion de las

amplitudes Ec. (3.116) que se realizo para mantener acotada la solucion.En resumen, para un pozo de potencial como el de la Fig. 3.4 de profundidad V0 y de ancho a, la funcion de

onda (acotada) en las tres regiones en que el potencial divide al espacio vienen dadas por

ϕI (x) = B1eρx ; ϕII (x) = A2e

ikx +A′2e

−ikx ; ϕIII (x) = B′3e

−ρx (3.126)

ρ =

√−2mE

~2> 0 ; k =

√2m (E + V0)

~2> 0 (3.127)

A2

B1=

(ρ+ ik

2ik

)e(−ρ+ik)

a2 ;

A′2

B1= −

(ρ− ik

2ik

)e−(ρ+ik)a

2 ;B′

3

B1=ρ

ksin ka+ cos ka (3.128)

e2ika =(ρ− ik)2

(ρ+ ik)2(3.129)

donde hemos supuesto que la partıcula incide desde la region I.

Caso 1 para energıa negativa

La ligadura (3.129) nos conduce a dos situaciones posiblesI)

ρ− ik

ρ+ ik= −eika (3.130)

reescribimos esta relacion en la forma

(ρ/k) − i

(ρ/k) + i= −eika ⇒ ρ

k− i = −

(ρk

+ i)eika ⇒ ρ

k

[1 + eika

]= i[1 − eika

]

ρ

k=

(eika − 1

)

i (1 + eika)=

(eika−1)i

e−ika/2

2

(1 + eika) e−ika/2

2

=

(eika/2 − e−ika/2

)/2i(

e−ika/2 + eika/2)/2

=sin(ka2

)

cos(ka2

)

quedando finalmenteρ

k= tan

(ka

2

)(3.131)

definimos la magnitud del complejo ρ+ ik en la forma

k0 ≡√k2 + ρ2 =

√2mV0

~2(3.132)

donde hemos tenido en cuenta las Ecs. (3.127). Usando identidades trigonometricas y las Ecs. (3.131, 3.132), tenemosque

1

cos2(ka2

) = 1 + tan2 ka

2= 1 +

ρ2

k2=k2 + ρ2

k2

1

cos2(ka2

) =

(k0

k

)2

(3.133)

de modo que la Ec. (3.130) es equivalente a las Ecs. (3.131, 3.133) que se pueden sintentizar en las ecuaciones

∣∣∣∣cos(ka

2

)∣∣∣∣ =k

k0; tan

(ka

2

)> 0 (3.134)

Donde hemos tenido en cuenta que la Ec. (3.133) proviene de la Ec. (3.131), pero sustituyendo una tangente al

Page 154: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

154 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

Figura 3.5: Solucion grafica de las Ecs. (3.134, 3.138). La interseccion de la lınea recta con las lıneas punteadascosenoidales nos dan los puntos denotados por P , correspondientes a soluciones de las Ecs. (3.134) y asociados afunciones de onda pares. La interseccion de la recta con las lıneas punteadas del arco senoidal nos dan los puntosdenotados por I, correspondientes a soluciones de las Ecs. (3.138) y asociados a funciones de onda impares.

cuadrado con lo cual se pierde la informacion del signo de esta tangente al llegar a la Ec. (3.133).

La primera de las Ecs. (3.134) se puede solucionar graficando la parte izquierda y =∣∣cos

(ka2

)∣∣ y la parte derechay = k/k0 y encontrando la interseccion entre las dos graficas. Es decir graficamos los arcos cosenoidales (arcos delcoseno con nodos en (2q + 1) π/a de la Fig. 3.5 con q entero no negativo) y la lınea recta de pendiente 1/k0 paraobtener tal interseccion. Ahora bien, las franjas ascendentes del coseno (lıneas contınuas del arco cosenoidal en laFig. 3.5) violan la condicion dada por la segunda ecuacion (3.134), en tanto que las franjas descendentes (lıneaspunteadas del arco cosenoidal en la Fig. 3.5) satisfacen tal condicion11. Los puntos de interseccion de la recta conlas lıneas punteadas del coseno se denotan en la Fig. 3.5 con la letra P , y sus componentes x nos dan los valores knque cuantizan al numero de onda y por tanto a la energıa, la cual viene dada por la ecuacion (3.127)

kn =

√2m (En + V0)

~2(3.135)

Por otro lado, dividiendo las dos primeras Ecs. (3.128) se obtiene

A′2

A2=

−(ρ−ik2ik

)e−(ρ+ik)a

2

(ρ+ik2ik

)e(−ρ+ik)

a2

= −(ρ− ik) e−ika2

(ρ+ ik) eika2

= −(ρ− ik)

(ρ+ ik)e−ika

y utilizando la Ec. (3.130) resultaA′

2

A2= 1

si reemplazamos la Ec. (3.131) (la cual es equivalente a la Ec. 3.130) en la tercera de las Ecs. (3.128) y definiendox ≡ ka/2 obtenemos

B′3

B1=

ρ

ksin ka+ cos ka = tan

(ka

2

)sinka+ cos ka = tanx sin 2x+ cos 2x

= tan x (2 sinx cos x) +(1 − 2 sin2 x

)= 2

sinx

cos xsinx cos x+ 1 − 2 sin2 x

B′3

B1= 1

11Por ejemplo en la franja 0 ≤ k ≤ π/a es claro que tan (ka/2) > 0, en tanto que en la franja π/a < k < 2π/a se tiene quetan (ka/2) ≤ 0, y ası sucesivamente.

Page 155: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.8. POZO DE POTENCIAL 155

En conclusion la Ec. (3.130) que define el caso 1 de nuestro analisis, conduce a las relaciones

A′2 = A2 ; B′

3 = B1 (3.136)

y al reemplazar estas relaciones en la Ecs. (3.126) esto nos da

ϕI (x) = B1eρx ; ϕII (x) = 2A2 cos kx ; ϕIII (x) = B1e

−ρx (3.137)

para −a/2 ≤ x ≤ a/2 (region II), es claro que −x tambien pertenece a la region II. Si x pertenece a la region I (x ≤−a/2) entonces −x pertenece a la region III (−x ≥ a/2). Similarmente, si x esta en la region III entonces −x esta enla region I. Vemos ademas que la Ec. (3.137) nos dice que

ϕI (x) = B1eρx = ϕIII (−x) ; ϕII (x) = ϕII (−x)

lo cual nos lleva a la conclusion de que en el caso 1 caracterizado por la Ec. (3.130), la funcion de onda es par entodas las regiones i.e.

ϕ (−x) = ϕ (x) ; x ∈ (−∞, ∞)

Caso 2 para energıa negativa

La Ec. (3.129), tiene dos soluciones, la primera corresponde a la Ec. (3.130) y la segunda vendra dada por

ρ− ik

ρ+ ik= eika

un calculo analogo nos lleva a que los numeros de onda permitidos estan dados por∣∣∣∣sin

(ka

2

)∣∣∣∣ =k

k0; tan

(ka

2

)< 0 (3.138)

la Fig. 3.5 muestra la interseccion entre la recta de pendiente 1/k0 y los arcos senoidales (arcos del seno con nodosen k = 2qπ/a siendo q entero no negativo). La interseccion entre la recta y la parte punteada (descendente) de losarcos senoidales, nos da los puntos denotados por I en la Fig. 3.5, cuya abcisa nos da el valor cuantizado de kn, conel cual se encuentra la energıa cuantizada usando la Ec. (3.135). Notese que los niveles encontrados se encuentranentre los niveles hallados para el primer caso. Puede similarmente demostrarse que la funcion de onda asociada esimpar.

Relacion entre k0 y los estados acotados

Observese que si

0 ≤ k0 ≤ π

a

La Fig. 3.5 nos muestra que solo existe un estado acotado para la partıcula y dicho estado se asocia con una funcionde onda par. En otras palabras, la recta tiene una pendiente muy alta de modo que cruza la recta horizontal (maximode los sinusoides) antes de llegar al primer nodo de la funcion cosenoidal (de modo que solo cruza una vez la lıneapunteada del coseno) y antes de llegar al primer maximo de la funcion senoidal (de modo que no cruza la lıneapunteada del seno). Un analisis similar nos muestra que cuando tenemos

π

a≤ k0 ≤ 2π

a

aparecen solo dos estados uno par y otro impar. Generalizando, si se cumple la condicion

2pπ

a≤ k0 ≤ (2p+ 1) π

a; p = 0,

1

2, 1,

3

2, 2,

5

2, . . . (3.139)

aparecen [p+ 1] estados pares y[p+ 1

2

]estados impares, siendo [p] la funcion parte entera de p que se define como

[p] ≡ k tal que : k es entero con k ≤ p < k + 1

Page 156: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

156 CAPITULO 3. ECUACION DE SCHRODINGER Y SUS PROPIEDADES

Para el ejemplo de la figura 3.5 tenemos que 4π/a < k0 < 5π/a, de modo que p = 2. El numero de estados pares es[2 + 1] = 3, el numero de estados impares es

[2 + 1

2

]= 2.

Es util escribir la condicion (3.139), en terminos de parametros mas fısicos. De la definicion (3.132) podemosescribir la condicion (3.139) en la forma

2pπ

a≤

√2mV0

~2≤ (2p+ 1) π

a⇒

(2pπ

a

)2

≤ 2mV0

~2≤(

(2p+ 1) π

a

)2

(2p)2π2~2

2ma2≤ V0 ≤ (2p+ 1)2

π2~2

2ma2

(2p)2 V1 ≤ V0 ≤ (2p+ 1)2 V1 ; V1 ≡ π2~2

2ma2; p = 0,

1

2, 1,

3

2, 2,

5

2, . . . (3.140)

La Ec. (3.140), nos sugiere definir a V1 como un potencial umbral. Por ejemplo si p = 0 tenemos que 0 ≤ V0 ≤ V1

conduce a un estado par y ningun estado impar. Si p = 1/2, la condicion queda V1 ≤ V0 ≤ 4V1 que conduce a unafuncion par y otra impar y ası sucesivamente.

Si V0 >> V1 (de modo que p >> 1) entonces la pendiente de la recta 1/k0 es muy pequena y los primeros numerosde onda practicamente coinciden con los nodos de los arcos senoidal y cosenoidal. Es decir, para los numeros deonda mas bajos tenemos que

k ' nπ

a; para n entero y n << p

y aplicando la Ec. (3.135), la energıa queda

E ' n2π2~2

2ma2− V0 ; para n entero y n << p (3.141)

Pozo de potencial con profundidad infinita

Asumiremos que V (x) es cero fuera del intervalo 0 < x < a, e infinito negativo −V0 → −∞ en dicho intervalo.Supondremos sin embargo que E + V0 ≡ ∆E > 0 en 0 < x < a y que ∆E es finito, a fin de que la partıcula poseaenergıa cinetica finita. La discusion es totalmente analoga a la realizada en la seccion 3.6.2, Pag. 143 para escalon depotencial infinito. Segun esta discusion, al penetrar en la barrera la onda es evanescente con longitud de penetracionque tiende a cero, en el lımite podemos entonces considerar que la funcion decae a cero inmediatamente, es decirla funcion de onda se anula en las discontinuidades de salto infinito. Esto es consistente con las ecuaciones que seobtienen en este lımite para el empalme, como se aprecia en las Ecs. (3.81, 3.82). Adicionalmente, la Ec. (3.82)tambien nos muestra que la funcion de onda debe seguir siendo continua en los empalmes, con lo cual la funcion deonda en nuestro caso debe ser nula fuera del intervalo [0, a]. No obstante, vimos que en general la primera derivadaya no es contınua, debido a que tenemos un potencial no acotado.

Como E + V0 ≡ ∆E es positivo y finito, la solucion de la ecuacion de onda esta dada por

ϕ (x) = Aeikx +A′e−ikx para 0 ≤ x ≤ a; k ≡√

2m ∆E

~2(3.142)

poniendo la condicion de nulidad de la funcion de onda en el extremo x = 0 tenemos que

ϕ (0) = 0 = A+A′ ⇒ A = −A′ ⇒ϕ (x) = A

(eikx − e−ikx

)= 2iA sin kx (3.143)

usando nulidad de la funcion de onda (3.143) en el extremo x = a tenemos

ϕ (a) = 2iA sin ka = 0

con lo cual ka = nπ o equivalentemente

kn =nπ

a; n entero positivo (3.144)

Page 157: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

3.8. POZO DE POTENCIAL 157

n es positivo ya que se asume k positivo en la Ec. (3.142)12. La funcion queda

ϕ (x) = 2iA sinnπ

ax

la constante 2iA la elegimos como positiva (fase cero) de modo que normalice a la funcion de onda. Con esto setiene finalmente

ϕn (x) =

√2

asin(nπx

a

)

con energıas

∆En =n2π2~2

2ma2(3.145)

en este caso la cuantizacion de la energıa es mucho mas simple de demostrar. Notese que la Ec. (3.144), nos diceque la condicion para el estado estacionario es tal que el ancho a del potencial debe contener un numero entero desemilongitudes de onda π/k. Este es el analogo a la formacion de ondas estacionarias con extremo fijo en optica.Vemos que la condicion de extremo fijo (nulidad de la funcion de onda en los extremos) solo se da para pozosinfinitamente profundos. Si el pozo tiene profundidad finita, el extremo no es totalmente fijo, lo cual se traduce enla penetracion de una onda evanescente (pero no nula) en las regiones fuera del pozo.

Si bien no hay pozos infinitos, en la practica pozos muy profundos poseen el comportamiento aquı descrito.Pero ¿que es un pozo muy profundo?. La respuesta esta en el potencial umbral V1 definido en la Ec. (3.140).Efectivamente, vimos que cuando V0 >> V1 los estados mas bajos se comportan como los de un pozo infinito comose ve al comparar las Ecs. (3.141, 3.145). Debe tenerse en cuenta sin embargo, que aun cuando V0 sea mucho mayorque V1 siempre habra estados excitados que se desvıen significativamente del comportamiento aquı descrito, valedecir cuando la aproximacion n << p ya no sea valida, como se ve en la Ec. (3.141).

3.8.2. Partıcula con energıa E > 0

En esta situacion, definiremos el origen de modo que

V (x) =

0 si x < 0 (region I)−V0 < 0 si 0 < x < L (region II)0 si L < x (region III)

con el fin de poder comparar con los resultados de la seccion 3.7.1. Cuando la partıcula clasica tiene energıa positivay viene desde −∞, viaja con energıa cinetica constante Ek = E hasta x = 0, donde experimenta un aumentoabrupto en su energıa cinetica a Ek = E + V0, y luego una desaceleracion similar en x = L, continuando hacia laderecha con energıa cinetica constante Ek = E.

Para E > 0, en el analogo optico todos los ındices de refraccion son reales

n1 = n3 =c

Ω

1

~

√2mE ; n2 =

c

Ω

1

~

√2m (E + V0)

y los resultados se pueden extraer de la Sec. 3.7.1, con la asignacion V0 → −V0. Puesto que n2 es mayor que n1

y n3 la situacion optica es analoga a tener una capa de vidrio en medio del aire13. Para obtener la onda reflejadapara x < 0, o la onda transmitida para x > L, es necesario superponer un numero infinito de ondas que surgende la reflexion sucesiva entre x = 0 y x = L (interferometro multiple analogo a un Fabry-Perot). Se encuentra quepara ciertas frecuencias incidentes la onda es completamente transmitida (asumiendo que L, V0 y m son fijos). En elcaso cuantico, la partıcula tiene cierta probabilidad de ser reflejada, pero existen ciertos valores llamados energıasresonantes para los cuales la probabilidad de transmision es 1 y por tanto la probabilidad de reflexion es cero.

12Si tomaramos la raız negativa en la Ec. (3.142) tendrıamos la misma solucion de la funcion de onda.13En la Sec. 3.7.1, la situacion optica era la de una capa de aire rodeada de vidrio.

Page 158: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 4

Enunciado matematico de los postulados dela mecanica cuantica

4.1. Los fenomenos clasicos

En mecanica clasica, un sistema discreto de partıculas se describe a traves de un conjunto de coordenadasgeneralizadas qi (t) y de velocidades generalizadas qi (t), y podemos utilizar por ejemplo el Lagragiano L = L (qi, qi, t)como el generador de las ecuaciones de movimiento del conjunto qi (t) , qi (t). Las q′is deben ser independientes enel sentido de que debe ser posible mover una sola de estas coordenadas sin violar las ligaduras impuestas sobre elsistema. De esta forma, para un pendulo simple con el origen ubicado en el pivote, la unica coordenada generalizadaes θ puesto que la distancia r de la lenteja es fija, de modo que no es posible mover el valor de r sin violar la ligadurade distancia constante al origen. Por esta razon el numero de coordenadas generalizadas n del sistema no es engeneral igual a 3N , siendo N el numero de partıculas. No obstante, las ligaduras son usualmente manifestacionesmacroscopicas de fuerzas microscopicas, por ejemplo la tension de la cuerda del pendulo es el resultado de lasfuerzas que generan los enlaces moleculares de la cuerda. Por esta razon, en el mundo microscopico el concepto deligadura basicamente desaparece y los sistemas de partıculas se tratan en general como sistemas no ligados por lasinteracciones. Por tanto, el numero de grados de libertad de posicion sera usualmente n = 3N .

A menudo resulta mas ventajoso utilizar en lugar del conjunto qi, qi un nuevo conjunto qi, pi donde lasvariables pi estan dadas por

pi ≡∂L (q, q, t)

∂qi

y pi se denomina el momento canonicamente conjugado a la variable qi. Si definimos la transformada de Legendredel Lagrangiano en la forma

H ≡∑

i

piqi − L (qi, qi, t)

a esta cantidad cuando se escribe enteramente en terminos del conjunto qi, pi, la llamamos el Hamiltoniano delsistema y actua como generador de ecuaciones de movimiento para el sistema qi, pi, a traves de las llamadasecuaciones de Hamilton

qi =∂H

∂pi; pi = −∂H

∂qi

La resolucion de estas ecuaciones nos genera el comportamiento de qi y pi como funcion del tiempo y por tantotoda la informacion fısica del sistema. El Hamiltoniano es una funcion que puede variar tanto funcional comonumericamente cuando se hace un cambio en el sistema coordenado. El uso directo de las ecuaciones de Hamiltonpermite demostrar que

dH

dt=∂H

∂t

En consecuencia, si para un sistema coordenado dado el Hamiltoniano no es funcion explıcita del tiempo, estacantidad sera una constante de movimiento y si una cierta coordenada generalizada qi no aparece en el Hamiltoniano,pero sı aparece su momento conjugado pi, se tiene que este momento conjugado sera una constante de movimiento.Adicionalmente, para muchos casos de interes el Hamiltoniano corresponde a la energıa total del sistema, para que el

158

Page 159: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

4.1. LOS FENOMENOS CLASICOS 159

Hamiltoniano sea la energıa del sistema se deben cumplir los siguientes requisitos (como condiciones de suficiencia):(a) El lagrangiano asociado debe poder descomponerse en la forma

L (q, q, t) = L0 (q, t) + L1 (q, q, t) + L2 (q, q, t)

siendo Li con i = 0, 1, 2 una funcion homogenea de grados 0, 1 y 2 en las variables qi. (b) La transformacion quelleva de las coordenadas cartesianas a las coordenadas generalizadas

ri = ri (q1, ..., qn)

no debe depender explıcitamente del tiempo, y (c) el potencial asociado solo debe ser funcion de las coordenadas yel tiempo. Para los sistemas microscopicos estas condiciones se cumplen en casi todos los casos de interes. Vale decirque la condicion (c) es violada por los potenciales asociados a las interacciones electromagneticas para las cuales elpotencial depende tambien de las qi. No obstante, se puede demostrar que aun con la violacion de esta condicion,el Hamiltoniano sigue siendo la energıa del sistema para el caso especial de interacciones electromagneticas. Noteseque esto tiene que ver con el hecho de que estas son condiciones de suficiencia pero no de necesidad.

En virtud de la discusion anterior, asumiremos para nuestros propositos que el Hamiltoniano corresponde numeri-camente a la energıa total del sistema. De particular importancia sera el Hamiltoniano asociado a una partıcula norelativista, no ligada y sometida a un potencial que no depende de las velocidades generalizadas. En este caso elHamiltoniano corresponde a la energıa total de la partıcula y se podra escribir en la forma

H =p2

2m+ V (r, t)

si usamos como coordenadas generalizadas las coordenadas cartesianas de la partıcula, se tendra que el momentolineal pi sera el momento canonicamente conjugado a la variable xi con i = 1, 2, 3. Si aplicamos las ecuaciones deHamilton a este Hamiltoniano, las ecuaciones de movimiento quedan

xi =pim

; pi = −∂V∂xi

que coinciden con las leyes Newtonianas basicas.

Por otro lado, existen en la mecanica clasica los fenomenos ondulatorios, estos aparecen de manera naturalcomo excitaciones o perturbaciones colectivas de un sistema de partıculas, como es el caso de las cuerdas vibranteso las olas en el agua, estos fenomenos colectivos se pueden entender a la luz de las leyes de Newton pero nose presentan fenomenos ondulatorios clasicos para una sola partıcula. Mas bien se trata de una perturbacionque se transmite de una partıcula a otra generando propiedades de propagacion. Por otro lado, existen fenomenosondulatorios (electromagneticos) que no estan asociados clasicamente a partıculas y que no estan regidos por lasleyes de Newton sino por las denominadas ecuaciones de Maxwell. Podemos entonces por un lado hablar de materia(regida por la mecanica Newtoniana) que genera los fenomenos corpusculares y las ondas mecanicas, y la radiacion(regida por las ecuaciones de Maxwell, que genera fenomenos ondulatorios que clasicamente no estan asociados ala materia). De otra parte, podemos hablar de fenomenos corpusculares generados por las partıculas individuales yfenomenos ondulatorios generados por los campos electromagneticos o por perturbaciones colectivas en la materia.En todo caso, salvo por la ley de Lorentz que nos da la interaccion de la radiacion con la materia, estos dos tipos deentes fısicos radiacion y materia son completamente distintos en mecanica clasica y se rigen por leyes muy distintas.Por otro lado, una partıcula individual no puede generar fenomenos ondulatorios de modo que el comportamientocorpuscular esta bien diferenciado del comportamiento ondulatorio.

De la anterior discusion podemos inferir las principales caracterısticas de los sistemas clasicos

(1) El estado de un sistema en un tiempo t queda totalmente especificado por el valor de sus coordenadas ymomentos conjugados en tal tiempo. Esto equivale a conocer sus posiciones, masas y velocidades en dicho instante.

(2) Al especificar el estado del sistema en cierto tiempo, cualquier cantidad fısica tiene un valor unico que sereflejara en el proceso de medida (con ciertas incertidumbres de ındole experimental).

(3) Las ecuaciones de Hamilton son un posible conjunto de ecuaciones de movimiento. De ellas se observa quedados los valores de qi (t0) , pi (t0) para un tiempo inicial t0, la evolucion de qi, pi es unica de modo que los valoresqi (t) , pi (t), estan completamtne determinados para todo tiempo. En consecuencia el estado del sistema se conoce

Page 160: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

160 CAPITULO 4. ENUNCIADO MATEMATICO DE LOS POSTULADOS DE LA MECANICA CUANTICA

completamente para cualquier tiempo t ≥ t0 si lo conocemos para t0. Esto a su vez implica que cualquier cantidadfısica evoluciona de manera unica y su valor al ser medido sera unico en cualquier instante.

(4) En principio todos valores reales de qi, pi son posibles de obtener en un sistema mecanico (al menos dentro deciertos intervalos). Por tanto un observable F (qi, pi) tambien posee valores en un espectro contınuo al menos dentrode cierto intervalo. Ademas en el proceso de medicion estos seran tambien los valores accesibles de las cantidadesfısicas.

(5) Las ecuaciones de Maxwell nos dan cuenta de la radiacion a traves de grados de libertad contınuos caracter-izados por los campos electricos y magneticos. La evolucion de estas ecuaciones es unica para condiciones inicialesy de frontera adecuadas, junto con el conocimiento de la distribucion de cargas y corrientes.

4.2. Los fenomenos cuanticos

La exposicion sistematica de los sistemas microscopicos descritos anteriormente nos ha llevado a encontrarfenomenos que difieren radicalmente de los fenomenos clasicos, veamos los mas importantes

(1) Existen ciertas cantidades fısicas tales como la energıa, el momento angular etc. que bajo ciertas condicionessolo nos arrojan medidas discretas. Este fenomeno de cuantizacion de las medidas accesibles aparece en escenariostan diversos como la radiacion del cuerpo negro, el efecto fotoelectrico y la medicion de los espectros atomicos.

(2) Tanto la materia como la radiacion presentan fenomenos de dualidad onda partıcula. Pueden dispersarsecomo partıculas pero tambien interferir y difractarse como las ondas.

(3) La repeticion sistematica de ciertos experimentos bajo las mismas condiciones iniciales, nos lleva a que lamedida de los observables no es reproducible. Sin embargo, cuando muchos experimentos identicos son realizados,aparece un patron reproducible relativo a la distribucion con que se obtienen las diferentes medidas. Estos nos llevaa la idea de que existe un patron de probabilidad para obtener cada uno de los resultados accesibles (que en generalpueden o no estar cuantizados).

(4) La distribucion de probabilidad esta asociada con el caracter ondulatorio de los sistemas.

(5) En un proceso de medida se evidencia solo uno de los aspectos (ondulatorio o corpuscular) de la naturalezacuantica, como una moneda que posee dos caras pero solo nos muestra una a la vez (principio de complementareidad).

(6) La cuantizacion de los observables nos conduce a pensar que los estados asociados a estos observables tambienestan cuantizados (autoestados del sistema). El principio de superposicion que poseen las ondas sugiere pensar que elestado del sistema en un tiempo t es la superposicion de todos los autoestados, en donde cada autoestado contribuyecon cierto peso.

(7) El proceso de medida nos cambia el estado del sistema de manera drastica: justo antes de la medida el estadodel sistema es la superposicion de todos los autoestados, justo despues de la medida el sistema queda preparado enuna superposicion que solo incluye a los autoestados asociados con el autovalor obtenido.

(8) Lo anterior nos induce a pensar que existe una perturbacion fundamental que no puede ser minimizada, yque es inherente al proceso de medicion e independiente de la resolucion del aparato de medida.

(9) La probabilidad de obtener un autovalor esta relacionada con los coeficientes asociados a sus autoestados.Lo anterior es confirmado por la repeticion sucesiva de los experimentos. Notese que esto ademas implica que laforma en que actuara la perturbacion fundamental no se puede predecir con certeza.

(10) Como corolario se obtiene que si vuelvo a hacer una medida del mismo observable justo despues de la primeramedicion, el autovalor se reproduce con total certeza. Lo anterior es confirmado por los hechos experimentales.

(11) La distribucion de probabilidad para la materia evoluciona de manera determinista, siendo la ecuacion deSchrodinger un buen prospecto como generador de esta evolucion, al menos en el regimen no relativista.

(12) La funcion de onda (solucion de la ecuacion de Schrodinger) que describe la distribucion de probabilidaddebe ser de cuadrado integrable para poder mantener la conservacion de la probabilidad.

(13) Para una partıcula el estado clasico en un tiempo t se caracteriza por seis cantidades (3 posiciones y tresmomentos) en tanto que para una partıcula cuantica esta caracterizada por un numero infinito de cantidades: losvalores de ψ (r, t) para cada posicion r.

En sıntesis, los postulados deben dar cuenta de las caracterısticas arriba citadas.

Page 161: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

4.3. ESTABLECIMIENTO DE LOS POSTULADOS 161

4.3. Establecimiento de los postulados

4.3.1. Descripcion de los estados y las cantidades fısicas

Hemos visto que el estado de una partıcula se caracteriza por la funcion de onda ψ (r, t) que es una funcion decuadrado integrable. Adicionalmente, vimos que a cada funcion de onda en el espacio z le corresponde un ket |ψ〉 enel espacio de estados Er. Donde la relacion entre ambos viene dada por |ψ (t)〉 → 〈r |ψ (t)〉 = ψ (r, t). Esta relacionnos muestra a la funcion de onda como una representacion del ket |ψ (t)〉 en la base |r〉. Ademas, la representacionpor kets posee la flexibilidad de ser expresada en cualquier base. Generalizaremos este enunciado de una partıculaal caso de un sistema fısico arbitrario

Primer postulado: El estado de un sistema fısico en un tiempo t0 esta especificado por un ket |ψ (t0)〉 ∈ E.Siendo E un subespacio de un espacio de Hilbert H, donde H es isomorfo e isometrico al espacio L2 de las funcionescuadraticamente integrables.

Al ser E un espacio vectorial, una combinacion lineal de estados es tambien un estado, lo cual implica un principiode superposicion. Mas adelante veremos las implicaciones fısicas de este principio de superposicion.

De otra parte, observamos que la ecuacion de Schrodinger independiente del tiempo nos lleva a una ecuacion devalores propios

H |ψ〉 = E |ψ〉

donde el operador H esta definido por

H =P 2

2m+ V (r)

siendo P el operador cuyos valores propios corresponden al momento de la partıcula. Este operador H tiene comovalores propios los valores accesibles de energıa del sistema. En forma similar vimos que al menos para partıculalibre los operadores R y P tiene como valores propios los valores accesibles (contınuos) de posicion y momento. Valeademas decir que H, R y P son todos observables. La generalizacion de estos hechos nos lleva al segundo y tercerpostulado

Segundo postulado: Toda cantidad fısica medible A, esta descrita por un operador A que actua sobre el espaciovectorial E. Dicho operador es un observable, i.e. un operador hermıtico cuyo espectro de autoestados es completo.

Mas adelante veremos que la caracterıstica de observable es esencial. Notese que en la mecanica cuantica losestados estan representados por vectores y las cantidades Fısicas por operadores.

Tercer postulado: El unico resultado posible en una medicion de una cantidad fısica A es uno de los autovaloresdel correspondiente observable A.

Por supuesto, toda medida experimental debe ser un numero real. El caracter hermıtico de A nos garantizaque una medida de A nos dara un valor real, ya que todo valor propio de A es real. Adicionalmente, dado que elproblema de valores propios conduce en muchas circunstancias a valores propios discretos, es de esperarse que estepostulado nos de cuenta de la naturaleza cuantica de algunas cantidades fısicas.

4.3.2. El proceso de medicion y la distribucion de probabilidad

Cuando analizamos el experimento de fotones polarizados (seccion 2.7.2), nos topamos con el principio dedescomposicion espectral, al cual le daremos un caracter mas general en la presente seccion. Consideremos que unsistema esta caracterizado en el tiempo t, por el ket |ψ (t)〉 (de acuerdo con el primer postulado) el cual asumiremoscomo normalizado a 1

〈ψ |ψ〉 = 1

sabemos que si queremos medir una cantidad fısica A asociada a un observable A no podemos hacer una predicciondel resultado con toda certeza sino solo una prediccion de la probabilidad de obtener un valor dado accesible, esdecir un autovalor dado de A.

Asumamos por ahora que el espectro de A es totalmente discreto y no degenerado, en tal caso a cada valorpropio an le corresponde un unico vector propio normalizado |un〉 (excepto por una fase constante). La ecuacion devalores propios de A es

A |un〉 = an |un〉

Page 162: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

162 CAPITULO 4. ENUNCIADO MATEMATICO DE LOS POSTULADOS DE LA MECANICA CUANTICA

y dado que A es un observable, los vectores propios |un〉 forman una base ortonormal en E . El vector de estado|ψ〉 se puede entonces expandir en esta base

|ψ〉 =∑

n

cn |un〉

y postularemos siguiendo el principio de descomposicion espectral (seccion 2.7.2 Ecs. 2.5, 2.6, 2.7), que la probabil-idad de obtener el valor propio ak esta dada por

P (ak) = |ck|2 = |〈uk |ψ〉|2

¿Que ocurre si el autovalor es degenerado?, en este caso varios vectores ortonormales corresponden a este valorpropio

A∣∣uin⟩

= an∣∣uin⟩

; i = 1, ..., gn

dado que A es observable, el conjunto∣∣uin

⟩forma una base de modo que podemos expandir el estado |ψ〉 en dicha

base

|ψ〉 =∑

n

gn∑

i=1

cin∣∣uin⟩

(4.1)

en este caso la probabilidad P (ak) debe involucrar a todos los coeficientes asociados a los estados propios con valorpropio ak

P (ak) =

gk∑

i=1

∣∣cik∣∣2 =

gk∑

i=1

∣∣〈uik |ψ〉∣∣2

con lo cual estableceremos el cuarto postulado para espectros discretosCuarto postulado (caso de espectro discreto): Cuando se mide una cantidad fısica A sobre un sistema que

esta en el estado normalizado |ψ〉, la probabilidad P (ak) de obtener el autovalor ak correspondiente al observableA es

P (ak) =

gk∑

i=1

∣∣〈uik |ψ〉∣∣2 (4.2)

siendo gk el grado de degeneracion de ak y∣∣uik

⟩i = 1, ..., gk un conjunto ortonormal de vectores que forman una

base en el autosubespacio Ek generado por el valor propio ak del observable A.Naturalmente, cuando ak no es degenerado, entonces gk = 1 y la suma solo contiene un termino, siendo el

autoespacio Ek de una dimension.Notese que para que este postulado tenga sentido, es necesario que el calculo de la probabilidad no dependa de

la base especıfica∣∣uik

⟩que se use. Esto se puede ver facilmente considerando la descomposicion de E como suma

directa de los autoespacios EkE = E1 ⊕ E2 ⊕ . . .⊕ Ek ⊕ . . . (4.3)

notese que para poder hacer esta descomposicion, es necesario que el operador sea un observable (extension delteorema espectral a dimension infinita). Si retomamos la Ec. (4.1) y la reescribimos adecuadamente resulta

|ψ〉 =

g1∑

i=1

ci1∣∣ui1⟩

+

g2∑

i=1

ci2∣∣ui2⟩

+ . . .+

gk∑

i=1

cik∣∣uik⟩

+ . . .

y es claro que

|ψm〉 ≡gm∑

i=1

cim∣∣uim

⟩∈ Em (4.4)

de modo que|ψ〉 = |ψ1〉 + |ψ2〉 + . . . + |ψk〉 + . . . ; |ψm〉 ∈ Em (4.5)

Por otro lado, en virtud de la descomposicion (4.3), existe una unica expansion de |ψ〉 en vectores de cada autoespacio.En otras palabras, cada |ψm〉 en la expansion es unico. En terminos de proyectores tenemos que

|ψ〉 = (P1 + P2 + . . .+ Pk + . . .) |ψ〉 = P1 |ψ〉 + P2 |ψ〉 + . . .+ Pk |ψ〉 + . . .

Pm |ψ〉 = |ψm〉 ∈ Em

Page 163: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

4.3. ESTABLECIMIENTO DE LOS POSTULADOS 163

en notacion de Dirac el proyector Pm se escribe

Pm =

gm∑

i=1

∣∣uim⟩ ⟨uim∣∣

como se puede verificar al operar sobre |ψ〉

Pm |ψ〉 =

gm∑

i=1

∣∣uim⟩ ⟨uim∣∣ψ〉 =

gm∑

i=1

cim∣∣uim

⟩= |ψm〉 ∈ Em

la probabilidad es

P (ak) =

gk∑

i=1

∣∣cik∣∣2 =

gk∑

i=1

∣∣〈uik |ψ〉∣∣2 =

gk∑

i=1

〈ψ∣∣uik⟩〈uik |ψ〉

P (ak) = 〈ψ|Pk |ψ〉 (4.6)

y usando la idempotencia y hermiticidad de Pk se tiene que

P (ak) = 〈ψ|PkPk |ψ〉 =(〈ψ|P †

k

)(Pk |ψ〉)

P (ak) = 〈ψk|ψk〉 = ‖ψk‖2

pero dado que |ψk〉 es unico y su norma es independiente de la base en que se calcule, vemos que esta probabilidades independiente de la base como se esperaba. La Ec. (4.6) es una forma alternativa de calcular esta probabilidad.

Veamos el caso de un espectro contınuo no degenerado. La ecuacion de valores propios de A es

A |vα〉 = α |vα〉

siendo α un ındice contınuo y siendo |vα〉 ortonormal en el sentido extendido. Siendo A un observable (tambien enel sentido extendido), podemos expandir el ket |ψ〉 en terminos de los autoestados de A

|ψ〉 =

∫dα c (α) |vα〉

puesto que el conjunto de medidas accesibles de A es contınuo, debemos definir una densidad de probabilidad, talcomo lo hicimos con la funcion de onda ψ (r, t) y su transformada de Fourier ψ (p, t). En el caso de estas funcionesla probabilidad de encontrar a la partıcula en un volumen d3r o dentro de un intervalo tridimensional de momentod3p estan dados por

dP (r) = |ψ (r, t)|2 d3r = |〈r |ψ〉|2 d3r ; R |r〉 = r |r〉dP (p) =

∣∣ψ (p, t)∣∣2 d3p = |〈p |ψ〉|2 d3p ; P |p〉 = p |p〉

la extrapolacion natural para un espectro contınuo arbitrario es

dP (α) = ρ (α) dα ; ρ (α) = |〈vα |ψ〉|2

siendo dP (α) la probabilidad de obtener un valor dentro del intervalo entre α y α + dα. Naturalmente, α puedeestar indicando varios ındices contınuos.

Cuarto postulado (caso contınuo no degenerado): Cuando se mide la cantidad fısica A sobre un sistemaque esta en el estado normalizado |ψ〉, la probabilidad de obtener un valor dentro del intervalo entre α y α + dαesta dada por

dP (α) = |〈vα |ψ〉|2 dα ≡ ρ (α) dα (4.7)

siendo |vα〉 el autovector correspondiente al autovalor α del observable A asociado a la cantidad Fısica A. A lacantidad ρ (α) la llamamos la densidad de probabilidad asociada al autovalor α.

Page 164: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

164 CAPITULO 4. ENUNCIADO MATEMATICO DE LOS POSTULADOS DE LA MECANICA CUANTICA

Notese que tanto en el contınuo como en el discreto, la probabilidad de obtener cualquier valor accesible es iguala la unidad como debe ser

k

P (ak) =∑

k

〈ψ|Pk |ψ〉 = 〈ψ|∑

k

Pk |ψ〉 = 〈ψ| I |ψ〉 = 〈ψ |ψ〉 = 1

o alternativamente∑

k

P (ak) =∑

k

gk∑

i=1

∣∣cik∣∣2 = 〈ψ |ψ〉 = 1

en el caso contınuo

∫ b

adP (α) =

∫ b

a|〈vα |ψ〉|2 dα =

∫ b

a〈ψ |vα〉 〈vα |ψ〉 dα = 〈ψ|

∫ b

a|vα〉 〈vα| dα

|ψ〉 = 〈ψ| I |ψ〉 = 1

siendo [a, b] el intervalo en donde se define la variable contınua α. Por supuesto, si la funcion es de cuadradointegrable pero no esta normalizada, estas probabilidades se pueden calcular normalizando a |ψ〉

∣∣ψ′⟩ =1√

〈ψ |ψ〉|ψ〉

y para el discreto y el contınuo se obtiene

P (ak) =

gk∑

i=1

∣∣〈uik∣∣ψ′⟩∣∣2 =

1

〈ψ |ψ〉

gk∑

i=1

∣∣〈uik |ψ〉∣∣2

dP (α) = ρ (α) dα =1

〈ψ |ψ〉 |c (α)|2

es importante enfatizar que el caracter de observable de A es vital para la construccion del cuarto postulado, yaque este depende de que un estado (arbitrario) pueda expandirse en terminos de los autovectores de A.

Si el espectro contınuo es degenerado podemos escribir

A∣∣∣vβα⟩

= α∣∣∣vβα⟩

β ∈ [c, d]

y la densidad de probabilidad asociada a α se obtiene sumando sobre todos los vectores propios con valor propio α

ρ (α) =

∫ d

c

∣∣∣〈vβα |ψ〉∣∣∣2dβ ; dP (α) =

[∫ d

c

∣∣∣〈vβα |ψ〉∣∣∣2dβ

]dα

la extension a casos en donde parte del espectro es contınuo y parte discreto es relativamente simple y sera ilustradaposteriormente con ejemplos.

4.3.3. Relevancia fısica de las fases en mecanica cuantica

Consideremos dos kets |ψ〉 y |ψ′〉 relacionados en la forma

∣∣ψ′⟩ = eiθ |ψ〉

siendo θ un numero real. Es facil ver que los dos vectores poseen la misma norma y que la probabilidad predichapara una medicion arbitraria es la misma para ambos kets.

〈ψ′ ∣∣ψ′⟩ = 〈ψ| e−iθeiθ |ψ〉 = 〈ψ |ψ〉∣∣〈uik |ψ′〉

∣∣2

〈ψ′ |ψ′〉 =

∣∣eiθ〈uik |ψ〉∣∣2

〈ψ |ψ〉 =

∣∣〈uik |ψ〉∣∣2

〈ψ |ψ〉

aun mas, los kets relacionados en la forma ∣∣ψ′′⟩ = αeiθ |ψ〉

Page 165: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

4.3. ESTABLECIMIENTO DE LOS POSTULADOS 165

tambien contienen la misma informacion fısica, ya que estrictamente los observables solo se calculan con ketsnormalizados. En consecuencia, dos kets linealmente dependientes representan el mismo estado del sistema fısico.

Este resultado debe interpretarse con cuidado. Por ejemplo, sea el estado

|ψ〉 = λ1 |ψ1〉 + λ2 |ψ2〉

donde λ1 y λ2 son complejos. De lo anterior, sabemos que eiθ1 |ψ1〉 representa al mismo estado que |ψ1〉 y queeiθ2 |ψ2〉 representa al mismo estado que |ψ2〉, no obstante el estado

|ϕ〉 = λ1eiθ1 |ψ1〉 + λ2e

iθ2 |ψ2〉

no representa el mismo estado fısico que |ψ〉, ya que la diferencia de fase θ2 − θ1 dara lugar a fenomenos deinterferencia, volveremos sobre esto mas adelante. Por el momento mencionaremos que los dos estados describiranla misma fısica solo si θ1 = θ2 + 2nπ, siendo n un entero. Pues en tal caso eiθ1 = eiθ2 y resulta

|ϕ〉 = eiθ1 [λ1 |ψ1〉 + λ2 |ψ2〉] = eiθ1 |ψ〉

de modo que un factor de fase global no afecta las predicciones fısicas, pero las fases relativas de los coeficientes deuna expansion son significativas.

4.3.4. El proceso de medida y la reduccion del paquete de onda

Hasta el momento hemos hablado del valor experimental obtenido en la medicion pero no del estado del sistemauna vez que la medicion se ha efectuado. En el experimento de polarizacion de fotones vimos que justo despues deque la medida es realizada, el sistema queda preparado en el autoestado asociado al autovalor que se obtuvo en lamedicion. Vamos ahora a generalizar este proceso conocido como reduccion del paquete de onda.

Supongamos que queremos medir una cantidad fısica A asociada a un observable A en un tiempo dado t. Si |ψ〉representa el estado del sistema justo antes de la medicion, el cuarto postulado nos permite obtener la probabilidadpara cada autovalor posible en la medicion. Sin embargo, una vez que la medida es efectuada solo uno de los posiblesautovalores es obtenido. Por tanto, justo despues de la medicion, ya no podemos hablar de la probabilidad de obtenerun autovalor, pues ya sabemos cual de ellos se obtuvo, de manera que poseemos una informacion adicional y escomprensible que el estado del sistema ya no sea |ψ〉 ya que justo despues de la medicion el estado debe incorporarla informacion del autovalor especıfico que se obtuvo. Por tanto, es de esperarse que el estado |ψk〉 justo despuesde la medida sea la componente de |ψ〉 asociada con el autoestado ak. Tendremos entonces que cuando se ejecutauna medida con resultado ak, el estado tendra un cambio abrupto desde |ψ〉 (justo antes de la medicion) hasta |ψk〉pero normalizado (justo despues de la medicion).

|ψ〉 (ak)−→ 1√〈ψk |ψk〉

|ψk〉 =Pk |ψ〉√〈ψ|Pk |ψ〉

Es importante decir que la normalizacion es necesaria ya despues de la medicion |ψk〉 describe todo el estado delsistema y no solo una componente de tal estado como antes de la medicion. Recordando las expansiones (4.1, 4.5)y la expresion (4.4) para la componente |ψk〉 de |ψ〉 sobre el autoespacio Ek, se tiene

|ψ〉 =∑

n

gn∑

i=1

cin∣∣uin⟩

|ψ〉 (ak)−→ 1√∑gkm=1

∣∣cmk∣∣2

gk∑

i=1

cik∣∣uik⟩

Quinto postulado: Si la medida de la cantidad fısica A sobre el sistema en el estado |ψ〉, nos da el valor propioak, el estado del sistema inmediatamente despues de la medida esta dado por la proyeccion normalizada de |ψ〉 sobreel autoespacio Ek asociado con ak

|ψ〉 (ak)−→ Pk |ψ〉√〈ψ|Pk |ψ〉

=1√

〈ψk |ψk〉|ψk〉 =

1√∑gkm=1

∣∣cmk∣∣2

gk∑

i=1

cik∣∣uik⟩

(4.8)

Page 166: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

166 CAPITULO 4. ENUNCIADO MATEMATICO DE LOS POSTULADOS DE LA MECANICA CUANTICA

el estado del sistema inmediatamente despues de la medicion es entonces un autovector de A con autovalor ak. Perono un autovector cualquiera de Ek, sino la componente sobre este autoespacio del estado |ψ〉 que se tenıa antes dela medicion. Cuando hay ausencia de degeneracion gk = 1 y se tiene que el estado despues de la medicion es

|ψ〉 (ak)−→ 1√|ck|2

ck |uk〉 =1

|ck|(|ck| eiα

)|uk〉

|ψ〉 (ak)−→ eiα |uk〉

el cual es fısicamente identico a |uk〉. Efectivamente en este caso salvo por una constante de proporcionalidad, el au-tovector asociado a ak es unico. Este postulado nos da cuenta de los cambios abruptos en el estado, o perturbacionesfundamentales que se aprecian en diversos experimentos.

4.3.5. Evolucion fısica de los sistemas cuanticos

Ya hemos usado argumentos de plausibilidad para suponer que la ecuacion de Schrodinger es la ecuacion quegobierna la evolucion temporal de los estados correspondientes a un sistema de una partıcula cuantica no relativista.Postularemos que esta misma ecuacion gobierna la evolucion temporal de todos los sistemas cuanticos no relativistas

Sexto postulado: La evolucion temporal de un vector de estado |ψ (t)〉 esta regida por la ecuacion de Schrodinger

i~d

dt|ψ (t)〉 = H (t) |ψ (t)〉

dondeH (t) es el observable asociado con la energıa total del sistema. H (t) se conoce como el operador Hamiltonianodel sistema y se obtiene del Hamiltoniano clasico por medio de ciertas reglas de cuantizacion.

Antes de explicar las reglas de cuantizacion, discutiremos un aspecto importante de la evolucion temporal queresulta de la combinacion del quinto y sexto postulados. La ecuacion de Schrodinger me dara la evolucion del estadodel sistema desde un tiempo inicial t0 hasta un tiempo final t2, siempre que en este intervalo no se realice ningunamedida. Asumamos por el contrario, que se realiza la medida de una cantidad A asociada a un observable A, enel tiempo t1 con t0 < t1 < t2, y que el resultado es el valor propio ak. En tal caso, la ecuacion de Schrodingerme permitira calcular la evolucion del estado desde su valor en t0 dado por |ψ (t0)〉 hasta el valor que adquiere ent1 (justo antes de la medida) dado por |ψ (t1)〉, como en ese instante se realiza una medida el sistema tendra uncambio discontınuo de estado de modo que en t1 (pero justo despues de la medida) el sistema queda en el estado|ψk|−1 |ψk〉, por tanto la evolucion temporal del sistema para tiempos posteriores a t1 debera tomar este valor comocondicion inicial |ψ′ (t1)〉 = |ψk|−1 |ψk〉 para obtener su evolucion hasta cualquier valor posterior del tiempo digamost2, siempre que no se haga otra medida entre t1 y t2. En general, cada medida obligara a una “recalibracion” delas condiciones iniciales (tomando como tiempo inicial el tiempo en que se realiza cada medida), para calcular laevolucion temporal del estado.

Volvamos ahora a las condiciones de cuantizacion

4.3.6. Reglas de cuantizacion

Hemos visto que el Hamiltoniano clasico tiene asociado un operador cuyos valores propios son las energıasaccesibles del sistema. Conocemos la forma de este operador para la representacion en la base |r〉, y vemos que apartir del Hamiltoniano clasico H (r,p, t) el operador Hamiltoniano queda en la forma

p2

2m+ V (r) → P2

2m+ V (R) = − ~2

2m∇2 + V (r)

H (r,p, t) → H (R,P, t)

siendo P y R los operadores de momento y posicion definidos en la seccion 1.43.4. En lo anterior hemos usado elhecho de que en la representacion de la base |r〉, el operador P esta representado por el operador diferencial −i~∇,y el operador R esta representado por la multiplicacion por el valor de posicion R → r (ver Ecs. 1.184, 1.189).

Nuevamente, extenderemos este algoritmo a la construccion de un operador A asociado a una cantidad fısicaA que esta definida en la mecanica clasica. Consideremos una partıcula sin espın sujeta a un potencial escalar,estableceremos la siguiente regla de cuantizacion

Page 167: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

4.3. ESTABLECIMIENTO DE LOS POSTULADOS 167

A la posicion r (x, y, z) de la partıcula se le asocia el observable R (x, y, z). Al momento p (px, py, pz) de lapartıcula se le asocia el observable P (px, py, pz).

Recordemos que las componentes de los operadores R y P satisfacen las relaciones canonicas de commutacion

[Ri, Rj ] = [Pi, Pj ] = 0 ; [Ri, Pj ] = − [Pj , Ri] = i~δij (4.9)

por tanto, dado que una cantidad fısica clasica A se puede escribir en terminos de r,p, t i.e. A (r,p, t), el corre-spondiente observable A se obtendra reemplazando las variables dinamicas r,p en la expresion A (r,p, t) por losobservables R y P

A (t) = A (R,P, t)

sin embargo, este algoritmo puede generar algunas ambiguedades e inconsistencias. Asumamos por ejemplo que enla cantidad fısica A (r,p, t) aparece un termino de la forma

r · p = xpx + ypy + zpz

en mecanica clasica, el producto r · p es conmutativo, de modo que tambien podemos escribirlo como

p · r = pxx+ pyy + pzz

pero en el proceso de cuantizacion, ambos terminos conducen a operadores diferentes ya que R y P no conmutan

R ·P 6= P · R

adicionalmente, ninguno de estos operadores es Hermıtico1

(R · P)† = (XPx + Y Py + ZPz)† = P †

xX† + P †

yY† + P †

zZ† = PxX + PyY + PzZ = P ·R

la segunda de las Ecs. (1.42) nos sugiere la forma de generar un operador hermıtico con este producto

Z ≡ R ·P + (R ·P)†

2=

R · P + P ·R2

=P ·R + (P ·R)†

2⇒

Z ≡ R ·P + P · R2

esta forma ademas de ser hermıtica, es simetrica con respecto a R ·P y P ·R es decir con respecto a la cuantizacionde cualquiera de los dos operadores. De modo que debemos anadir una regla de simetrizacion de los operadores queincluya operadores mas complejos que R · P

Regla de cuantizacion y simetrizacion: El observable A que describe a una cantidad fısica definida clasica-mente por A (r,p, t), se obtiene reemplazando para A a las variables dinamicas r,p (canonicamente conjugadas)por los observables R,P, en una forma adecuadamente simetrizada.

Mas adelante veremos sin embargo, que ciertos observables A en mecanica cuantica no provienen de una cantidadfısica A definida clasicamente, sino que surgen directamente como observables cuanticos, este es el caso del espın dela partıcula.

Es importante enfatizar que las reglas de cuantizacion y las propiedades de commutacion establecidas en estaseccion solo son validas para las coordenadas cartesianas. Si bien es posible extenderlas a otros tipos de coordenadas,no adquiriran formas tan simples. Veamos algunos ejemplos del uso de las reglas de cuantizacion.

(a) El caso mas simple es el de una partıcula de masa m, bajo una interaccion que se puede describir porun potencial que solo depende de la posicion y el tiempo, el Hamiltoniano clasico en coordenadas cartesianasvendra dado por

H (r,p) =p2

2m+ V (r) ; p = m

dr

dt= mv

la regla de cuantizacion no presenta dificultades ya que no es necesaria ninguna simetrizacion puesto que R y Pnunca se acoplan, de modo que no aparecen productos de operadores que no conmutan. El Hamiltoniano comoobservable queda

H (R,P) =P2

2m+ V (R)

1Recordemos que el producto de operadores hermıticos no es en general hermıtico (ver teorema 1.34).

Page 168: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

168 CAPITULO 4. ENUNCIADO MATEMATICO DE LOS POSTULADOS DE LA MECANICA CUANTICA

en este caso particular en virtud del sexto postulado la cuacion de Schrodinger queda

i~d

dt|ψ (t)〉 =

[P2

2m+ V (R)

]|ψ (t)〉

(b) Veamos ahora el Hamiltoniano de una partıcula sometida a una interaccion electromagnetica, en tal caso elHamiltoniano clasico se escribe en la forma

H (r,p) =1

2m[p− qA (r, t)]2 + qφ (r, t) (4.10)

siendo A (r, t) , φ (r, t) los potenciales vectorial y escalar, p es el momento canonicamente conjugado a r y esta dadopor

p = mdr

dt+ qA (R, t) = mv + qA (R, t)

notese que el momento p canonicamente conjugado a r, no es el momento lineal de la partıcula, esto se debe aque para una partıcula en un campo electromagnetico, el potencial generalizado asociado depende de la velocidadgeneralizada y no solo de la posicion. De nuevo la cuantizacion es sencilla puesto que no hay operadores parasimetrizar, el Hamiltoniano como observable queda

H (R,P) =1

2m[P − qA (R, t)]2 + V (R, t) ; V (R, t) ≡ qφ (R, t)

y la ecuacion de Schrodinger resulta

i~d

dt|ψ (t)〉 =

1

2m[P − qA (R, t)]2 + V (R, t)

|ψ (t)〉

habiamos mencionado antes que a pesar de que el potencial generalizado depende de la velocidad, el Hamiltonianocontinua siendo la energıa del sistema, esto se puede ver teniendo en cuenta que el momento lineal de la partıculaque denotaremos por ~p esta relacionado con el momento conjugado a la variable r en la forma

~p = p− qA

de modo que el Hamiltoniano clasico queda

H =~p2

2m+ V (r, t)

el primer termino es la energıa cinetica y el segundo es la componente del potencial que genera trabajo. La claveesta en el hecho de que el campo magnetico (que es el que introduce el potencial dependiente de la velocidad) norealiza trabajo.

Este ejemplo tambien nos sirve para realizar una aclaracion importante, en la regla de cuantizacion es el momentop canonicamente conjugado a r, y no el momento lineal ~p el que debe reemplazarse por el operador P. Si recordamosque dos variables xi, pi canonicamente conjugadas clasicamente son tales que sus corchetes de Poisson cumplen larelacion

[xi, xj ]pois = [pi, pj]pois = 0 ; [xi, pj]pois = − [pj , xi]pois = δij (4.11)

diremos que las cantidades que clasicamente cumplen las relaciones canonicas (4.11) con corchetes de Poisson,pasaran en el proceso de cuantizacion a cumplir las relaciones canonicas (4.9) con conmutadores. Notese ademasque las propiedades fundamentales de los conmutadores (1.36-1.41) tambien las cumplen los corchetes de Poisson ycon ambas se podra generar un algebra de Lie.

Page 169: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 5

Consecuencias de los postulados sobre losobservables y sus medidas

Ya hemos estudiado los kets de posicion |r〉 y los kets de momento |p〉 ası como los operadores de posicion ymomento R y P. Por simplicidad usaremos el caso unidimensional, las ecuaciones de valores propios para X,Px son

X |x〉 = x |x〉 ; Px |px〉 = px |px〉

estos operadores tienen un espectro contınuo lo cual coincide con el hecho experimental de que todos los valoresreales son posibles para las posiciones y momentos de la partıcula. Si utilizamos el cuarto postulado podemoscalcular la probabilidad de obtener una posicion dentro del intervalo entre x y x+ dx o la probabilidad de obtenerun momento en el intervalo entre px y px + dpx.

dP (x) = |〈x |ψ〉|2 dx = |ψ (x)|2 dx ; dP (p) = |〈p |ψ〉|2 dp =∣∣ψ (p)

∣∣2 dp

de hecho estas expresiones fueron usadas para establecer el cuarto postulado. No obstante, es de particular interesla interpretacion a la luz de este postulado del caso en el que el estado del sistema esta descrito justamente por |x ′〉o |p′〉, en tal caso estas probabilidades quedan

dP (x) =∣∣〈x∣∣x′⟩∣∣2 dx =

∣∣δ(x− x′

)∣∣2 dx ; dP (p) =∣∣〈p∣∣p′⟩∣∣2 dp =

∣∣δ(p− p′

)∣∣2 dp

si integramos estas probabilidades entre x′ − ε y x′ + ε o entre p′ − ε y p′ + ε respectivamente, tenemos que laprobabilidad da la unidad sin importar el tamano de ε, si por el contrario calculamos la integral en cualquiervolumen que excluya al punto x′ o p′ esta integral da cero. Por tanto |x′〉 describe un estado en donde la partıculaesta en un punto bien definido del espacio y |p′〉 describe una partıcula con momento especıfico p′. Para el estado|x′〉 la medida de posicion es totalmente predecible y para el estado |p′〉 es totalmente predecible la medida delmomento. Notese que para el estado |x′〉 la densidad de probabilidad asociada a la posicion diverge en el punto x′ yse anula en los demas, esto esta relacionado con el hecho de que este no es un estado fısicamente realizable, ya queno es de cuadrado integrable. Similar discusion ocurre para el estado |p′〉 para el cual la densidad de probabilidadasociada al momento diverge en el punto p′ y se anula en los demas.

El estado |x′〉 se puede calcular en las bases |x〉 y |p〉

x′ (x) = 〈x∣∣x′⟩

= δ(x− x′

); x′ (p) = 〈p

∣∣x′⟩

=e−ipx

′/~

√2π~

si calculamos la probabilidad de que al medir el momento lineal de la partıcula en el estado |x ′〉 se encuentre unvalor entre p y p+ dp, obtenemos

dP (p) =∣∣x′ (p)

∣∣2 dp =dp

2π~

encontramos una probabilidad uniforme. Nuevamente, esto viola la conservacion de la probabilidad por ser un estadoimpropio. Sin embargo, es interesante ver que el colapso de la funcion de onda en un punto del espacio (es decir lacerteza total de tener una posicion descrita por el estado |x′〉) lleva a la incertidumbre total en el momento, como

169

Page 170: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

170CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

ya se discutio para el principio de incertidumbre de Heisenberg. Un analisis similar se puede hacer para el estadoimpropio |p′〉. Como X, P tiene como valores propios las posiciones y momentos de estos estados colapsados, tienesentido que la regla de cuantizacion reemplace x por X y p por P .

Vale la pena mencionar que para interpretar adecuadamente una funcion de onda, es esencial conocer la baseen la que esta escrita. A manera de ejemplo, observese que el ket |x〉 corresponde a una partıcula perfectamentelocalizada en x y con incertidumbre total del momento, en tanto que el ket |−p〉 corresponde a una partıcula conmomento perfectamente definido −p y con total incertidumbre en la posicion. Ahora veamos como se escribe |x〉 enla base |p〉 y como se escribe |−p〉 en la base |x〉

x (p) = 〈p |x〉 =e−ipx/~√

2π~; −p (x) = 〈x |−p〉 =

e−ipx/~√2π~

notese que dos estados totalmente distintos pueden ser descritos con la misma forma funcional si ambos estanescritos en bases diferentes. Una onda plana en la base |p〉 corresponde a una partıcula bien localizada, en tantoque la misma onda plana en la base |x〉 esta asociada a una partıcula con momento bien definido.

Como ya se menciono, en algunos casos la ecuacion de valores propios (establecida en el tercer postulado)conduce a un espectro discreto y en otros casos a un espectro contınuo, lo cual nos generara la discretizacion deciertas cantidades fısicas. Lo interesante es que tanto para los casos discretos como para los contınuos hay unaexcelente concordancia con los experimentos.

Los postulados cuatro y cinco plantean ciertos problemas fundamentales inherentes al proceso de medida. Porejemplo, la existencia de una perturbacion fundamental implica que el sistema no se puede considerar independien-temente al aparato de medida, en realidad el conjunto sistema fısico-aparato de medida deben considerarse como untodo. El punto es que el proceso de observacion requiere de una interaccion entre el sistema y el aparato. Ademas elaparato de medida (para un sistema fısico dado) define tanto los autoresultados como los autoestados que se puedenobtener en el proceso de medicion, como se discutio en la seccion 2.7.2, pagina 106 sobre la medicion de fotonespolarizados. Esto conlleva a preguntas delicadas sobre el proceso de medida que no discutiremos aquı.

Notese que de acuerdo con los postulados cuarto y quinto, la indeterminacion en el proceso de medida indicapor un lado la existencia de la perturbacion fundamental pero tambien la no determinacion de su comportamientoespecıfico, ya que a partir del estado antes de la medida (que se puede obtener en forma totalmente determinista), lamedida nos lleva a un cambio abrupto que no se puede determinar con certeza. Puesto que la ecuacion de Schrodingeres totalmente determinista, la generacion de la perturbacion fundamental y de la indeterminacion son inherentes alproceso de medida.

En lo que sigue consideraremos solo medidas ideales. Esto significa que se asume que el aparato de medida esperfecto, de modo que solo se generan las perturbaciones e incertidumbres inherentes a las leyes cuanticas. En larealidad, los aparatos son imperfectos y por tanto presentan una incertidumbre experimental que afecta de maneraadicional a la medida. Por ejemplo, un analizador deja pasar ondas polarizadas no solo en una direccion fija sinoen cierto intervalo alrededor de esta direccion. Sin embargo, a diferencia de las incertidumbres y perturbacionescuanticas, estas incertidumbres y perturbaciones experimentales pueden disminuırse indefinidamente (al menos enprincipio) para acercarse cada vez mas al lımite ideal.

5.1. Consideraciones estadısticas

5.1.1. Valor medio de un observable para un sistema en un estado dado

Para verificar el cuarto postulado, es necesario preparar un sistema en un estado bien definido y repetir elexperimento muchas veces, donde para cada experimento tenemos un sistema identico con el mismo estado inicial.Estrictamente, las predicciones solo se reproduciran en el lımite cuando N (numero de reproducciones del experi-mento o numero de eventos) tiende a infinito. En la practica N es finito y por tanto deben usarse tecnicas estadısticaspara interpretar los resultados.

De aquı en adelante denominaremos observable tanto a la cantidad fısica como al operador cuantico asociado.Definiremos el valor esperado (o valor medio) de un observable, como el promedio de los resultados obtenidos cuandose realiza un gran numero de mediciones N de dicho observable, para sistemas identicos que se preparan en un estadoespecıfico |ψ〉. Denotaremos al valor esperado del observable A para el sistema en el estado |ψ〉 en la forma 〈A〉 |ψ〉o cuando se sobreentienda cual es el estado, la notacion se simplificara en la forma 〈A〉.

Page 171: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.1. CONSIDERACIONES ESTADISTICAS 171

La idea es poder predecir el valor esperado con base en los postulados. Comencemos primero con el caso deespectro discreto. Si se realizan N experimentos para identicos sistemas cada uno en el estado |ψ〉 y se obtiene elautovalor an para el observable A un numero N (an) de veces, la probabilidad de obtener dicho autovalor se definecomo

P (an) ≡ lımN→∞

N (an)

N(5.1)

y es claro que ∑

n

N (an) = N

el valor medio es simplemente la suma de todas las medidas obtenidas dividida por el numero N de medidas. Porsupuesto, cuando un numero N (an) de medidas han dado el mismo resultado an, la suma con que contribuyen estoseventos se escribe simplemente como anN (an) y se suma sobre los resultados diferentes obtenidos

〈A〉|ψ〉 =1

N

n

anN (an)

a N (an) se le conoce como la frecuencia del evento. Si tomamos el lımite cuando N → ∞ y usamos la definicion(5.1) de probabilidad se tiene que

〈A〉|ψ〉 =∑

n

anP (an)

y usando la Ec. (4.2) que proviene del cuarto postulado, se obtiene

〈A〉|ψ〉 =∑

n

an

gn∑

i=1

∣∣〈ψ∣∣uin⟩∣∣2 =

n

an

gn∑

i=1

〈ψ∣∣uin⟩〈uin |ψ〉

donde∣∣uin⟩

son los vectores propios (ortonormalizados) de A asociados al valor propio an

A∣∣uin⟩

= an∣∣uin⟩

de modo que

〈A〉|ψ〉 =∑

n

gn∑

i=1

〈ψ| an∣∣uin⟩〈uin |ψ〉 =

n

gn∑

i=1

〈ψ|A∣∣uin⟩〈uin |ψ〉

〈A〉|ψ〉 = 〈ψ|A[∑

n

gn∑

i=1

∣∣uin⟩ ⟨uin∣∣]|ψ〉 = 〈ψ|A

[∑

n

Pn

]|ψ〉 = 〈ψ|AI |ψ〉

donde hemos usado la relacion de completez para el discreto Ec. (1.168), notese que el uso de la completez requiereuna vez mas que A sea un observable. Finalmente, la expresion para el valor esperado queda

〈A〉|ψ〉 = 〈ψ|A |ψ〉 (5.2)

para el caso del espectro contınuo no degenerado, el argumento es similar. Consideremos N experimentos identicosy denominemos dN (α) el numero de experimentos cuyo resultado este incluıdo entre α y α + dα, la probabilidadla definimos similarmente como

dP (α) = lımN→∞

dN (α)

N

el valor medio o esperado se escribe como

〈A〉|ψ〉 = lımN→∞

1

N

∫α dN (α) =

∫α dP (α)

usando de nuevo el cuarto postulado (para espectro contınuo), sustituımos dP (α) por su valor en la Ec. (4.7)

〈A〉|ψ〉 =

∫α |〈ψ |vα〉|2 dα =

∫α 〈ψ |vα〉 〈vα |ψ〉 dα

Page 172: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

172CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

y dado queA |vα〉 = α |vα〉

se obtiene

〈A〉|ψ〉 =

∫α |〈ψ |vα〉|2 dα =

∫〈ψ|α |vα〉 〈vα |ψ〉 dα =

∫〈ψ|A |vα〉 〈vα |ψ〉 dα

〈A〉|ψ〉 = 〈ψ|A[∫

|vα〉 〈vα| dα]|ψ〉 = 〈ψ|AI |ψ〉 = 〈ψ|A |ψ〉

donde hemos usado la relacion de completez para el contınuo Ec. (1.168). Por tanto, se obtiene de nuevo la Ec.(5.2). Es importante aclarar que 〈A〉|ψ〉 es un promedio realizado sobre un conjunto de mediciones identicas, y nodebe confundirse con los promedios temporales que se utilizan con frecuencia en fısica para estados que dependendel tiempo.

Si el ket no esta normalizado, la Ec. (5.2) se debe convertir en

〈A〉|ψ〉 =〈ψ|A |ψ〉〈ψ |ψ〉

5.1.2. Valor esperado para los observables X, P

Para realizar el calculo del valor esperado de un observable debemos recurrir a una representacion especıfica.Calculemos 〈X〉|ψ〉 usando la representacion |r〉

〈X〉|ψ〉 = 〈ψ|X |ψ〉 =

∫d3r 〈ψ |r〉 〈r|X |ψ〉 =

∫d3r ψ∗ (r) x〈r |ψ〉

〈X〉|ψ〉 =

∫d3r ψ∗ (r) x ψ (r) (5.3)

calculando 〈P 〉|ψ〉 usando la representacion |p〉 se obtiene

〈Px〉|ψ〉 =

∫d3p ψ∗ (p) px ψ (p) (5.4)

si por ejemplo se calcula 〈P 〉|ψ〉 usando la representacion |r〉 se tiene

〈Px〉|ψ〉 = 〈ψ|Px |ψ〉 =

∫d3r 〈ψ |r〉 〈r|Px |ψ〉 =

∫d3r ψ∗ (r)

[~

i∂x

]〈r |ψ〉

〈Px〉|ψ〉 =

∫d3r ψ∗ (r)

[~

i∂xψ (r)

](5.5)

5.1.3. Valor esperado para el commutador de dos observables

El facil ver que el commutador de dos operadores hermıticos es antihermıtico

[A,B]† = (AB −BA)† = BA−AB = − [A,B]

esto significa que podemos escribir el commutador entre dos operadores hermıticos como

[A,B] = iC ; C = C†

siendo C un operador hermıtico, los valores propios de iC son puramente imaginarios al igual que su valor esperadocon respecto a cualquier estado |ψ〉. Podemos escribir entonces

〈[A,B]〉 = iM

siendo M un numero real. Vemos que si A y B son observables, su commutador no es un observable ya que no eshermıtico.

Page 173: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.1. CONSIDERACIONES ESTADISTICAS 173

5.1.4. La desviacion media cuadratica

Si bien el valor medio o esperado 〈A〉 nos da el orden de magnitud de los resultados esperados al medir lacantidad fısica A, es tambien estadısticamente importante conocer la dispersion que presentan los datos cuando serealizan una gran cantidad de medidas. Asumamos que el espectro de A es contınuo. Si hacemos una grafica deρ (α) vs α, el valor esperado 〈A〉 sera la abscisa del “centro de gravedad” del area bajo la curva, notese ademas quesi esta curva no es simetrica alrededor de 〈A〉 entonces el valor αm para el cual ρ (αm) adquiere su valor maximo,no necesariamente coincide con 〈A〉. De hecho, puede existir mas de un maximo local.

La grafica de ρ (α) vs α suele ser asintotica, es decir tiende a cero para α→ ±∞, pero usualmente no es igual acero para ningun α real. Esto implica que estrictamente hay en la mayorıa de los casos una probabilidad diferentede cero de encontrar cualquier valor real de α. Sin embargo, es usual definir un ancho δA centrado en 〈A〉 en el cualeste la mayor parte del area bajo la curva, es decir existe una probabilidad cercana a la unidad de que la medidade α arroje un valor entre 〈A〉 − δA/2 y 〈A〉 + δA/2. La cantidad δA caracteriza el ancho de la curva de modoque a menor δA, tenemos que los resultados estaran mas concentrados alrededor de 〈A〉, lo cual indica una menordispersion de las medidas.

Veremos ahora como encontrar una cantidad que caracterice la dispersion de las medidas. A priori uno podrıapensar en tomar la diferencia entre cada valor αi obtenido y 〈A〉, (a esta diferencia la llamamos la desviacion deldato αi), para luego promediar estas desviaciones. Este metodo sin embargo, no es adecuado ya que el promedio delas desviaciones es siempre cero tanto en el contınuo como en el discreto

D (αi) ≡ 〈A〉 − αi ; 〈D (A)〉 =1

N

N∑

i=1

D (αi) =1

N

N∑

i=1

[〈A〉 − αi] ⇒

〈D (A)〉 =1

NN 〈A〉 − 1

N

N∑

i=1

αi = 〈A〉 − 1

N

n∑

k=1

nkαk = 〈A〉 − 〈A〉 = 0

donde el promedio de A se reescribio multiplicando αk por su frecuencia nk (numero de datos con el mismo resultado)y sumando sobre los datos diferentes (k = 1, .., n). Similarmente en el contınuo

〈D (A)〉 = 〈〈A〉 − α〉 = 〈A〉 − 1

α1 − α0

∫ α1

α0

ρ (α) α dα

〈D (A)〉 = 〈A〉 − 〈A〉 = 0

donde el ρ (α) dα es la frecuencia diferencial en el contınuo (densidad por diferencial de volumen). La anulacion de ladesviacion promedio tiene que ver con la definicion misma de valor promedio o esperado, en el cual las desviacionesnegativas se compensan con las positivas. Para evitar este fenomeno de cancelacion, podemos definir las desviacionescuadraticas en la forma

(∆A)2 ≡⟨(A− 〈A〉)2

y definimos entonces la raız de la desviacion media cuadratica como

∆A =

√⟨(A− 〈A〉)2

⟩(5.6)

y usando la expresion para el valor medio o esperado dada por la Ec. (5.2) obtenemos

∆A =

√〈ψ| (A− 〈A〉)2 |ψ〉

la desviacion media cuadratica se puede reescribir en la forma⟨(A− 〈A〉)2

⟩=

⟨[A2 − 2A 〈A〉 + 〈A〉2

]⟩=⟨A2⟩− 2 〈A〉 〈A〉 + 〈A〉2

⟨(A− 〈A〉)2

⟩=

⟨A2⟩− 〈A〉2

y la raız de la desviacion media cuadratica queda

∆A =

√〈A2〉 − 〈A〉2 (5.7)

Page 174: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

174CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

por ejemplo para el espectro contınuo de un observable A, ∆A queda en la forma

(∆A)2 =

∫ α1

α0

[α− 〈A〉]2 ρ (α) dα

(∆A)2 =

∫ α1

α0

α2ρ (α) dα−[∫ α1

α0

α ρ (α) dα

]2

5.2. Observables compatibles

Consideremos dos observables A y B que conmutan

[A,B] = 0

asumiremos por simplicidad que ambos espectros son discretos. El teorema 1.69 nos dice que existe un conjuntocompleto de vectores propios comunes a ambos observables, es usual denotar esta base como |an, bp, i〉, o aun massimple como |n, p, i〉

A |n, p, i〉 = an |n, p, i〉 ; B |n, p, i〉 = bp |n, p, i〉

donde el ındice i indica que a cada par de autovalores (an, bp) le pueden corresponder varios autovectores linealmenteindependientes. Por tanto, para cada posible valor del par (an, bp) existe por lo menos un vector |n, p, i〉 para elcual la medida de A siempre sera an y la medida de B siempre sera bp. Veamos las implicaciones fısicas sobre losobservables asociados a operadores que conmutan.

Partamos de un estado inicial normalizado dado |ψ〉 (que en principio es arbitrario). Este estado se puede escribircomo

|ψ〉 =∑

n′,u,v

cn′,u,v

∣∣n′, u, v⟩

(5.8)

asumamos que primero hacemos una medida del observable A y se obtiene an y que inmediatamente despues (demodo que en el tiempo transcurrido se pueda despreciar la evolucion temporal del estado) realizamos una medidade B de la cual obtenemos el valor bp. Calculemos la probabilidad P (an, bp) de obtener an en la primera medida ybp en la segunda. Usando el cuarto postulado Ec. (4.2) y la Ec. (5.8), la probabilidad P (an) de obtener la primeramedida es

P (an) =∑

p′,i′

∣∣⟨n, p′, i′∣∣ψ〉∣∣2 =

p′,i′

∣∣∣∣∣∣⟨n, p′, i′

∣∣∑

n′,u,v

cn′,u,v

∣∣n′, u, v⟩∣∣∣∣∣∣

2

=∑

p′,i′

∣∣∣∣∣∣

n′,u,v

cn′,u,v

⟨n, p′, i′

∣∣n′, u, v〉

∣∣∣∣∣∣

2

=∑

p′,i′

∣∣∣∣∣∣

n′,u,v

cn′,u,vδn,n′δp′uδi′v

∣∣∣∣∣∣

2

P (an) =∑

p′,i′

∣∣cn,p′,i′∣∣2 (5.9)

pero segun el quinto postulado Ec. (4.8), el sistema luego de esta primera medicion queda preparado en el estadonormalizado |ψn〉 definido por

|ψn〉 =1√∑

k,m |cn,k,m|2∑

p′,i′

cn,p′,i′∣∣n, p′, i′

⟩(5.10)

este sera entonces el estado en el que estara el sistema justo antes de la medicion de B. Recurriendo de nuevo alcuarto postulado Ec. (4.2) la probabilidad de que habiendo obtenido en la primera medicion el valor an se obtenga

Page 175: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.2. OBSERVABLES COMPATIBLES 175

en la segunda medicion el valor bp estara dada por

Pan (bp) =∑

n′,i

∣∣⟨n′, p, i∣∣ψn〉

∣∣2 =∑

n′,i

∣∣∣∣∣∣⟨n′, p, i

∣∣ 1√∑

k,m |cn,k,m|2∑

p′,i′

cn,p′,i′∣∣n, p′, i′

⟩∣∣∣∣∣∣

2

=

∑n′,i

∣∣∣∑

p′,i′ cn,p′,i′〈n′, p, i |n, p′, i′〉∣∣∣2

∑k,m |cn,k,m|2

=

∑n′,i

∣∣∣∑

p′,i′ cn,p′,i′δn′nδpp′δii′∣∣∣2

∑k,m |cn,k,m|2

Pan (bp) =

∑n′,i |cn,p,iδn′n|2∑k,m |cn,k,m|2

Pan (bp) =

∑i |cn,p,i|2∑

k,m |cn,k,m|2(5.11)

ahora bien, la probabilidad P (an, bp) que buscamos corresponde a una composicion de eventos: para que estosdos eventos de hecho ocurran, debemos primero encontrar an para lo cual hay una probabilidad P (an) y entonceshabiendo cumplido la primera condicion, debemos encontrar bp para lo cual hay una probabilidad Pan (bp) por lotanto

P (an, bp) = P (an) × Pan (bp) (5.12)

sustituyendo (5.9) y (5.11) en (5.12) se obtiene

P (an, bp) =

p′,i′

∣∣cn,p′,i′∣∣2[ ∑

i |cn,p,i|2∑k,m |cn,k,m|2

]

P (an, bp) =∑

i

|cn,p,i|2 (5.13)

y el estado del sistema despues de la segunda medicion de acuerdo con el quinto postulado Ec. (4.8), sera

|ψn,p〉 =Pp |ψn〉√

〈ψn|Pp |ψn〉(5.14)

evaluemos el numerador y el denominador de esta expresion, usando la Ec. (5.10).

Pp |ψn〉 =

l,v

|l, p, v〉 〈l, p, v|

1√∑

k,m |cn,k,m|2∑

p′,i′

cn,p′,i′∣∣n, p′, i′

=

[∑l,v

∑p′,i′ cn,p′,i′ |l, p, v〉 〈l, p, v| n, p′, i′〉

]

√∑k,m |cn,k,m|2

=

[∑l,v

∑p′,i′ cn,p′,i′ |l, p, v〉 δlnδpp′δvi′

]

√∑k,m |cn,k,m|2

Pp |ψn〉 =

∑i′ cn,p,i′ |n, p, i′〉√∑

k,m |cn,k,m|2(5.15)

〈ψn|Pp |ψn〉 =

p′,r

c∗n,p′,r⟨n, p′, r

∣∣∑

i′ cn,p,i′ |n, p, i′〉∑k′,m′

∣∣cn,k′,m′

∣∣2 =

∑p′,r

∑i′ c

∗n,p′,rcn,p,i′ 〈n, p′, r|n, p, i′〉∑k′,m′

∣∣cn,k′,m′

∣∣2

〈ψn|Pp |ψn〉 =

∑p′,r

∑i′ c

∗n,p′,rcn,p,i′δnnδp′pδri′∑

k′,m′

∣∣cn,k′,m′

∣∣2 =

∑i′ c

∗n,p,i′cn,p,i′∑

k′,m′

∣∣cn,k′,m′

∣∣2 =

∑i′

∣∣cn,p,i′∣∣2

∑k′,m′

∣∣cn,k′,m′

∣∣2 ⇒

√〈ψn|Pp |ψn〉 =

√∑i′

∣∣cn,p,i′∣∣2

√∑k′,m′

∣∣cn,k′,m′

∣∣2(5.16)

Page 176: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

176CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

Reemplazando (5.15, 5.16) en (5.14), el estado justo despues de la segunda medida queda finalmente

|ψn,p〉 =1√∑

k |cn,p,k|2∑

i

cn,p,i |n, p, i〉 (5.17)

es facil verificar que |ψn,p〉 es un estado propio de A y B con valores propios an y bp

A |ψn,p〉 =

∑i cn,p,i [A |n, p, i〉]√∑

k |cn,p,k|2=

∑i cn,p,i [an |n, p, i〉]√∑

k |cn,p,k|2= an

∑i cn,p,i [|n, p, i〉]√∑

k |cn,p,k|2

A |ψn,p〉 = an |ψn,p〉

y similarmente para B

B |ψn,p〉 = bp |ψn,p〉Por tanto, si midieramos de nuevo A (nuevamente los tiempos deben ser cortos para que el estado no haya evolu-cionado significativamente a partir del estado descrito por la Ec. 5.17) la probabilidad de obtener el resultado an es1 y no se altera el estado del sistema. Igualmente si medimos B con el sistema en el estado |ψn,p〉 la probabilidadde obtener bp es 1 y el estado permanece inalterado despues de la medicion.

Volvamos ahora al estado inicial |ψ〉 del sistema y hagamos las mediciones en el orden contrario (primero B yluego A). Evaluaremos la probabilidad de obtener el valor bp en la primera medida y el valor an en la segunda medidaque denotamos como P (bp, an), siguiendo los mismos razonamientos del caso anterior vemos que la probabilidad deobtener bp en la primera medida es

P (bp) =∑

n′,i′

∣∣cn′,p,i′∣∣2

y si el valor bp es obtenido, el estado despues de la medicion sera

|ϕp〉 =1√∑

uv |cu,p,v|2∑

n′,i′

cn′,p,i′∣∣n′, p, i′

y la probabilidad de que partiendo del estado |ϕp〉 se obtenga el valor an del observable A en la segunda medida es

Pbp (an) =1∑

uv |cu,p,v|2∑

i

|cn,p,i|2

adicionalmente la probabilidad de que ocurran ambos eventos en este orden sera

P (bp, an) = P (bp) × Pbp (an)

P (bp, an) =∑

i

|cn,p,i|2 (5.18)

si de hecho encontramos bp en la primera medida y an en la segunda, el estado del sistema despues de la segundamedida sera

|ϕp,n〉 =1√∑

k |cn,p,k|2∑

i

cn,p,i |n, p, i〉 (5.19)

comparando la Ec. (5.13) con la Ec. (5.18) vemos que la probabilidad de obtener un par especıfico de valores (an, bp)de los observables A y B respectivamente, es igual sin importar el orden en que se midan (siempre teniendo en cuentaque la distancia temporal entre dos medidas debe ser pequena para evitar la evolucion del sistema). Adicionalmente,al comparar (5.17) con (5.19) vemos que el estado despues de la segunda medida tambien es el mismo en amboscasos. Finalmente, una medida posterior de A o B nos dara con certeza los valores an o bp.

Notese que estos hechos dependen de que podamos encontrar un conjunto completo comun de vectores propiospara ambos observables, para lo cual es necesario y suficiente que ambos observables conmuten (teorema 1.69). Poresta razon a los observables conmutantes tambien se les denomina observables compatibles.

Page 177: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.3. OBSERVABLES NO COMPATIBLES E INCERTIDUMBRES 177

Podemos resumir las propiedades de los observables compatibles de la siguiente manera: Cuando dos observablesA y B son compatibles, si medimos primero A entonces la medida posterior de B no causa ninguna perdida deinformacion previamente obtenida en la medida de A y viceversa. Por el contrario, la medida de B se “adiciona”como informacion a lo que se obtiene en la primera medida. Ademas la realizacion de las dos medidas ejecutadasen cualquier orden arroja la misma distribucion de probabilidad para cada par accesible de valores propios. Ahorasupongamos que se realizan dos experimentos ambos con el mismo estado inicial, midiendo en el primero la secuenciaA ⇒ B y en el segundo la secuencia B ⇒ A, si en ambos experimentos se obtienen los mismos valores propios,entonces obtendremos el mismo estado final.

Vale decir que si en un experimento particular en el orden A⇒ B se obtuvo (an, bp), no quiere decir que en otroexperimento especıfico con las mismas condiciones iniciales y en el orden B ⇒ A se obtenga (bp, an), ya que lo quese igualan son las probabilidades1. Adicionalmente, tampoco tenemos que llegar al mismo estado final en ambosexperimentos, solo tenemos garantizado que si en ambos experimentos obtenemos los mismos valores propios, elestado final sera el mismo.

Ahora bien, puesto que no es relevante el orden en que se ejecutan las medidas de A y B podemos considerarla medicion simultanea de ambos observables. Notese que para observables compatibles se puede hacer una especiede “extension” de los postulados cuarto y quinto como se puede apreciar de las Ecs. (5.13, 5.18) y de las Ecs. (5.17,5.19). De estas ecuaciones se observa que podemos considerar a la dupla (an, bp) como un solo resultado quecorresponde a la superposicion de vectores ortonormales |n, p, i〉 donde i indica la degeneracion asociada al “unicovalor propio” cnp ≡ (an, bp).

5.3. Observables no compatibles e incertidumbres

Segun el teorema 1.69 si A y B no conmutan, no existe un conjunto completo de vectores propios comunes aambos observables2. Por tanto, los argumentos anteriores no seran validos. Esto se puede ilustrar de manera sencillasi reemplazamos el espacio de Hilbert E por el espacio vectorial real de dos dimensiones. Supongamos que |u1〉 , |u2〉son autovectores ortonormales del observable A (que definen a los ejes X,Y ) con autovalores a1 y a2. Sean |v1〉 , |v2〉autovectores ortonormales de B (que definen ejes X ′Y ′ en general rotados con respecto a XY ), con valores propiosb1 y b2. Si definimos θ el angulo de rotacion (en direccion antihoraria) de los ejes X ′Y ′ con respecto a los ejes XYtenemos que las bases correspondientes a los autovectores de A y B estan relacionadas por

|v1〉 = cos θ |u1〉 + sin θ |u2〉|v2〉 = cos

(θ +

π

2

)|u1〉 + sin

(θ +

π

2

)|u2〉 = − sin θ |u1〉 + cos θ |u2〉

en resumen estas relaciones y sus inversas quedan

|v1〉 = cos θ |u1〉 + sin θ |u2〉 ; |v2〉 = − sin θ |u1〉 + cos θ |u2〉|u1〉 = cos θ |v1〉 − sin θ |v2〉 ; |u2〉 = sin θ |v1〉 + cos θ |v2〉

ahora pensemos que la condicion inicial esta dada por un vector unitario |ψ〉 en direccion arbitraria que hace unangulo ϕ con |u1〉. En ambas bases este vector se escribe

|ψ〉 = cosϕ |u1〉 + sinϕ |u2〉 ; |ψ〉 = cos (ϕ− θ) |v1〉 + sin (ϕ− θ) |v2〉Primero mediremos A y asumamos que encontramos el valor a1, el sistema quedara preparado en el estado |u1〉. Siluego medimos B y encontramos por ejemplo b2 el estado final del sistema sera |v2〉.

|ψ〉 (a1)=⇒ |u1〉

(b2)=⇒ |v2〉 (5.20)

si por otro lado, realizamos las medidas en el orden opuesto y encontramos los mismos valores propios anteriorespero en la secuencia b2 ⇒ a1 el esquema sera

|ψ〉 (b2)=⇒ |v2〉

(a1)=⇒ |u1〉 (5.21)

1Es decir el patron de distribucion de valores propios en ambos casos debe ser el mismo cuando se hace una gran cantidad deexperimentos de cada tipo.

2Esto no significa que no puedan existir vectores propios comunes a ambos. Pero si estos existen, no seran suficientes para conformaruna base.

Page 178: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

178CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

el estado final del sistema no es el mismo en ambos casos. Ahora, las probabilidades en ambos casos serıan

P (a1, b2) = P (a1) × Pa1 (b2) = |〈ψ| u1〉|2 × |〈u1| v2〉|2

P (b2, a1) = P (b2) × Pb2 (a1) = |〈ψ| v2〉|2 × |〈v2| u1〉|2

cada uno de estos productos internos da

〈ψ| u1〉 = cosϕ ; 〈ψ| v2〉 = sin (ϕ− θ) ; 〈u1| v2〉 = 〈v2| u1〉 = − sin θ

por lo tantoP (a1, b2) = cos2 ϕ sin2 θ ; P (b2, a1) = sin2 (ϕ− θ) sin2 θ

con lo cual se observa queP (b2, a1) 6= P (a1, b2)

esto significa entonces que dos observables no compatibles no se pueden medir simultaneamente3. Se puede ver delas Ecs. (5.20, 5.21) que la segunda medida genera la perdida de la informacion suministrada por la primera. Si porejemplo despues de la secuencia A ⇒ B representada por (5.20) medimos de nuevo A, no podemos tener certezadel resultado ya que |v2〉 no es autovector de A. Toda la informacion que se gano en la primera medida de A se haperdido.

5.4. La desviacion media cuadratica y el principio de incertidumbre paraobservables arbitrarios (opcional)

Supongamos que tenemos dos observables A y B arbitrarios, siguiendo los argumentos de la seccion 5.1.3,definiremos el valor esperado de su conmutador en la forma

iM ≡ 〈[A,B]〉 (5.22)

donde M es un numero real. Asumamos que el sistema fısico esta en el estado |ψ〉. Con base en dicho estado,construiremos un ket |ϕ〉 y su bra asociado 〈ϕ| en la forma

|ϕ〉 = (A+ iλB) |ψ〉 ; 〈ϕ| = 〈ψ| (A− iλB) (5.23)

siendo λ una variable real arbitraria. Estudiaremos las predicciones para el producto de las incertidumbres ∆A, ∆Bdonde las incertidumbres se definiran a traves de la raız de la desviacion media cuadratica de cada observable.

La norma al cuadrado de |ϕ〉 se escribe como

〈ϕ|ϕ〉 = 〈ψ| (A− iλB) (A+ iλB) |ψ〉 = 〈ψ|A2 + iλAB − iλBA+ λ2B2 |ψ〉〈ϕ|ϕ〉 =

⟨A2⟩

+ iλ 〈AB −BA〉 + λ2⟨B2⟩

=⟨A2⟩

+ iλ 〈[A,B]〉 + λ2⟨B2⟩

〈ϕ|ϕ〉 = λ2⟨B2⟩− λM +

⟨A2⟩≥ 0 (5.24)

donde hemos usado la Ec. (5.22). Ahora bien, por definicion la norma al cuadrado de |ϕ〉 es no negativa para todovalor de λ. Por tanto, el polinomio cuadratico en λ definido por la ecuacion (5.24) debe ser no negativo para todoλ, esto solo es posible si tal polinomio no posee raıces reales en λ o a lo mas las raıces reales deben ser degeneradasy corresponder a un mınimo local (en cuyo caso la norma de |ϕ〉 es cero para un valor dado de λ, y positiva paralos otros valores). Esto implica que como ecuacion cuadratica para λ, el discriminante deber ser negativo o cero

M2 − 4⟨A2⟩ ⟨B2⟩

≤ 0 ⇒ (5.25)

⟨A2⟩ ⟨B2⟩

≥ M2

4(5.26)

3Supongamos que medimos un observable A en el tiempo t y otro observable B en el tiempo t+ ∆t. La medicion simultanea se puededefinir consistentemente solo si los “lımites laterales” ∆t → 0+ (donde se mide en el orden A ⇒ B) y ∆t → 0− (donde se mide en elorden B ⇒ A) conducen a las mismas predicciones en terminos de distribucion de probabilidad, y estados. Por esta razon solo se puededefinir adecuadamente la medicion simultanea de observables compatibles.

Page 179: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.4. LA DESVIACION MEDIA CUADRATICA Y EL PRINCIPIO DE INCERTIDUMBRE PARA OBSERVABLES ARBITRARIOS (OPCIONAL)179

recordando que |ψ〉 describe el estado del sistema, introducimos dos nuevos observables A ′, B′ definidos por

A′ = A− 〈A〉 I = A− 〈ψ|A |ψ〉 (5.27)

B′ = B − 〈B〉 I = B − 〈ψ|B |ψ〉 (5.28)

donde 〈A〉 y 〈B〉 son numeros reales e I es el operador identidad. Es claro que las relaciones de conmutacion deA′, B′ coinciden con las de A y B [

A′, B′] = [A,B] = iM (5.29)

con lo cual el resultado (5.26) tambien es valido para A′ y B′

⟨A′2⟩ ⟨B′2⟩ ≥ M2

4⇒

⟨(A− 〈A〉)2

⟩⟨(B − 〈B〉)2

⟩≥ M2

4

y teniendo en cuenta la definicion de la raız de la deviacion media cuadratica Ec. (5.6), tenemos que

(∆A)2 (∆B)2 ≥ M2

4⇒

(∆A) · (∆B) ≥ |M |2

y recordando la definicion (5.22) resulta

(∆A) · (∆B) ≥ |〈[A,B]〉|2

(5.30)

Si definimos la incertidumbre en los observables como la raız de la desviacion media cuadratica de su distribucion,esto se puede considerar como una extension del principio de incertidumbre. Notese que en este caso el lımite inferioresta muy bien definido, precisamente porque hemos definido de manera muy clara el ancho de la distribucion pormedio de la raız de la desviacion media cuadratica.

Vale decir ademas que solo tendremos un lımite inferior no nulo, cuando los observables NO son compatibles (noconmutantes). Para los observables compatibles no hay un principio de incertidumbre, lo que permite sin ambiguedadsu medicion simultanea y la no destruccion de la informacion por efecto de mediciones adicionales.

Un caso especial muy importante es el de dos variable conjugadas. Se dice que dos observables Q, P sonconjugados si

[Q,P ] = i~

esta es una extrapolacion natural del concepto de variables canonicamente conjugadas en mecanica clasica, quecumplen propiedades similares pero con los corchetes de Poisson en lugar de los conmutadores. Para observablesconjugados, la expresion (5.30) queda en la forma

∆Q · ∆P ≥ ~/2

A su vez, un caso especial de variables conjugadas son los pares de posicion y momento (X,Px), (Y, Py) y (Z,Pz).Se obtiene entonces

∆X · ∆Px ≥ ~/2 ; ∆Y · ∆Py ≥ ~/2 ; ∆Z · ∆Pz ≥ ~/2

que son las relaciones de incertidumbre de Heisenberg (2.31), pero con lımites inferiores precisos, lo cual surge dehaber definido de manera precisa las incertidumbres.

5.4.1. Paquetes de mınima incertidumbre

Es natural preguntarse por las condiciones que se requieren para obtener un paquete de mınima incertidumbre.Es decir, bajo que condiciones obtenemos la igualdad en la Ec. (5.30). Esto implica imponer la igualdad en lasdesigualdades (5.24-5.30). En particular, esto implica que el polinomio cuadratico en λ definido por la ecuacion

Page 180: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

180CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

(5.24) sea nulo y corresponda a un mınimo local para algun valor λ0 (raız real degenerada), esto conlleva a lanulidad de la norma de |ϕ〉. Lo anterior se obtiene con la anulacion del discriminante Ec. (5.25)

⟨A2⟩ ⟨B2⟩

=M2

4⇒

⟨A2⟩

=M2

4 〈B2〉 (5.31)

que a su vez nos lleva a la solucion λ ≡ λ0 para la cuadratica (5.24)

λ0 =M

2 〈B2〉 =2⟨A2⟩

M(5.32)

donde hemos usado la Ec. (5.35). Redefiniendo los observables a traves de las Ecs. (5.27, 5.28) y teniendo en cuentala invarianza del conmutador Ec. (5.29) vemos que los resultados obtenidos para A y B son tambien validos paraA′ y B′ (ya que todos ellos dependen solo de la relacion de conmutacion Ec. 5.22). Por tanto para el ket

∣∣ϕ′⟩ =(A′ + iλB′) |ψ〉 ;

⟨ϕ′∣∣ = 〈ψ|

(A′ − iλB′)

podemos hacer el mismo procedimiento que se realizo para el ket |ϕ〉 de la Ec. (5.23), y llegar a que la norma de|ϕ′〉 es nula cuando λ = λ0. Pero la norma es cero si y solo si el ket es nulo, por lo tanto

(A′ + iλB′) |ψ〉 = 0 ⇒

[A− 〈A〉 + iλ0 (B − 〈B〉)] |ψ〉 = 0 (5.33)

ası mismo las Ecs. (5.31) son aplicables tambien para A′, B′ con lo cual

⟨A′2⟩ =

M2

4 〈B′2〉 ; λ0 =M

2 〈B′2〉 =2⟨A′2⟩

M(5.34)

y teniendo en cuenta que

⟨A′2⟩ ≡

⟨(A− 〈A〉)2

⟩≡ (∆A)2 ;

⟨B′2⟩ ≡

⟨(B − 〈B〉)2

⟩≡ (∆B)2

las Ecs. (5.34) quedan finalmente

(∆A)2 =M2

4 (∆B)2; λ0 =

M

2 (∆B)2=

2 (∆A)2

M(5.35)

la Ec. (5.33) junto con las ligaduras (5.35) nos dictaminan la condicion para obtener paquetes de mınima incer-tidumbre. Su solucion explıcita debe realizarse en una base especıfica y depende de la naturaleza de los operadoresA y B.

Un caso particular de interes surge para variables conjugadas para lo cual definimos A ≡ Q, B ≡ P y M ≡ ~.La Ec. (5.33) y las ligaduras (5.35) quedan en la forma

[Q− 〈Q〉 + iλ0 (P − 〈P 〉)] |ψ〉 = 0 ; (∆Q)2 =~2

4 (∆P )2; λ0 =

~

2 (∆P )2=

2 (∆Q)2

~(5.36)

usando la representacion |q〉 y el hecho de que en esta representacion P actua como (~/i)d/dq (ver Ec. 1.205, Pag.93) se obtiene4

〈q| [Q− 〈Q〉 + iλ0 (P − 〈P 〉)] |ψ〉 = 0 ⇒[q − 〈Q〉 + iλ0

(~

i

d

dq− 〈P 〉

)]〈q |ψ〉 = 0 ⇒

[q + ~λ0

d

dq− 〈Q〉 − iλ0 〈P 〉

]ψ (q) = 0 (5.37)

4Debe tenerse en cuenta que la Ec. (1.205) fue demostrada para cualquier par de observables conjugados y no solo para posiciones ymomentos.

Page 181: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.5. PREPARACION DE UN ESTADO 181

para resolver la ecuacion diferencial (5.37) es conveniente introducir la funcion h (q) definida por

ψ (q) = ei〈P 〉q/~h (q − 〈Q〉) (5.38)

insertando la Ec. (5.38) en la Ec. (5.37) resulta[q + ~λ0

d

dq− 〈Q〉 − iλ0 〈P 〉

] [ei〈P 〉q/~h (q − 〈Q〉)

]= 0

[q − 〈Q〉 − iλ0 〈P 〉] ei〈P 〉q/~h (q − 〈Q〉) + ~λ0d

dq

[ei〈P 〉q/~h (q − 〈Q〉)

]= 0

[q − 〈Q〉 − iλ0 〈P 〉] ei〈P 〉q/~h (q − 〈Q〉) + ~λ0i 〈P 〉

~h (q − 〈Q〉) ei〈P 〉q/~ + ~λ0e

i〈P 〉q/~ ddqh (q − 〈Q〉) = 0

[q − 〈Q〉] h (q − 〈Q〉) + ~λ0d

dqh (q − 〈Q〉) = 0

sustituyendoq′ = q − 〈Q〉 (5.39)

queda [q′ + ~λ0

d

dq′

]h(q′)

= 0 (5.40)

cuya solucion es

h(q′)

= Ce− q′2

2λ0~ (5.41)

siendo C una constante de normalizacion que elegiremos como positiva. Reemplazando las Ecs. (5.36, 5.39) en lasolucion (5.41), tenemos

h (q − 〈Q〉) = Ce− (q−〈Q〉)2

4(∆Q)2 = Ce−[

(q−〈Q〉)2(∆Q)

]2(5.42)

finalmente reemplazando (5.42) en (5.38) y normalizando (con constante positiva) resulta

ψ (q) =1

4

√2π (∆Q)2

ei〈P 〉q/~e−[

(q−〈Q〉)2(∆Q)

]2(5.43)

para encontrar el paquete de onda recıproco, es decir en la base |p〉, podemos proceder de manera analoga aldesarrollo anterior, o haciendo la transformada de Fourier de la Ec. (5.43). En tal caso se encuentra la funcion deonda recıproca ψ (p) definida por

ψ (p) =1

4

√2π (∆P )2

e−i~〈Q〉pe

−[

(q−〈P 〉)2(∆P )

]2(5.44)

En la Sec. 2.12.3, pag. 120, habıamos demostrado que los paquetes gaussianos son de mınima incertidumbre. Enla presente seccion hemos demostrado el recıproco: para dos observables conjugados Q y P , hemos demostrado quesi ∆Q · ∆P es exactamente ~/2, la funcion de onda asociada con este estado en la representacion |q〉 es un paquetegaussiano ası como la representacion de la funcion de onda en la base |p〉.

5.5. Preparacion de un estado

Consideremos un sistema fısico en el estado |ψ〉 y midamos el observable A, asumiremos que todos los observablestienen espectro discreto. Si el valor obtenido an es no degenerado el autovector normalizado |un〉 en que se preparael sistema es fısicamente unico, por tanto conocemos perfectamente el estado despues de la medida, y ademas dichoestado es independiente de |ψ〉 (el estado justo antes de la medida).

Sin embargo, si el autovalor an es degenerado, el estado inmediatamente despues de la medida sera

∣∣ψ′n

⟩=

Pn |ψ〉〈ψ|Pn |ψ〉

=1√∑gn

k=1 |ckn|2

gn∑

i=1

cin∣∣uin⟩

Page 182: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

182CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

tanto los valores absolutos de los coeficientes cin como sus fases son relevantes. Y puesto que este estado es laproyeccion |ψ′

n〉 (normalizada) del vector |ψ〉 sobre el autosubespacio En tendremos que el autoestado final dependede |ψ〉 y por lo tanto tambien los coeficientes cin siempre que En sea de mas de una dimension (si En es de una soladimension, solo hay un vector normalizado fısicamente relevante).

Ahora bien, dado que vimos que la medicion de otro observable B compatible con A adiciona informacion sobreel estado, y se puede medir simultaneamente con A, vemos que si el resultado (an, bp) de las dos medidas correspondea un unico autovector |an, bp〉 ≡ |n, p〉 comun a A y B no tendremos suma sobre i en (5.17) y resulta

|ψnp〉 =cnp|cnp|

|n, p〉 = eiθ |n, p〉

que es fısicamente equivalente a |n, p〉. En otras palabras, el autoespacio Enp de autovectores comunes a A y B convalores propios an y bp es de una dimension y por tanto define fısicamente un unico vector normalizado. Por tanto,la especificacion de estos dos valores determina el estado final de manera unica e independiente de |ψ〉.

Podrıa ocurrir sin embargo que existan varios vectores |n, p, i〉 linealmente independientes que conduzcan almismo par (an, bp) de valores propios de A y B, es decir el espacio Enp no es unidimensional y para determinar laproyeccion de |ψ〉 sobre Enp se requiere conocer a |ψ〉. En este caso podemos ganar mas informacion introduciendoun tercer observable C compatible con los otros dos y medir su valor propio cq. El proceso debe continuar hasta quese remueva completamente la degeneracion es decir cuando el autoespacio Enpq... sea unidimensional, en cuyo casoel estado |npq . . .〉 es fısicamente unico.

Por otro lado, es posible que la medicion de cierto conjunto de autovalores especıficos sea suficiente para de-terminar el estado de manera unica, pero cuando el mismo sistema me arroja otros valores propios las medidaspodrıan resultar insuficientes. Por ejemplo, si medimos el observable A y se obtiene el valor no degenerado a1, elestado estara totalmente determinado. Pero si la medida nos arroja el valor a2 (degenerado), necesitaremos medirotro observable compatible para determinar el estado.

La idea por supuesto es determinar un conjunto de observables A1, A2, . . . , Am; que determine de manera unicael estado despues de la medida (independiente de |ψ〉) sin importar los valores experimentales obtenidos. Para elloes necesario que todos los autoespacios de la forma En1,n2,...,nm sean unidimensionales. En otras palabras, el conjuntocompleto de autovectores |n1, n2, . . . , nm〉 comun a los observables A1, A2, . . . , Am no debe presentar degeneracionpara ningun conjunto posible de medidas (an1 , . . . , anm). Esto indica entonces que el conjunto A1, A2, . . . , Amforma un C.S.C.O. (ver seccion 1.23). Adicionalmente, es natural pensar que el conjunto A1, A2, . . . , Am seaminimal en el sentido de que al remover un observable del conjunto el sistema ya no sea un C.S.C.O. Usualmentese asume que un C.S.C.O. dado es minimal a menos que se indique lo contrario.

Los metodos para preparar un sistema cuantico en un estado bien definido son similares en principio a losque se usan para polarizar luz. Cuando se coloca un polarizador en el camino de un haz de luz, la luz que saleesta polarizada en una direccion especıfica caracterıstica del polarizador, e independiente del estado de polarizacionde la luz incidente. Similarmente se pueden construır dispositivos para preparar un sistema cuantico de manera quesolo permitan el paso de un estado correspondiente a un autovalor especıfico. Si queremos preparar completamenteel estado, sera necesario usar m dispositivos que midan a los observables A1, .., Am que solo permitan el paso de unconjunto especıfico de autovalores (an1 , ..., anm).

Es claro que puede haber infinidad de C.S.C.O, si cambiamos el conjunto completo de observables compatibles,obtendremos otros estados del sistema. Para entender mejor esto, recordemos que los autoestados estan definidosno solo por el sistema a estudiar sino tambien por los aparatos de medicion (ver seccion 2.7.2, pag 106).

5.6. Propiedades adicionales de la ecuacion de Schrodinger

Hemos establecido formalmente en el sexto postulado, que la ecuacion de Schrodinger es la ecuacion de evolucionde los estados de sistemas cuanticos no relativistas. Veremos algunas propiedades adicionales de esta ecuacion (verseccion 3.3)

5.6.1. Aspectos adicionales sobre la conservacion de la probabilidad (opcional)

Hemos visto que la norma de los estados permanece invariante en el tiempo cuando la ecuacion de Schrodingeres la ecuacion de evolucion, lo cual es esencial para la conservacion de la probabilidad. Adicionalmente para una

Page 183: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.6. PROPIEDADES ADICIONALES DE LA ECUACION DE SCHRODINGER 183

partıcula sometida a un potencial que solo depende de la posicion V (r, t) cuyo Hamiltoniano es

H =P2

2m+ V (R, t)

podemos encontrar una ecuacion de continuidad que nos expresa la conservacion local de la probabilidad en la forma

∂ρ

∂t+ ∇ · J = 0 ; ρ ≡ ψψ∗ = |ψ (r, t)|2 (5.45)

J ≡ ~

2mi[ψ∗∇ψ − ψ∇ψ∗] =

1

mRe

[ψ∗(

~

i∇ψ)]

(5.46)

siendo ρ, J la densidad y corriente de probabilidad respectivamente. Escribamos J en la forma

J ≡ 1

2m

[ψ∗(

~

i∇)ψ − ψ

(~

i∇)ψ∗]

=1

2m

[ψ∗(

~

i∇)ψ − ψ

(−~

i∇ψ)∗]

=1

2m

[〈ψ| r〉

(~

i∇)〈r|ψ〉 + 〈r|ψ〉

(~

i∇〈r|ψ〉

)∗]

J =1

2m[〈ψ| r〉 〈r|P |ψ〉 + 〈r|ψ〉 〈r|P |ψ〉∗] =

1

2m[〈ψ| r〉 〈r|P |ψ〉 + 〈ψ|P |r〉 〈r|ψ〉]

J =1

2m〈ψ| [|r〉 〈r|P + P |r〉 〈r|] |ψ〉

donde hemos usado la Ec. (1.189). Finalmente

J = [〈ψ| K (r) |ψ〉] ; K (r) ≡ 1

2

|r〉 〈r| P

m+

P

m|r〉 〈r|

(5.47)

para la densidad de corriente es mas facil ver que

ρ = [〈ψ| [|r〉 〈r|] |ψ〉] = 〈ψ| % (r) |ψ〉 ; % (r) ≡ |r〉 〈r| (5.48)

si comparamos las Ecs. (5.47, 5.48) con la Ec. (5.2), vemos que la densidad y la corriente de probabilidad se puedenver como el valor esperado de los operadores K (r) y % (r) respectivamente. Ahora bien, en coordenadas cartesianaslos momentos canonicos son los momentos lineales (cuando el potencial no depende de la velocidad). Por tanto,P/m se puede considerar el “operador velocidad” V. En consecuencia, el “operador densidad de corriente” K (r)esta relacionado con el operador densidad % (r) en la forma

K (r) ≡ 1

2%V + V%

que corresponde a la cuantizacion de la relacion J =ρv, pero adecuadamente simetrizada.Si la partıcula se coloca en un campo electromagnetico descrito por los potenciales φ (r, t) y A (r, t) , el Hamil-

toniano asociado es (ver Ec. 4.10)

H =[P− qA (R, t)]2

2m+ V (R, t) ; V (R, t) ≡ qφ (R, t) + V (R) (5.49)

donde V (R) es un potencial escalar que describe una interaccion adicional a la del campo electromagnetico sobrela partıcula. Con un procedimiento similar al de la seccion 3.3.4, la densidad de corriente resultante es

JEM =1

mRe

ψ∗[

~

i∇− qA

(5.50)

que tambien se puede obtener de la corriente (5.46) simplemente reemplazando P → P − qA, o equivalentemente~

i∇ → ~

i∇− qA (R, t).Un ejemplo sencillo para el calculo de ρ y J es la onda plana. Sea un estado (no estrictamente fısico) descrito

por una onda planaψ (r, t) = Aei(k·r−ωt)

Page 184: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

184CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

la densidad de probabilidad es claramente

ρ = ψψ∗ = |A|2

que es uniforme y constante. El calculo de J (r, t) es inmediato

J =1

mRe

[ψ∗(

~

i∇ψ)]

=1

mRe

A∗e−i(k·r−ωt)

(~A

i∇ei(k·r−ωt)

)

J =1

mRe

A∗e−i(k·r−ωt)

(~A

iikei(k·r−ωt)

)=

1

mRe

~ |A|2 k

J =~k

m|A|2 (5.51)

y recordando que vg = ~k/m es la velocidad de grupo asociada al momento ~k (seccion 2.11 Ec. 2.41). Vemosque esta corriente tambien es analoga a la relacion clasica J = ρv. La corriente generada por una onda plana esestacionaria (independiente del tiempo) y ademas es uniforme y homogenea.

5.7. Evolucion del valor esperado de un observable y su relacion con lamecanica clasica

Si A es un observable, su valor esperado cuando el sistema esta en el estado |ψ (t)〉 se escribe como

〈A〉 (t) = 〈ψ (t)|A |ψ (t)〉

Vale decir que el valor medio o esperado solo depende de t ya que por ejemplo si usamos la representacion de|r〉 este valor esperado corresponde a una integral sobre todo el espacio para un tiempo fijo. En contraste, elobservable clasico A (r,p, t) asume un valor para ciertas posiciones y momentos especıficos en un tiempo dado (yaque las partıculas estan localizadas y sus momentos se pueden medir simultaneamente junto con las posiciones).Para estos observables clasicos, la dependencia con el tiempo puede ser tanto explıcita como implıcita, es decir atraves de r (t) y p (t).

Cuando cuantizamos el observable asignamos a la cantidad clasica A (r,p, t) el operador hermıtico A ≡ A (R,P, t).Observese que ni los autoestados ni los autovalores de los operadores R y P dependen del tiempo, por tanto losobservables cuanticos R y P no pueden dar cuenta de una dependencia implıcita con el tiempo. En conclusion, losobservables cuanticos solo dependen del tiempo de manera explıcita. En cuanto al valor esperado del observable, lavariacion temporal de 〈A〉 se debe tanto a la variacion temporal del estado |ψ (t)〉 (dictaminada por la ecuacion deSchrodinger), como a la variacion temporal del observable mismo A (t). Si usamos por ejemplo la representacion decoordenadas, el valor esperado de A queda

〈A〉 =

∫d3r ψ∗ (r, t) A

(r,

~

i∇, t

)ψ (r, t)

de lo cual es claro que esta cantidad solo depende del tiempo, ya que esta integrada sobre las variables espaciales.

Vamos a estudiar la variacion temporal del valor esperado de un observable arbitrario y a relacionarla con lavariacion temporal clasica. Derivando el valor esperado con respecto al tiempo resulta

d

dt〈ψ (t)|A |ψ (t)〉 =

[d

dt〈ψ (t)|

]A |ψ (t)〉 + 〈ψ (t)|

[∂A

∂t

]|ψ (t)〉 + 〈ψ (t)|A

[d

dt|ψ (t)〉

]

donde hemos usado que dA/dt = ∂A/∂t ya que un observable cuantico solo puede depender del tiempo de maneraexplıcita. Usando las Ecs. (3.23, 3.24) tenemos

d

dt〈ψ (t)|A |ψ (t)〉 = 〈ψ (t)|

[− 1

i~H (t)

]A |ψ (t)〉 + 〈ψ (t)|

[∂A

∂t

]|ψ (t)〉 + 〈ψ (t)|A

[1

i~H (t)

]|ψ (t)〉

d

dt〈ψ (t)|A |ψ (t)〉 =

1

i~〈ψ (t)| [AH −HA] |ψ (t)〉 + 〈ψ (t)|

[∂A

∂t

]|ψ (t)〉

Page 185: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.7. EVOLUCION DEL VALOR ESPERADO DE UN OBSERVABLE Y SU RELACION CON LA MECANICA CLASICA185

quedando finalmented

dt〈A〉 =

1

i~〈[A, H]〉 +

⟨∂A

∂t

⟩(5.52)

vale recordar que en el formalismo clasico Hamiltoniano, un observable Acl que es funcion de las variables del espaciode fase y del tiempo es decir Acl = Acl (q,p, t), posee una evolucion temporal dada por

dAcldt

= [Acl,H]pois +∂Acl∂t

(5.53)

donde en lugar del conmutador, esta el corchete de Poisson entre el observable y el Hamiltoniano. Volviendo alproblema cuantico, veremos que el valor esperado (y no el operador A

(r, ~

i∇, t)) es el que debe ser comparado con

el correspondiente observable clasico.

5.7.1. Evolucion temporal de los valores esperados de R, P: Teorema de Ehrenfest

Dado que R, P son todos los observables fundamentales para la cuantizacion de una partıcula sin espın, esnecesario explorar la evolucion temporal de sus valores esperados. Si bien estos observables no dependen del tiempo,sus valores esperados sı poseen una dependencia temporal proveniente de la evolucion del estado |ψ (t)〉.

Asumiendo un Hamiltoniano de la forma

H =P2

2m+ V (R) (5.54)

asignando A → R en la Ec. (5.52) y usando el Hamiltoniano (5.54) tenemos

d

dt〈R〉 =

1

i~

⟨[R,

P2

2m+ V (R)

]⟩+

⟨∂R

∂t

⟩=

1

i~

⟨[R,

P2

2m

]⟩+

1

i~〈[R, V (R)]〉

y usando las propiedades de los conmutadores (1.36-1.41) ası como las relaciones canonicas de conmutacion (4.9)obtenemos

d

dt〈R〉 =

1

2mi~〈[R, P]P〉 +

1

2mi~〈P [R, P]〉 =

⟨i~I

2mi~P

⟩+

⟨P

i~I

2mi~

quedando finalmented

dt〈R〉 =

1

m〈P〉

similarmente el valor esperado para P es

d

dt〈P〉 =

1

i~

⟨[P,

P2

2m+ V (R)

]⟩+

⟨∂P

∂t

⟩=

1

i~

⟨[P,

P2

2m

]⟩+

1

i~〈[P, V (R)]〉

d

dt〈P〉 =

1

i~〈[P, V (R)]〉

y usando la Ec. (1.139) pag. 67, se obtiene

[P, V (R)] = −i~∇V (R)

se obtienen entonces la relaciones fundamentales

d

dt〈R〉 =

1

m〈P〉 ;

d

dt〈P〉 = −〈∇V (R)〉 (5.55)

estas dos ecuaciones se conocen como teorema de Ehrenfest. Muy semejantes a las relaciones asociadas a suscorrespondientes observables clasicos.

En virtud de la similitud con las relaciones clasicas, es natural buscar el lımite clasico a traves del teorema deEhrenfest Ecs. (5.55). La funcion de onda ψ (r, t) que describe el estado de una partıcula, es en general un paquetede ondas. 〈R〉 representa tres coordenadas 〈Xi〉 que en general dependen del tiempo. Al punto definido por 〈R〉 (t)en el instante t, lo llamaremos el centro del paquete de onda en tal instante. Notese que si el paquete es asimetricoel centro del paquete sera en general diferente del punto en donde la amplitud es maxima. Cuando movemos el

Page 186: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

186CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

parametro tiempo el punto 〈R〉 (t) se mueve en el espacio generando la trayectoria del centro del paquete. Porsupuesto, esta trayectoria no se puede asociar a la partıcula cuyo estado esta descrito por el paquete completo quetiene una extension dada5. Sin embargo, si la extension del paquete de ondas es mucho menor que todas las demaslongitudes involucradas en el problema, podemos aproximar el paquete de ondas por su centro y la descripcionclasica resultara una buena aproximacion.

La pregunta natural es entonces si el movimiento del centro del paquete de onda obedece las leyes de la mecanicaclasica. La respuesta yace en el teorema de Ehrenfest, la primera de las Ecs. (5.55) nos dice que la velocidad delcentro del paquete es igual al momento promedio del paquete dividido por m. Por tanto la segunda de las Ecs.(5.55) se puede escribir como

md2 〈R〉dt2

= −〈∇V (R)〉

por tanto, el centro del paquete seguira una trayectoria clasica solo si la cantidad −〈∇V (R)〉 coincide con la fuerzaclasica en el punto donde se ubica el centro del paquete

Fcl = [−∇V (r)]r=〈R〉

debemos observar sin embargo que −〈∇V (R)〉 es en realidad el valor promedio de la fuerza sobre el paquetecompleto, que no necesariamente debe coincidir con su valor en el centro del paquete

〈∇V (R)〉 6= [∇V (r)]r=〈R〉 (5.56)

lo cual se puede expresar diciendo que el valor medio de una funcion no es en general igual al valor que toma cuandose evalua en el valor medio de la variable. Esto se puede ver con facilidad tomando un ejemplo especıfico, sea unpotencial de la forma

V (x) = λxn (5.57)

siendo λ una constante real y n un entero positivo. La cuantizacion de este potencial nos lleva a

V (X) = λXn (5.58)

el lado izquierdo de (5.56) nos da

⟨d

dxV (X)

⟩=

⟨d

dx(λXn)

⟩= λn

⟨Xn−1

en tanto que el lado derecho de (5.56) es

[d

dxV (x)

]

x=〈X〉=

[d

dx(λxn)

]

x=〈X〉=[nλxn−1

]x=〈X〉 = λn 〈X〉n−1

y en general⟨Xn−1

⟩6= 〈X〉n−1. Por ejemplo, para n = 3 se tiene que

⟨X2⟩6= 〈X〉2 y la diferencia entre ambas es

proporcional a la raız de la desviacion media cuadratica definida en la Ec. (5.7).Sin embargo, para n = 0 (partıcula libre), n = 1 (partıcula en un campo de fuerzas uniforme) y n = 2 (partıcula

en un potencial parabolico i.e. un oscilador armonico), la igualdad sı se cumple y vemos que el centro del paquetede onda en estos casos obedece las leyes de la mecanica clasica.

Por otro lado, aunque los dos lados de (5.56) no son en general iguales, ocurre que en algunas circunstancias(escenarios semiclasicos) la diferencia entre ambos es despreciable, esto ocurre cuando el paquete de onda es losuficientemente localizado. Para verlo, escribamos el lado izquierdo de (5.56) en la base |r〉.

〈∇V (R)〉 =

∫d3r ψ∗ (r, t) [∇V (r)] ψ (r, t) =

∫d3r |ψ (r, t)|2 ∇V (r) (5.59)

asumir el paquete muy localizado equivale a decir que |ψ (r, t)|2 es una distribucion que toma valores no despreciablessolo en cierto dominio cuyas dimensiones son mucho mas pequenas que las distancias sobre las cuales ∇V (r)

5Notese incluso que cada punto en esta trayectoria no necesariamente coincide con el punto de maxima densidad de probabilidad encada instante.

Page 187: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.8. SOLUCIONES DE LA ECUACION DE SCHRODINGER PARA SISTEMAS CONSERVATIVOS 187

varıa apreciablemente. Por tanto, en este dominio centrado alrededor de 〈R〉, la cantidad ∇V (r) es practicamenteconstante. En tal caso se puede reemplazar ∇V (r) en (5.59) por su valor en r = 〈R〉 y se puede sacar de la integral en(5.59), y teniendo en cuenta que ψ (r, t) esta normalizada, se obtiene que para paquetes suficientemente localizadostenemos que

〈∇V (R)〉 ∼= [∇V (r)]r=〈R〉 (5.60)

es claro en particular que en el lımite macroscopico en el cual las longitudes de onda de De Broglie son muchomenores que las distancias sobre las cuales los potenciales y sus gradientes varıan, los paquetes de onda pueden serlo suficientemente localizados para satisfacer la Ec. (5.60) y al mismo tiempo mantener un momento bien definido.Este ultimo punto es muy importante, ya que no basta con que 〈R〉 se comporte de manera semejante al valorclasico de posicion para llegar a un escenario clasico, pues un paquete muy localizado en 〈R〉 implica que el paquetede onda en el espacio de los momentos puede ser muy disperso, y tendrıamos que aunque 〈P〉 pueda tener uncomportamiento similar al valor clasico, la dispersion de 〈P〉 significara una incertidumbre enorme en su medida locual nos aleja del escenario clasico. Por tanto, es necesario que los valores de ∆r y ∆p compatibles con el principiode incertidumbre sean mucho menores que todas las distancias y momentos involucradas en el problema, situacionque en general se cumple en los sistemas macroscopicos.

Bajo las condiciones anteriores, el movimiento del paquete de onda es practicamente el de una partıcula clasicade masa m sometida al potencial V (r). Vemos como era de esperarse que la ecuacion de Schrodinger genera lassoluciones clasicas con ciertas condiciones lımite apropiadas que en particular son satisfechas por los sistemasmacroscopicos.

5.8. Soluciones de la ecuacion de Schrodinger para sistemas conservativos

En mecanica clasica, si el Hamiltoniano no depende explıcitamente del tiempo, es una constante de movimientoen virtud de que su derivada total coincide con su derivada parcial. Si ademas el Hamiltoniano coincide con la energıadel sistema entonces la energıa total del sistema es constante en el tiempo y hablamos de un sistema conservativo.Es natural entonces averiguar por las propiedades de un sistema conservativo cuando cuantizamos un Hamiltonianoque es clasicamente constante de movimiento y que corresponde a la energıa del sistema.

Consideremos en primer lugar la ecuacion de valores propios del Hamiltoniano

H |ϕn,τ 〉 = En |ϕn,τ 〉 (5.61)

asumiremos por simplicidad un espectro discreto. El ındice τ denota la degeneracion de los valores propios que puedecorresponder a varios ındices. Tales ındices nos fijaran los autovalores de observables que constituyen un C.S.C.O.junto con H. Puesto que H no depende explıcitamente del tiempo, los autovalores En y autovectores |ϕn,τ 〉 tampocodependeran del tiempo.

Hemos visto para un caso especıfico de sistema conservativo (ver seccion 3.2) que la Ec. de Schrodinger se puedesolucionar a partir de este problema de valores propios. En este caso veremos que la Ec. (5.61) tambien se puedeutilizar para resolver la ecuacion de Schrodinger. Teniendo en cuenta que H es observable, podemos expandir lasolucion de la Ec. de Schrodinger en terminos de la base |ϕn,τ 〉

|ψ (t)〉 =∑

n,τ

cn,τ (t) |ϕn,τ 〉 ; cn,τ (t) ≡ 〈ϕn,τ |ψ (t)〉 (5.62)

notese que toda la dependencia temporal de |ψ (t)〉 esta contenida en los cn,τ (t). Aplicando el bra 〈ϕn,τ | sobre laecuacion de Schrodinger y teniendo en cuenta que este bra no depende del tiempo

i~d

dt〈ϕn,τ |ψ (t)〉 = 〈ϕn,τ |H |ψ (t)〉 (5.63)

y dada la hermiticidad de H el hermıtico conjugado de (5.61) es

〈ϕn,τ |H = En 〈ϕn,τ | (5.64)

aplicando (5.64) y la segunda Ec. (5.62) en (5.63) se obtiene

i~d

dtcn,τ (t) = Encn,τ (t)

Page 188: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

188CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

la cual se puede integrar directamente para obtener

cn,τ (t) = cn,τ (t0) e−iEn(t−t0)/~ (5.65)

por tanto, si H no depende del tiempo podemos encontrar a |ψ (t)〉 a partir de su valor inicial |ψ (t0)〉 en la siguienteforma

(a) Expandimos el valor inicial del estado en la base de autoestados de H

|ψ (t0)〉 =∑

n

τ

cn,τ (t0) |ϕn,τ 〉 ; cn,τ (t0) ≡ 〈ϕn,τ |ψ (t0)〉 (5.66)

(b) En virtud de las Ecs. (5.62) y (5.65), multiplicamos cada sumando en la expansion (5.66) por la fase e−iEn(t−t0)/~,siendo En el autovalor asociado a los autoestados |ϕn,τ 〉

|ψ (t)〉 =∑

n

τ

cn,τ (t0) e−iEn(t−t0)/~ |ϕn,τ 〉 (5.67)

para el caso de espectro contınuo se realiza un procedimiento analogo para obtener

|ψ (t)〉 =∑

τ

∫dE cτ (E, t0) e

−iE(t−t0)/~ |ϕE,τ 〉 (5.68)

o si la degeneracion τ tambien es contınua tenemos

|ψ (t)〉 =

∫dτ

∫dE c (τ, E, t0) e

−iE(t−t0)/~ |ϕE,τ 〉

notese finalmente que los sumandos en (5.67) poseen fases diferentes para diferentes valores de n. Por tanto, dichasfases son fısicamente relevantes y producen fenomenos de interferencia.

5.8.1. Estados estacionarios

Un caso especial importante surge cuando el estado inicial del sistema |ψ (t0)〉 coincide con un ket propio de H.En tal caso la expansion (5.66) viene dada por autoestados de H asociados a un solo valor propio

|ψ (t0)〉 =∑

τ

cn,τ (t0) |ϕn,τ 〉 (5.69)

y dado que no hay suma sobre n, la Ec. (5.67) para el estado |ψ (t)〉 queda

|ψ (t)〉 = e−iEn(t−t0)/~∑

τ

cn,τ (t0) |ϕn,τ 〉 = e−iEn(t−t0)/~ |ψ (t0)〉

de modo que el estado inicial y el estado en cualquier tiempo solo difieren en una fase global fısicamente irrelevante.Por tanto, todas las propiedades fısicas de sistemas que estan inicialmente preparados en un autoestado de H,permanecen inalteradas en el tiempo. Por esta razon a los estados propios del Hamiltoniano se les denomina estadosestacionarios.

De aquı surge ademas la manifestacion cuantica de la conservacion de la energıa para sistemas conservativos. Sien el tiempo t0 medimos la energıa de un sistema conservativo y encontramos el valor En, el sistema queda preparadoluego de la medicion en un autoestado de H dado por (5.69) con valor propio En. A partir de este momento se puedeaplicar la ecuacion de Schrodinger tomando este autoestado de H como estado inicial, pero dado que dicho estado esestacionario, no se genera fısicamente evolucion temporal y para todo tiempo el estado continua siendo autoestadode H con energıa En. En consecuencia, una segunda medida de la energıa del sistema en cualquier tiempo posteriornos dara el mismo valor de energıa En obtenido en la primera medicion.

Finalmente, vale la pena senalar que lo anterior nos conduce a que solo hay evolucion cuando la energıa en elestado inicial no esta bien definida (de manera que hay varias fases de la forma e−iEk(t−t0)/~). Esto nos llevara masadelante a una relacion de incertidumbre entre el tiempo de evolucion y la energıa.

Page 189: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.8. SOLUCIONES DE LA ECUACION DE SCHRODINGER PARA SISTEMAS CONSERVATIVOS 189

5.8.2. Constantes de movimiento

La Ec. (5.52) nos dice que la cantidad 〈A〉 sera constante de movimiento si se cumplen las condiciones

∂A

∂t= 0 ; [A,H] = 0 (5.70)

aplicando estas condiciones en (5.52) se obtiene que

d 〈A〉dt

=d

dt〈ψ (t)|A |ψ (t)〉 = 0 (5.71)

para cualquier estado |ψ (t)〉 del sistema. Es claro que si se cumplen las condiciones (5.70) el valor medio de Asera constante de movimiento6. En consecuencia, definiremos por extension que un observable A es constante demovimiento si cumplen las condiciones (5.70). En palabras, un observable es constante de movimiento si no dependeexplıcitamente del tiempo y conmuta con el Hamiltoniano. En particular si H no depende del tiempo (sistemasconservativos), H como tal es constante de movimiento.

Veremos que si A es constante de movimiento hay algunas consecuencias fısicas adicionales. En primer lugar,puesto que A y H son observables que conmutan, poseen un conjunto comun completo de kets propios

H |ϕn,p,τ 〉 = En |ϕn,p,τ 〉 ; A |ϕn,p,τ 〉 = ap |ϕn,p,τ 〉

de nuevo asumimos espectros discretos por simplicidad7. El ındice τ fija los valores propios de observables queforman un C.S.C.O. con H y A. Ahora bien, los kets |ϕn,p,τ 〉 son autoestados de H y por tanto son estadosestacionarios (siempre que H no dependa del tiempo). En consecuencia, si |ϕn,p,τ 〉 define el estado inicial del sistema,permanecera en este estado indefinidamente (excepto por una fase global irrelevante). No obstante, |ϕn,p,τ 〉 tambienes ket propio de A. En consecuencia, cuando A es una constante de movimiento, existen estados estacionarios|ϕn,p,τ 〉 del sistema fısico que permanecen para todo tiempo como autoestados de A con el mismo autovalor ap. Poresta razon a los autovalores de A se les denomina numeros cuanticos buenos. Es claro que si |ϕn,p,τ 〉 es el estadoinicial, el valor de la energıa y de ap seran siempre el mismo sin importar el tiempo en que se midan, el orden enque se midan (son observables compatibles), o cuantas veces se midan, ademas hay una certeza total en sus valores(ambas cantidades estan bien definidas y se conservan).

Ahora supongamos que el estado inicial no es del tipo |ϕn,p,τ 〉, sino un ket arbitrario |ψ (t0)〉. Veremos que si elsistema es conservativo, la probabilidad de encontrar un cierto valor ap es independiente del tiempo cuando se midela constante de movimiento A. Expandiendo |ψ (t0)〉 en la base |ϕn,p,τ 〉 se tiene

|ψ (t0)〉 =∑

n

p

τ

cn,p,τ (t0) |ϕn,p,τ 〉

y aplicando el procedimiento descrito por las Ecs. (5.66) y (5.67) se obtiene

|ψ (t)〉 =∑

n

p

τ

cn,p,τ (t) |ϕn,p,τ 〉 ; cn,p,τ (t) = cn,p,τ (t0) e−iEn(t−t0)/~

y usando el postulado de descomposicion espectral, la probabilidad P (ap, t) de obtener ap cuando A se mide sobre

6Si se pide⟨∂A∂t

⟩= 〈[A,H]〉 = 0, entonces la Ec. (5.71) solo sera valida para un estado o estados especıficos |ψ (t)〉. La idea aquı es

estudiar constantes de movimiento inherentes al sistema y no a condiciones iniciales especıficas.7Si en lugar de la Ec. (5.70) asumimos la condicion mas debil ∂A

∂t+ [A,H] = 0, tenemos que A no conmuta en general con H. Por

tanto, aunque tal condicion conduce a la conservacion de 〈A〉 Ec. (5.71), no conduce a la existencia de una base comun para A y H demodo que las consecuencias fısicas adicionales que discutiremos aquı, no son validas para esta condicion mas debil.

Page 190: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

190CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

el sistema en el tiempo t (y por tanto en el estado |ψ (t)〉) esta dado por

P (ap, t) =∑

n,τ

|〈ϕn,p,τ |ψ (t)〉|2 =∑

n,τ

∣∣∣∣∣∣〈ϕn,p,τ |

n′p′τ ′

cn′,p′,τ ′ (t)∣∣ϕn′,p′,τ ′

⟩∣∣∣∣∣∣

2

=∑

n,τ

∣∣∣∣∣∣

n′p′τ ′

cn′,p′,τ ′ (t) 〈ϕn,p,τ∣∣ϕn′,p′,τ ′

⟩∣∣∣∣∣∣

2

=∑

n,τ

∣∣∣∣∣∣

n′p′τ ′

cn′,p′,τ ′ (t) δn,n′δp,p′δτ,τ ′

∣∣∣∣∣∣

2

=∑

n

τ

|cn,p,τ (t)|2 =∑

n

τ

cn,p,τ (t) c∗n,p,τ (t)

P (ap, t) =∑

n

τ

cn,p,τ (t0) e−iEn(t−t0)/~ c∗n,p,τ (t0) e

iEn(t−t0)/~

cada fase se anula y se obtiene

P (ap, t) =∑

n

τ

|cn,p,τ (t0)|2 = P (ap, t0)

lo cual prueba la independencia con el tiempo de esta distribucion de probabilidad. En particular, si en t0 el sistemaesta en un autoestado de A con autovalor am, de modo que P (ak, t0) = δkm, esta probabilidad no evoluciona en eltiempo; por lo tanto, para cualquier instante se obtiene la misma medida am, y el estado del sistema en cualquiertiempo continua siendo autoestado de A con valor propio am.

5.8.3. Frecuencias de Bohr de un sistema y reglas de seleccion

Sea B un observable del sistema que estamos estudiando y que no necesariamente conmuta con H. La evoluciontemporal de 〈B〉 esta dada por la Ec. (5.52)

d

dt〈B〉 =

1

i~〈[B,H]〉 +

⟨∂B

∂t

para un sistema conservativo el estado en cualquier instante vendra dado por (5.67), con lo cual podemos calcularel valor esperado de B cuando el sistema esta en el estado |ψ (t)〉. Para ello necesitamos el bra asociado a (5.67) elcual viene dado por

〈ψ (t)| =∑

n′

τ ′

c∗n′,τ ′ (t0) eiEn′(t−t0)/~

⟨ϕn′,τ ′

∣∣ (5.72)

usando (5.67, 5.72) el valor esperado de B resulta

〈ψ (t)|B |ψ (t)〉 =

[∑

n′

τ ′

c∗n′,τ ′ (t0) eiEn′ (t−t0)/~

⟨ϕn′,τ ′

∣∣]B

[∑

n

τ

cn,τ (t0) e−iEn(t−t0)/~ |ϕn,τ 〉

]

〈B〉|ψ(t)〉 =∑

n′

τ ′

n

τ

c∗n′,τ ′ (t0) cn,τ (t0)⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉 ei(En′−En)(t−t0)/~ (5.73)

asumiremos de aquı en adelante que B no depende explıcitamente del tiempo, en tal caso los elementos matriciales⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉 son constantes. De esto y de la Ec. (5.73) se ve que la evolucion temporal de 〈B〉 (t) se debeexclusivamente a las fases, es decir a terminos oscilantes con frecuencias dadas por

νn′,n ≡ 1

|En′ −En|~

=|En′ −En|

h

tales frecuencias son caracterısticas del sistema bajo estudio pero son independientes del observable B consideradoy de las condiciones iniciales del sistema (descritas por los coeficientes c∗n′,τ ′ (t0) cn,τ (t0) ), ya que solo dependen delos valores propios de H.

Las frecuencias νn′,n se denominan las frecuencias de Bohr del sistema. Por ejemplo, para un atomo los valoresesperados de todos los parametros atomicos (tales como momentos dipolares electricos y magneticos), oscilan a lasvarias frecuencias de Bohr del atomo. Es razonable imaginar que estas frecuencias pueden ser absorbidas o emitidas

Page 191: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.8. SOLUCIONES DE LA ECUACION DE SCHRODINGER PARA SISTEMAS CONSERVATIVOS 191

por el atomo, lo cual nos permite entender intuitivamente la relacion de Bohr entre las diferentes frecuenciasabsorbidas o emitidas y las diferencias en las energıas atomicas.

Puede verse de (5.73) que aunque las frecuencias involucradas en la evolucion temporal de 〈B〉 no dependende B, los pesos de cada frecuencia sı dependen de B a traves de los elementos matriciales

⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉. Enparticular si hay elementos

⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉 que sean nulos, las correspondientes frecuencias vn′,n estaran ausentesde la expansion de 〈B〉 (t) sin importar cual sea el estado inicial del sistema. Este es el origen de las reglas deseleccion que nos indican las frecuencias que pueden ser emitidas o absorbidas bajo las condiciones dadas. Loselementos de matriz

⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉 nos dicen la importancia de cada frecuencia de Bohr.

De lo anterior vemos que el estudio de las reglas de seleccion proviene del calculo de los elementos no diagonales⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉 de los diversos observables atomicos (o de cualquier otro sistema cuantico) tales como los dipoloselectricos y magneticos.

Por otro lado, la Ec. (5.73) muestra que el peso completo de cada frecuencia esta dado por el producto

W(n, n′

)=∑

τ

τ ′

c∗n′,τ ′ (t0) cn,τ (t0)⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉

y por tanto tambien depende de las condiciones iniciales por medio de c∗n′,τ ′ (t0) cn,τ (t0). Vale la pena anotar

que si bien la nulidad de los elementos⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉 conduce a la ausencia de una frecuencia de Bohr paracualquier estado inicial del sistema, tambien se puede dar la ausencia de una frecuencia por la nulidad del productoc∗n′,τ ′ (t0) cn,τ (t0), es decir por ciertas condiciones iniciales especıficas. En particular, si el estado inicial es un estadoestacionario de energıa Ek la expansion de |ψ (t0)〉 solo contiene un valor de n (n = k) y el producto c∗n′,τ ′ (t0) cn,τ (t0)solo es no nulo para n = n′ = k, en este caso 〈B〉 no depende del tiempo y no hay frecuencias de Bohr no triviales,notese que esta regla de seleccion se da por condiciones iniciales y se da para cualquier observable B.

Es interesante ver que de la Ec. (5.73) tambien podemos verificar que el valor esperado de una constante demovimiento no depende del tiempo. Al ser B constante de movimiento, no depende explıcitamente del tiempo conlo cual la dependencia temporal de 〈B〉 recae exclusivamente en las fases que contienen la energıa en la Ec. (5.73).Ahora bien el teorema 1.68 (pag. 50) nos dice que dado que B conmuta con H (por ser constante de movimiento),si |ϕn,τ 〉 y

∣∣ϕn′,τ ′⟩

corresponden a autovalores diferentes (En′ 6= En) entonces el producto⟨ϕn′,τ ′

∣∣B |ϕn,τ 〉 es cero.Por tanto para una constante de movimiento solo sobreviven los terminos con n = n ′ para los cuales las fasesei(En′−En)(t−t0)/~ seran iguales a la unidad y no habra dependencia temporal.

5.8.4. Relacion de incertidumbre entre tiempo y energıa

A continuacion veremos que los sistemas conservativos presentan la propiedad de que entre mayor sea la incer-tidumbre en la energıa, mas rapida es la evolucion temporal. Para ver esto, definimos ∆t como un intervalo de tiempocaracterıstico al final del cual el sistema ha evolucionado de forma apreciable, y ∆E denotara la incertidumbre enla energıa.

Veamos primero el caso en el cual la energıa esta completamente definida, esto ocurre cuando el sistema esta enun autoestado de H, de modo que ∆E = 0. Hemos visto que este estado es estacionario y que por tanto noevoluciona, podemos considerar entonces que el tiempo para que el sistema evolucione apreciablemente es infinito,vemos entonces que cuando ∆E = 0 se tiene que ∆t→ ∞.

Ahora asumamos que el sistema en el estado inicial se encuentra en el estado |ψ (t0)〉 que es una superposicionde solo dos autoestados de H que denotamos por |ϕ1〉 , |ϕ2〉

|ψ (t0)〉 = c1 |ϕ1〉 + c2 |ϕ2〉 (5.74)

el estado en cualquier tiempo sera entonces

|ψ (t)〉 = c1e−E1(t−t0)/~ |ϕ1〉 + c2e

−E2(t−t0)/~ |ϕ2〉

si medimos la energıa encontramos E1 o E2. En consecuencia, la incertidumbre en la energıa es del orden de

∆E ∼= |E2 −E1|

Page 192: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

192CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

ahora consideremos un observable arbitrario B que no conmuta con H. La probabilidad de encontrar en una medidade B en el tiempo t el valor propio bm (que asumimos no degenerado por simplicidad) asociado con el autovector|um〉 nos da

P (bm, t) = |〈um |ψ (t)〉|2 = 〈um |ψ (t)〉 〈ψ (t) |um〉=

〈um|

[c1e

−E1(t−t0)/~ |ϕ1〉 + c2e−E2(t−t0)/~ |ϕ2〉

]

×[c∗1e

E1(t−t0)/~ 〈ϕ1| + c∗2eE2(t−t0)/~ 〈ϕ2|

]|um〉

P (bm, t) =c1e

−E1(t−t0)/~ 〈um|ϕ1〉 + c2e−E2(t−t0)/~ 〈um|ϕ2〉

×c∗1e

E1(t−t0)/~ 〈ϕ1| um〉 + c∗2eE2(t−t0)/~ 〈ϕ2|um〉

= c1c∗1 〈um|ϕ1〉 〈ϕ1|um〉 + c2c

∗2 〈um|ϕ2〉 〈ϕ2|um〉

+c1c∗2e

−E1(t−t0)/~eE2(t−t0)/~ 〈um|ϕ1〉 〈ϕ2|um〉 + c2c∗1e

−E2(t−t0)/~eE1(t−t0)/~ 〈um|ϕ2〉 〈ϕ1| um〉

P (bm, t) = |c1|2 |〈um|ϕ1〉|2 + |c2|2 |〈um|ϕ2〉|2 + c1c∗2e

(E2−E1)(t−t0)/~ 〈um|ϕ1〉 〈ϕ2|um〉+[c1c

∗2e

(E2−E1)(t−t0)/~ 〈um|ϕ1〉 〈ϕ2|um〉]∗

P (bm, t) = |c1|2 |〈um|ϕ1〉|2 + |c2|2 |〈um|ϕ2〉|2 + 2Rec1c

∗2e

(E2−E1)(t−t0)/~ 〈um|ϕ1〉 〈ϕ2|um〉

(5.75)

notese que la interferencia esta dada por la diferencia entre las dos fases. Esta ecuacion muestra que la probabilidadoscila entre dos valores extremos, con una frecuencia de Bohr dada por

v21 =|E2 −E1|

h

vale la pena mencionar que esta frecuencia de Bohr no dependio del observable, sino de las condiciones inicialesdescritas por la Ec. (5.74), y por supuesto de los valores propios del Hamiltoniano. El tiempo caracterıstico deevolucion sera entonces un periodo de oscilacion de la probabilidad

∆t ∼= 1

ν21=

h

|E2 −E1|∼= h

∆E

con lo cual se obtiene la relacion∆t · ∆E ∼= h

Asumamos ahora que el espectro de H es contınuo y no degenerado. El estado inicial |ψ (t0)〉 se puede escribircomo

|ψ (t0)〉 =

∫dE c (E) |ϕE〉

siendo |ϕE〉 el ket propio de H con autovalor E. Asumamos que en una grafica de |c (E)|2 (densidad de probabilidadpara E) vs. E, la densidad de probabilidad solo es apreciable en un intervalo [E0 − ∆E/2, E0 + ∆E/2]. La cantidad∆E representa entonces la incertidumbre en la energıa del sistema (que depende del algoritmo para elegir el ancho).El estado en un tiempo t se obtiene de (5.68)

|ψ (t)〉 =

∫dE c (E) e−iE(t−t0)/~ |ϕE〉

la probabilidad de obtener bm cuando se mide el observable B (de espectro discreto) en el estado |ψ (t)〉 es

P (bm, t) = |〈um |ψ (t)〉|2 =

∣∣∣∣∫dE c (E) e−iE(t−t0)/~〈um |ϕE〉

∣∣∣∣2

P (bm, t) ∼=∣∣∣∣∣

∫ E0+∆E/2

E0−∆E/2dE c (E) e−iE(t−t0)/~〈um |ϕE〉

∣∣∣∣∣

2

(5.76)

Page 193: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.9. CONSECUENCIAS FISICAS DEL PRINCIPIO DE SUPERPOSICION 193

en general 〈um |ϕE〉 no varıa en forma rapida con E cuando E varıa alrededor de E0. Si ∆E es lo suficientementepequeno, la variacion de 〈um |ϕE〉 en la integral (5.76) se puede despreciar con respecto a la variacion de c (E). Conlo cual la integral (5.76) se puede aproximar a

P (bm, t) ∼= |〈um |ϕE0〉|2∣∣∣∣∣

∫ E0+∆E/2

E0−∆E/2dE c (E) e−iE(t−t0)/~

∣∣∣∣∣

2

cuando esta aproximacion es valida vemos que P (bm, t) es proporcional al cuadrado del modulo de la transformadade Fourier de c (E). Aplicando la propiedad de incertidumbre para la transformada de Fourier, vemos que el anchoen t de P (bm, t), es decir ∆t esta relacionado con el ancho ∆E de |c (E)|2 por medio de la relacion

∆E · ∆t & h

usualmente conocida como la cuarta relacion de incertidumbre de Heisenberg. Sin embargo, esta relacion es diferentea la mostrada por las componentes de R y P ya que el tiempo es un parametro para el cual no existe un operadorcuantico asociado, y las variables H y t no son canonicamente conjugadas.

A priori podrıa pensarse que la presencia de incertidumbre en la energıa para un sistema conservativo, entraen conflicto con la conservacion de la energıa. Debemos observar sin embargo, que el concepto de conservacion (ono conservacion) de una cantidad fısica involucra la comparacion entre dos o mas medidas de dicha cantidad. Si elestado inicial no es estacionario, entonces hay una incertidumbre en la energıa, tal incertidumbre persiste y puedeevolucionar en el tiempo mientras no se realice una medida. No obstante, cuando se realiza una medida de la energıa,el sistema queda preparado en un estado estacionario con energıa bien definida En, y ya se discutio que toda medidaposterior de la energıa dara el mismo valor En con toda certeza. Lo mismo ocurrira con cualquier cantidad posteriorde medidas de este observable. Tenemos entonces un principio de conservacion puesto que el experimento revela quepara un sistema conservativo, las medidas de esta cantidad fısica en diferentes tiempos coinciden siempre. Similardiscusion se puede dar para la conservacion del momento u otra cantidad fısica.

5.8.5. Cuarta relacion de incertidumbre para un paquete de onda unidimensional

Veamos el caso de un paquete de ondas unidimensional. A la incertidumbre ∆p en el momento del paquete lepodemos asociar una incertidumbre en la energıa de la forma

∆E =dE

dp∆p ; E = ~ω ; p = ~k ⇒

∆E =dω

dk∆p = vg ∆p (5.77)

por otra parte, el tiempo caracterıstico de evolucion ∆t es el tiempo que le toma a este paquete de onda viajandoa la velocidad vg para “pasar” un punto fijo en el espacio, es decir para que haya recorrido una longitud igual a suextension espacial ∆x. Por tanto

∆t ∼= ∆x

vg(5.78)

y combinando las Ecs. (5.77, 5.78) resulta

∆E · ∆t ∼= ∆x · ∆p & ~

5.9. Consecuencias fısicas del principio de superposicion

El primer postulado nos dice que los estados accesibles de un sistema cuantico forman un espacio vectorialcompleto, lo cual implica que la superposicion lineal (incluso infinita) de estados fısicamente realizables tambien nosda un estado fısicamente realizable. Veremos las consecuencias fısicas de este primer postulado.

Hemos mencionado ya los efectos de interferencia que surgen de este primer postulado cuando se combina conlos demas, estos fueron especialmente importantes en la explicacion de la dualidad onda partıcula. Vimos ademasque la interferencia se da entre las amplitudes de probabilidad por lo cual debemos examinar tales amplitudes enforma detallada

Page 194: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

194CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

5.9.1. Diferencia entre superposicion lineal y mezcla estadıstica

Sean |ψ1〉 y |ψ2〉 dos estados normalizados ortogonales

〈ψ1 |ψ1〉 = 〈ψ2 |ψ2〉 = 1 ; 〈ψ1 |ψ2〉 = 0

estos estados podrıan ser por ejemplo estados propios de un observable B asociados a valores propios diferentesb1 y b2. Si el sistema esta en el estado |ψ1〉 podemos calcular todas las probabilidades concernientes a resultadosde medidas de un cierto observable A. Si asumimos por ejemplo que el autovalor an de A es no degenerado ydenotamos |un〉 a su autovector asociado normalizado, la probabilidad de encontrar el valor an cuando se mide Asobre el sistema estando este en el estado |ψ1〉 esta dado por

P1 (an) = |〈un |ψ1〉|2

analogamente podemos medir esta probabilidad cuando el sistema esta en el estado |ψ2〉

P2 (an) = |〈un |ψ2〉|2

ahora consideremos un estado normalizado |ψ〉 que se construye como superposicion de los estados |ψ1〉 y |ψ2〉

|ψ〉 = c1 |ψ1〉 + c2 |ψ2〉 ; |c1|2 + |c2|2 = 1 (5.79)

este vector estara normalizado si |ψ1〉 y |ψ2〉 lo estan. Puesto que |ψ1〉 y |ψ2〉 son autovectores del observable Bcorrespondientes a valores propios diferentes b1 y b2, la probabilidad de medir b1 es |c1|2 y la de medir b2 es |c2|2. Confrecuencia se dice que cuando el sistema esta en el estado |ψ〉 descrito por (5.79), entonces |c1|2 es la probabilidadde encontrar al sistema en el estado |ψ1〉 y |c2|2 es la probabilidad de encontrarlo en el estado |ψ2〉, debe decirse sinembargo que esto solo es cierto si se ejecuta una medida del observable B, ya que si se mide cualquier otro observableC en general |ψ1〉 y |ψ2〉 no seran autoestados de C y por tanto luego de la medida el sistema no quedara en ningunode estos estados. En este caso se tendra que expandir a |ψ〉 en autoestados de C (esto es posible dado que es unobservable), y obtener los respectivos coeficientes. Esto nos muestra una vez mas que el aparato de medida y lamedida misma juegan un papel muy importante en los postulados.

Volviendo a la distribucion de probabilidades para b1 y b2, lo anterior podrıa sugerir erroneamente que N sistemasidenticos cada uno en el estado |ψ〉 descrito por (5.79), equivalen a otro conjunto compuesto por N |c1|2 sistemasidenticos cada uno en el estado |ψ1〉, junto con N |c2|2 sistemas identicos cada uno en el estado |ψ2〉. A esto se ledenomina una mezcla estadıstica de los estados |ψ1〉 y |ψ2〉 con pesos |c1|2 y |c2|2.

Para chequear esta hipotesis calcularemos la probabilidad de encontrar el autovalor an cuando medimos A, sobreel sistema en el estado |ψ〉. Si interpretamos este estado como una mezcla estadıstica de los estados |ψ1〉 y |ψ2〉 conpesos |c1|2 y |c2|2, esta probabilidad se puede calcular como la suma ponderada de probabilidades P1 (an) y P2 (an)

8

P (an)?= |c1|2 P1 (an) + |c2|2 P2 (an) (5.80)

por otro lado, aplicando los postulados de la mecanica cuantica, esta probabilidad se calcula como

P (an) = |〈un|ψ〉|2

la probabilidad es el modulo al cuadrado de la amplitud de probabilidad 〈un|ψ〉. Tal amplitud es la suma dedos terminos

〈un|ψ〉 = 〈un| c1 |ψ1〉 + c2 |ψ2〉 = c1 〈un|ψ1〉 + c2 〈un|ψ2〉el modulo al cuadrado se calcula con un procedimiento identico al que nos llevo a la Ec. (5.75) (excepto por laausencia de las exponenciales de la energıa)

P (an, t) = |c1|2 |〈un|ψ1〉|2 + |c2|2 |〈un|ψ2〉|2 + 2Re c1c∗2 〈un|ψ1〉 〈ψ2| un〉8Puesto que P1 (an) es la probabilidad de obtener el valor an cuando el sistema esta en el estado |ψ1〉, es claro que en una mezcla

estadıstica con N muy grande, el numero de estados |ψ1〉 que arrojara an cuando se mide A sobre los N∣∣c21∣∣ estados |ψ1〉, viene

dada por N∣∣c21∣∣P1 (an). Similarmente, N

∣∣c22∣∣P2 (an) es el numero de estados |ψ2〉 de la mezcla estadıstica que arrojaran el valor an

en la medicion de A. Es claro entonces que la probabilidad de obtener an cuando se mide sobre la mezcla estadıstica completa es

lımN→∞N|c21|P1(an)+N|c22|P2(an)

Nque coincide con la Ec. (5.80).

Page 195: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.9. CONSECUENCIAS FISICAS DEL PRINCIPIO DE SUPERPOSICION 195

puesto que las cantidades c1, c2, 〈un|ψ1〉 y 〈ψ2|un〉 son complejas podemos escribirlas en notacion polar

c1 = |c1| eiθ1 , c2 = |c2| eiθ2 , 〈un|ψ1〉 = |〈un|ψ1〉| eiδ1〈ψ2|un〉 = 〈un|ψ2〉∗ = |〈un|ψ2〉| e−iδ2

con lo cual la probabilidad queda

P (an, t) = |c1|2 |〈un|ψ1〉|2 + |c2|2 |〈un|ψ2〉|2 + 2Re|c1| |c2| |〈un|ψ1〉| |〈un|ψ2〉| ei(θ1+δ1−θ2−δ2)

P (an, t) = |c1|2 |〈un|ψ1〉|2 + |c2|2 |〈un|ψ2〉|2 + 2 |c1| |c2| |〈un|ψ1〉| |〈un|ψ2〉|Reei(θ1+δ1−θ2−δ2)

quedando finalmente

P (an, t) = |c1|2 |〈un|ψ1〉|2 + |c2|2 |〈un|ψ2〉|2 + 2 |c1| |c2| |〈un|ψ1〉| |〈un|ψ2〉| cos (θ1 + δ1 − θ2 − δ2)

que se puede reescribir como

P (an, t) = |c1|2 P1 (an) + |c2|2 P2 (an) + 2 |c1| |c2| |〈un|ψ1〉| |〈un|ψ2〉| cos (θ1 + δ1 − θ2 − δ2)

este resultado difiere del mostrado en (5.80) en donde se considero a |ψ〉 como una mezcla estadıstica. El punto esque la mezcla estadıstica no considera los efectos de interferencia contenidos en el producto cruzado que se obtienecuando se eleva al cuadrado una suma de amplitudes. El resultado muestra que la probabilidad no depende solode los modulos de los pesos |c1| y |c2| y de las amplitudes |〈un|ψ1〉| y |〈un|ψ2〉| sino tambien de sus fases relativasθ1, θ2, δ1 y δ2. Notese sin embargo, que una fase global eiθ multiplicando al estado |ψ〉 no afecta esta probabilidadpuesto que se elimina con su conjugado en el termino de interferencia.

5.9.2. Efectos de interferencia en fotones polarizados

Consideremos fotones polarizados que se propagan en la direccion uz en los cuales el estado de polarizacionesta representado por el operador unitario

u =1√2

(ux + uy) (5.81)

este estado es una superposicion de dos estados de polarizacion ortogonales ux y uy. Esto representa luz polarizadalinealmente a un angulo de π/4 con respecto a los ejes X e Y .

Si consideraramos u como una mezcla estadıstica de los estados ux y uy con identicos pesos, tendrıamos que

N fotones en el estado u son equivalentes a N ×(

1√2

)2= N

2 fotones en el estado ux y N2 fotones en el estado

uy. Si colocaramos en la trayectoria del haz de luz un analizador cuyo eje u′ sea perpendicular a u (y de modoque u,u′ generen un plano paralelo a XY), para la mezcla estadıstica la mitad de los fotones pasarıa el analizador.En contraste, tanto la teorıa cuantica como los experimentos muestran que ninguno de los N fotones en el estadou pasa el analizador (ver seccion 2.7.2).

Este ejemplo muestra que una superposicion lineal de la forma (5.81) es diferente a una mezcla estadıstica deiguales proporciones entre los estados ux y uy. Notese por ejemplo que la superposicion en (5.81) describe un haz deluz polarizada a π/4 de los ejes X e Y . En contraste, una mezcla estadıstica esta asociada con un haz no polarizadopuesto que el sistema contiene fotones de diferente polarizacion la mitad en direccion ux y la otra mitad en ladireccion uy.

La importancia de las fases relativas de los coeficientes de la expansion se puede ilustrar con los siguientes estadosde polarizacion

u1 =1√2

(ux + uy) ; u1 =1√2

(ux − uy) ; u1 =1√2

(ux + iuy) ; u1 =1√2

(ux − iuy)

los cuales difieren solo en las fases relativas de sus coeficientes siendo estas fases 0, π, π/2 y −π/2 respectivamente.Estos cuatro estados son fısicamente distintos: los dos primeros representan luz polarizada linealmente pero en direc-ciones distintas (el primer estado es ortogonal al segundo). Los dos ultimos representan luz polarizada circularmente(dextrogira y levogira respectivamente).

Page 196: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

196CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

5.9.3. Suma sobre los estados intermedios

Para ilustrar el uso adecuado del principio de superposicion, vamos a examinar dos experimentos ilustrativos.En esta seccion asumiremos que los observables A,B,C tienen un espectro discreto y no degenerado. Asumiremostambien que todas las medidas sucesivas se hacen en intervalos de tiempo cortos, de manera que el sistema no hatenido tiempo de evolucionar.

Primer experimento: Asumamos que en cierto tiempo, se midio el observable A y se obtuvo el valor propioa. El estado despues de la medida sera el ket propio |ua〉 asociado con a. Inmediatamente despues medimos alobservable C que no conmuta con A y obtenemos el valor c, de modo que el sistema quedara en el estado |vc〉. Laprobabilidad de que habiendo obtenido el valor a en la primera medida, obtengamos en la segunda medida un valorc esta dada por

Pa (c) = |〈vc |ua〉|2 (5.82)

Segundo experimento: En este experimento medimos de forma sucesiva los observables A,B, y C que noconmutan entre sı. Si Pa (b, c) es la probabilidad de que habiendo obtenido el resultado a en la primera medida seobtengan los valores b y c en las otras dos, tenemos que esta probabilidad es el producto

Pa (b, c) = Pa (b) × Pb (c)

es decir Pa (b, c) es la probabilidad Pa (b) de que habiendo obtenido el valor a del observable A en la primera medida,obtengamos b en la segunda, multiplicada por la probabilidad de que habiendo obtenido un valor b del observableB en la segunda medida obtengamos un valor c de C en la tercera. Si denotamos |wb〉 al ket propio de B asociadocon el valor propio b, la cantidad Pa (b, c) estara dada por

Pa (b, c) = |〈vc|wb〉|2 |〈wb| ua〉|2 (5.83)

Veamos ahora las semejanzas y diferencias entre ambos experimentos. Asumiremos que en ambos experimentosse han obtenido los mismos valores especıficos de A y C. En ambos experimentos el estado despues de la medicionde A es |ua〉, de hecho el papel de esta medicion es el de fijar a |ua〉 como el estado inicial. Despues de la medicion deC en ambos experimentos el estado sera |vc〉 que lo tomaremos como el estado final. Los dos experimentos coincidenentonces en el estado inicial y en el final.

Para ambos experimentos es posible descomponer el estado justo antes de la medida de C en terminos deautovectores |wb〉 de B, y decir que entre los estados |ua〉 y |vc〉 el sistema puede “pasar” a traves de diferentes“estados intermedios” |wbi〉. Cada uno de estos estados intermedios define un posible “camino” entre el estado inicial|ua〉 y el estado final |vc〉.

De aquı surge la diferencia fundamental entre los dos experimentos. En el primero el camino que el sistemaha tomado para ir desde |ua〉 hasta |vc〉 no ha sido determinado experimentalmente, ya que solo hemos medido laprobabilidad Pc (a) de que comenzando en el estado |ua〉 terminemos en el estado |vc〉. En el segundo experimentoel camino para ir desde |ua〉 hasta |vc〉 ha sido determinado experimentalmente midiendo el observable B, ya queesta medida nos permite obtener la probabilidad Pa (b, c) de que el sistema comenzando en |ua〉, pase a traves deun estado intermedio dado |wb〉 y termine en el estado |vc〉.

La idea ahora es relacionar a Pa (c) con Pa (b, c). Resulta tentador pensar que en el primer experimento el sistemaes “libre de pasar” a traves de todos los estados intermedios |wb〉, pareciera entonces que la probabilidad global Pa (c)es la suma de todas las probabilidades Pa (b, c) asociadas con cada uno de los posibles “caminos”, esto conducirıa a

Pa (c)?=∑

b

Pa (b, c) (5.84)

veremos que este resultado es incorrecto a la luz de los postulados de la mecanica cuantica. La manera mas simplepara relacionar Pa (c) con Pa (b, c) consiste en tomar la formula de probabilidad Pa (c) Ec. (5.82) y aplicarle larelacion de completez para la base |wb〉

Page 197: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.9. CONSECUENCIAS FISICAS DEL PRINCIPIO DE SUPERPOSICION 197

Pa (c) = |〈vc |ua〉|2 =

∣∣∣∣∣∑

b

〈vc |wb〉 〈wb |ua〉∣∣∣∣∣

2

(5.85)

Pa (c) =

[∑

b

〈vc |wb〉 〈wb |ua〉][∑

b′

〈vc |wb′〉 〈wb′ |ua〉]∗

Pa (c) =∑

b

b′

〈vc |wb〉 〈wb |ua〉 〈vc |wb′〉∗ 〈wb′ |ua〉∗

es conveniente separar los terminos en las componentes diagonales b = b′ y los no diagonales

Pa (c) =∑

b

〈vc |wb〉 〈wb |ua〉 〈vc |wb〉∗ 〈wb |ua〉∗ +∑

b

b′ 6=b〈vc |wb〉 〈wb |ua〉 〈vc |wb′〉∗ 〈wb′ |ua〉∗

Pa (c) =∑

b

|〈vc |wb〉|2 |〈wb |ua〉|2 +∑

b

b′ 6=b〈vc |wb〉 〈wb |ua〉 〈vc |wb′〉∗ 〈wb′ |ua〉∗

y teniendo en cuenta la Ec. (5.83) tenemos que

Pa (c) =∑

b

Pa (b, c) +∑

b

b′ 6=b〈vc |wb〉 〈wb |ua〉 〈vc |wb′〉∗ 〈wb′ |ua〉∗ (5.86)

comparando (5.86) con (5.84) vemos nuevamente que los terminos cruzados que aparecen en el cuadrado del modulode la suma en (5.85) estan ausentes en (5.84), y por tanto todos los efectos de interferencia entre los diferentesposibles caminos.

Los argumentos anteriores nos muestran que es necesario razonar en terminos de amplitudes de probabilidadpara aplicar adecuadamente el principio de superposicion. Cuando los estados intermedios del sistema no estandeterminados experimentalmente son las amplitudes de probabilidad y no las probabilidades las que se debensumar.

Para comprender mejor el error en el razonamiento que nos llevo a la Ec. (5.84), recurrimos al quinto postulado dereduccion del paquete de onda. En el segundo experimento, la medida del observable B involucra una perturbaciondel sistema bajo estudio y durante la medida su ket de estado experimenta un cambio abrupto que se manifiestacomo la proyeccion sobre uno de los estados |wb〉, esta perturbacion inevitable y fundamental es la responsable de ladesaparicion de los efectos de interferencia. En el primer experimento no podemos decir que el sistema fısico “pasa”a traves de uno u otro de los estados |wb〉, es mas acertado decir que el sistema pasa a traves de todos los estados|wb〉 en forma ponderada. Esto se puede ver teniendo en cuenta que el estado antes de la medida de B del segundoexperimento es |ua〉 y este tambien es el estado del sistema en el primer experimento antes de la medida de C, enel primer experimento el estado antes de la medida de C es

|ua〉 =∑

b

cb |wb〉

vemos entonces que cuando no se realiza la medida de B el sistema “esta en todos los estados posibles |wb〉” aunqueen forma ponderada por los coeficientes cb.

De otra parte si las medidas sucesivas no se hacen en tiempos cortos, es posible realizar razonamientos similaresteniendo en cuenta la evolucion del sistema con la ecuacion de Schrodinger, y en todo caso la diferencia fundamentalentre superposiciones lineales de estados y mezcla estadıstica de estados continua existiendo (ver seccion 7.1.2 Pag.220).

Notese que estos razonamientos son muy similares a los que se describieron en la seccion 2.7 sobre el experimentode Young de la doble rendija. En el, la densidad de probabilidad de que un foton emitido por la fuente llegue aun punto dado M en la pantalla se obtiene primero superponiendo linealmente los campos electricos radiados porcada rendija para luego elevar al cuadrado y obtener la intensidad en M (y por tanto la densidad de probabilidaddeseada). El campo electrico hace las veces de la amplitud de probabilidad y la intensidad hace las veces de ladensidad de probabilidad como tal. Cuando no intentamos determinar por cual rendija pasa el foton (es decir no

Page 198: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

198CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

determinamos experimentalmente el “estado intermedio”), son los campos electricos radiados por cada rendija los quese deben superponer linealmente y no sus intensidades, con el fin de obtener la intensidad (densidad de probabilidad)resultante. Podemos decir entonces que el campo radiado por una rendija sobre el punto M representa la amplitudpara un foton emitido desde la fuente (estado inicial) de pasar a traves de tal rendija (estado intermedio) antes dearrivar al punto M sobre la pantalla (estado final), pero sin la medicion del estado intermedio se considera que elfoton pasa por ambas rendijas (todos los estados intermedios accesibles).

De lo anterior podemos obtener las siguientes conclusiones(a) Las predicciones probabilısticas de la teorıa cuantica se obtienen siempre elevando al cuadrado el modulo de

una amplitud de probabilidad(b) Cuando en un experimento particular no se mide un estado intermedio, no se debe razonar en terminos de

las probabilidades de los diversos resultados accesibles que se hubieran obtenido en tales medidas. Se debe razonaren terminos de las amplitudes de probabilidad. Esto tiene que ver con que las medidas destruyen la interferencia,dado que se obtienen valores bien definidos de un observable y un estado intermedio dado. En contraste cuandouna medida no se efectua, el sistema esta simultaneamente en todos los estados intermedios posibles y es estasimultaneidad la que permite la interferencia.

(c) El hecho de que los estados de un sistema fısico se pueden superponer linealmente significa que las amplitudesde probabilidad con frecuencia tiene la forma de una suma de amplitudes parciales. La correspondiente probabilidades entonces igual al modulo al cuadrado de esta suma de terminos con lo cual las amplitudes parciales interfierenentre sı.

5.10. El principio de superposicion para casos en que varios estados estan

asociados a una medida

En la anterior seccion hemos trabajado el caso de mediciones asociadas a valores propios no degenerados en loscuales hay un solo estado asociado a cada medida. En este caso la probabilidad de ocurrencia de un evento se haescrito como el cuadrado del modulo de una suma de terminos (amplitudes). No obstante, cuando hay presenciade degeneracion el cuarto postulado Ec. (4.2) nos dice que la probabilidad de obtener un valor propio degeneradoinvolucra una suma de cuadrados de modulos. Debe tenerse en cuenta sin embargo que cada sumando en (4.2) puedea su vez ser el modulo al cuadrado de una suma de amplitudes. Esto implicara discutir con cuidado el uso adecuadodel principio de superposicion para obtener la probabilidad asociada a valores propios degenerados.

Por otra parte, existe otro escenario importante en el cual varios estados estan asociados con una medicion:cuando la resolucion del aparato de medida es insuficiente (como ocurre en la realidad). Hasta el momento hemosconsiderado medidas ideales pero es necesario discutir como las limitaciones experimentales deben ser manejadaspara obtener predicciones teoricas sobre los resultados. Esta discusion permitira ademas extender el quinto postuladode reduccion del paquete de onda a los espectros contınuos.

5.10.1. El principio de superposicion para valores propios degenerados

Cuando un valor propio an es gn−degenerado, sus kets propios linealmente independientes∣∣uin

⟩generan un

autosubespacio En de dimension gn. En este caso, el estado en el cual queda el sistema despues de obtener an enla medicion no esta unıvocamente determinado, ya que depende del estado inicial |ψ〉 (estado justo antes de lamedicion). Si el estado inicial |ψ〉 es dado, el estado justo despues de la medicion vendra dado por la proyeccionnormalizada de |ψ〉 sobre En que denotamos por |ψn〉. Sin embargo, incluso cuando se obtiene la misma medida anesta proyeccion es diferente cuando cambia el vector inicial, por lo cual podemos decir que hay varios estados finalesasociados a la medida an.

La Ec. (4.2) nos dice como calcular la probabilidad P (an) de obtener el valor an cuando conocemos el estado|ψ〉 del sistema justo antes de la medicion.

P (an) =

gn∑

i=1

∣∣⟨uin∣∣ψ〉∣∣2 (5.87)

para calcular esta probabilidad escogemos una base ortonormal∣∣uin

⟩del autosubespacio En y calculamos la proba-

bilidad∣∣⟨uin

∣∣ψ〉∣∣2 de encontrar al sistema en cada uno de los estados de esta base, la probabilidad P (an) sera entonces

Page 199: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.10. EL PRINCIPIO DE SUPERPOSICION PARA CASOS EN QUE VARIOS ESTADOS ESTAN ASOCIADOS A UNA MEDIDA199

la suma de estas gn probabilidades. Debemos tener en cuenta que cada probabilidad∣∣⟨uin

∣∣ψ〉∣∣2 puede ser el cuadrado

del modulo de una suma de amplitudes que nos generara interferencias. Por ejemplo si el estado inicial normalizadoes de la forma

|ψ〉 = c1 |ψ1〉 + c2 |ψ2〉cada sumando en (5.87) sera de la forma

∣∣⟨uin∣∣ψ〉∣∣2 =

∣∣c1⟨uin∣∣ψ1〉 + c2

⟨uin∣∣ψ2〉

∣∣2

con lo cual se obtienen interferencias al expandir el modulo al cuadrado.

5.10.2. Aparatos insuficientemente selectivos en la medida

Supongamos que tenemos un dispositivo para medir el observable A de un sistema fısico dado, y que el estadojusto antes de la medicion viene dado por

|ψ〉 =∑

k,i

ck,i∣∣uik⟩

(5.88)

siendo∣∣uik

⟩los estados propios de A con valor propio ak. Asumamos que el dispositivo posee las siguientes

caracterısticas.

(a) El dispositivo solo puede dar dos respuestas (autoresultados), que por convencion denotaremos como “si” y“no”.

(b) Si el estado inicial del sistema |ψ〉 esta en una combinacion lineal cuyos valores propios yacen todos en unintervalo dado ∆ del eje real, la respuesta sera definitivamente “sı”. En otras palabras, la respuesta es “sı” con todacerteza, cuando todos los ck,i no nulos de (5.88) sean tales que ak ∈ ∆.

(c) La respuesta es definitivamente “no” si el estado inicial del sistema |ψ〉 esta en una combinacion lineal deestados donde todos los valores propios asociados a los estados de la combinacion lineal yacen fuera del intervalo ∆.

Vemos que ∆ define el poder de resolucion del instrumento. Ası mismo ∆ define los autoestados asociados a losautoresultados “si” y “no”. Si existe un solo valor propio an de A en el intervalo ∆ el dispositivo tendra una resolucioninfinita, ya que para el sistema en un estado inicial arbitrario, la probabilidad P (si) sera igual a la probabilidad deobtener an en la medida de A. La probabilidad de obtener “no” es naturalmente P (no) = 1 − P (si).

Por otro lado, si existen varios valores propios an de A en ∆, el dispositivo no tiene suficiente resolucion paradiscriminar entre estos diferentes autovalores. En este caso hablamos de un aparato o dispositivo insuficientementeselectivo.

Para estudiar la distribucion de probabilidad de P (no) , P (si) con estos dispositivos insuficientemente selectivos,debemos primero estudiar la perturbacion que estos aparatos crean sobre el sistema cuando realizan una medida.Para caracterizar esta perturbacion anadiremos la siguiente hipotesis: El dispositivo transmite sin perturbar todoslos estados propios de A asociados con autovalores incluıdos en el intervalo ∆, ası como cualquier combinacion linealde estos estados, en cambio el dispositivo bloquea los autoestados de A asociados con valores propios fuera delintervalo ∆ ası como todas sus combinaciones lineales. El dispositivo actua entonces como un filtro perfecto paratodos los estados asociados con ∆.

Ilustraremos la plausibilidad de esta hipotesis con un ejemplo. Cuando el espectro de un observable es contınuo,todo dispositivo experimental para medir este espectro es siempre insuficientemente selectivo. Tomaremos en conse-cuencia un ejemplo con espectro contınuo. Supongamos que queremos medir la coordenada x de un electron que sepropaga en la direccion uz. Para ello colocamos sobre el plano XY (en z = 0) una superficie bloqueadora con unaranura con bordes entre x1 y x2 y de ancho infinito paralelo al eje Y . Un paquete de onda que este completamenteincluıdo entre los planos x = x1 y x = x2, entrara a la region derecha (viniendo desde la izquierda) sin ninguna mod-ificacion (esto equivale a un “sı”). Que el paquete de onda este entre los planos x = x1 y x = x2 significa que es unasuperposicion de autoestados de R con autovalores x, y, z donde los x estan todos incluıdos en el intervalo [x1, x2].Por otro lado, cualquier paquete de onda situado por debajo de x = x1 o por encima de x = x2 sera bloqueado porla superficie y no pasara a la derecha (esto equivale a un “no”).

Vemos que para un dispositivo insuficientemente selectivo, hay varios estados finales posibles luego de unamedicion que ha dado la respuesta “si” incluso cuando el espectro de A es no degenerado, ya que los estados propiosde A asociados a los diferentes autovalores ak en ∆ son estados posibles finales.

Page 200: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

200CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

Queremos estudiar cuales son las predicciones que podemos hacer con estos dispositivos cuando un sistemafısico en un estado arbitrario es medido con uno de ellos. Para el ejemplo anterior cuando el paquete de ondaesta completamente adentro (o afuera) del intervalo [x1, x2], la respuesta es definitivamente si (no). Debemos estudiarlas probabilidades P (si) y P (no) cuando el paquete no esta completamente adentro ni completamente afuera.Veremos que esto es equivalente a medir un observable cuyo espectro sea degenerado.

Por el momento retornaremos al caso de un espectro discreto. Consideremos el autosubespacio E∆ generadopor todos los autoestados

∣∣uin⟩

de A cuyos valores propios yacen en el intervalo ∆. El proyector P∆ sobre estesubespacio es

P∆ =∑

an∈∆

gn∑

i=1

∣∣uin⟩ ⟨uin∣∣ (5.89)

donde hemos tenido en cuenta que las autovalores an pueden ser degenerados. Notese que E∆ esta compuestopor todos los estados accesibles del sistema despues de que la medida de A ha dado el valor “si”. En terminosmas matematicos, podemos decir que la respuesta del dispositivo es definitivamente “si” cuando el estado inicialpertenece a E∆, es decir para cualquier estado propio de P∆ con valor propio +1. Adicionalmente, la respuesta esdefinitivamente “no” cuando el estado inicial pertenece al complemento ortogonal de E∆ es decir cuando el estadoes autoestado de P∆ con valor propio 0. Si denotamos E∆ al complemento ortogonal de E∆ podemos escribir

E = E∆ ⊕ E∆ ; |ψ〉 = |ψ∆〉 ⊕ |ψ∆〉 ; |ψ〉 ∈ E ; |ψ∆〉 ∈ E∆ ; |ψ∆〉 ∈ E∆ (5.90)

P∆ |ψ〉 = |ψ∆〉 ; P∆ |ψ∆〉 = (+1) |ψ∆〉 ; P∆ |ψ∆〉 = (0) |ψ∆〉 (5.91)

donde |ψ〉 es un estado arbitrario. Vemos entonces que las respuestas “si” y “no” que nos da nuestro dispositivoequivalen a los autovalores +1 y 0 respectivamente del observable P∆. Podemos decir entonces que el dispositivoesta realmente midiendo los valores propios de P∆ en lugar de los de A.

Con tal interpretacion podemos calcular las distribuciones de probabilidad P (si) y P (no) aplicando los postula-dos al observable P∆ que es el que realmente se esta midiendo. La probabilidad P (si) es la probabilidad de obtenerel valor propio +1 para el observable P∆. Si el estado inicial normalizado es |ψ〉 tal probabilidad se puede escribiraplicando el cuarto postulado (pag. 162) y la Ec. (4.2)

P (si) = P (+1) =∑

m

|〈vm|ψ〉|2 ; P (no) = 1 − P (si)

donde |vm〉 es una base ortonormal asociada al subespacio E(+1) generado por el valor propio +1 de P∆. De (5.91)es claro que E(+1) es justamente E∆; por tanto una base ortonormal |vm〉 posible es precisamente la base

∣∣uin⟩

con an ∈ ∆, que se construyo para E∆. Por tanto, las probabilidades quedan en la forma

P (si) = P (+1) =∑

an∈∆

gn∑

i=1

∣∣⟨uin∣∣ψ〉∣∣2 ; P (no) = 1 − P (si) (5.92)

otra forma es usar las Ecs. (4.6, 5.90) donde en este caso el proyector sobre el autoespacio E(+1) = E∆ del observableP∆ es justamente P∆

P (si) = 〈ψ|P∆ |ψ〉 = 〈ψ∆ |ψ∆〉 (5.93)

aplicando (5.89) en (5.93) vemos que se reproduce (5.92)

|ψ∆〉 = P∆ |ψ〉 =∑

an∈∆

gn∑

i=1

∣∣uin⟩ ⟨uin∣∣ψ〉 ; 〈ψ|P∆ |ψ〉 = 〈ψ|

[∑

an∈∆

gn∑

i=1

∣∣uin⟩ ⟨uin∣∣ψ〉]

(5.94)

〈ψ|P∆ |ψ〉 =∑

an∈∆

gn∑

i=1

〈ψ∣∣uin⟩ ⟨uin∣∣ψ〉 =

an∈∆

gn∑

i=1

∣∣⟨uin∣∣ψ〉∣∣2 (5.95)

Similarmente, puesto que el dispositivo no perturba los estados que pertenecen a E∆ y bloquea aquellos quepertenecen a E∆, vemos que el estado del sistema despues de la medicion cuando ha dado un resultado “si”, es decir

Page 201: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.11. DISCUSION GENERAL SOBRE EL FENOMENO DE INTERFERENCIA 201

cuando el autovalor obtenido para P∆ es +1 esta dado por |ψ∆〉 pero normalizado, de las Ecs. (5.94, 5.95) se tiene

∣∣ψ′⟩ =|ψ∆〉

〈ψ∆ |ψ∆〉 =P∆ |ψ〉

〈ψ|P∆ |ψ〉 (5.96)

∣∣ψ′⟩ =

∑an∈∆

∑gni=1

∣∣uin⟩ ⟨uin∣∣ψ〉√∑

am∈∆

∑gmk=1 |〈ukm|ψ〉|

2(5.97)

cuando ∆ contiene solo un autovalor an de A, E∆ y P∆ se reducen a En y Pn y la resolucion del aparato es infinita, enel sentido de que las incertidumbres y perturbaciones son solo las inherentes a las leyes de la mecanica cuantica, esdecir estamos hablando de medidas ideales en el sentido cuantico. Vemos entonces que las Ecs. (4.6, 4.8) se puedenver como casos particulares de las Ecs. (5.93, 5.96). Notese que la suma sobre an en las Ecs. (5.92, 5.97) se puede vercomo una “degeneracion adicional”. Se puede observar que cuando ∆ contiene varios valores propios, el problemase asemeja a un problema con degeneracion incluso si cada an en ∆ es no degenerado, ya que en lo que concierne alcalculo de la probabilidad Ec. (5.92), la suma sobre an es tambien una suma de modulos al cuadrado al igual quela suma sobre i.

5.11. Discusion general sobre el fenomeno de interferencia

Hemos visto que en algunos casos la probabilidad se calcula como el cuadrado del modulo de una suma deamplitudes y en otros casos como suma de modulos cuadrados (sumas de probabilidades). Es importante dejar clarocuando se emplea cada algoritmo.

Nuevamente el experimento de Young de la doble rendija resulta ilustrativo. Supongamos que queremos calcularla probabilidad de que un determinado foton golpee la pantalla en un cierto intervalo [x1, x2]. Esta probabilidad esproporcional a la intensidad total incidente sobre todo este intervalo

IT =

∫ x2

x1

I (x) dx =

∫ x2

x1

|E (x)|2 dx

es decir es una suma de cuadrados (suma de densidades de probabilidad). No obstante, la intensidad en un puntode la pantalla x ∈ [x1, x2] es el cuadrado del campo electrico E (x) el cual es la superposicion lineal de los camposelectricos EA (x) y EB (x) radiados por las dos rendijas A y B sobre el punto x en la pantalla. I (x) es entonces|EA (x) + EB (x)|2 es decir el cuadrado de una suma. EA (x) y EB (x) son las amplitudes asociadas a los dos caminosposibles (paso por cada rendija) que terminan en el mismo punto x. Estas amplitudes se adicionan para obtener laamplitud en x ya que no estamos tratando de determinar por cual rendija pasa el foton. Luego, para calcular laintensidad total se suman estos modulos al cuadrado (suma de intensidades), es decir se suman las intensidades sobrelos diferentes puntos x, para obtener la intensidad total en el intervalo [x1, x2] (equivalente a suma de probabilidadespara obtener probabilidad total).

La anterior discusion nos muestra que la suma de amplitudes se realiza cuando partiendo desde un estadoinicial dado llegamos por diferentes caminos al mismo estado final (en este caso un punto fijo x en la pantalla).Tendremos tantas amplitudes como caminos intermedios considerados. Una vez calculado el modulo al cuadradode la suma de estas amplitudes se suman estos cuadrados sobre estados finales diferentes (en este ejemplocorresponde a sumar las intensidades sobre los diferentes puntos x del intervalo).

Resumimos el algoritmo en la siguiente forma: Se suman las amplitudes correspondientes al mismo estado final,luego se suman las probabilidades correspondientes a estados finales ortogonales.

El hecho de que se sume sobre estados ortogonales tiene que ver con que usualmente los diferentes estados quese usan para construır una base son todos ortogonales entre sı. En general, debemos decir que se suma sobre estadoslinealmente independientes.

5.12. Medicion insuficiente de espectros contınuos

Ya mencionamos que todo dispositivo que mida un observable con espectro contınuo necesariamente debe serinsuficiente, ya que ningun instrumento de medicion esta exento de la incertidumbre experimental. Por tanto, la

Page 202: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

202CAPITULO 5. CONSECUENCIAS DE LOS POSTULADOS SOBRE LOS OBSERVABLES Y SUS MEDIDAS

discusion sobre la aplicacion de los postulados para medidas insuficientes resulta apropiado para el estudio de lamedicion de espectros contınuos.

El ejemplo mas simple y directo es la medicion de la posicion de una partıcula. Nos preguntamos por la proba-bilidad de encontrar a la partıcula en una posicion dentro de un intervalo ∆ = [x1, x2] con un dispositivo similar aldescrito anteriormente.

Asumamos que la partıcula (sin espın) esta en un estado |ψ〉. El subespacio E∆ asociado con esta medidaes el expandido por los kets |r〉 = |x, y, z〉 / x1 ≤ x ≤ x2. Puesto que estos kets son ortonormales en el sentidoextendido, la aplicacion de la regla descrita en la seccion 5.11 nos dice que

P (x1 ≤ x ≤ x2) =

∫ x2

x1

dx

∫ ∞

−∞dy

∫ ∞

−∞dz |〈x, y, z |ψ〉|2 =

∫ x2

x1

dx

∫ ∞

−∞dy

∫ ∞

−∞dz |ψ (r)|2 (5.98)

vemos que la Ec. (5.93) conduce al mismo resultado ya que P∆ viene dado en este caso por

P∆ =

∫ x2

x1

dx

∫ ∞

−∞dy

∫ ∞

−∞dz |x, y, z〉 〈x, y, z|

de modo que

P (x1 ≤ x ≤ x2) = 〈ψ|P∆ |ψ〉 = 〈ψ|[∫ x2

x1

dx

∫ ∞

−∞dy

∫ ∞

−∞dz |x, y, z〉 〈x, y, z|

]|ψ〉

P (x1 ≤ x ≤ x2) =

∫ x2

x1

dx

∫ ∞

−∞dy

∫ ∞

−∞dz 〈ψ |x, y, z〉 〈x, y, z|ψ〉 (5.99)

P (x1 ≤ x ≤ x2) =

∫ x2

x1

dx

∫ ∞

−∞dy

∫ ∞

−∞dz |ψ (r)|2 (5.100)

ahora debemos encontrar el estado |ψ ′〉 despues de que la medicion arroje un valor “si”, es decir cuando la posicionde la partıcula este dentro de ∆ despues de la medicion. Para ello aplicamos la Ec. (5.96)

∣∣ψ′⟩ =P∆ |ψ〉

〈ψ|P∆ |ψ〉 =1

〈ψ|P∆ |ψ〉

∫ x2

x1

dx′∫ ∞

−∞dy′∫ ∞

−∞dz′

∣∣x′, y′, z′⟩ ⟨x′, y′, z′

∣∣ψ〉∣∣ψ′⟩ =

1

N

∫ x2

x1

dx′∫ ∞

−∞dy′∫ ∞

−∞dz′

∣∣r′⟩ψ(r′)

; N ≡ 〈ψ|P∆ |ψ〉

donde el factor de normalizacion N ≡ 〈ψ|P∆ |ψ〉 = P (x1 ≤ x ≤ x2), esta dado por la Ec. (5.100). Es inmediatoencontrar la funcion de onda asociada a |ψ ′〉

〈r∣∣ψ′⟩ =

1

N

∫ x2

x1

dx′∫ ∞

−∞dy′∫ ∞

−∞dz 〈r

∣∣r′⟩ψ(r′)

ψ′ (x, y, z) =1

N

∫ x2

x1

dx′∫ ∞

−∞dy′∫ ∞

−∞dz δ

(x− x′

)δ(y − y′

)δ(z − z′

)ψ(x′, y′, z′

)

ψ′ (x, y, z) =1

N

∫ x2

x1

dx′ δ(x− x′

)ψ(x′, y, z

)

y como x puede estar dentro o fuera del intervalo [x1, x2] la funcion de onda sera

ψ′ (x, y, z) =

ψ (x, y, z) si x1 ≤ x ≤ x2

0 si x /∈ [x1, x2](5.101)

vemos entonces que la parte de ψ (r) que corresponde al intervalo asociado al aparato de medicion persiste sinmodificacion, ya que el factor 1/N simplemente asegura que el estado se mantenga normalizado. El resto es suprimidopor la medicion. Podemos decir entonces que el paquete de onda inicial ψ (r) de la partıcula esta siendo “truncado”por los lımites de la “ranura”. Podemos entonces entender a partir de estos procesos porque hablamos de unareduccion del paquete de onda.

Ahora bien, si tenemos un gran numero de partıculas todas en el estado |ψ〉, entrando sucesivamente en elaparato, el resultado sera algunas veces “si” y otras veces “no” segun la distribucion de probabilidad prescrita

Page 203: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

5.13. POSTULADO DE REDUCCION DEL PAQUETE DE ONDA (QUINTO POSTULADO) PARA UN ESPECTRO CONTINUO203

anteriormente. Si la respuesta es “si”, la partıcula sigue su camino a partir de un estado inicial “truncado” o“reducido” dado por |ψ′〉; si el resultado es “no” la partıcula es absorbida por la placa colocada en el plano XY .

Es claro que cuando el espectro es contınuo, el dispositivo sera siempre insuficientemente selectivo puesto que elintervalo [x1, x2] siempre contiene infinitos puntos por pequeno que este sea. Vale la pena sin embargo, analizar ellımite cuando el ancho de este intervalo tiende a cero. Tomemos un intervalo de ancho ∆x centrado en x0, si ∆x lotomamos lo suficientemente pequeno podemos despreciar la variacion de ψ (r) en x y reemplazarla por su valor enx0, en cuyo caso se puede integrar en x la probabilidad dada por (5.98)

P

(x0 −

∆x

2, x0 +

∆x

2

)' ∆x

∫ ∞

−∞dy

∫ ∞

−∞dz |ψ (x0, y, z)|2

dP (x0) = ρ (x0) dx

donde de acuerdo con el cuarto postulado hemos interpretado a la densidad de probabilidad asociada a x0 como laintegral en y y z de la expresion anterior. La diferencia con la Ec. (4.7) es que en (4.7) el espectro se consideraba nodegenerado en tanto que aquı el espectro de X es infinitamente degenerado en Er, ya que todo vector de la forma|x, y, z〉 es vector propio de X. Por esta razon, en esta densidad de probabilidad interviene una integral doble sobrey y z.

5.13. Postulado de reduccion del paquete de onda (quinto postulado) paraun espectro contınuo

En la discusion del quinto postulado dada en la seccion 4.3.4, nos hemos restringido al caso discreto. Sin embargo,la discusion realizada en la seccion 5.12 sobre dispositivos insuficientemente selectivos nos permite extender elpostulado al caso de espectro contınuo. El cual estableceremos de la siguiente forma

Quinto postulado o postulado de reduccion del paquete de onda (caso contınuo): Si estando el sistemaen un estado |ψ〉 realizamos una medida sobre el observable A de espectro contınuo no degenerado, obteniendo comoresultado un valor dentro del intervalo [α0 − ∆α, α0 + ∆α], el estado del sistema inmediatamente despues de lamedida esta descrito por

∣∣ψ′⟩ =P∆α (α0) |ψ〉

〈ψ|P∆α (α0) |ψ〉; P∆α (α0) ≡

∫ α0+∆α2

α0−∆α2

dα |να〉 〈να|

el proceso de reduccion aparece con claridad en la Ec. (5.101), si la generalizamos a cualquier observable A deespectro contınuo α con funcion de onda 〈να |ψ〉 que representa a |ψ〉 en la base |να〉. Segun la Ec. (5.101)adecuadamente generalizada, el sistema queda preparado en un estado cuya funcion de onda es cero fuera delintervalo de seleccion y dentro de dicho intervalo conserva la forma de la funcion de onda original (excepto por unfactor de normalizacion). Sin importar que tan pequeno sea ∆α nunca obtenemos el autoestado |να0〉 despues de lamedida, el cual en la base |να〉 estarıa representado por 〈να |να0〉 = δ (α− α0). Pues la funcion de onda truncadasiempre tiene un ancho finito ∆α. Finalmente, es claro que el factor de normalizacion debe ser mayor que la unidad.

Page 204: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 6

Aplicacion de los postulados cuando se poseeinformacion parcial de un sistema

Hemos estudiado hasta el momento la aplicacion de los postulados cuando el estado del sistema se conoceperfectamente. Veremos dos casos en los cuales manejamos informacion parcial del sistema (a) cuando el sistemaesta compuesto de dos o mas subsistemas, y solo realizamos medidas de un subsistema especıfico. (b) cuandodesconocemos las condiciones iniciales detalladas y solo poseemos informacion en forma de probabilidad, comoocurre en la mecanica estadıstica. Estudiaremos primero el caso (a).

6.1. Aplicacion de los postulados cuando se mide un observable de un sub-sistema

Hemos visto que cuando dos subsistemas cuanticos se condensan, podemos formar un unico sistema global atraves del producto tensorial de los espacios de Hilbert asociados a cada subsistema. Nuestro proposito es estudiar elcomportamiento del sistema global cuando se realiza la medida de un observable asociado a uno de los subsistemas.

Consideremos el sistema fısico como compuesto de dos subsistemas (1) y (2) descritos por los espacios de HilbertE (1) y E (2). El espacio de estados asociado al sistema global es

E ≡ E (1) ⊗ E (2)

por ejemplo un sistema de dos electrones (sin espın), esta descrito por una funcion de onda de la forma ψ (x1, y1, z1;x2, y2, z2) asociadacon un ket del espacio Er (1) ⊗ Er (2). Consideremos el caso en el cual se mide un observable asociado a solo unode los subsistemas. Asumiremos de aquı en adelante que las medidas se realizaran sobre el subsistema (1) ya queel analisis del caso en que se hace una medida sobre el subsistema (2) es totalmente analogo. El observable A (1)asociado a una medida sobre el subsistema (1) es la extension tensorial del observable A (1) (ver Ec. 1.127)

A (1) ≡ A (1) ⊗ I (2) (6.1)

ya vimos en la seccion 1.32.3 que el espectro de A (1) en E (1)⊗E (2) es identico al espectro de A (1) en E (1). Vimosadicionalmente que la degeneracion de cada valor propio en E (1)⊗E (2) es el producto de su degeneracion en E (1)por la dimension de E (2). Esto implica que (si E (2) es de dos o mas dimensiones) todo valor propio de A (1) esdegenerado. En consecuencia, cuando se realiza una medida sobre el subsistema (1), el estado del sistema globaldespues de la medida dependera tanto del resultado de la medida como del estado justo antes de esta. Fısicamente,esto se debe a que el resultado no da ninguna informacion sobre el subsistema (2), y por tanto el ket asociado noconstituye un C.S.C.O.

Vamos a calcular la probabilidad de obtener un valor propio dado an en una medida del observable A (1). Paraello apelamos a la Ec. (4.6) pag 163

P (1) (an) = 〈ψ| Pn (1) |ψ〉 (6.2)

siendo |ψ〉 el estado (normalizado) en el que se encuentra el sistema global antes de la medicion. El proyector

204

Page 205: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

6.1. APLICACION DE LOS POSTULADOS CUANDO SE MIDE UN OBSERVABLE DE UN SUBSISTEMA205

extendido Pn (1) se escribe en terminos del proyector Pn (1) en E (1) en la forma

Pn (1) ≡ Pn (1) ⊗ I (2) ; Pn (1) =

gn∑

i=1

∣∣uin (1)⟩ ⟨uin (1)

∣∣ (6.3)

siendo∣∣uin (1)

⟩una base ortonormal en E (1) y gn la degeneracion de an en E (1). Pn (1) es entonces el proyector

en E (1) ⊗ E (2) sobre el autosubespacio generado por an en E (1) ⊗ E (2). Adicionalmente podemos expresar laidentidad de (2) usando una base ortonormal |vk (2)〉 de E (2) con lo cual Pn (1) queda

Pn (1) ≡ Pn (1) ⊗ I (2) =

[gn∑

i=1

∣∣uin (1)⟩ ⟨uin (1)

∣∣]⊗[∑

k

|vk (2)〉 〈vk (2)|]

=

gn∑

i=1

k

[∣∣uin (1)⟩⊗ |vk (2)〉

] [⟨uin (1)

∣∣ 〈vk (2)|]

Pn (1) =

gn∑

i=1

k

∣∣uin (1) vk (2)⟩ ⟨uin (1) vk (2)

∣∣ (6.4)

aplicando este proyector en la Ec. (6.2) resulta

P (1) (an) = 〈ψ| Pn (1) |ψ〉 =

gn∑

i=1

k

〈ψ|[∣∣uin (1) vk (2)

⟩ ⟨uin (1) vk (2)

∣∣] |ψ〉

=

gn∑

i=1

k

〈ψ| uin (1) vk (2)〉⟨uin (1) vk (2)

∣∣ψ〉

P (1) (an) = 〈ψ| Pn (1) |ψ〉 =

gn∑

i=1

k

∣∣⟨uin (1) vk (2)∣∣ψ〉∣∣2 (6.5)

adicionalmente, el estado |ψ′〉 justo despues de la medicion se puede calcular empleando la Ec. (4.8) pag. 165, yteniendo en cuenta las Ecs. (6.5, 6.4)

∣∣ψ′⟩ =Pn (1) |ψ〉√〈ψ| Pn (1) |ψ〉

=

∑gni=1

∑k

∣∣uin (1) vk (2)⟩ ⟨uin (1) vk (2)

∣∣ψ〉√∑gni=1

∑k |〈uin (1) vk (2)|ψ〉|2

(6.6)

Notese que las Ecs. (6.2, 6.3, 6.6), nos dicen que la base ortonormal |vk (2)〉 en E (2) se puede elegir arbitrariamentesin alterar las predicciones fısicas sobre los observables del subsistema (1). Esto es de esperarse, ya que al no realizarseninguna medida en el sistema (2), ningun conjunto de estados en E (2) es preferencial.

6.1.1. Interpretacion fısica de los estados que son productos tensoriales

En la seccion 1.32, vimos que no todos los estados en E (1) ⊗ E (2) se pueden expresar como producto tensorialde estados en E (1) y en E (2). Estudiaremos aquı el significado fısico de los estados que sı son producto tensorial delos subespacios anteriores, sea |ψ〉 ∈ E (1) ⊗ E (2) tal que

|ψ〉 = |ϕ (1)〉 ⊗ |χ (2)〉 = |ϕ (1)χ (2)〉 ; |ϕ (1)〉 ∈ E (1) , |χ (2)〉 ∈ E (2) ; ‖|ϕ (1)〉‖ = ‖|χ (2)〉‖ (6.7)

supongamos que |ψ〉 es el estado del sistema antes de la medicion de A (1), el estado |ψ′〉 despues de la medicion seobtiene aplicando las Ecs. (6.6, 6.7, 6.3)

∣∣ψ′⟩ =Pn (1) |ψ〉√〈ψ| Pn (1) |ψ〉

=[Pn (1) ⊗ I (2)] [|ϕ (1)〉 ⊗ |χ (2)〉]√

[〈ϕ (1)| ⊗ 〈χ (2)|] [Pn (1) ⊗ I (2)] [|ϕ (1)〉 ⊗ |χ (2)〉]∣∣ψ′⟩ =

Pn (1) |ϕ (1)〉 ⊗ I (2) |χ (2)〉√[〈ϕ (1)| ⊗ 〈χ (2)|] [Pn (1) |ϕ (1)〉 ⊗ I (2) |χ (2)〉]

=Pn (1) |ϕ (1)〉 ⊗ |χ (2)〉√

〈ϕ (1)|Pn (1) |ϕ (1)〉 〈χ (2)|χ (2)〉

Page 206: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

206CAPITULO 6. APLICACION DE LOS POSTULADOS CUANDO SE POSEE INFORMACION PARCIAL DE UN SISTEMA

que se puede escribir como

∣∣ψ′⟩ =∣∣ϕ′ (1)

⟩⊗ |χ (2)〉 ;

∣∣ϕ′ (1)⟩≡ Pn (1) |ϕ (1)〉√

〈ϕ (1)|Pn (1) |ϕ (1)〉

vemos que el estado posterior a la medicion tambien es un producto tensorial tal que el estado del subsistema (1)ha cambiado pero no el estado asociado al subsistema (2). La probabilidad P (an) queda en la forma

P (1) (an) = 〈ψ| Pn (1) |ψ〉 = 〈ϕ (1)χ (2)| [Pn (1) ⊗ I (2)] |ϕ (1)χ (2)〉= 〈ϕ (1)|Pn (1) |ϕ (1)〉 〈χ (2)| I (2) |χ (2)〉

P (1) (an) = 〈ϕ (1)|Pn (1) |ϕ (1)〉

de lo cual se ve que P (1) (an) no depende de |χ (2)〉 solo del estado |ϕ (1)〉 del subsistema (1). Por tanto, cuando elestado del sistema esta descrito por un producto tensorial como en la Ec. (6.7), las predicciones fısicas asociadas asolo uno de los dos subsistemas, no dependen del estado del otro subsistema y se obtienen unicamente a partir delestado del subsistema sobre el que se mide.

En consecuencia, un estado producto |ϕ (1)〉⊗ |χ (2)〉 describe una simple yuxtaposicion de los subsistemas (1) y(2) cada uno de ellos en los estados |ϕ (1)〉 y |χ (2)〉 respectivamente. En tal estado, se dice que los dos subsistemasNO estan correlacionados, esto implica que la medicion de observables que pertenecen a uno u otro subsistemacorresponden a variable aleatorias independientes. Esto ocurre cuando los subsistemas han sido preparados en losestados |ϕ (1)〉 y |χ (2)〉 para luego unirlos sin interaccion.

6.1.2. Significado fısico de estados que no son productos tensoriales

Sean |un (1)〉 y |vk (2)〉 bases de E (1) y E (2) respectivamente. Si el estado |ψ〉 no esta asociado a un productotemsorial entonces este se escribe como

|ψ〉 =∑

n,k

cn,k |un (1)〉 ⊗ |vk (2)〉

donde hay por lo menos dos sumandos diferentes de cero. Veamos las predicciones sobre la medicion de un observableA (1) asociado solo al subsistema (1). En tal caso, es facil probar que las predicciones fısicas no se pueden escribir soloen terminos de un estado del subsistema (1). Esto se puede ver aplicando las formulas (6.5, 6.6) en el contexto masgeneral. Esta situacion corresponde entonces a la existencia de correlaciones entre los dos subsistemas, los resultadosde medidas sobre cada subsistema corresponden a variables aleatorias dependientes y que pueden ser correlacionadas.Puede demostrarse por ejemplo que si dos subsistemas descritos por un producto tensorial se “concetan” entre sı pormedio de una interaccion, el nuevo estado ya no sera un producto tensorial.

Estudiemos primero el caso mas sencillo, asumiendo que el valor propio an obtenido en la medida es no degener-ado, en tal caso desaparece la sumatoria sobre i en la Ec. (6.3) y en todas las demas ecuaciones. El estado despuesde la medida se obtiene de (6.6) suprimiendo la suma sobre i

∣∣ψ′⟩ =

∑k |un (1) vk (2)〉 〈un (1) vk (2)|ψ〉√∑

k |〈un (1) vk (2)|ψ〉|2=

|un (1)〉 ⊗∑k |vk (2)〉 〈un (1) vk (2)|ψ〉√∑k |〈un (1) vk (2)|ψ〉|2

∣∣ψ′⟩ = |un (1)〉 ⊗∣∣χ′ (2)

⟩;∣∣χ′ (2)

⟩=

∑k |vk (2)〉 〈un (1) vk (2)|ψ〉√∑

k |〈un (1) vk (2)|ψ〉|2(6.8)

en este caso, sin importar el estado |ψ〉 previo a la medicion del subsistema (1), el estado global posterior a lamedicion de un observable no degenerado es siempre un producto tensorial. Esto es resultado se puede extender alcaso en que se realiza un conjunto de mediciones asociadas a un C.S.C.O. es decir cuando la medicion es completacon respecto a un subsistema (estas mediciones son naturalmente parciales con respecto al sistema global).

Cuando el estado del sistema global no es un producto tensorial del tipo |ϕ (1)〉⊗|χ (2)〉, no podemos asociar cadaket |ϕ (1)〉 , |χ (2)〉 a los subsistemas (1) y (2) 1. Surge entonces la pregunta de como caracterizar cada sistema parcial

1Por ejemplo, la energıa de un sistema compuesto no es en general la suma de las energıas individuales ya que la interaccion aporta adicha energıa, ademas no hay una manera no ambigua de “repartir” la energıa total del sistema asignandole una porcion a cada sistema.

Page 207: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

6.2. OPERADOR DENSIDAD 207

en un sistema correlacionado. Esta pregunta es de gran interes si tenemos en cuenta que en general todo sistemafısico ha interactuado en el pasado con otros sistemas incluso si esta aislado en el momento en que estudiamos talsistema. Esto implica que el sistema total (sistema bajo estudio mas el sistema con el que interactuo en el pasado)no es en general un estado producto y no es posible asociar un vector de estado |ϕ (1)〉 con el sistema bajo estudio.Este problema se resuelve asociando al subsistema (1) (sistema bajo estudio) un operador (operador densidad) enlugar de un vector, volveremos sobre este punto en la seccion 6.2.

Por el momento, tomaremos un caso en el cual se puede asociar un vector de estado para el sistema (1), estoes cuando se realiza un conjunto completo de medidas del subsistema (1). Hemos visto que en tal situacion, paracualquier estado del sistema global (1) + (2) antes de la medida, un conjunto completo de medidas en E (1) colocaal sistema global en un estado que es producto tensorial como se ve en la Ec. (6.8). El vector asociado con (1) es elque se obtiene de manera unica (salvo por un factor multiplicativo), por medio de los valores del conjunto completode medidas sobre (1). En consecuencia, el conjunto completo de medidas sobre (1) borra todas las correlaciones quesurgen de interacciones previas entre los dos sistemas. En particular, si en el momento de la medida el sistema (2)esta muy lejos y ya no interactua con el sistema (1), el sistema (2) puede ser totalmente omitido para efectos deestudiar al sistema (1).

Hemos visto que cuando el estado |ψ〉 es un producto tensorial, el vector de estado asociado al subsistema (2),no depende de medidas hechas sobre el sistema (1). Ahora bien, cuando el estado del sistema global es |ψ〉 antes delas medidas, y realizamos un conjunto completo de medidas sobre (1), la Ec. (6.8) nos muestra el estado |ψ ′〉 en elcual queda preparado el sistema global. Dicha ecuacion nos muestra que cuando |ψ〉 no es un producto tensorial, elvector de estado |χ′ (2)〉 asociado al sistema (2) posterior a las medidas, depende del resultado del conjunto completode medidas en (1). Esto es a priori sorprendente ya que el estado del sistema (2) despues de ejecutar un conjuntocompleto de medidas en (1), dependera del resultado de dichas medidas incluso si el sistema (2) esta muy lejos delsistema (1) en el momento de realizar las medidas. En otras palabras un conjunto completo de medidas sobre (1)influirıa sobre el sistema (2) incluso cuando estos no interactuan. Esta paradoja ha sido ampliamente estudiada porcinetıficos como Einstein, Podolsky, Rosen y Bell.

6.2. Operador densidad

Cuando conocemos completamente el estado del sistema en un cierto tiempo, podemos predecir determinısti-camente el estado en cualquier tiempo posterior en tanto no se realice una medida. Tambien podemos predecirperfectamente probabilidades de obtener determinados resultados cuando se realizan medidas. Para determinarcompletamente el estado en cierto tiempo es suficiente realizar un conjunto de medidas que formen un C.S.C.O.Este es el caso en el experimento de polarizacion de fotones descrito en la seccion 2.7.2 en el cual el estado depolarizacion de esto es conocido perfectamente cuando el haz atravieza el polarizador.

Sin embargo, ocurre con frecuencia que el estado del sistema no esta completamente determinado. Por ejemplo,los estados de polarizacion de los fotones que emanan de una fuente de luz natural (no polarizada) no estan biendefinidos. Otro ejemplo lo constituyen los atomos de un gas a cierta temperatura, para los cuales el valor de la energıacinetica de los atomos solo se conoce estadısticamente. La pregunta natural es como incorporar esta informacionincompleta en el formalismo de modo que se pueda aprovechar de la mejor manera posible. Esto nos llevara a laintroduccion del operador densidad que nos permitira incorporar los resultados parciales en los postulados de lamecanica cuantica.

6.2.1. El concepto de mezcla estadıstica de estados

Ya hemos mencionado el concepto de mezcla estadıstica de estados (ver seccion 5.9.1, pag 194). Cuando tenemosinformacion incompleta de un sistema es usual utilizar el concepto de probabilidad para incorporar la informacionparcial. Como ejemplo, cada estado de polarizacion posible para un foton posee la misma probabilidad en un haz deluz no polarizada. Un sistema termodinamico en equilibrio a temperatura T posee una probabilidad proporcional ae−En/kT de estar en el estado de energıa En.

En mecanica cuantica es usual que la informacion parcial se presente de la siguiente forma: Un sistema cuanticodado posee un conjunto de estados accesibles |ψn〉 siendo pk la probabilidad de obtener un estado especıfico |ψk〉

Page 208: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

208CAPITULO 6. APLICACION DE LOS POSTULADOS CUANDO SE POSEE INFORMACION PARCIAL DE UN SISTEMA

donde obviamente ∑

k

pk = 1 ; 0 ≤ pk ≤ 1

decimos entonces que el sistema esta en una mezcla estadıstica de estados accesibles |ψn〉 con probabilidadespn. Queremos ahora hacer predicciones sobre los resultados cuando se realiza un conjunto de medidas sobre elsistema. Si el sistema estuviera en un estado |ψk〉 podrıamos aplicar los postulados para realizar las correspondientespredicciones. Sin embargo, dado que no tenemos certeza sobre el estado inicial sino solo una probabilidad pk de quese encuentre en ese estado, los resultados obtenidos deben ser ponderados por el factor pk y luego sumados sobretodos los estados accesibles en la mezcla estadıstica.

Los estados accesibles |ψk〉 se pueden normalizar y de hecho asumiremos de aquı en adelante que estannormalizados. Sin embargo, estos estados no son necesariamente ortogonales.

Por otra parte sera necesario distinguir en nuestro estudio dos tipos diferentes de probabilidad: (a) Probabilidadde obtener un estado |ψk〉 en el tiempo inicial. En otras palabras, probabilidad de encontrar al sistema en t0 enunas condiciones iniciales dadas. Este tipo de probabilidad se utiliza tambien en mecanica estadıstica clasica y esinherente a la informacion incompleta sobre las condiciones iniciales. (b) Probabilidad de obtener ciertos resultadoscuando se realizan medidas en el sistema, esta probabilidad es eminentemente cuantica y proviene de los postuladosde la mecanica cuantica, ademas no desaparece incluso si determinamos perfectamente las condiciones iniciales(estado |ψk〉) del sistema.

Adicionalmente, es necesario diferenciar entre una mezcla estadıstica y una superposicion lineal de estados (versecciones 5.9.1, 5.9.3). Cuando tenemos una superposicion lineal de estados

|ψ〉 =∑

k

ck |ψk〉 (6.9)

es frecuente decir que cuando el vector de estado es |ψ〉, el sistema tiene probabilidad |ck|2 de estar en el estado|ψk〉. Esto en realidad significa que cuando se realiza un conjunto de medidas que corresponden a un C.S.C.O. y quetienen a |ψk〉 como autovector, la probabilidad de encontrar el conjunto de autovalores asociados con |ψk〉 es |ck|2.Vimos en la seccion 5.9.3 que un estado |ψ〉 dado por la Ec. (6.9) no equivale simplemente a un sistema que tiene laprobabilidad |ck|2 de estar en el estado |ψk〉 para cada estado accesible. Esto se debe a que una combinacion linealdel conjunto |ψk〉 genera interferencias entre los estados accesibles debidas a terminos cruzados de la forma ckc

∗p

que surgen cuando los modulos de la amplitud de probabilidad se suman y luego se elevan al cuadrado.Lo anterior implica que no podemos en general describir una mezcla estadıstica a traves de un “vector de estado

promedio” que sea una superposicion de los estados |ψk〉. Como ya mencionamos, cuando tomamos una sumaponderada de probabilidades no se obtienen terminos de interferencia entre los estados accesibles de la mezclaestadıstica.

Ya hemos sugerido una estrategia para estudiar los estados que son una mezcla estadıstica que es calcular laspredicciones fısica asociadas a cada estado |ψk〉 ponderando cada estado con su probabilidad para entonces sumarsobre los estados accesibles. Aunque este metodo es correcto resulta engorroso en muchos casos. Por otro lado antela imposibilidad de describir los estados mezclados por medio de un “vector promedio”, recurriremos a utilizar un“operador promedio” que denominaremos operador densidad. Comenzaremso el tratamiento con el caso mas sencilloen el cual el estado del sistema es completamente conocido

6.2.2. Estados puros y operador densidad

Cuando el estado inicial es perfectamente conocido solo hay un estado accesible |ψm〉 de modo que las proba-bilidades asociadas a los estados estan dadas por pk = δkm. En tal caso existe un vector de estado que describe alsistema en cualquier instante de tiempo

|ψ (t)〉 =∑

n

cn (t) |un〉

siendo |un〉 una base ortonormal en el espacio de estados, que por simplicidad asumiremos discreta. Si el estadoesta normalizado los coeficientes satisfacen la relacion

n

|cn (t)|2 = 1 (6.10)

Page 209: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

6.2. OPERADOR DENSIDAD 209

si A es un observable, sus elementos de matriz en la base |un〉 y su valor esperado cuando el sistema esta en elestado |ψ (t)〉 estan dados por

〈un|A |up〉 = Anp (6.11)

〈A〉 (t) = 〈ψ (t)|A |ψ (t)〉 =∑

n,p

〈ψ (t)|un〉 〈un|A |up〉 〈up |ψ (t)〉 (6.12)

〈A〉 (t) =∑

n,p

c∗n (t) cp (t) Anp ; ck (t) ≡ 〈uk |ψ (t)〉 (6.13)

y la evolucion de |ψ (t)〉 se describe con la ecuacion de Schrodinger

i~d

dt|ψ (t)〉 = H (t) |ψ (t)〉 (6.14)

siendo H (t) el Hamiltoniano del sistema. Notese que el valor esperado de A depende cuadraticamente de loscoeficientes de Fourier como se aprecia en la Ec. (6.13). El producto de coeficientes c∗n (t) cp (t) que aparece en dichaecuacion se puede escribir en la forma

c∗n (t) cp (t) = 〈up |ψ (t)〉 〈ψ (t)|un〉 = 〈up| [|ψ (t)〉 〈ψ (t)|] |un〉

de modo que este producto es claramente un elemento de la representacion matricial del proyector |ψ (t)〉 〈ψ (t)| enla base |uk〉. Es natural entonces definir un operador ρ (t) en la forma

ρ (t) ≡ |ψ (t)〉 〈ψ (t)| (6.15)

que denominaremos operador densidad. Su representacion matricial en la base |uk〉 es claramente

ρpn = 〈up| ρ (t) |un〉 = c∗n (t) cp (t) (6.16)

mostraremos a continuacion que el operador densidad ρ (t), posee la misma informacion fısica que el vector de estado|ψ (t)〉. Para verlo reescribiremos las formulas (6.10, 6.13, 6.14) en terminos de ρ (t). Sustituyendo (6.16) en (6.10)tenemos ∑

n

|cn|2 =∑

n

c∗ncn = 1 ⇒∑

n

ρnn = 1

de modo que la traza del operador densidad es igual a la unidad

Trρ (t) = 1 (6.17)

teniendo en cuenta las relaciones (6.11, 6.16), la Ec. (6.13) queda

〈A〉 (t) =∑

n,p

c∗n (t) cp (t) Anp =∑

n,p

〈up| ρ (t) |un〉 〈un|A |up〉 =∑

p

〈up| ρ (t)A |up〉

〈A〉 (t) = Tr ρ (t)A (6.18)

ahora calcularemos la evolucion temporal de ρ (t), partiendo de la Ecuacion de Schrodinger y su conjugada

d

dtρ (t) =

d

dt[|ψ (t)〉 〈ψ (t)|] =

[d

dt|ψ (t)〉

]〈ψ (t)| + |ψ (t)〉

[d

dt〈ψ (t)|

]

=1

i~H (t) |ψ (t)〉 〈ψ (t)| + 1

(−i~)|ψ (t)〉 〈ψ (t)|H (t) =

1

i~H (t) ρ (t) − 1

i~ρ (t)H (t)

d

dtρ (t) =

1

i~[H (t) , ρ (t)]

veamos ahora como se escribe la probabilidad P (an) de obtener el valor an cuando se mide el observable A, enterminos del operador densidad. La Ec. (4.6) nos muestra que P (an) es el valor esperado del proyector Pn sobre elautoespacio generado por an

P (an) = 〈ψ (t)|Pn |ψ (t)〉 = 〈Pn〉 (6.19)

Page 210: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

210CAPITULO 6. APLICACION DE LOS POSTULADOS CUANDO SE POSEE INFORMACION PARCIAL DE UN SISTEMA

y usando (6.18) en (6.19) se obtieneP (an) = 〈Pn〉 = Tr Pnρ (t) (6.20)

otras propiedades del operador densidad se siguen directamente de su definicion Ec. (6.15)

ρ† (t) = ρ (t) ; ρ2 (t) = ρ (t) ; Trρ2 (t) = 1

En resumen, hemos encontrado las siguientes expresiones para el operador densidad y su relacion con los ob-servables fısicos

〈A〉 (t) = Tr ρ (t)A ; P (an) = Tr Pnρ (t) (6.21)

i~d

dtρ (t) = [H (t) , ρ (t)] (6.22)

Trρ = 1, ρ† (t) = ρ (t) (6.23)

ρ2 (t) = ρ (t) ; Trρ2 (t) = 1 (6.24)

la primera de las Ecs. (6.21) nos expresa la conservacion de la probabilidad en el lenguaje del operador densidad.Veremos que estas ecuaciones seran tambien validas en el caso de estados mezclados, excepto las Ecs. (6.24), lascuales provienen del hecho de que para estados puros, el operador densidad es un proyector.

Para el caso de estados puros, el formalismo de operador densidad es totalmente equivalente al de vectores deestado. No obstante, el formalismo de operador densidad posee algunas ventajas incluso para estudiar estados puros.Por ejemplo, los estados fısicamente equivalentes |ψ (t)〉 y eiθ |ψ (t)〉 estan asociados a un solo operador densidadρ (t) = |ψ (t)〉 〈ψ (t)| de modo que el operador densidad remueve la arbitrariedad introducida por la fase en el vectorde estado. Por otra parte, las Ecs. (6.21, 6.22, 6.23) muestran que las formulas basicas para los observables sonlineales con respecto al operador densidad ρ (t). En contraste, las Ecs. (6.12, 6.19) son cuadraticas en el vector deestado |ψ (t)〉. Veremos que la linealidad simplificara el tratamiento considerablemente.

6.2.3. Mezcla estadıstica de estados: estados no puros

Estudiaremos ahora la incorporacion del operador densidad para la caracterizacion de estados mezclados, en loscuales no es posible una caracterizacion por vectores de estado. Sean pk las probabilidades de encontrar al sistemaen los cada estado accesible |ψk〉. Estas probabilidades pk son numeros reales que satisfacen las condiciones

0 ≤ pk ≤ 1 ;∑

k

pk = 1 (6.25)

veamos como calcular la probabilidad P (an) de que al medir el observable A se obtenga el valor an. Comenzaremospor evaluar la probabilidad Pk (an) de obtener el valor an del observable A, cuando el sistema se encuentra en elestado |ψk〉, puesto que tal probabilidad sale directamente de los postulados

Pk (an) = 〈ψk|Pn |ψk〉para obtener P (an) debemos entonces ponderar esta probabilidad con la probabilidad pk de que el sistema este enel estado |ψk〉 2, para luego sumar sobre todos los estados accesibles

P (an) =∑

k

pkPk (an) (6.26)

Pk (an) es una probabilidad asociada a un estado puro (con vector de estado |ψk〉) de modo que podemos evaluarlaaplicando la Ec. (6.20)

Pk (an) = Tr ρkPn (6.27)

siendo ρk = |ψk〉 〈ψk| el operador densidad asociado al vector de estado |ψk〉. Para obtener P (an) en terminos delos operadores densidad ρk sustituımos (6.27) en (6.26)

P (an) =∑

k

pkTr ρkPn = Tr

k

pkρkPn

(6.28)

2Esto nos da la probabilidad de que ocurran simultaneamnte dos hechos: (a) que el estado del sistema sea |ψk〉 y (b) que el valorobtenido en la medida del observable A sea an.

Page 211: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

6.2. OPERADOR DENSIDAD 211

observese que si definimos

ρ (t) =∑

k

pkρk (t) (6.29)

y sustituımos esta definicion en (6.28), obtendremos una expresion para estados mezclados analoga a la Ec. (6.20)para estados puros

P (an) = Tr ρPn (6.30)

es natural entonces definir a ρ en la Ec. (6.29), como el operador densidad asociado al sistema en un estado mezclado.Notese que ρ es el promedio ponderado de los operadores ρk asociados a estados puros.

6.2.4. Propiedades generales del operador densidad

Derivaremos las propiedades del operador densidad para estados mezclados. Obviamente, tales propiedadesdeben contener como caso particular las propiedades del operador densidad para estados puros, para lo cual debehacerse pk = δkm. Calculemos primero la traza de ρ

Trρ = Tr

[∑

k

pkρk

]=∑

k

pkTrρk =∑

k

pk = 1

donde hemos usado las Ecs. (6.29, 6.17, 6.25). La expresion para la probabilidad Ec. (6.30) coincide con la expresionpara estados puros, con la extension apropiada del operador densidad Ec. (6.29). Veamos lo que ocurre con el valoresperado de un observable

〈A〉 =∑

k

pk 〈Ak〉 =∑

k

pkTr ρkA = Tr

[∑

k

pkρk

]A

= Tr

[∑

k

pkρk

]A

〈A〉 = Tr ρA

esto tambien se puede ver usando la Ec. (6.30) en la forma

〈A〉 =∑

n

anP (an) =∑

n

anTr ρPn = Tr

ρ∑

n

anPn

= Tr ρA

calculemos ahora la evolucion temporal del operador densidad para estados mezclados. Para ello asumiremos quea diferencia del estado del sistema, su Hamiltoniano esta bien definido. En otras palabras, el sistema como talesta perfectamente definido aunque no lo este su estado. Puede verse facilmente que si en el tiempo t0 el sistematiene una probabilidad pk de estar en el estado |ψk〉 entonces en un tiempo posterior t, tiene la misma probabilidadde estar en el estado |ψk (t)〉. Si el sistema esta en el estado |ψk〉 (puro) en t0, la evolucion temporal esta dada poral ecuacion de Schrodinger

i~d

dt|ψk (t)〉 = H (t) |ψk (t)〉 ; |ψk (t0)〉 = |ψk〉

el operador densidad en el tiempo t esta dado por

ρ (t) =∑

k

pkρk (t) (6.31)

donde hemos usado el hecho ya mencionado de que pk no evoluciona en el tiempo. Usando (6.22, 6.31) encontramosque

dρ (t)

dt=

k

pkdρk (t)

dt=∑

k

pk1

i~[H (t) , ρk (t)] =

1

i~

[H (t) ,

k

pkρk (t)

]=

1

i~[H (t) , ρ]

i~dρ (t)

dt= [H (t) , ρ]

notese que hemos usado la linealidad de las Ecs. (6.22, 6.31) con respecto a ρk (t) para obtener la evolucion temporalde ρ. Vemos entonces que ecuacion de evolucion temporal es totalmente analoga a la obtenida para estados purosEc. (6.22).

Page 212: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

212CAPITULO 6. APLICACION DE LOS POSTULADOS CUANDO SE POSEE INFORMACION PARCIAL DE UN SISTEMA

Notese sin embargo, que ρ definido por (6.31) no es un proyector (a menos que pk = δkm, en cuyo caso tenemosun estado puro). Se puede verificar que cuando el estado es mezclado i.e. pk 6= δkm tenemos que

ρ2 6= ρ ; Trρ2 < 1 (6.32)

y que verificando una sola de las ecuaciones (6.24) nos dice que el sistema esta en un estado puro. En conclusion,utilizando la definicion (6.31) del operador densidad ρ para estados mezclados, se obtienen las Ecs. (6.21-6.23), perolas Ecs. (6.24) para estados puros son reemplazadas por las Ecs. (6.32) para estados mezclados.

Demostraremos adicionalmente que ρ es un operador positivo, en primer lugar es claro que ρ es hermıtico puestoque pk son numeros reales no negativos. Adicionalmente, si tomamos un ket arbitrario |u〉 podemos escribir

〈u| ρ |u〉 =∑

k

pk 〈u| ρk |u〉 =∑

k

pk 〈u|ψk〉〈ψk |u〉 =∑

k

pk |〈u|ψk〉|2

〈u| ρ |u〉 ≥ 0 (6.33)

donde hemos usado el hecho de que las probabilidades pk son no negativas. Esto demuestra que ρ es un operadorpositivo.

Resumimos estos resultados en la siguiente forma: sea un sistema que esta en una mezcla estadıstica de estadoscon estados accesibles |ψk〉, cada uno de ellos asociado a una probabilidad pk, definimos el operador densidadρ con las siguientes propiedades

ρ (t) ≡∑

k

pkρk (t) ; ρk (t) ≡ |ψk〉 〈ψk| (6.34)

ρ = ρ† ; Trρ = 1 ; ρ es un operador positivo (6.35)

ρ2 (t) = ρ (t) ; Trρ2 (t) = 1 para estados puros (i.e. pk = δkm) (6.36)

ρ2 (t) 6= ρ (t) ; Trρ2 (t) < 1 para estados mezclados (i.e. pk 6= δkm) (6.37)

〈A〉 (t) = Tr ρ (t)A ; P (an) = Tr Pnρ (t) (6.38)

i~d

dtρ (t) = [H (t) , ρ (t)] (6.39)

6.2.5. Populaciones y coherencias

Veremos ahora el significado Fısico de los elementos matriciales ρnp de ρ en una cierta base |un〉. Consideremosprimero los elementos diagonales ρnn. De acuerdo con (6.34) estos elementos estan dados por

ρnn =∑

k

pk [ρk]nn =∑

k

pk [|ψk〉 〈ψk|]nn =∑

k

pk〈un |ψk〉 〈ψk| un〉 =∑

k

pk |〈un |ψk〉|2

ρnn =∑

k

pk

∣∣∣c(k)n

∣∣∣2

; c(k)n ≡ 〈un |ψk〉 (6.40)

los factores∣∣∣c(k)n

∣∣∣2

son cantidades positivas que fısicamente se interpretan de la siguiente manera: Si el estado del

sistema es |ψk〉 y si se mide un observable A cuyos vectores propios estan dados por la base |un〉, entonces∣∣∣c(k)n

∣∣∣2

es la probabilidad de que el sistema quede preparado en el estado |un〉 despues de la medida de A.

Ahora bien, la Ec. (6.40), nos dice que ρnn es la suma ponderada (a traves de las probabilidades asociadas alos estados) de las probabilidades arriba mencionadas. En otras palabras, ρnn representa la probabilidad promediode encontrar al sistema en el estado |un〉. Este promedio surge de la indeterminacion que tenemos sobre el estadoinicial del sistema. Por las razones anteriores, ρnn se conoce como la populacion del estado |un〉; puesto que sirealizaramos la misma medida un numero N de veces para sistemas identicos bajo las mismas condiciones iniciales3,

3En este caso, las mismas condiciones iniciales no significan que el sistema parta siempre del mismo estado |ψk〉. Lo que significa esque en el momento inicial para cada experimento, el sistema posee los mismo estados accesibles |ψk〉 con las mismas ponderacionespk para estos. Podemos decir que el sistema esta en la misma condicion mezclada inicial, ya que para cada experimento, el operadordensidad es el mismo en el tiempo inicial.

Page 213: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

6.2. OPERADOR DENSIDAD 213

siendo N un numero muy grande, un numero Nρnn de sistemas estaran en el estado |un〉. Es claro ademas de la Ec.

(6.40), que ρnn es un numero real positivo, igual a cero solo si todos los∣∣∣c(k)n

∣∣∣2

son cero.

Con un calculo muy similar se encuentran los elementos no diagonales de ρ en la base |un〉

ρnp =∑

k

pkc(k)n c(k)∗p ; c(k)n ≡ 〈un |ψk〉 (6.41)

los terminos cruzados c(k)n c

(k)∗p son del mismo tipo que los estudiados en la seccion 5.9.1. Por tanto, ellos expresan

los efectos de interferencia entre los estados |un〉 y |up〉 que pueden surgir cuando el estado |ψk〉 es una superposicionlineal coherente de estos estados. La Ec. (6.41) nos dice que ρnp es el promedio de estos terminos cruzados tomadossobre todos los estados accesibles de la mezcla estadıstica. A diferencia de las populaciones, ρnp se puede anularincluso si los terminos cruzados no son nulos, esto se debe a que estos terminos cruzados son numeros complejos(y no numeros reales no negativos como ocurre con los ρnn). Si un ρnp es cero, significa que hay una cancelacionestadıstica de los efectos de interferencia entre los estados |un〉 y |up〉. Por otro lado, si ρnp no es cero, decimosque existe cierta coherencia entre estos estados. Por esta razon, a los elementos no diagonales ρnp suele llamarselescoherencias.

Es importante mencionar que la distincion entre populaciones y coherencias depende de la base |un〉 escogidaen el espacio de estados, o en otras paralabras del observables A para el cual construımos la base |un〉 de vectorespropios. Puesto que ρ es hermıtico, es posible encontrar una base ortonormal |χl〉 donde ρ sea diagonal, ρ se puedeescribir entonces en la forma

ρ =∑

l

πl |χl〉 〈χl|

siendo πl los valores propios de ρ. Dado que ρ es positivo, sus valores propios son reales no-negativos y puesto queTrρ =

∑l πl = 1 tenemos que

0 ≤ πl ≤ 1 ;∑

l

πl = 1

por tanto se puede considerar que ρ describe una mezcla estadıstica de los estados |χ l〉 con probabilidades πl.Claramente, no hay coherencias entre los estados |χl〉.

Usando la Ec. (6.33) se puede demostrar que

ρnnρpp ≥ |ρnp|2

de esto se obtiene en particular, que ρ solo puede tener coherencias entre estados cuya populacion es no nula.Un caso interesante ocurre cuando la base elegida |un〉 son autovectores del Hamiltoniano, y este ultimo no

depende explıcitamente del tiempo. Tenemos entonces que

H |un〉 = En |un〉

usando la Ec. (6.39) y teniendo en cuenta que |un〉 y En no dependen del tiempo (ya que el Hamiltoniano no deendendel tiempo) se encuentra que

〈un|(i~d

dtρ

)|up〉 = 〈un| [H, ρ] |up〉 ⇒ i~

d

dt〈un| ρ |up〉 = 〈un| [Hρ− ρH] |up〉

⇒ i~dρnpdt

= 〈un| [Enρ− ρEp] |up〉 ⇒ i~dρnpdt

= (En −Ep) 〈un| ρ |up〉

i~dρnpdt

= (En −Ep) ρnp

conviene colocar los terminos diagonales y no diagonales por aparte

i~dρnndt

= 0 ; i~dρnpdt

= (En −Ep) ρnp

de lo cual se deduceρnn (t) = constante ; ρnp = e

i~(Ep−En)tρnp (0)

de modo que las populaciones son constantes y las coherencias oscilan a las frecuencias de Bohr del sistema.

Page 214: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

214CAPITULO 6. APLICACION DE LOS POSTULADOS CUANDO SE POSEE INFORMACION PARCIAL DE UN SISTEMA

6.3. Aplicaciones del operador densidad

6.3.1. Sistema en equilibrio termodinamico

Este ejemplo es tomado de la mecanica estadıstica cuantica. Consideremos un sistema termodinamico en equi-librio con un bano termico a temperatura absoluta T . Se puede mostrar que su operador densidad es

ρ = Z−1e−H/kT ; Z ≡ Tre−H/kT

donde H es el Hamiltoniano del sistema, k la constante de Boltzmann y Z es una funcion de normalizacion (conocidacomo funcion de particion) para mantener la traza de ρ igual a la unidad.

Vamos a calcular las populaciones y coherencias para la base ortonormal |un〉 asociada a los autoestados delHamiltoniano. Los elementos matriciales de ρ estaran dados por

ρnp = Z−1 〈un| e−H/kT |up〉 = Z−1 〈un| e−Ep/kT |up〉 = Z−1e−Ep/kT 〈un|up〉ρnp = Z−1e−Ep/kT δnp

vemos entonces que en el equilibrio termodinamico, las populaciones de los estados estacionarios |un〉 son funcionesexponencialmente decrecientes de la energıa, ademas el decrecimiento es mas rapido a medida que disminuye latemperatura. Por otro lado, las coherencias entre los estados estacionarios son nulas.

6.3.2. Descripcion de subsistemas con base en observables globales de un sistema: el conceptode traza parcial

Volveremos a estudiar sistemas consistentes en dos subsistemas (1) y (2) como se describio en la seccion 6.1.Sea E (1) [E (2)] el espacio de estados del subsistema (1) [(2)], y sea |un (1)〉 [|vp (2)〉] una base ortonormal enel espacio E (1) [E (2)]. El espacio de estados para el sistema global E y una base ortonormal para dicho espacio seobtienen como

E = E (1) ⊗ E (2) ; |un (1) vp (2)〉 ≡ |un (1)〉 ⊗ |vp (2)〉 ≡ |un (1)〉 |vp (2)〉

Sea un observable A que actua en el espacio E . Ya hemos estudiado como extender un operador que proviene de unode los espacios factores. Ahora estudiaremos un proceso inverso: con base en el operador A que actua en el espacioproducto, encontraremos un operador A (1) que actua en el espacio E (1), y que nos permitira hacer prediccionesfısicas sobre el sistema (1). Esta operacion se denominara la traza parcial con respecto al sistema (2). Naturalmente,se puede inducir analogamente el operador A (2) sobre el sistema (2) usando la traza parcial con respecto al sistema(1).

Introduciremos el operador A (1) por medio del operador A, definiendo los elementos matriciales de A (1) en labase |un (1)〉 de E (1)

〈un (1)|A (1) |un′ (1)〉 ≡∑

p

〈un (1) vp (2)|A |un′ (1) vp (2)〉 = 〈un (1)|∑

p

[〈vp (2)|A |vp (2)〉]|un′ (1)〉 (6.42)

como esta definicion es valida para cualquier base |un (1)〉 de E (1) tenemos

A (1) ≡∑

p

[〈vp (2)|A |vp (2)〉] (6.43)

si definimos la traza parcial con respecto al sistema (2) de un operador A sobre E en la forma

Tr2A ≡∑

p

〈vp (2)|A |vp (2)〉 (6.44)

podemos escribir la definicion de A (1), Ec. (6.43) en la forma

A (1) ≡ Tr2A (6.45)

Page 215: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

6.3. APLICACIONES DEL OPERADOR DENSIDAD 215

para comprender el concepto de traza parcial, escribamos la traza “normal” de un operador A en terminos de labase |un (1)〉 |vp (2)〉 de E

TrA =∑

n

p

〈un (1) vp (2)|A |un (1) vp (2)〉 (6.46)

comparando (6.46) con (6.44) vemos que la apariencia de las dos ecuaciones es similar, excepto que en (6.44) solose suma sobre la base del sistema (2). Por esta razon, hablamos de la traza parcial de A con respecto al sistema (2).Notese ademas que la traza parcial con respecto al sistema (2) de un operador A sobre E es un operador en E (1),en contraste con la traza normal, la cual es un numero complejo.

Veamos ahora como se escribe la traza normal de A en terminos de las trazas parciales sobre los sistemas (1) y(2).

TrA =∑

n

p

〈un (1)| 〈vp (2)|A |vp (2)〉 |un (1)〉 =∑

n

〈un (1)|∑

p

〈vp (2)|A |vp (2)〉|un (1)〉

=∑

n

〈un (1)| Tr2A |un (1)〉 = Tr1 (Tr2A)

asumiendo que las sumatorias pueden intercambiarse encontramos que

TrA = Tr1 (Tr2A) = Tr2 (Tr1A) (6.47)

Es facil ver que la traza parcial con respecto al sistema (1) de un operador sobre E (1) es un numero complejo, eigualmente cuando tomamos el sistema (2). Por esta razon, si tomamos la traza parcial con respecto a (1) y luegola traza parcial con respecto a (2) (o viceversa) de un observable A sobre E , el resultado es un numero complejocomo se ve en la Ec. (6.47).

Obtendremos ahora la traza (normal) de A (1) (calculada sobre E (1)). Para ello usamos la Ec. (6.43), con locual se obtiene

TrA (1) =∑

n

〈un|A (1) |un〉 =∑

n

〈un|[∑

p

〈vp (2)|A |vp (2)〉]|un〉 =

n

p

〈unvp (2)|A |unvp (2)〉

TrA (1) = TrA (6.48)

En conclusion la traza de A (calculada sobre E) coincide con la traza de A (1) (calculada sobre E (1)) y obviamentetambien coincide con la traza de A (2) (calculada sobre E (2)).

Adicionalmente, es facil ver a partir de la Ec. (6.43), que si A es hermıtico entonces A (1) y A (2) tambien loson.

6.3.3. Traza parcial y operador densidad

Una de las aplicaciones de mayor interes del concepto de traza parcial se obtiene cuando lo aplicamos al operadordensidad ρ sobre E = E (1) ⊗ E (2). Puesto que la traza de ρ es igual a la unidad, la traza de ρ (1) y ρ (2) tambienlo sera, de acuerdo con la Ec. (6.48). Ası mismo, los operadores ρ (1) y ρ (2) tambien seran hermıticos y en general,puede demostrarse que ρ (1) y ρ (2) satisfacen todas las propiedades de un operador densidad establecidas en laseccion 6.2.44.

Sea ademas A (1) un observable definido sobre E (1). La Ec. (6.38) nos dice que el valor esperado del observable

4Sin embargo, la evolucion temporal de ρ (1) o ρ (2) no viene en general dada por la Ec. (6.39).

Page 216: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

216CAPITULO 6. APLICACION DE LOS POSTULADOS CUANDO SE POSEE INFORMACION PARCIAL DE UN SISTEMA

A (1) ≡ A (1) ⊗ I2 sobre E esta dado por

⟨A (1)

⟩= Tr

ρA (1)

=∑

n,p

〈un (1) vp (2)|[ρA (1)

]|un (1) vp (2)〉

=∑

n,p

〈un (1) vp (2)| ρ

n′,p′

∣∣un′ (1) vp′ (2)⟩ ⟨un′ (1) vp′ (2)

∣∣ (A (1) ⊗ I2) |un (1) vp (2)〉

=∑

n,p

n′,p′

〈un (1) vp (2)| ρ∣∣un′ (1) vp′ (2)

⟩〈un′ (1)|A (1) |un (1)〉

⟨vp′ (2)

∣∣ I2 |vp (2)〉

=∑

n,p

n′,p′

〈un (1) vp (2)| ρ∣∣un′ (1) vp′ (2)

⟩〈un′ (1)|A (1) |un (1)〉 δpp′

con lo cual es valor esperado de A (1) queda

⟨A (1)

⟩=∑

n,n′

[∑

p

〈un (1) vp (2)| ρ |un′ (1) vp (2)〉]〈un′ (1)|A (1) |un (1)〉

pero el factor dentro de parentesis cuadrados es el elemento matricial de ρ (1), como se observa en la definicion(6.42). Con lo cual tenemos

⟨A (1)

⟩=

n,n′

[〈un (1)| ρ (1) |un′ (1)〉] 〈un′ (1)|A (1) |un (1)〉 =∑

n

n′

[ρ (1)]nn′ [A (1)]n′n =∑

n

[ρ (1)A (1)]nn

⟨A (1)

⟩= Tr [ρ (1)A (1)] (6.49)

comparando con la expresion (6.38) vemos que la traza parcial ρ (1) nos permite calcular los valores esperados de

observables del tipo⟨A (1)

⟩como si el sistema (1) estuviera aislado y tuviera a ρ (1) como su operador densidad.

Similarmente, obtenemos una expresion analoga a la segunda de las Ecs. (6.38) para calcular probabilidades asociadasa observables del tipo A (1), es decir para resultados de medidas realizadas solo sobre el sistema (1).

En la seccion 6.1.2, vimos que no es posible asignar un vector de estado al sistema (1), si el estado del sistemaglobal (1)+(2) no esta descrito por un producto tensorial de estados de E (1) y E (2). Esto nos muestra otra ventajadel operador densidad: independientemente de que el sistema global este o no este en un producto de estados, o deque el sistema este en un estado puro o mezclado, siempre es posible construır un operador densidad ρ (1) asociadoal subsistema (1), utilizando las trazas parciales. Esto permite el calculo de todas las cantidades asociadas solo conel sistema (1). En contraste, para que podamos asignar un vector de estado a cada subsistema del sistema global, serequiere que dicho sistema global este en un estado puro y que el vector de estado que lo describe sea un productotensorial de vectores de cada subsistema.

Por otro lado, Se puede demostrar a partir de la Ec. (6.42) que Trρ2 (1)

no es en general igual a la unidad,

incluso si Trρ = Trρ2 = 1. Fısicamente, esto significa que incluso si ρ describe un estado puro, los operadoresdensidad ρ (1) y ρ (2) obtenidos por trazas parciales no necesariamente describen estado puros. En otras palabras,no es en general posible asignar un vector de estado al subsistema (1) [o al (2)], excepto en el caso en el cual elsistema global es un estado producto.

Lo anterior nos induce a estudiar el caso en el cual el sistema global esta en un estado producto

|ψ〉 = |ϕ (1)〉 |χ (2)〉 = |ϕ (1)χ (2)〉 (6.50)

puesto que esto implica un estado puro, el operador densidad viene dado por la Ec. (6.15)

ρ = |ϕ (1)χ (2)〉 〈ϕ (1)χ (2)| = [|ϕ (1)〉 〈ϕ (1)|] ⊗ [|χ (2)〉 〈χ (2)|]

esto se puede escribir en la forma

ρ = σ (1) ⊗ τ (2) (6.51)

σ (1) ≡ |ϕ (1)〉 〈ϕ (1)| , τ (2) ≡ |χ (2)〉 〈χ (2)| (6.52)

Page 217: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

6.3. APLICACIONES DEL OPERADOR DENSIDAD 217

Calculando las trazas parciales a partir de (6.44) se tiene que

Tr2 σ (1) ⊗ τ (2) ≡∑

p

〈vp (2)| [σ (1) ⊗ τ (2)] |vp (2)〉 = σ (1)∑

p

〈vp (2)| τ (2) |vp (2)〉

Tr2 σ (1) ⊗ τ (2) = σ (1) Tr [τ (2)] = σ (1)

y similarmente para Tr1 σ (1) ⊗ τ (2), con lo cual se obtiene

Tr2 σ (1) ⊗ τ (2) = σ (1) ; Tr1 σ (1) ⊗ τ (2) = τ (2) (6.53)

por tanto si el operador densidad esta descrito por (6.51), tal operador representa una simple yuxtaposicion de unsistema (1) descrito por el operador densidad σ(1), y un sistema (2) descrito por τ (2). No hay correlacion entreestos dos subsistemas.

Notese que los resultados arriba mencionados dependen de la Ec. (6.51), pero no de las Ecs. (6.50, 6.52). Estoimplica que la validez de (6.53) se extiende a un contexto mas general, ya que es posible encontrar estados delsistema en los cuales ρ se puede factorizar en la forma (6.51), pero en donde los operadores factor no necesariamenteson de la forma descrita por (6.52), es decir σ (1) y τ (2) pueden corresponder a estados puros y/o mezclados. Si almenos uno de los operadores σ (1) , τ (2) corresponde a un estado mezclado, el estado del sistema no estara descritopor un vector de la forma (6.50). Lo anterior implica la simple yuxtaposicion de dos sistemas cada uno en un estadomezclado, pero que no estan correlacionados entre sı, y el sistema global sera en general mezclado.

Page 218: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 7

Formulaciones alternativas de la mecanicacuantica

7.1. Operador evolucion temporal: definicion y propiedades

En la seccion 3.3.2 vimos que la transformacion que nos lleva de un estado inicial |ψ (t0)〉 al estado |ψ (t)〉 delmismo sistema en un instante posterior t, es una transformacion lineal descrita por la Ec. (3.21)

|ψ (t)〉 = U (t, t0) |ψ (t0)〉 (7.1)

por otro lado, vimos en la seccion 3.3.3, que los kets |ψ (t)〉 poseen la misma norma para todo tiempo, propiedadfundamental para obtener conservacion de la probabilidad. Esto implica entonces que el operador U (t, t0) debe serunitario (debe conservar la norma). Caracterizar este operador conocido como operador evolucion temporal, es entodo sentido equivalente fısicamente a resolver la ecuacion de Schrodinger. Una primera propiedad que se desprendedirectamente de la definicion Eq. (7.1) es que

U (t0, t0) = I (7.2)

escribiendo la Ec. de Schrodinger en el lenguaje de los kets y usando la Eq. (7.1) se tiene

i~d

dt|ψ (t)〉 = H (t) |ψ (t)〉 (7.3)

i~

[∂

∂tU (t, t0)

]|ψ (t0)〉 = H (t)U (t, t0) |ψ (t0)〉

y teniendo en cuenta que el estado inicial es en principio arbitrario, podemos escribir

i~∂

∂tU (t, t0) = H (t)U (t, t0) (7.4)

vemos que (7.4) es una ecuacion diferencial de primer orden para U (t, t0) que debe cumplir la condicion inicial (7.2).Las Ecs. (7.2, 7.4) se pueden sintetizar en una sola ecuacion integral

U (t, t0) = I − i

~

∫ t

t0

H(t′)U(t′, t0

)dt′

La Ec. (7.1) es valida para todos los valores de t y t0 (de momento no hemos introducido causalidad), por tantopodemos escribir

|ψ (t1)〉 = U (t1, t0) |ψ (t0)〉 (7.5)

|ψ (t2)〉 = U (t2, t1) |ψ (t1)〉 (7.6)

y sustituyendo (7.5) en (7.6) se tiene

|ψ (t2)〉 = U (t2, t1) [U (t1, t0) |ψ (t0)〉]|ψ (t2)〉 = [U (t2, t1)U (t1, t0)] |ψ (t0)〉 (7.7)

218

Page 219: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

7.1. OPERADOR EVOLUCION TEMPORAL: DEFINICION Y PROPIEDADES 219

de la misma forma, la accion de U (t2, t0) se puede escribir usando (7.1)

|ψ (t2)〉 = U (t2, t0) |ψ (t0)〉 (7.8)

y puesto que |ψ (t2)〉 y |ψ (t0)〉 son arbitrarios, la comparacion de las Ecs. (7.7, 7.8) nos da

U (t2, t0) = U (t2, t1)U (t1, t0) (7.9)

este procedimiento se puede generalizar para escribir

U (tn, t0) = U (tn, tn−1)U (tn−1, tn−2) . . . U (t2, t1)U (t1, t0) (7.10)

donde t0, t1, . . . , tn son arbitrarios. Si asumimos causalidad i.e. t0 < t1 < . . . < tn, la Ec. (7.10) se puede interpretardiciendo que el sistema evoluciona desde t0 pasando progresivamente por los estados intermedios t1, t2, . . .,tn−1 hastallegar a tn. Si usamos t0 = t2 en (7.9) y tenemos en cuenta (7.2) llegamos a

U (t2, t2) = I = U (t2, t1)U (t1, t2)

U (t1, t2) = U−1 (t2, t1) (7.11)

es importante insistir en que t1 y t2 son arbitrarios y no se ha asumido causalidad. La relacion (7.11) es sin embargomuy logica desde el punto de vista causal.

Veremos como es el operador evolucion temporal infinitesimal, es decir el que conecta a un tiempo t con untiempo t+ dt, para ello escribimos la ecuacion de Schrodinger (7.3) en forma diferencial

i~ d |ψ (t)〉 = H (t) |ψ (t)〉 dt ⇒ [|ψ (t+ dt)〉 − |ψ (t)〉] = − i

~H (t) |ψ (t)〉 dt ⇒

|ψ (t+ dt)〉 =

[I − i

~H (t) dt

]|ψ (t)〉 (7.12)

de la definicion de operador evolucion temporal se tiene

|ψ (t+ dt)〉 = U (t+ dt, t) |ψ (t)〉 (7.13)

comparando (7.12) con (7.13) se tiene que

U (t+ dt, t) =

[I − i

~H (t) dt

]

vemos que el operador infinitesimal de evolucion temporal es unitario a primer orden ya que H es hermıtico

U † (t+ dt, t) =

[I +

i

~H (t) dt

]⇒

U (t+ dt, t)U † (t+ dt, t) =

[I − i

~H (t) dt

] [I +

i

~H (t) dt

]

U (t+ dt, t)U † (t+ dt, t) = I +O((dt)2

)

una transformacion unitaria finita se obtiene con sucesivas transformaciones infinitesimales, este proceso de inte-gracion solo requiere terminos de primer orden ya que los de segundo orden continuan yendo a cero cuando se tomael lımite. Por tanto, el operador finito de evolucion temporal sera tambien unitario como tenıa que ser

U † (t1, t2) = U−1 (t1, t2) = U (t2, t1)

Page 220: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

220 CAPITULO 7. FORMULACIONES ALTERNATIVAS DE LA MECANICA CUANTICA

7.1.1. Operador evolucion temporal para sistemas conservativos

Cuando H no es funcion del tiempo, la Ec. (7.4) junto con la condicion inicial (7.2) se pueden integrar paraobtener

U (t, t0) = e−iH(t−t0)/~ (7.14)

es facil verificar que este operador es unitario y que U (t0, t) = U−1 (t, t0). La unitariedad de U (t, t0) (y por tantola conservacion de la probabilidad) esta directamente relacionada con la hermiticidad de H. Una vez mas, vemos elpapel clave de la hermiticidad del Hamiltoniano en la conservacion de la probabilidad. A manera de consistencia,vamos a encontrar la Ec. (5.67) a partir de la Ec. (5.66) aplicando el operador evolucion temporal para sistemasconservativos. La Ec. (5.66) es una expansion del estado inicial del sistema en la base |ϕn,τ 〉 de estados propios delHamiltoniano

|ψ (t0)〉 =∑

n

τ

cn,τ (t0) |ϕn,τ 〉 ; cn,τ (t0) ≡ 〈ϕn,τ |ψ (t0)〉 (7.15)

al aplicar el operador evolucion temporal a un |ϕn,τ 〉 queda

U (t, t0) |ϕn,τ 〉 = e−iH(t−t0)/~ |ϕn,τ 〉 =∞∑

k=0

1

k!

[− i

~H (t− t0)

]k|ϕn,τ 〉 =

∞∑

k=0

1

k!

[− i

~(t− t0)

]kHk |ϕn,τ 〉

=∞∑

k=0

1

k!

[− i

~(t− t0)

]kEkn |ϕn,τ 〉 =

∞∑

k=0

1

k!

[− i

~En (t− t0)

]k|ϕn,τ 〉

U (t, t0) |ϕn,τ 〉 = e−iEn(t−t0)/~ |ϕn,τ 〉 (7.16)

aplicando U (t, t0) a ambos lados de la Ec. (7.15) y teniendo en cuenta que este operador es lineal tenemos

U (t, t0) |ψ (t0)〉 =∑

n

τ

cn,τ (t0) U (t, t0) |ϕn,τ 〉

|ψ (t)〉 =∑

n

τ

cn,τ (t0) e−iEn(t−t0)/~ |ϕn,τ 〉 (7.17)

donde hemos usado (7.16). Esta ecuacion coincide con (5.67).

7.1.2. Observaciones adicionales sobre el operador evolucion temporal (opcional)

Cuando H depende explıcitamente del tiempo podrıamos pensar en analogıa con la ecuacion (7.14), que eloperador evolucion temporal es igual al operador V (t, t0) dado por

V (t, t0) = e− i

~

∫ tt0H(t′) dt′

sin embargo, esto no es correcto en general, dado que la derivada de un operador de la forma eF (t) no es en generaligual a F ′ (t) eF (t) (ver Eq. 1.146, pag. 69) de modo que en este caso

i~∂V (t, t0)

∂t6= H (t)V (t, t0)

Consideremos ahora los experimentos descritos en la seccion 5.9.3 en los cuales se llegaba desde el mismo estadoinicial |ua〉 hasta el mismo estado final |vc〉 de dos maneras: (1) Efectuando medidas de los observables A y Cobteniendo dichos estados y (2) Efectuando sucesivamente medidas de los observables A,B y C donde para elestado intermedio se obtiene |wb〉. En la discusion de la seccion 5.9.3 se asumio que las medidas se hacıan enintervalos muy cortos de modo que el sistema no tenıa tiempo de evolucionar. Ahora asumiremos que las medidas sehacen en intervalos en los cuales la evolucion temporal es apreciable. Para el primer caso asumimos que el sistemaesta en el estado |ua〉 en t0, y |vc〉 en t2. Para el segundo caso asumimos que el sistema esta en el estado |ua〉 en t0,en el estado |wc〉 en t1 y finalmente en el estado |vc〉 en t2. Es decir t0, t1 y t2 definen los tiempos en que se realizanlas medidas.

En tal situacion, la Ec. (5.82) se convierte en

Pa (c) =∣∣〈vc|ψ

(t−2)〉∣∣2 = |〈vc|U (t2, t0) |ua〉|2 (7.18)

Page 221: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

7.2. BRAS, KETS Y OBSERVABLES EQUIVALENTES 221

donde∣∣ψ(t−2)⟩

es el estado del sistema que evoluciona desde |ua〉 en t0 hasta el instante justo antes de la medidade C, por eso la notacion t−2 , es claro que

∣∣ψ(t+2)⟩

= |vc〉 (estado justo despues de la medida de C). La Ec. (5.83)queda

Pa (b, c) =∣∣〈vc|φ

(t−2)〉∣∣2 ∣∣〈wb|ψ

(t−1)〉∣∣2 = |〈vc|U (t2, t1) |wb〉|2 |〈wb|U (t1, t0) |ua〉|2 (7.19)

siendo∣∣φ(t−2)⟩

el estado del sistema justo antes de la medida de C, cuando el sistema evoluciona a partir del estado|wb〉 en t1. El estado

∣∣ψ(t−1)⟩

describe al sistema justo antes de la medida de B cuando evoluciona desde |ua〉 en t0.Ahora usando la Ec. (7.9) se tiene

〈vc|U (t2, t0) |ua〉 = 〈vc|U (t2, t1)U (t1, t0) |ua〉〈vc|U (t2, t0) |ua〉 =

b

〈vc|U (t2, t1) |wb〉 〈wb|U (t1, t0) |ua〉 (7.20)

sustituyendo (7.20) en la Ec. (7.18), y comparando el resultado con la Ec. (7.19), se puede verificar que al igual queen la ecuacion (5.86) se tiene que

Pa (c) 6=∑

b

Pa (b, c)

7.2. Bras, kets y observables equivalentes

A traves de la discusion de los postulados de la mecanica cuantica y sus consecuencias, hemos observado quelas predicciones de la mecanica cuantica tales como valores accesibles de un observable, probabilidades, valoresesperados del observable etc. estan expresados en terminos de ecuaciones de valores propios y productos escalares,es decir expresiones de la forma

A |η〉 = a |η〉 ; m = 〈φ|A |ψ〉 (7.21)

donde |η〉 , |φ〉 , |ψ〉 se refiere a estados arbitrarios del sistema y A es un observable (operador hermıtico comple-to). Desde este punto de vista los bras, kets y observables (entendidos estos ultimos como operadores hermıticoscompletos) no son cantidades medibles sino solo herramientas para calcular los verdaderos observables fısicos (val-ores propios y productos escalares). Esto es analogo a lo que ocurre con los potenciales escalar y vectorial enelectrodinamica los cuales son excelentes herramientas pero no corresponden a observables fısicos.

Esto indica que si los kets, bras y observables se redefinen de manera que no se alteran los valores propios ni losproductos escalares, tendremos una imagen diferente pero totalmente equivalente fısicamente desde el punto de vistade los postulados. La alternativa mas evidente para hacer este cambio de imagen es el uso de operadores unitariosya que estos no alteran el valor del producto interno. Vamos a reexpresar el producto interno en (7.21) insertandooperadores identidad a traves de un operador unitario I = O†O = OO†

〈φ|A |ψ〉 = 〈φ|(O†O

)A(O†O

)|ψ〉 =

[〈φ|O†

] (OAO†

)[O |ψ〉]

〈φ|A |ψ〉 = 〈Oφ|(OAO†

)|Oψ〉 (7.22)

ahora redefinimos los operadores, kets y bras en la forma

A′ ≡ OAO† ;∣∣ψ′⟩ ≡ |Oψ〉 = O |ψ〉 ;

⟨ψ′∣∣ ≡ 〈Oψ| = 〈ψ|O† (7.23)

y combinando las Ecs. (7.22, 7.23) es claro que

〈φ|A |ψ〉 =⟨φ′∣∣A′ ∣∣ψ′⟩ (7.24)

adicionalmente puede verificarse que el espectro de valores propios de A′ coincide con el de A, y los vectores propiosde A′ estan dados por |η′〉 ≡ O |η〉 , siendo |η〉 los kets propios de A

A |η〉 = a |η〉 ⇒ OA |η〉 = aO |η〉 ⇒ OA(O†O

)|η〉 = aO |η〉 ⇒

(OAO†

)[O |η〉] = a [O |η〉]

A |η〉 = a |η〉 ⇒ A′ ∣∣η′⟩

= a∣∣η′⟩

; A′ ≡ OAO† ;∣∣η′⟩≡ O |η〉

En conclusion, los nuevos bras, kets y operadores mantienen intactos los valores propios y productos internosasociados con los observables fısicos y por tanto describen la misma Fısica que los bras, kets y operadores originales.

Page 222: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

222 CAPITULO 7. FORMULACIONES ALTERNATIVAS DE LA MECANICA CUANTICA

7.2.1. La transformada de un operador y sus propiedades

Si tomamos la igualdad expresada en (7.24) para los elementos de una base del espacio

〈ui|A |uj〉 =⟨u′i∣∣A′ ∣∣u′j

tal igualdad se puede interpretar diciendo que el elemento matricial A′ij de A′ en la base

∣∣∣u′j⟩

coincide con el

elemento matricial Aij de A en la base |uj〉; siendo ambas bases ortonormales (conectadas por una transformacionunitaria). En este contexto se dice que A′ es la transformada del operador A. La transformada A′ posee propiedadesmuy utiles, ya vimos que el espectro de ambos operadores es identico y sus vectores propios estan conectados poruna transformacion unitaria. Las siguientes propiedades se obtienen de la definicion

(A′)† =

(OAO†

)†= OA†O† =

(A†)′

A = A† ⇔ A′ =(A′)†

de modo que la hermiticidad se preserva con esta relacion. Vemos ademas que la transformada de A esta conectadacon A por una transformacion de similaridad, con el requerimiento de que el operador que realiza la transformacionsea unitario. Como las transformaciones de similaridad preservan el producto, es claro que

(A′)n = (An)′

y usando la definicion para una funcion F (A) del operador A, Ec. (1.129) se obtiene

F ′ (A) = F(A′) (7.25)

donde en este caso F ′ (A) significa la transformada de la funcion F (A) con respecto al operador O, y no la derivadade F (A) “con respecto a A” (ver notacion en la seccion 1.34.1 Eq. 1.135). Para los conmutadores de las transformadasde dos operadores A y B tenemos

[A′, B′] =

[OAO†, OBO†

]=(OAO†

)(OBO†

)−(OBO†

)(OAO†

)

= OA(O†O

)BO† −OB

(O†O

)AO† = OABO† −OBAO† = O (AB −BA)O†

[A′, B′] = O [A,B]O† = [A,B]′ (7.26)

de modo que el conmutador de las transformadas es la transformada del conmutador. Si el conmutador es propor-cional a la identidad (observables conjugados) tenemos

[Q,P ] = αI ⇒[Q′, P ′] = O [Q,P ]O† = αOIO† = αI

[Q,P ] = αI ⇒[Q′, P ′] = [Q,P ] (7.27)

el caso mas importante son los observables X,P para los cuales vemos que el conmutador de sus transformadasX ′, P ′, es identico al de los operadores originales.

7.3. La imagen de Schrodinger y la imagen de Heisenberg

Denotaremos a los kets, bras y observables originalmente utilizados en la mecanica cuantica como |ψS〉 , 〈ψS | ,AS ; indicando que estan en la “imagen de Schrodinger”. En esta imagen, los observables basicos X,P no dependendel tiempo y los observables que se construyen con ellos solo pueden tener dependencia explıcita con el tiempo(excluiremos el espın por ahora) de modo que AS = AS (X,P, t), simplificaremos la notacion a AS = AS (t). Laevolucion temporal del estado en la imagen de Schrodinger se obtiene a traves de la ecuacion de Schrodinger (deallı el nombre de la imagen) o equivalentemente, a traves del operador evolucion temporal Ec. (7.1)

|ψS (t)〉 = U (t, t0) |ψS (t0)〉 ⇒ |ψS (t0)〉 = U † (t, t0) |ψS (t)〉 (7.28)

Page 223: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

7.3. LA IMAGEN DE SCHRODINGER Y LA IMAGEN DE HEISENBERG 223

donde hemos tenido en cuenta que U (t, t0) es unitario, y por tanto tambien lo es U † (t, t0). Notese que definiendo aO ≡ U † (t, t0) como el operador unitario para transformar bras, kets y observables, segun la Ec. (7.23), vemos quela Ec. (7.28) nos conduce a que los nuevos bras y kets seran independientes del tiempo. Denotaremos a los nuevosbras, kets y operadores con el subındice H para indicar “la imagen de Heisenberg”. Usando O ≡ U † (t, t0) en lasEcs. (7.23) y aplicando la Ec. (7.28) se obtiene

|ψH〉 ≡ U † (t, t0) |ψS (t)〉 = |ψS (t0)〉 ; 〈ψH | ≡ 〈ψS (t)|U (t, t0) = 〈ψS (t0)| (7.29)

AH ≡ U † (t, t0)AS (t)U (t, t0) (7.30)

la Ec. (7.29) nos muestra que en la imagen de Heisenberg, los kets y bras no poseen evolucion temporal y suvalor coincide con el del estado en la imagen de Schrodinger en t0. Por otro lado, incluso los observables A que enla imagen de Schrodinger no dependen del tiempo, adquieren dependencia temporal en la imagen de Heisenbergcomo se aprecia en la Ec. (7.30). Se tiene entonces que la evolucion temporal en la imagen de Heisenberg recaecompletamente en los operadores.

Calculemos la evolucion temporal del operador AH (t) para un operador arbitrario AS (t). Derivando la Ec.(7.30) y usando la Ec. (7.4) ası como su adjunta, se tiene que

dAH (t)

dt=

dU † (t, t0)

dtAS (t)U (t, t0) + U † (t, t0)

dAS (t)

dtU (t, t0) + U † (t, t0)AS (t)

dU (t, t0)

dtdAH (t)

dt= − 1

i~U † (t, t0)H

†S (t)AS (t)U (t, t0) + U † (t, t0)

dAS (t)

dtU (t, t0)

+1

i~U † (t, t0)AS (t)HS (t)U (t, t0)

insertando un operador identidad apropiadamente tenemos

dAH (t)

dt= − 1

i~U † (t, t0)HS (t)

[U (t, t0)U

† (t, t0)]AS (t)U (t, t0) + U † (t, t0)

dAS (t)

dtU (t, t0)

+1

i~U † (t, t0)AS (t)

[U (t, t0)U

† (t, t0)]HS (t)U (t, t0)

dAH (t)

dt= − 1

i~

[U † (t, t0)HS (t)U (t, t0)

] [U † (t, t0)AS (t)U (t, t0)

]+ U † (t, t0)

dAS (t)

dtU (t, t0)

+1

i~

[U † (t, t0)AS (t)U (t, t0)

] [U † (t, t0)HS (t)U (t, t0)

]

dAH (t)

dt= − 1

i~HH (t)AH (t) + U † (t, t0)

(dAS (t)

dt

)U (t, t0) +

1

i~AH (t)HH (t)

i~dAH (t)

dt= [AH (t) , HH (t)] + i~

(dAS (t)

dt

)

H

(7.31)

una ecuacion muy similar a la ecuacion para un observable clasico u (q, p) que es funcion del espacio de fase q, p, endonde tenemos corchete de Poisson en lugar de conmutador (ver Ec. 5.53). A manera de consistencia, veremos quees facil reproducir la Ec. (5.52) teniendo en cuenta que por construccion

〈A〉 (t) = 〈ψS (t)|AS (t) |ψS (t)〉 = 〈ψH |AH (t) |ψH〉

teniendo en cuenta la Ec. (7.31) y el hecho de que en la imagen de Heisenberg los estados no dependen del tiempose tiene

d 〈A〉 (t)

dt= 〈ψH |

dAH (t)

dt|ψH〉 = 〈ψH |

1

i~[AH (t) , HH (t)] +

(dAS (t)

dt

)

H

|ψH〉

d 〈A〉 (t)

dt=

1

i~〈[AH (t) , HH (t)]〉H +

⟨(dAS (t)

dt

)

H

H

(7.32)

una vez mas, por construccion estas cantidades son iguales al caso en que todo lo evaluamos en la imagen deSchrodinger, de modo que sustituyendo el subındice H por S en la Ec. (7.32), se reproduce la Ec. (5.52). Notesesin embargo, que la expresion (7.31) es mas general que la Ec. (5.52) ya que la ultima es valida solo para valoresesperados en tanto que (7.31) es valida para los operadores como tal.

Page 224: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

224 CAPITULO 7. FORMULACIONES ALTERNATIVAS DE LA MECANICA CUANTICA

7.3.1. Algunos sistemas simples en la imagen de Heisenberg

Tomemos el caso de una partıcula no-relativista unidimensional de masa m sometida a un potencial del tipoV (XS , t). Usando la Ec. (7.25), tenemos que

HS (t) =P 2S

2m+ V (XS , t) ; HH (t) =

P 2H

2m+ V (XH , t) (7.33)

la Ec. (7.27) nos dice que[XH , PH ] = [XS , PS ] = i~ (7.34)

sustituyendo (7.33, 7.34) en (7.31) se obtiene la evolucion temporal de los operadores XH , PH

i~dXH (t)

dt= [XH (t) , HH (t)] + i~

(dXS

dt

)

H

=

[XH (t) ,

P 2H

2m+ V (XH , t)

]

=

[XH (t) ,

P 2H

2m

]=PH2m

[XH (t) , PH ] + [XH (t) , PH ]PH2m

= i~PHm

dXH (t)

dt=

PHm

i~dPH (t)

dt= [PH (t) , HH (t)] + i~

(dPSdt

)

H

=

[PH (t) ,

P 2H

2m+ V (XH , t)

]

= [PH (t) , V (XH , t)] = −i~∂XHV (XH , t)

dPH (t)

dt= −∂V (XH , t)

∂XH

donde se ha usado la Ec. (1.139) pag. 67. Hemos obtenido entonces la evolucion temporal de los observables basicosen la imagen de Heisenberg

dXH (t)

dt=PHm

;dPH (t)

dt= −∂V (XH , t)

∂XH(7.35)

estas ecuaciones son una generalizacion del teorema de Ehrenfest Ec. (5.55), ya que estas ecuaciones son validaspara los operadores como tal y no solo para sus valores esperados.

Vemos que la analogıa con las ecuaciones clasicas es mas fuerte en la imagen de Heisenberg. En la imagen deSchrodinger, la analogıa aparece solo cuando se toman los valores esperados de los observables. En contraste, en laimagen de Heisenberg la analogıa aparece directamente en la ecuaciones de movimiento para los observables.

Un sistema simple de amplio interes ocurre cuando el sistema es conservativo (HS es independiente del tiempo),y el observable AS conmuta con el Hamiltoniano HS. Para sistemas conservativos, el operador evolucion temporalesta dado por (7.14)

U (t, t0) = e−i~HS(t−t0)

si AS conmuta con HS tambien conmuta con eαHS de modo que conmuta con U (t, t0). El observable asociado en laimagen de Heisenberg queda entonces

AH (t) = U † (t, t0)AS (t)U (t, t0) = U † (t, t0)U (t, t0)AS (t) = AS (t)

En conclusion, si el sistema es conservativo y AS conmuta con HS , los observables en las imagenes de Schrodinger yde Heisenberg coinciden. Como caso particular, HS = HH para sistemas conservativos. Notese que no es necesarioque AS sea constante de movimiento, ya que en general hemos permitido que AS (t) sea funcion explıcita del tiempo.

7.4. La imagen de interaccion

Consideremos un sistema fısico descrito por un Hamiltoniano H0S en la imagen de Schrodinger. Denotaremos eloperador evolucion temporal asociado a H0S como U0 (t, t0) de modo que se cumplen las Ecs. (7.4)

i~∂U0 (t, t0)

∂t= H0S (t) U0 (t, t0) ; U0 (t0, t0) = I (7.36)

Page 225: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

7.4. LA IMAGEN DE INTERACCION 225

asumimos ahora que el sistema es “perturbado” por cierta interaccion adicional, de modo que el Hamiltoniano semodifica en la forma

HS (t) = H0S (t) +WS (t) (7.37)

definiremos una transformacion unitaria para kets, bras y observables a traves del operador evolucion temporal del“Hamiltoniano no perturbado” H0S. Por tanto, los nuevos kets, bras y observables se definiran como

|ψI (t)〉 ≡ U †0 (t, t0) |ψS (t)〉 ; 〈ψI (t)| ≡ 〈ψS (t)|U0 (t, t0) ; AI ≡ U †

0 (t, t0)AS U0 (t, t0) (7.38)

notese que en ausencia de perturbacion i.e. cuando WS (t) = 0, el ket |ψI (t)〉 es independiente del tiempo (y todocoincide con la imagen de Heisenberg). No obstante, la presencia de WS (t) hace que |ψI (t)〉 tenga aun dependenciatemporal. Coloquialmente, podemos decir que el operador unitario elegido, “absorbe” la dependencia temporal delket debida a H0S dejandonos solo con la dependencia temporal causada por WS (t). Ya veremos que las ecuaciones demovimiento apoyan esta vision cualitativa de la situacion. Las Ecs. (7.36, 7.37, 7.38), describen lo que se denominala “imagen de interaccion”.

Primero describiremos la dinamica de los kets |ψI (t)〉 en la imagen de interaccion. Derivando la primera de lasEcs. (7.38) resulta

i~d |ψI (t)〉

dt≡ i~

dU †0 (t, t0)

dt|ψS (t)〉 + i~U †

0 (t, t0)d |ψS (t)〉

dt

y usando las Ecs. (7.36, 7.3) tenemos

i~d |ψI (t)〉

dt≡ −U †

0 (t, t0)H0S (t) |ψS (t)〉 + U †0 (t, t0)HS (t) |ψS (t)〉

= −U †0 (t, t0)H0S (t)

[U0 (t, t0)U

†0 (t, t0)

]|ψS (t)〉

+U †0 (t, t0)HS (t)

[U0 (t, t0)U

†0 (t, t0)

]|ψS (t)〉

i~d |ψI (t)〉

dt= −

[U †

0 (t, t0)H0S (t)U0 (t, t0)] [U †

0 (t, t0) |ψS (t)〉]

+[U †

0 (t, t0)HS (t)U0 (t, t0)] [U †

0 (t, t0) |ψS (t)〉]

i~d |ψI (t)〉

dt=

U †

0 (t, t0) [HS (t) −H0S (t)]U0 (t, t0)[

U †0 (t, t0) |ψS (t)〉

]

=[U †

0 (t, t0)WS (t)U0 (t, t0)] [U †

0 (t, t0) |ψS (t)〉]

quedando finalmente

i~d |ψI (t)〉

dt= WI (t) |ψI (t)〉 (7.39)

de modo que la evolucion temporal del ket |ψI (t)〉 en la imagen de interaccion esta regida solo por el termino deperturbacion como se habıa anticipado. Es facil demostrar que la ecuacion diferencial (7.39) es equivalente a laecuacion integral dada por

|ψI (t)〉 = |ψI (t0)〉 +1

i~

∫ t

t0

dt′ WI

(t′) ∣∣ψI

(t′)⟩

(7.40)

teniendo en cuenta la Ec. (7.38) y el hecho de que U0 (t0, t0) = I, obtenemos la condicion

|ψI (t0)〉 = |ψS (t0)〉

la ecuacion integral (7.40) se puede resolver por iteracion de manera que |ψI (t)〉 queda escrita como una expansionen series de potencias integrales de WI (t)

|ψI (t)〉 =

I +

1

i~

∫ t

t0

dt1 WI (t1) +

(1

i~

)2 ∫ t

t0

dt1 WI (t1)

∫ t1

t0

dt2WI (t2) + . . .

|ψI (t0)〉 (7.41)

Page 226: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

226 CAPITULO 7. FORMULACIONES ALTERNATIVAS DE LA MECANICA CUANTICA

Estudiemos ahora la evolucion temporal de los observables en esta imagen. Para esto se deriva en el tiempo lasegunda de las ecuaciones (7.38), el procedimiento es muy similar al realizado para obtener la Ec. (7.31), el unicodetalle a tener en cuenta es que aquı se usa U0 (t, t0) que esta asociado a H0S, de modo que el analogo a la Ec.(7.31) queda

i~dAI (t)

dt= [AI (t) , H0I (t)] + i~

(dAS (t)

dt

)

I

(7.42)

las ecuaciones de evolucion (7.39) y (7.42) muestran que los kets de estado tienen solo aWI (t) como fuente de cambio,en tanto que los operadores tiene solo a H0I como fuente de cambio. Cada parte del Hamiltoniano contribuye auno u otro cambio, a diferencia de la imagen de Schrodinger en donde la dinamica de los kets esta regida por elHamiltoniano completo, o la de Heisenberg en la cual la dinamica de los operadores se rige por el Hamiltonianocompleto.

Es notable que la Ec. (7.39) para los kets, se asemeja a la ecuacion de Schrodinger en la imagen del mismonombre, aunque en la Ec. (7.39) solo aparece la perturbacion. Analogamente, la Ec. (7.42) para los operadores seasemeja a la Ec. (7.31) en la imagen de Heisenberg, aunque en (7.42) solo aparece el Hamiltoniano no perturbado.

Si por ejemplo, WS (t) es mucho menor1 que H0S (t), la dinamica del vector |ψI (t)〉 es mucho mas “suave” quela dinamica de |ψS (t)〉. Este hecho facilita el uso de diversos metodos de aproximacion. En la practica, esta imagenresulta util cuando H0S es un Hamiltoniano suficientemente simple para conocer su solucion analıtica, de modo queWS (t) se considera una perturbacion que se puede evaluar por diferentes metodos. Dado que los operadores tomansus valores no perturbados (que en principio se asumen conocidos), podemos concentrarnos solo en la evolucion delos kets |ψI〉 que en general tienen una evolucion suave. Por ejemplo H0S puede ser la energıa cinetica (solucion departıcula libre como caso no perturbado) y WS (t) puede ser la energıa potencial, o H0S puede ser la energıa cineticamas una parte de la energıa potencial que sea suficientemente simple, y WS (t) contiene interacciones externasadicionales mas complejas.

1Naturalmente, la comparacion entre dos observables se refiere en realidad a la comparacion entre su valores propios.

Page 227: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 8

El oscilador armonico cuantico

El oscilador armonico es un sistema de gran importancia en la fısica clasica. Tal importancia radica en el hechode que todo movimiento acotado alrededor de un punto de equilibrio estable puede ser aproximado a un movimientoarmonico simple, siempre que las oscilaciones sean suficientemente pequenas. La cuantizacion del oscilador armonicoaparece en el nacimiento mismo de la mecanica cuantica, ya que la hipotesis de Planck consistio en cuantizar losmodos normales que estan asociados a osciladores armonicos en el interior de un cuerpo negro. Adicionalmente, laspequenas oscilaciones alrededor del equilibrio tambien estan presentes en el mundo microscopico, como es el casode las vibraciones de moleculas diatomicas o de los atomos alrededor del punto de equilibrio en un red cristalina,etc. Puesto que en estos casos las “elongaciones” alrededor del equilibrio son comparables a la longitud de onda deDe Broglie de los objetos que vibran, es claro que las correcciones cuanticas seran importantes para estos sistemasque se comportan como osciladores armonicos.

8.1. Propiedades generales del oscilador armonico cuantico unidimensional

El Hamiltoniano cuantizado del oscilador armonico sera de la forma

H =P 2

2m+

1

2mω2X2

puesto que H no es funcion del tiempo, el oscilador armonico cuantico define un sistema conservativo. En conse-cuencia, el estudio mecanico cuantico de dicho sistema se reduce al estudio de su ecuacion de valores propios

H |ϕ〉 = E |ϕ〉

que en la base |x〉 se escribe como[− ~2

2m

d2

dx2+

1

2mω2x2

]ϕ (x) = E ϕ (x)

antes de resolver en detalle la ecuacion de valores propios vale la pena mencionar que la forma del potencial

V (x) =1

2kx2 =

1

2mω2x2

nos permite obtener algunas propiedades generales de las soluciones. En primer lugar, los autovalores del Hamil-toniano son positivos, ya que se puede mostrar que en general si la funcion potencial tiene una cota inferior, losautovalores E de un Hamiltoniano de la forma

H =P 2

2m+ V (X)

son mayores que el mınimo de V (x) de modo que si V (x) ≥ Vm ⇒ E > Vm. Para nuestro caso Vm = 0 y por tantoE > 0.

Las autofunciones de H en la base |x〉 tienen paridad definida. Esto es debido a que el potencial es una funcionpar

V (−x) = V (x)

227

Page 228: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

228 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

podemos buscar autofunciones de H en la base |x〉 con paridad definida. Veremos que esto combinado con el hechode que el espectro no es degenerado nos conduce a que las funciones de onda asociadas con los estados estacionariosson necesariamente pares o impares.

El espectro de energıa es discreto, cualquiera que sea el valor total de la energıa, el movimiento clasico esta lim-itado a un intervalo acotado, y se puede demostrar que en este caso los autovalores son discretos.

Veremos ahora el problema de valores propios en detalle.

8.2. El problema de valores propios del Hamiltoniano

Veremos que el espectro de energıas de la ecuacion de valores propios

H |ϕ〉 = E |ϕ〉

se puede resolver con base en las relaciones canonicas de conmutacion

[X,P ] = i~

por conveniencia utilizaremos los siguientes operadores adimensionales

X ≡√mω

~X ; P ≡ P√

m~ω(8.1)

con los cuales, las relaciones canonicas de conmutacion quedan

[X, P

]= i (8.2)

y el Hamiltoniano se puede escribir en la forma

H = ~ωH ; H ≡ 1

2

(X2 + P 2

)(8.3)

podemos entonces simplificar la ecuacion de valores propios en la forma

H∣∣ϕiν⟩

= εν∣∣ϕiν⟩

donde tanto el operador H como los valores propios εν son adimensionales. Los ındices ν, i pueden ser (por elmomento) contınuos o discretos y el ındice i nos indica el grado de degeneracion.

Notese que si X y P fueran numeros, podrıamos escribir H en (8.3) de la forma H =(X+iP√

2

)(X−iP√

2

), es decir

como el producto de dos funciones lineales. Sin embargo, dado que X y P son operadores no conmutantes, estafactorizacion no es correcta. Sin embargo, veremos que la redefinicion de estos operadores lineales nos simplificaconsiderablemente el problema de valores propios, definiremos entonces

a ≡ 1√2

(X + iP

); a† ≡ 1√

2

(X − iP

)(8.4)

a =

(√mω

2~X + i

P√2m~ω

); a† =

(√mω

2~X − i

P√2m~ω

)(8.5)

cuya inversa se escribe como

X =1√2

(a† + a

); P =

i√2

(a† − a

)(8.6)

X =

√~

2mω

(a† + a

); P = i

√m~ω

2

(a† − a

)(8.7)

Page 229: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

8.2. EL PROBLEMA DE VALORES PROPIOS DEL HAMILTONIANO 229

el conmutador de a† y a se calcula con las reglas canonicas de conmutacion

[a, a†

]=

1

2

[X + iP , X − iP

]=

1

2

[X + iP , X

]− i

2

[X + iP , P

]

=1

2

[X, X

]+i

2

[P , X

]− i

2

[X, P

]− i

2

[iP , P

]

=i

2

[P , X

]+i

2

[P , X

]= i[P , X

]

y usando la Ec. (8.2) queda [a, a†

]= I (8.8)

esta relacion es entonces equivalente a las reglas canonicas de conmutacion. Ahora queremos escribir el Hamiltonianoen terminos de los operadores a, a†, para ello calculamos primero el producto a†a 1

a†a =1

2

(X − iP

)(X + iP

)=

1

2

(X2 + P 2 + iXP − iP X

)

a†a =1

2

(X2 + P 2 + i

[X, P

])

a†a =1

2

(X2 + P 2 − I

)(8.9)

de aquı en adelante reemplazamos la identidad I por el numero 1 lo cual no es causa de ambiguedad. Notese que lapresencia del termino adicional I/2 es debido a la no conmutatividad de X y P . Comparando (8.3) con (8.9) vemosque el Hamiltoniano adimensional sera

H = N +1

2; N ≡ a†a (8.10)

es claro que el nuevo operador N es Hermıtico

N † =(a†a)†

= (a)†(a†)†

= a†a = N

por otro lado el Hamiltoniano adimensional tambien se puede escribir como

H = aa† − 1

2

ahora bien, de acuerdo con la Ec. (8.10), H y N solo difieren en un operador que es multiplo de la identidad. Enconsecuencia, los autovectores de H son autovectores de N y viceversa.

Ahora calcularemos los conmutadores de N con a y a† por medio de la Ec. (8.8)

[N, a] =[a†a, a

]= a† [a, a] +

[a†, a

]a = −a

[N, a†

]=

[a†a, a†

]= a†

[a, a†

]+[a†, a†

]a = a†

en resumen, el algebra de conmutadores entre a, a† y N se escribe[a, a†

]= 1 ; [N, a] = −a ;

[N, a†

]= a† (8.11)

donde tambien hemos tenido en cuenta la Ec. (8.8). Veremos que la ecuacion de valores propios se resolvera enterminos de las propiedades de los operadores a, a† y N . De momento, hemos reducido el problema a encontrar losvectores y valores propios del operador N

N∣∣ϕiν⟩

= ν∣∣ϕiν⟩

y teniendo en cuenta las Ecs. (8.3, 8.10) los autovectores∣∣ϕiν⟩

seran tambien autovectores del Hamiltoniano H conautovalores E =

(ν + 1

2

)~ω

H∣∣ϕiν⟩

=

(ν +

1

2

)~ω∣∣ϕiν⟩

(8.12)

1De acuerdo con la discusion anterior este producto serıa el Hamiltoniano si los operadores P , X fueran conmutantes.

Page 230: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

230 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

8.3. Determinacion del espectro

En todo lo que sigue, asumiremos que los∣∣ϕiν⟩

estan normalizados. Calculemos la norma del vector a∣∣ϕiν⟩. Dicha

norma es obviamente no negativa

∥∥a∣∣ϕiν⟩∥∥2

=⟨ϕiν∣∣ a†a

∣∣ϕiν⟩

=⟨ϕiν∣∣N

∣∣ϕiν⟩

∥∥a∣∣ϕiν⟩∥∥2

= ν⟨ϕiν∣∣ϕiν〉 = ν ≥ 0 (8.13)

lo cual nos indica que

Lemma 1 Los valores propios del operador N son no negativos

La Ec. (8.13) nos muestra que∥∥a∣∣ϕiν⟩∥∥ = 0 ⇔ ν = 0 pero dado que

∥∥a∣∣ϕiν⟩∥∥ = 0 ⇔ a

∣∣ϕiν⟩

= 0 se tiene quea∣∣ϕiν⟩

= 0 ⇔ ν = 0.De acuerdo a lo anterior, si ν > 0 entonces a

∣∣ϕiν⟩

no es cero. Apliquemos ahora el conmutador [N, a] sobre elautovector

∣∣ϕiν⟩

usando las reglas de conmutacion (8.11)

[N, a]∣∣ϕiν⟩

= −a∣∣ϕiν⟩⇒ Na

∣∣ϕiν⟩

= aN∣∣ϕiν⟩− a

∣∣ϕiν⟩

= aν∣∣ϕiν⟩− a

∣∣ϕiν⟩

N[a∣∣ϕiν⟩]

= (ν − 1)[a∣∣ϕiν⟩]

esta expresion nos indica que cuando ν > 0 el vector a∣∣ϕiν⟩

es vector propio de N con autovalor ν − 1. Esto indicaademas que ν ≥ 1 cuando ν > 0, ya que de lo contrario ν − 1 serıa un autovalor negativo de N contradiciendo ellema anterior. Estos resultados los podemos resumir en la siguiente forma

Lemma 2 Sea∣∣ϕiν⟩

un autovector no nulo de N con autovalor ν. Tenemos que (a) a∣∣ϕiν⟩

= 0 ⇔ ν = 0. (b) Siν > 0 ⇒ a

∣∣ϕiν⟩

es un autovector no nulo de N con autovalor ν − 1.

El anterior lema nos caracteriza las propiedades de los vectores a∣∣ϕiν⟩, es natural entonces preguntarse por las

propiedades de los vectores a†∣∣ϕiν⟩. Con un proceso similar al anterior se tiene que

∥∥∥a†∣∣ϕiν⟩∥∥∥

2=

⟨ϕiν∣∣ aa†

∣∣ϕiν⟩

=⟨ϕiν∣∣aa† − a†a+ a†a

∣∣ϕiν⟩

=⟨ϕiν∣∣[a, a†

]+N

∣∣ϕiν⟩

∥∥∥a†∣∣ϕiν⟩∥∥∥

2=

⟨ϕiν∣∣ (1 +N)

∣∣ϕiν⟩

= (ν + 1)⟨ϕiν∣∣ϕiν〉

∥∥∥a†∣∣ϕiν⟩∥∥∥

2= ν + 1

donde hemos usado la Ec. (8.8). Puesto que ν ≥ 0 el vector a†∣∣ϕiν⟩

es siempre no nulo. Ahora usando la Ec. (8.11)calculemos

[N, a†

] ∣∣ϕiν⟩

= a†∣∣ϕiν⟩⇒ Na†

∣∣ϕiν⟩

= a†N∣∣ϕiν⟩

+ a†∣∣ϕiν⟩

= νa†∣∣ϕiν⟩

+ a†∣∣ϕiν⟩

N[a†∣∣ϕiν⟩]

= (ν + 1)[a†∣∣ϕiν⟩]

vemos que a†∣∣ϕiν⟩

es un autovector de N con autovalor ν + 1. Lo anterior podemos resumirlo en la forma

Lemma 3 Sea∣∣ϕiν⟩

un autovector no nulo de N con autovalor ν. Tenemos que (a) a†∣∣ϕiν⟩

es siempre no nulo. (b)a†∣∣ϕiν⟩

es un autovector de N con autovalor ν + 1.

Por ahora sabemos que el espectro de N es no negativo. Asumamos que ν no es entero y mostraremos que estahipotesis contradice al lema 1 y por tanto debe ser rechazada. Si ν no es entero podemos encontrar un entero n talque

n < ν < n+ 1 (8.14)

consideremos la sucesion de kets

∣∣ϕiν⟩, a∣∣ϕiν⟩, a2

∣∣ϕiν⟩, . . . , ap

∣∣ϕiν⟩, . . . , an

∣∣ϕiν⟩

(8.15)

Page 231: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

8.3. DETERMINACION DEL ESPECTRO 231

aplicaremos iterativamente el lema 2.∣∣ϕiν⟩

= a0∣∣ϕiν⟩

es por hipotesis un autovector no nulo de N con valor propioν0 = ν − 0. Ahora a

∣∣ϕiν⟩

de acuerdo con el lema es un autovector no nulo (ya que ν > 0) de N con valor propioν1 = ν − 1, podemos denotar entonces a

∣∣ϕiν⟩≡∣∣ϕiν−1

⟩. Otra aplicacion del lema lleva a que si v − 1 > 0 entonces

a2∣∣ϕiν⟩

= a∣∣ϕiν−1

⟩es un autovector no nulo de N con valor propio ν2 = ν−2. En general ap

∣∣ϕiν⟩

= a[ap−1

∣∣ϕiν⟩]

= a∣∣ϕiν−p+1

⟩es autovector no nulo de N con valor propio ν − p, siempre y cuando se cumpla que ν − p + 1 > 0.

Adicionalmente, puesto que ν no es entero, ν− p es no nulo, con lo cual el lema 1, nos dice que v− p > 0. A su vez,de la Ec. (8.14) vemos que la condicion ν − p > 0 solo se cumple en el intervalo 0 ≤ p ≤ n.

En sıntesis, de acuerdo con el lema 2, un vector ap∣∣ϕiν⟩

de la sucesion (8.15) con 0 ≤ p ≤ n, es un autovector nonulo de N con valor propio ν − p > 0.

Veamos ahora que pasa con un vector fuera de la sucesion para lo cual calculamos

an+1∣∣ϕiν⟩

= a[an∣∣ϕiν⟩]

an∣∣ϕiν⟩

es un autovector no nulo de N con valor propio v − n > 0 (de acuerdo con la Ec. 8.14). Por tanto podemosaplicar el lema 2 para decir que an+1

∣∣ϕiν⟩

es autovector de N con autovalor ν − n − 1 pero este valor propio esestrictamente negativo de acuerdo con la Ec. (8.14). Esto contradice el lema 1 por lo cual debemos rechazar lahipotesis de que ν es no entero.

Lo anterior se puede describir de otra forma diciendo que ap∣∣ϕiν⟩

con 0 ≤ p ≤ n es autovector de N donde losvalores propios νp tienen la siguiente caracterıstica: ν0 = ν ∈ (n, n+ 1); ν1 ∈ (n− 1, n); v2 ∈ (n− 2, n− 1) ; . . . ;νn−1 ∈ (1, 2); νn ∈ (0, 1). Al aplicar de nuevo el operador a, el valor propio correspondiente quedarıa en el intervalo(−1, 0) que esta prohibido por el lema 1.

Veremos ahora que la hipotesis de que ν es entero es perfectamente consistente con los lemas anteriores, en talcaso la Ec. (8.14) se cambia por

n = ν < n+ 1

y el ket an∣∣ϕiν⟩

es un autovector no nulo de N con valor propio v − n = 0. Como su valor propio es cero, el lema 2nos dice que

an+1∣∣ϕin⟩

= 0 (8.16)

por tanto el conjunto de vectores diferentes obtenida por aplicacion reiterada de a sobre∣∣ϕiν⟩

esta limitada cuandoν = n es entero, ya que el lema 2 predice que para todo entero m ≥ n+ 1 tenemos que am

∣∣ϕiν⟩

= 0, y se obtiene elvector cero para cualquier aplicacion adicional del operador a. De esta manera se evita la contradiccion con el lema1 evitando valores propios negativos.

Veremos ahora que el espectro de N consta de todos los enteros no negativos. Ya hemos construıdo un autovectorde N con valor propio nulo: an

∣∣ϕin⟩≡∣∣ϕi0⟩. Ahora bien, el lema 3 nos dice que la aplicacion sucesiva de a† sobre

∣∣ϕi0⟩

nos genera autoestados(a†)k ∣∣ϕi0

⟩, con valor propio k, barriendo claramente todos los valores enteros no negativos.

Utilizando la Ec. (8.12) decimos que los autovalores de H tienen la forma

En =

(n+

1

2

)~ω ; n = 0, 1, 2, . . .

vemos entonces que la energıa del oscilador armonico cuantico esta cuantizada, ya que no puede adquirir cualquiervalor. El espaciamiento entre los valores accesibles es ademas uniforme, es decir cada estado excitado consiste enagregar un cuanto ~ω al estado anterior. Adicionalmente, el estado base (estado de menor energıa) no posee energıacero sino ~ω/2. Notese que el espaciamiento uniforme de los niveles de energıa del oscilador armonico cuantico convalor de espaciamiento ~ω, coincide con la hipotesis de Planck para el estudio de la radiacion del cuerpo negro.

8.3.1. Interpretacion de los operadores a, a† y N

Si comenzamos con un estado∣∣ϕin⟩

de H con valor propio En =(n+ 1

2

)~ω, la aplicacion de los operadores

a y a† sobre∣∣ϕin⟩

nos da

a∣∣ϕin⟩

= αn−1

∣∣ϕin−1

⟩;∣∣ϕin−1

⟩→ En−1 =

[(n− 1) +

1

2

]~ω = En − ~ω

a†∣∣ϕin⟩

= αn+1

∣∣ϕin+1

⟩;∣∣ϕin+1

⟩→ En+1 =

[(n+ 1) +

1

2

]~ω = En + ~ω

N = a†a∣∣ϕin⟩

= n∣∣ϕin⟩

; n = 0, 1, 2, 3, . . .

Page 232: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

232 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

vemos que la accion de a sobre∣∣ϕin⟩

equivale a “extraer” un cuanto de energıa ~ω del valor de energıa En del estadooriginal. En otras palabras, su accion sobre un autovector de N (o de H) consiste en hacer desaparecer un cuantode energıa. Por esta razon se denomina operador de destruccion o de aniquilacion.

Similarmente, la accion de a† sobre∣∣ϕin⟩

equivale a “anadir” un cuanto de energıa ~ω al valor original de energıaEn. Su accion sobre un autovector de N (o de H) consiste en hacer aparecer un cuanto de energıa. Por esta razonse denomina operador de construccion o creacion.

Finalmente, vemos que el operador N aplicado sobre∣∣ϕin⟩

nos da el valor n de cuantos que estan asociados conel nivel de energıa (hay n cuantos agregados al valor del mınimo de la energıa). Por esta razon N se conoce comooperador numero.

8.3.2. Estudio de la degeneracion del espectro

Mostraremos que el espectro del oscilador armonico es no degenerado. Comenzaremos estudiando el estado base.Todos los autoestados de H asociados a E0 = ~ω/2, o equivalentemente todos los autoestados de N asociados conn = 0, deben satisfacer segun el lema 2 la siguiente condicion

a∣∣ϕi0⟩

= 0 (8.17)

debemos ver entonces cuantos kets linealmente independientes satisfacen esta condicion. Usando las Ecs. (8.5), laEc. (8.17) queda en la forma

1√2

[√mω

~X +

i√m~ω

P

] ∣∣ϕi0⟩

= 0 ⇒[√

~

√mω

~X +

√mω

~

i√m~ω

P

] ∣∣ϕi0⟩

= 0 ⇒[mω

~X +

i

~P

] ∣∣ϕi0⟩

= 0

que en la base |x〉 se escribe

(mω

~x+

d

dx

)ϕi0 (x) = 0 ; ϕi0 (x) = 〈x

∣∣ϕi0⟩

(8.18)

debemos entonces resolver la ecuacion diferencial de primer orden (8.18). Su solucion mas general es de la forma

ϕi0 (x) = ce−12mω

~x2

(8.19)

siendo c una constante de integracion (solo hay una en virtud de que la ecuacion es de primer orden). Por tantotodas las soluciones no nulas posibles de (8.18) son linealmente dependientes. Existe por tanto un unico ket dentrode factores multiplicativos asociado a E0 = ~ω/2. Por tanto, el estado base es no degenerado2.

La demostracion de que los demas estados no son degenerados la haremos por induccion para lo cual ya tenemosel primer paso al demostrar que el estado base no es degenerado.

El segundo paso en la induccion es probar que si En = (n+ 1/2) ~ω no es degenerado entonces el nivel En+1 =(n+ 1 + 1/2) ~ω tampoco lo es. Nuestra hipotesis es entonces que dentro de factores multiplicativos, solo hay unvector |ϕn〉 tal que

N |ϕn〉 = n |ϕn〉 (8.20)

ahora consideramos un autovector∣∣ϕin+1

⟩correspondiente al autovalor n+ 1, donde el ındice i indica una posible

degeneracion

N∣∣ϕin+1

⟩= (n+ 1)

∣∣ϕin+1

⟩(8.21)

el lema 2 nos dice que a∣∣ϕin+1

⟩es un autovector no nulo de N con autovalor n. Dado que este ket no es degenerado

por hipotesis, tenemos que a∣∣ϕin+1

⟩es linealmente dependiente con |ϕn〉

a∣∣ϕin+1

⟩= ci |ϕn〉

2Aunque aquı usamos la base |x〉, es claro que el grado de degeneracion es independiente de la base utilizada.

Page 233: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

8.4. ESTADOS PROPIOS DEL HAMILTONIANO 233

si aplicamos a† a ambos lados se tiene

a†a∣∣ϕin+1

⟩= cia† |ϕn〉

N∣∣ϕin+1

⟩= cia† |ϕn〉 (8.22)

donde hemos usado la definicion de N Ec. (8.10). Combinando (8.21) con (8.22) se tiene

(n+ 1)∣∣ϕin+1

⟩= cia† |ϕn〉

∣∣ϕin+1

⟩=

ci

(n+ 1)

[a† |ϕn〉

](8.23)

el lema 3 nos dice que a† |ϕn〉 es autovector de N con autovalor (n+ 1). La expresion (8.23) nos muestra quetodos los kets

∣∣ϕin+1

⟩asociados al valor propio (n+ 1) son linealmente dependientes con a† |ϕn〉. Por tanto el valor

propio n+ 1 es no degenerado y la demostracion esta completa. Todos los valores propios del Hamiltoniano son nodegenerados.

8.4. Estados propios del Hamiltoniano

Ya que hemos resuelto el problema de valores propios, procederemos ahora a estudiar el problema de los ketspropios del Hamiltoniano del oscilador armonico unidimensional. Tomaremos como hipotesis de trabajo que N y Hson observables, de modo que sus kets propios |ϕn〉 constituyen una base ortonormal3 de Ex, y se cumplen por lotanto, relaciones de ortonormalidad y completez

〈ϕn′ |ϕn〉 = δn′n ;∑

n

|ϕn〉 〈ϕn| = 1

la completez sera probada mas adelante utilizando la representacion |x〉, es decir calculando las funciones de ondaϕn (x) y mostrando que estas funciones son completas en el espacio de las funciones cuadraticamente integrables enx.

Por otro lado N y H tienen un espectro no degenerado. Por tanto cada uno de estos observables constituye porsı solo un C.S.C.O. en Ex.

8.4.1. Construccion de los kets propios con base en el ket del estado base

El ket |ϕ0〉 asociado al estado base i.e. a n = 0 en N y a E0 = ~ω/2 en H, es el vector en Ex que satisface lacondicion

a |ϕ0〉 = 0

y es unico salvo constantes de proporcionalidad. Si lo asumimos normalizado, la ambiguedad se reduce a solo unfactor de fase global arbitraria eiθ, con θ real. Aplicando el lema 3 pag 230, el vector |ϕ1〉 asociado a n = 1 esproporcional a a† |ϕ0〉

|ϕ1〉 = c1 a† |ϕ0〉 (8.24)

determinaremos c1 requiriendo que |ϕ1〉 este normalizado y que tal coeficiente sea real y positivo (es decir c1 se fijacon fase cero). Para esto se calcula la norma de |ϕ1〉

〈ϕ1 |ϕ1〉 =

〈ϕ0|

(a†)†c∗1

c1 a

† |ϕ0〉

= |c1|2 〈ϕ0| aa† |ϕ0〉

y usando la regla de conmutacion (8.8) se obtiene

〈ϕ1 |ϕ1〉 = |c1|2 〈ϕ0|(a†a+ 1

)|ϕ0〉 = |c1|2 〈ϕ0| (N + 1) |ϕ0〉 = |c1|2 〈ϕ0| (0 + 1) |ϕ0〉

〈ϕ1 |ϕ1〉 = |c1|2 〈ϕ0|ϕ0〉 ⇒ c1 = 1

3La ortonormalidad esta garantizada automaticamente, debido a la ausencia de degeneracion.

Page 234: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

234 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

la Ec. (8.24) queda entonces|ϕ1〉 = a† |ϕ0〉

De manera similar construımos a |ϕ2〉 aplicando el operador creacion a† sobre |ϕ1〉

|ϕ2〉 = c2 a† |ϕ1〉 (8.25)

nuevamente requeriremos que c2 sea una constante real positiva que normalice a |ϕ2〉. De aquı en adelante estesera el requerimiento para todas las constantes con que se construyen los siguientes estados.

〈ϕ2 |ϕ2〉 = |c2|2 〈ϕ1| aa† |ϕ1〉 = |c2|2 〈ϕ1| (N + 1) |ϕ1〉 = |c2|2 〈ϕ1| (1 + 1) |ϕ1〉〈ϕ2 |ϕ2〉 = 2 |c2|2 = 1 ⇒ c2 =

1√2

con lo cual la Ec. (8.25) queda

|ϕ2〉 =1√2a† |ϕ1〉 =

1√2

(a†)2

|ϕ0〉

este proceso se puede generalizar para construır al estado |ϕn〉 con base en el estado |ϕn−1〉

|ϕn〉 = cn a† |ϕn−1〉 (8.26)

〈ϕn |ϕn〉 = |cn|2 〈ϕn−1| aa† |ϕn−1〉 = |cn|2 〈ϕn−1| (N + 1) |ϕn−1〉 = |cn|2 〈ϕn−1| [(n− 1) + 1] |ϕn−1〉〈ϕn |ϕn〉 = n |cn|2 ⇒ cn =

1√n

con lo cual la Ec. (8.26) queda

|ϕn〉 =1√na† |ϕn−1〉 ; n = 1, 2, 3, . . . (8.27)

usando la Ec. (8.27) iterativamente, podemos conectar a |ϕn〉 con el estado base

|ϕn〉 =1√na† |ϕn−1〉 =

1√n

1√n− 1

(a†)2

|ϕn−2〉 =1√n

1√n− 1

1√n− 2

(a†)3

|ϕn−3〉

|ϕn〉 =1√n

1√n− 1

1√n− 2

. . .1√2

1√1

(a†)n

|ϕ0〉

quedando finalmente

|ϕn〉 =1√n!

(a†)n

|ϕ0〉 ; n = 0, 1, 2, 3, . . . (8.28)

En sıntesis, todos los autoestados de N yH se pueden construır con base en el autoestado base |ϕ0〉 por aplicacionsucesiva del operador creacion. El factor 1/

√n! garantiza la normalizacion de cada nuevo estado creado, bajo la

convencion de que los coeficientes de normalizacion tengan fase cero, es decir que sean reales y positivos.

8.4.2. Ortonormalidad de los kets propios (opcional)

Es interesante ver a manera de consistencia, que la expresion (8.28) conduce a que los kets |ϕn〉 son ortonormales

〈ϕn′ |ϕn〉 =1√n! n′!

〈ϕ0| an′(a†)n

|ϕ0〉 (8.29)

veamos como actuan los operadores sobre el ket

an′(a†)n

|ϕ0〉 = an′−1(aa†)(

a†)n−1

|ϕ0〉 = an′−1 (N + 1)

[(a†)n−1

|ϕ0〉]

an′(a†)n

|ϕ0〉 = an′−1 (N + 1)

[√(n− 1)! |ϕn−1〉

]= an

′−1 [(n− 1) + 1][√

(n− 1)! |ϕn−1〉]

an′(a†)n

|ϕ0〉 = nan′−1

[√

(n− 1)!1√

(n− 1)!

(a†)n−1

|ϕ0〉]

Page 235: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

8.4. ESTADOS PROPIOS DEL HAMILTONIANO 235

an′(a†)n

|ϕ0〉 = nan′−1(a†)n−1

|ϕ0〉 (8.30)

donde hemos usado la Ec. (8.28). Utilizaremos el resultado (8.30) iterativamente, para ello analizamos tres casos

1) n < n′. En este caso usamos la propiedad (8.30) n−veces de forma iterativa

an′(a†)n

|ϕ0〉 = n

[an

′−1(a†)n−1

|ϕ0〉]

= n

[(n− 1) an

′−2(a†)n−2

|ϕ0〉]

an′(a†)n

|ϕ0〉 = n (n− 1) (n− 2)

[an

′−3(a†)n−3

|ϕ0〉]

an′(a†)n

|ϕ0〉 = n [n− 1] [n− 2] . . . [n− (n− 1)]

[an

′−n(a†)n−n

|ϕ0〉]

(8.31)

an′(a†)n

|ϕ0〉 = n× [n− 1] × . . .× 1 ×[a|n

′−n|(a†)0

|ϕ0〉]

(8.32)

finalmente

an′(a†)n

|ϕ0〉 = n!a|n′−n| |ϕ0〉 (8.33)

pero por hipotesis |n′ − n| es un entero mayor o igual que 1, por tanto a|n′−n| |ϕ0〉 = 0 ya que a |ϕ0〉 = 0. Usando

(8.29) y (8.33) resulta que

〈ϕn′ |ϕn〉 =1√n! n′!

〈ϕ0| an′(a†)n

|ϕ0〉 =1√n! n′!

〈ϕ0|n!a|n

′−n| |ϕ0〉

= 0

2) si n = n′ podemos usar (8.31) para obtener

an(a†)n

|ϕ0〉 = n!a0(a†)0

|ϕ0〉 = n! |ϕ0〉 (8.34)

Usando (8.29) y (8.34) resulta que si n = n′

〈ϕn |ϕn〉 =1√n! n!

〈ϕ0| an(a†)n

|ϕ0〉 =1

n!〈ϕ0| n! |ϕ0〉 = 1

3) n > n′. En este caso podemos conjugar el producto interno 〈ϕn′ |ϕn〉 = 〈ϕn |ϕn′〉∗ y probar la ortogonalidad delmiembro derecho con lo cual quedamos nuevamente en el primer caso. Alternativamente, podemos usar la propiedad(8.30) n′−veces de forma iterativa, aplicando la Ec. (8.28). En tal caso el analogo de la Ec. (8.31) es

an′(a†)n

|ϕ0〉 = n [n− 1] [n− 2] . . .[n−

(n′ − 1

)] [an

′−n′(a†)n−n′

|ϕ0〉]

(8.35)

an′(a†)n

|ϕ0〉 = n [n− 1] [n− 2] . . .[n− n′ + 1

]×[a0(a†)|n−n′|

|ϕ0〉]

(8.36)

an′(a†)n

|ϕ0〉 = n [n− 1] [n− 2] . . .[n− n′ + 1

]×[√

(n− n′)! |ϕn−n′〉]

(8.37)

y el producto interno (8.29) queda

〈ϕn′ |ϕn〉 =1√n! n′!

〈ϕ0| an′(a†)n

|ϕ0〉

=n [n− 1] [n− 2] . . . [n− n′ + 1]

√(n− n′)!√

n! n′!〈ϕ0 |ϕn−n′〉 = 0

donde hemos usado el hecho de que n− n′ es un entero mayor o igual que uno, de modo que 〈ϕ0 |ϕn−n′〉 = 0.

Page 236: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

236 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

8.4.3. Accion de los operadores creacion y destruccion sobre los autoestados del Hamiltoniano

Las Ecs. (8.7) nos muestran que los observables X,P se pueden escribir en terminos de a y a†, por lo tantocualquier observable fısico (sin espın) se puede escribir en terminos de a y a†. Por otro lado, como los autoestados|ϕn〉 del Hamiltoniano del oscilador armonico, constituyen una base en Ex, recurriremos con frecuencia a esta basepara construır representaciones matriciales. Por lo anterior, resulta de especial importancia estudiar la accion de losoperadores a y a† sobre los estados |ϕn〉.

La accion de a† sobre |ϕn〉 se puede obtener reemplazando n por n+ 1 en la Ec. (8.27)

a† |ϕn〉 =√n+ 1 |ϕn+1〉 ; n = 0, 1, 2, . . .

para obtener a |ϕn〉 multiplicamos la Ec. (8.27) por a.

a |ϕn〉 =1√naa† |ϕn−1〉 =

1√n

(N + 1) |ϕn−1〉 =1√n

[(n− 1) + 1] |ϕn−1〉

a |ϕn〉 =√n |ϕn−1〉 ; n = 0, 1, 2, . . .

tenemos entonces que la accion de los operadores mas relevantes sobre los autoestados |ϕn〉 son

a† |ϕn〉 =√n+ 1 |ϕn+1〉 ; a |ϕn〉 =

√n |ϕn−1〉 ; n = 0, 1, 2, . . . (8.38)

N |ϕn〉 = n |ϕn〉 ; H |ϕn〉 =

(n+

1

2

)~ω |ϕn〉 ; n = 0, 1, 2, . . . (8.39)

Se puede ver que la segunda de las Ecs. (8.38) contiene automaticamente el hecho de que a |ϕ0〉 = 0. Notese que eladjunto de las Ecs. (8.38) es

〈ϕn| a =√n+ 1 〈ϕn+1| ; 〈ϕn| a† =

√n 〈ϕn−1| (8.40)

podemos expresar el significado de las Ecs. (8.38, 8.40) en palabras diciendo que a es un operador destruccion(construccion) para kets (bras), en tanto que a† es un operador construccion (destruccion) para kets (bras).

La accion de los observables basicos X y P sobre los autoestados |ϕn〉 se obtiene usando las Ecs. (8.7)

X |ϕn〉 =

√~

2mω

(a† + a

)|ϕn〉 =

√~

2mω

[√n+ 1 |ϕn+1〉 +

√n |ϕn−1〉

]

P |ϕn〉 = i

√mω~

2

(a† − a

)|ϕn〉 = i

√mω~

2

[√n+ 1 |ϕn+1〉 −

√n |ϕn−1〉

]

con estas relaciones es facil encontrar la representacion matricial de los operadores a, a†, X y P en la base |ϕn〉

〈ϕm| a |ϕn〉 =√n〈ϕm |ϕn−1〉 =

√nδm,n−1 (8.41)

〈ϕm| a† |ϕn〉 =√n+ 1〈ϕm |ϕn+1〉 =

√n+ 1δm,n+1 (8.42)

〈ϕm|X |ϕn〉 =

√~

2mω

[√n+ 1δm,n+1 +

√nδm,n−1

](8.43)

〈ϕm|P |ϕn〉 = i

√mω~

2

[√n+ 1δm,n+1 −

√nδm,n−1

](8.44)

se puede ver que las matrices representativas de a y a† son hermıticas conjugadas una de otra como era de esperarse,pues en este caso las matrices son reales y la una es la traspuesta de la otra. En forma explıcita estas matrices vienendadas por

a =

0√

1 0 0 · · ·0 0

√2 0 · · ·

0 0 0√

3 · · ·0 0 0 0 · · ·...

......

.... . .

; a† =

0 0 0 0 · · ·√1 0 0 0 · · ·

0√

2 0 0 · · ·0 0

√3 0 · · ·

......

......

. . .

notese que las matrices de X y P son proporcionales a la suma y la diferencia de las matrices anteriores. Finalmente,las matrices asociadas a X y P son hermıticas como se esperaba.

Page 237: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

8.5. FUNCIONES PROPIAS ASOCIADAS A LOS ESTADOS ESTACIONARIOS EN LA BASE |X〉 237

8.5. Funciones propias asociadas a los estados estacionarios en la base |x〉Los resultados obtenidos hasta el momento se han extraıdo a partir de los kets abstractos |ϕn〉 y el algebra

abstracta de los operadores a, a† y N . En otras palabras, todos los resultados anteriores son independientes de labase4. El unico resultado que no ha sido demostrado es el hecho de que los estados |ϕn〉 forman una base, lo cualhasta el momento es solo una hipotesis de trabajo que debe ser examinada. Con el fin de verificar la completez delos kets propios de H y con el fin de poder hacer calculos concretos de probabilidades vamos a encontrar estos ketspropios de H en la base |x〉 es decir las funciones de onda asociadas.

Ya hemos determinado la funcion de onda asociada al estado base ϕ0 (x) la cual esta dada por la Ec. (8.19)

ϕ0 (x) = 〈x |ϕ0〉 =(mωπ~

)1/4e−

12mω

~x2

(8.45)

donde (mω/π~)1/4 es un factor de normalizacion. Dado que los demas estados se obtienen de la Ec. (8.28)

|ϕn〉 =1√n!

(a†)n

|ϕ0〉 (8.46)

debemos obtener la representacion del vector |ϕn〉 en la base |x〉 para ello multiplicamos la Ec. (8.46) por el bra〈x|

〈x |ϕn〉 =1√n!

〈x|(a†)n

|ϕ0〉 =1√n!

〈x|[

1√2

(X − iP

)]n|ϕ0〉

ϕn (x) =1√n!

〈x|[

1√2

(√mω

~X − i√

mω~P

)]n|ϕ0〉

ϕn (x) =1√n!

1√2n

[√mω

~x− i√

mω~

~

i

d

dx

]n〈x|ϕ0〉

ϕn (x) =1√

2n n!

[√mω

~x−

√~

d

dx

]n〈x|ϕ0〉

ϕn (x) =1√

2n n!

[√~

(mω

~x− d

dx

)]n〈x|ϕ0〉

ϕn (x) =

[1

n!

(~

2mω

)n] 12[(

~x− d

dx

)]nϕ0 (x)

ahora usando en forma explıcita la funcion de onda del estado base Ec. (8.45) se tiene que

ϕn (x) =

[1

n!

(~

2mω

)n] 12 (mω

π~

) 14

[(mω

~x− d

dx

)]ne−

12mω

~x2

de lo anterior se puede ver facilmente que ϕn (x) es el producto de e−12mω

~x2

por un polinomio de grado n y paridad(−1)n. Los polinomios que surgen se denominan polinomios de Hermite.

Las dos primeras funciones asociadas a estados excitados (con energıa mayor al estado base) son

ϕ1 (x) =

[4

π

(mω~

)3]1/4

xe−12mω

~x2

ϕ2 (x) =(mω

4π~

)1/4 [2mω

~x2 − 1

]e−

12mω

~x2

si se grafica la funcion de onda y la densidad de probabilidad para n = 0, 1, 2 (ver Figs. 8.1, 8.2) y para valores

4La ausencia de degeneracion del estado base se demostro utilizando la base especıfica |x〉, pero el resultado debe ser independientede la base.

Page 238: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

238 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

Figura 8.1: Funciones de onda asociadas a n = 0, 1, 2 para el oscilador armonico.

Figura 8.2: Densidades de probabilidad asociadas a n = 0, 1, 2 para el oscilador armonico.

grandes de n (Figs. 8.3), se pueden observar las siguientes caracterısticas: cuando n aumenta, la region en x en lacual la densidad de probabilidad toma valores no despreciables se vuelve mayor. Esto corresponde a la caracterısticaclasica de que la amplitud de movimiento (y por tanto la region accesible) aumenta con la energıa. Tambien veremosque el valor promedio o esperado de la energıa potencial se incrementa con la energıa (y por tanto con n). Aunqueesto se puede ver de un calculo directo, se puede explicar cualitativamente teniendo en cuenta que para n grandes,ϕn (x) toma valores no despreciables en regiones donde x es grande y por tanto donde V (x) es grande. Las graficastambien muestran que el numero de ceros de ϕn (x) es igual a n, lo cual se puede demostrar formalmente con laspropiedades de los polinomios de Hermite. Un analisis de estos polinomios muestra tambien que el valor promediode la energıa cinetica se incrementa con n puesto que la energıa viene dada por

1

2m

⟨P 2⟩

= − ~2

2m

∫ ∞

−∞ϕ∗n (x)

d2ϕndx2

dx (8.47)

y cuando el numero de ceros de ϕn (x) aumenta, tambien se incrementa la curvatura de la funcion de onda y en laEc. (8.47) la segunda derivada de ϕn se incrementa a su vez.

Otra caracterıstica sobresaliente para grandes valores de n es que la densidad de probabilidad es grande parax ∼= ±xM siendo xM la amplitud clasica de movimiento cuando la energıa es En. Esto se relaciona con la caracterısticaclasica de que en xM la partıcula esta en reposo instantaneo y por tanto, en promedio se mantiene mas tiempo enlas vecindades de ±xM que por ejemplo en las vecindades de x = 0 donde la rapidez es maxima.

8.6. Valores esperados y dispersion para los observables cuando el sistema

esta en un estado estacionario del oscilador armonico

Dado que ninguno de los observables X y P conmuta con H, los autoestados |ϕn〉 del Hamiltoniano no sonautoestados de X ni P . Por tanto, si el oscilador armonico esta en un estado estacionario |ϕn〉 la medida de X o Pdara en principio cualquier valor ya que el espectro de estos observables incluye a todos los numeros reales.

Calcularemos los valores esperados de X y P y las raıces de la desviacion media cuadratica ∆X y ∆P , cuando el

Page 239: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

8.6. VALORES ESPERADOS Y DISPERSION PARA LOS OBSERVABLES CUANDO EL SISTEMA ESTA EN UN ESTADO ESTACIONARIO DEL OSCILADOR ARMONICO239

Figura 8.3: Funcion de onda (izquierda) y densidad de probabilidad (derecha) asociadas a n = 10, para el osciladorarmonico.

sistema esta en un estado estacionario |ϕn〉. Los valores esperados se calculan directamente de las Ecs. (8.43, 8.44)

〈X〉 = 〈ϕn|X |ϕn〉 = 〈P 〉 = 〈ϕn|P |ϕn〉 = 0

estos valores son validos para todo tiempo. Notese que el comportamiento del centro del paquete de onda difiereprofundamente del caso clasico en el cual las variables x y p son oscilantes en el tiempo (excepto cuando la energıaes cero)5. Para calcular ∆X, ∆P deben calcularse los valores esperados de X 2 y P 2

(∆X)2 = 〈ϕn|X2 |ϕn〉 − [〈ϕn|X |ϕn〉]2 = 〈ϕn|X2 |ϕn〉 (8.48)

(∆P )2 = 〈ϕn|P 2 |ϕn〉 − [〈ϕn|P |ϕn〉]2 = 〈ϕn|P 2 |ϕn〉 (8.49)

y usando (8.7) tenemos que

X2 =~

2mω

(a† + a

)(a† + a

)=

~

2mω

[(a†)2

+ aa† + a†a+ a2

]

X2 =~

2mω

[(a†)2

+ (1 +N) +N + a2

]

X2 =~

2mω

[(a†)2

+ a2 + 2N + 1

](8.50)

P 2 = −m~ω

2

(a† − a

)(a† − a

)= −m~ω

2

[(a†)2

− aa† − a†a+ a2

]

P 2 = −m~ω

2

[(a†)2

+ a2 − 2N − 1

](8.51)

reemplazando (8.50, 8.51) en (8.48, 8.49) es claro que

(∆X)2 =~

2mω〈ϕn|

[(a†)2

+ a2 + 2N + 1

]|ϕn〉 (8.52)

(∆P )2 = −m~ω

2〈ϕn|

[(a†)2

+ a2 − 2N − 1

]|ϕn〉 (8.53)

5Puede verse que clasicamente los valores promedio de x y p tomados sobre un periodo completo de movimiento, sı son nulos como enel caso cuantico. Sin embargo, debemos recordar que en el caso cuantico los promedios no son tomados sobre un periodo de movimiento.

Page 240: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

240 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

calculando cada elemento matricial se tiene

〈ϕn| a2 |ϕn〉 =√n (n− 1)〈ϕn |ϕn−2〉 = 0 (8.54)

〈ϕn|(a†)2

|ϕn〉 =√

(n+ 1) (n+ 2)〈ϕn |ϕn+2〉 = 0 (8.55)

〈ϕn| (2N + 1) |ϕn〉 = (2n+ 1) 〈ϕn |ϕn〉 = (2n+ 1) (8.56)

reemplazando (8.54, 8.55, 8.56) en (8.52, 8.53), resulta

(∆X)2 =(2n+ 1) ~

2mω; (∆P )2 =

(2n+ 1)m~ω

2

Finalmente

(∆X)2 =

(n+

1

2

)~

mω=

Enmω2

; (∆P )2 =

(n+

1

2

)m~ω = mEn (8.57)

notese que a medida que aumenta el nivel de energıa, se ensanchan ambos paquetes. Esto es perfectamente permitidopor el principio de incertidumbre el cual solo prohibe un angostamiento indefinido de ambos paquetes. El productode estas desviaciones que se puede tomar como la definicion de incertidumbre, es

∆X · ∆P =

(n+

1

2

)~ ≥ ~

2

La cota inferior para el producto ∆X · ∆P depende de la forma del potencial, y en el caso del oscilador armonicoadquiere el mınimo valor posible ~/2 cuando n = 0, es decir cuando el sistema esta en el estado base. Estoesta relacionado con el hecho de que en el estado base, la funcion de onda es una gaussiana y las gaussianas sondsitribuciones de mınima incertidumbre (ver Sec. 2.12.3).

Por otro lado, es bien sabido que si xM es la amplitud del oscilador armonico clasico con energıa En =(n+ 1/2) ~ω, la relacion entre la energıa y la amplitud es

En =1

2mω2x2

M

usando (8.57) se tiene que

(∆X)2 =Enmω2

=1

2

mω2x2M

mω2=

1

2x2M

∆X =1√2xM (8.58)

analogamente, si pM es la amplitud de oscilacion del momento clasico se tiene que

pM = mωxM

∆P =1√2pM (8.59)

vemos que el ancho ∆X es del orden del ancho del intervalo [−xM , xM ], esto es de esperarse ya que esta es la regionclasicamente accesible y ya vimos en la seccion 8.5 que es aproximadamente en esta region en donde ϕn (x) adquierevalores no despreciables. Un resultado similar se sigue para el intervalo [−pM , pM ].

Lo anterior permite tambien entender porque ∆X se incrementa con n: la densidad |ϕn (x)|2 posee dos picossimetricos situados aproximadamente en x = ±xM . La desviacion media cuadratica no puede ser mucho menor quela distancias entre picos incluso si estos son muy agudos. Un argumento similar se sigue para ∆P .

Ahora bien, el valor esperado de la energıa potencial en el estado |ϕn〉, se puede calcular teniendo en cuenta laEc. (8.48), y esta dado por

〈V (X)〉 =1

2mω2

⟨X2⟩⇒ 〈V (X)〉 =

1

2mω2 (∆X)2 (8.60)

similarmente, el valor esperado de la energıa cinetica es⟨P 2

2m

⟩=

1

2m(∆P )2 (8.61)

Page 241: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

8.7. PROPIEDADES DEL ESTADO BASE 241

y reemplazando (8.57) en (8.60, 8.61) resulta

〈V (X)〉 =1

2

(n+

1

2

)~ω =

En2⟨

P 2

2m

⟩=

1

2

(n+

1

2

)~ω =

En2

el valor esperado de las energıas cinetica y potencial es igual. Esto es consistente con el teorema del virial. Noobstante, debe tenerse en cuenta que en el teorema del virial el promedio es sacado sobre un periodo de movimiento,en tanto que el promedio cuantico no esta asociado a una evolucion temporal.

Es notable ademas la simetrıa entre los resultados sobre las variables X y P , esto se debe a que el Hamiltonianoes muy simetrico en ambos ya que la energıa cinetica es proporcional a P 2 y la energıa potencial es proporcionalX2. Tal simetrıa se ve de forma manifiesta en la Ec. (8.3).

Los estados estacionarios |ϕn〉 no tienen equivalente en la mecanica clasica ya que tienen energıa no nula a pesarde que 〈X〉 y 〈P 〉 sı son nulos. Sin embargo, podemos establecer cierta analogıa entre el estado estacionario |ϕn〉 yel estado de una partıcula clasica cuya posicion esta descrita por

x = xM cos (ωt− ϕ)

y para el cual la fase inicial ϕ es escogida arbitrariamente, es decir puede tomar cualquier valor entre 0 y 2π conla misma probabilidad. Los valores esperados de x y p son entonces nulos ya que

xcl = xM

[1

∫ 2π

0cos (ωt− ϕ) dϕ

]= 0

pcl = −pM[

1

∫ 2π

0sin (ωt− ϕ) dϕ

]= 0

ahora, calculando el valor esperado de x2cl y p2

cl

x2cl = xM

[1

∫ 2π

0cos2 (ωt− ϕ) dϕ

]=x2M

2

p2cl = pM

[1

∫ 2π

0sin2 (ωt− ϕ) dϕ

]=p2M

2

la desviacion media cuadratica clasica de x y p queda

∆xcl =

√x2cl − (xcl)

2 =xM√

2; ∆pcl =

√p2cl − (pcl)

2 =pM√

2

y vemos que coincide con sus valores cuanticos Ecs. (8.58, 8.59). Este promedio clasico se esta realizando sobre losposible valores de la fase y no sobre un periodo de movimiento. Es decir, al igual que el promedio cuantico, noinvolucra evolucion temporal.

8.7. Propiedades del estado base

En la mecanica clasica, el estado de mas baja energıa del oscilador armonico se obtiene cuando la partıculaesta en reposo en el origen (condiciones iniciales x = p = 0) y la energıa total es cero. En contraste, el sistemacuantico posee un estado de mınima energıa |ϕ0〉 con energıa no nula y la funcion de onda asociada posee unaextension espacial caracterizada por la desviacion media cuadratica ∆X =

√~/2mω.

La diferencia entre las dos descripciones tiene su origen en el principio de incertidumbre, que impide la min-imizacion simultanea de la energıa cinetica y la potencial, ya que los operadores energıa cinetica y potencial noconmutan entre sı. El estado base es entonces el resultado de la minimizacion de la suma de las dos energıas. Noteseque el resultado clasico x = p = 0 para obtener energıa mınima cero, requerirıa una determinacion total simultaneade posicion y momento, que cuanticamente no es posible.

Page 242: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

242 CAPITULO 8. EL OSCILADOR ARMONICO CUANTICO

Podemos realizar un argumento semicuantitativo para estimar el orden de magnitud de la energıa base y laextension espacial de su funcion de onda. Pensemos que la distancia ξ caracteriza la extension espacial de la funcionde onda, es decir ξ ∼ ∆X. Entonces, de acuerdo con (8.60) el potencial promedio sera del orden de

V ∼= 1

2mω2ξ2

pero∆X · ∆P ∼= ~ ⇒ ξ · ∆P ∼= ~ (8.62)

por tanto

∆P ∼= ~

ξ⇒ T =

p2

2m=

(∆P )2

2m∼= ~2

2mξ2

con lo cual el orden de magnitud de la energıa total es

E = T + V ∼= ~2

2mξ2+

1

2mω2ξ2 (8.63)

para valores pequenos de ξ, T domina sobre V y para valores grandes de ξ ocurre lo contrario. El estado base secalcula de manera aproximada con el mınimo de la funcion E en la Ec. (8.63)

(dE

)

ξ=ξm

= 0 ⇒ − ~2

mξ3m+mω2ξm = 0

−~2

m+mω2ξ4m = 0 ⇒ ξ4

m =~2

m2ω2

por tanto el valor mımimo aproximado del promedio de la energıa total es

E ∼= ~2

2mξ2m

+1

2mω2ξ2m =

~2

2m(

~

) +1

2mω2

(~

)=

2+

2

E ∼= ~ω

notese que la Ec. (8.62) implica tomar un principio de “mınima incertidumbre” ya que implica que el producto delas incertidumbres se acerca al lımite inferior. Vemos entonces que la combinacion de mınima incertidumbre con laminimizacion del promedio de la suma de las energıas cinetica y potencial, nos predice correctamente el orden demagnitud de la energıa del estado base.

8.8. Evolucion temporal de los observables del oscilador armonico

Consideremos un oscilador armonico cuyo estado en t = 0 esta descrito por el estado normalizado

|ψ (0)〉 =∞∑

n=0

cn (0) |ϕn〉 (8.64)

como el sistema es conservativo, el estado en cualquier tiempo se obtiene empleando las Ecs. (5.66, 5.67).

|ψ (t)〉 =

∞∑

n=0

cn (0) e−i(n+ 12 )ωt |ϕn〉

el valor esperado de cualquier observable estara dado por

〈ψ (t)|A |ψ (t)〉 =

[ ∞∑

m=0

c∗m (0) ei(m+ 12)ωt 〈ϕm|

]A

[ ∞∑

n=0

cn (0) e−i(n+ 12 )ωt |ϕn〉

]

〈ψ (t)|A |ψ (t)〉 =

∞∑

m=0

∞∑

n=0

c∗m (0) cn (0) ei(m−n)ωt 〈ϕm|A |ϕn〉

Page 243: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

8.8. EVOLUCION TEMPORAL DE LOS OBSERVABLES DEL OSCILADOR ARMONICO 243

el valor esperado de A es entonces

〈ψ (t)|A |ψ (t)〉 =

∞∑

m=0

∞∑

n=0

c∗m (0) cn (0)Amnei(m−n)ωt ; Amn ≡ 〈ϕm|A |ϕn〉 (8.65)

puesto que m y n son enteros, la evolucion temporal de los valores esperados solo involucra frecuencias de la formakω/2π con k entero. Por tanto las frecuencias de Bohr estan constituıdas por “armonicos” que son multiplos enterosdel “armonico fundamental” ω/2π. Para el caso particular de los observables X y P estos valores esperados seobtienen de (8.43, 8.65)

〈X〉 =

∞∑

m=0

∞∑

n=0

c∗m (0) cn (0)Xmnei(m−n)ωt

〈X〉 =

√~

2mω

∞∑

m=0

∞∑

n=0

c∗m (0) cn (0)[√n+ 1δm,n+1 +

√nδm,n−1

]ei(m−n)ωt

〈X〉 =

√~

2mω

∞∑

n=0

c∗n+1 (0) cn (0)[√n+ 1

]ei[(n+1)−n]ωt +

∞∑

m=0

c∗m (0) cm+1 (0)[√m+ 1

]ei[m−(m+1)]ωt

〈X〉 =

√~

2mω

∞∑

n=0

√n+ 1c∗n+1 (0) cn (0) eiωt +

∞∑

n=0

√n+ 1c∗n (0) cn+1 (0) e−iωt

donde hemos tenido en cuenta que los ındices m y n son mudos

〈X〉 =

√2~

∞∑

n=0

√n+ 1Re

[c∗n+1 (0) cn (0) eiωt

](8.66)

Vemos entonces que solo se incluyen ondas sinusoidales de frecuencia angular ω. Esto esta relacionado con la solucionclasica del oscilador armonico la cual es monocromatica para la variable x. Para 〈P 〉 se obtiene un resultado similar.

Por otro lado, en la discusion del teorema de Ehrenfest de la seccion 5.7.1 vimos que la condicion de igualdad delos dos miembros en la Ec. (5.56) necesaria para obtener el lımite clasico adecuado, se cumple para todo estado |ψ〉,cuando se usa el potencial del oscilador armonico que corresponde a n = 2 en la Ec. (5.58). Por tanto, de acuerdocon las Ecs. (5.55, 5.52) se tiene que

d 〈X〉dt

=1

i~〈[X,H]〉 =

〈P 〉m

d 〈P 〉dt

=1

i~〈[P,H]〉 = −mω2 〈X〉

integrando estas ecuaciones se obtiene

〈X〉 (t) = 〈X〉 (0) cosωt+1

mω〈P 〉 (0) sinωt (8.67)

〈P 〉 (t) = 〈P 〉 (0) cosωt−mω 〈X〉 (0) sinωt (8.68)

que es la forma sinusoidal que se obtuvo en (8.66).Es importante mencionar que este analogo clasico solo es valido si el estado |ψ (0)〉 descrito por (8.64) es una

superposicion con al menos dos coeficientes no nulos, ya que si solo uno de ellos es no nulo el sistema estara inicial-mente en un estado estacionario y los valores esperados no evolucionaran en el tiempo6. En consecuencia, cuandoel oscilador esta en un estado estacionario el comportamiento cuantico sera muy diferente al clasico incluso si nes muy grande. Si queremos un paquete de onda cuya posicion promedio oscile en el tiempo, deben superponersevarios estados estacionarios.

6Cuando solo uno de los coeficientes en (8.64) es no nulo, entonces al menos uno de los coeficientes cn (0) o cn+1 (0) es nulo paracada n en la Ec. (8.66), con lo cual 〈X〉 = 0. Similarmente 〈P 〉 = 0. Como en particular 〈X〉 (0) = 〈P 〉 (0) = 0, tambien se obtiene que〈X〉 (t) = 〈P 〉 (t) = 0 de las Ecs. (8.67, 8.68).

Page 244: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 9

Estados coherentes cuasi-clasicos deloscilador armonico (opcional)

Ya hemos estudiado las propiedades de los estados estacionarios del oscilador armonico y hemos observado quesu comportamiento difiere significativamente del oscilador armonico clasico. Por ejemplo, los valores esperados deX y P son cero y no oscilantes como ocurre en el caso clasico (excepto en el caso en que la energıa clasica es cero).Vimos tambien que para emular razonablemente el caso clasico, se necesita la superposicion de al menos dos estadosestacionarios. Por otro lado, es de esperarse que en el lımite de energıas mucho mayores que ~ω (numeros cuanticosn muy grandes), las predicciones clasicas y cuanticas sean casi identicas, ya que al tener una enorme cantidad decuantos se enmascara su caracter discreto.

Hemos visto que muchos sistemas clasicos y cuanticos se pueden describir con el oscilador armonico al menosen primera aproximacion. Por esta razon es importante saber como pasar gradualmente de una descripcion clasicaa una descripcion cuantica o vice versa. En otras palabras es importante caracterizar ciertos parametros que nosindiquen como dicernir cuando los resultados clasicos o cuanticos sean adecuados para describir cierto sistema fısico.Un caso importante es la radiacion electromagnetica, hemos visto que para altas intensidades la descripcion clasicaes adecuada, en tanto que para bajas intensidades el caracter discreto de la radiacion se manifiesta claramente.

Lo anterior nos induce a indagar por la existencia de estados cuanticos que conduzcan a predicciones fısicas muysimilares a las clasicas, al menos para el oscilador armonico macroscopico. Veremos que los estados que cumplenesta condicion son superposiciones coherentes de los estados estacionarios |ϕn〉 del oscilador armonico. Por talrazon a dichos estados se les denomina como estados coherentes del oscilador armonico o tambien estadoscuasi-clasicos. Los estados coherentes de la radiacion electromagnetica permiten dicernir cuantitativamente laimportancia de los efectos cuanticos en la radiacion para cada sistema radiativo.

La idea es entonces encontrar estados para los cuales los valores de 〈X〉 , 〈P 〉 , y 〈H〉 sean semejantes a losvalores clasicos para todo tiempo. Adicionalmente, puesto que estos observables no son compatibles (no conmutanentre sı) no es posible construır un estado cuantico en donde las tres cantidades esten bien definidas. Los estadoscoherentes deben entonces lidiar inevitablemente con el principio de incertidumbre, de modo que tambien debenlograr que las desviaciones medias cuadraticas ∆X,∆P, ∆H sean despreciables en el lımite macroscopico.

9.1. Parametrizacion del oscilador clasico con parametros cuanticos

Tomemos como punto de partida las ecuaciones clasicas del oscilador armonico

dx (t)

dt=p (t)

m;dp (t)

dt= −mω2x (t) (9.1)

reescribiremos por conveniencia estas ecuaciones en variable adimensionales x y p definidas por

x (t) = βx (t) , p (t) =1

~βp (t) ; β =

√mω

~(9.2)

reemplazando (9.2) en (9.1) tenemos

dx (t)

dt= ωp (t) ;

dp (t)

dt= −ωx (t) (9.3)

244

Page 245: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

9.2. CONSTRUCCION DE LOS ESTADOS COHERENTES O CUASI-CLASICOS 245

notese que la “normalizacion” de las variables x y p se realizo con constantes que dependen de ~, de modo quefacilite la comparacion del oscilador clasico con el oscilador cuantico. El estado clasico esta determinado para todotiempo por las variables x (t) , p (t) o equivalentemente, por las variables x (t) y p (t). Estas a su vez se puedensintentizar en un numero complejo adimensional α (t) en la forma

α (t) =1√2

[x (t) + ip (t)] (9.4)

y las ecuaciones (9.3) se pueden escribir como una unica ecuacion compleja en la forma

dα (t)

dt= −iω α (t) (9.5)

cuya solucion es

α (t) = α0e−iωt ; α0 = α (0) =

1√2

[x (0) + ip (0)] ≡ |α0| eiδ (9.6)

siendo α0 un numero complejo que se puede escribir como α0 = |α0| eiδ, claramente la solucion representa un fasorde magnitud |α0| y cuya fase esta dada por δ − ωt. Es decir, el fasor rota con velocidad angular −ω (de modo quesi ω > 0 el giro es en direccion horaria alrededor de O).

Es claro ademas que las componentes cartesianas del fasor α (t) en cualquier instante, corresponden a x (t) /√

2y p (t) /

√2. Vemos entonces que la descripcion completa del movimiento se obtiene a traves de la condicion inicial

descrita por α0, en la Ec. (9.6). Esta condicion inicial se expresa bien sea como posicion y momento inicial (com-ponentes cartesianas adimensionales) o bien sea como |α0| y δ (parametros polares correspondientes a la amplitudadimensional de la oscilacion y fase inicial respectivamente). De las Ecs. (9.4, 9.6) se obtiene

x (t) =1√2

[α0e

−iωt + α∗0eiωt]

=√

2Re[α0e

−iωt] ; p (t) = − i√2

[α0e

−iωt − α∗0eiωt]

=√

2Im[α0e

−iωt] (9.7)

ahora escribiremos la energıa del sistema clasico H la cual es una constante de movimiento y por tanto coincide consu valor inicial para todo tiempo

H =1

2m[p (0)]2 +

1

2mω2 [x (0)]2

H =~ω

2

[x (0)]2 + [p (0)]2

(9.8)

teniendo en cuenta la segunda de las Ecs. (9.6), la energıa queda en la forma

H = ~ω |α0|2 (9.9)

para un oscilador macroscopico es claro que la energıa es mucho mayor a la energıa del cuanto fundamental de modoque

|α0| >> 1 (9.10)

9.2. Construccion de los estados coherentes o cuasi-clasicos

Buscaremos estados mecano-cuanticos para los cuales los valores esperados 〈X〉 , 〈P 〉 y 〈H〉 sean muy similares alos valores clasicos x, p,H. Para ello compararemos a X,P con las variables adimensionales x, p para lo cual definire-mos los correspondientes observables adimensionales. Adicionalmente, escribiremos los observables en terminos delos operadores creacion y destruccion

X = βX =1√2

(a+ a†

); P =

1

~βP = − i√

2

(a− a†

); H = ~ω

(a†a+

1

2

)(9.11)

si comparamos las Ecs. (9.11) con las Ecs. (9.7, 9.6) vemos que el operador a es el analogo de la cantidad clasicaα (t) y a† posee el papel de α∗ (t). Clasicamente hemos visto que la cantidad compleja α0 (condiciones iniciales) nosdictamina la evolucion temporal de los observables clasicos que se describen con α (t) en la Ec. (9.6), y dado que a

Page 246: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

246CAPITULO 9. ESTADOS COHERENTES CUASI-CLASICOS DEL OSCILADOR ARMONICO (OPCIONAL)

es el analogo cuantico de α, es natural continuar la analogıa calculando la evolucion temporal de 〈a〉 para el sistemaen un estado arbitrario |ψ (t)〉. Tal evolucion se obtiene de la Ec. (5.52)

i~d

dt〈a〉 (t) = 〈[a,H]〉 (t) (9.12)

donde hemos tenido en cuenta que a es solo funcion de X y P y por tanto no depende explıcitamente del tiempo.El miembro derecho de (9.12) se escribe como

〈[a,H]〉 (t) = ~ω

⟨[a, a†a+

I

2

]⟩(t) = ~ω

⟨[a, a†a

]⟩(t) = ~ω

⟨[a, a†

]a⟩

(t)

〈[a,H]〉 (t) = ~ω 〈a〉 (t)

con lo cual la Ec. (9.12) queda

id

dt〈a〉 (t) = ω 〈a〉 (t) (9.13)

cuya solucion es〈a〉 (t) = 〈a〉 (0) e−iωt (9.14)

la solucion para⟨a†⟩(t) es la compleja conjugada de (9.14)

⟨a†⟩

(t) =⟨a†⟩

(0) eiωt = 〈a〉∗ (0) eiωt (9.15)

notese que las soluciones cuanticas (9.14, 9.15) son los analogos de la solucion clasica (9.6), como era de esperarseen virtud de la analogıa a, a† ↔ α, α∗. Sustituyendo (9.14) y (9.15) en (9.11) se obtiene

⟨X⟩

(t) =1√2

[〈a〉 (0) e−iωt + 〈a〉∗ (0) eiωt

]

⟨P⟩

(t) = − i√2

[〈a〉 (0) e−iωt − 〈a〉∗ (0) eiωt

](9.16)

el lımite clasico se obtiene igualando los valores esperados con las variables clasicas

⟨X⟩

(t) = x (t) ;⟨P⟩

(t) = p (t) (9.17)

esta igualacion se realiza comparando las Ecs. (9.16) con las Ecs. (9.7). De esto se ve que la condicion necesaria ysuficiente para obtener el lımite clasico (9.17) es que en t = 0 se cumpla la condicion

〈a〉 (0) = α0 (9.18)

siendo α0 el parametro complejo que caracteriza al movimiento clasico que pretendemos emular cuanticamente, yviene dado por la segunda de las Ecs. (9.6). Debemos ahora obtener la condicion para la igualacion de las energıasclasica y cuantica, para ello calculamos el valor esperado del Hamiltoniano cuantico, como este es constante demovimiento, se puede evaluar en cero

〈H〉 = ~ω⟨a†a⟩

(0) +~ω

2

debemos igualar esta energıa con su valor clasico H y obtener la condicion que se genera con tal igualacion. Paraello podemos despreciar el termino ~ω/2, ya que el lımite clasico corresponde a energıas mucho mayores que ~ω.Recordemos que el termino ~ω/2 es puramente cuantico en su origen. La igualacion de 〈H〉 ' ~ω

⟨a†a⟩(0) con el

valor clasico dado por la Ec. (9.9) nos lleva a la condicion

⟨a†a⟩

(0) = |α0|2 (9.19)

recordando que hemos asumido un estado |ψ (t)〉 para el sistema, las condiciones (9.18, 9.19) se escriben como

〈ψ (0)| a |ψ (0)〉 = α0 ; 〈ψ (0)| a†a |ψ (0)〉 = |α0|2 (9.20)

Page 247: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

9.3. PROPIEDADES DE LOS ESTADOS |α〉 247

veremos que las condiciones (9.20) son suficientes para determinar el estado normalizado |ψ (0)〉 excepto por unfactor de fase constante. Para verlo introducimos el operador b (α0) definido por

b (α0) ≡ a− α0

notese que este operador mide la “desviacion” entre el comportamiento del operador cuantico a y el de su analogoclasico α0 en el tiempo inicial, tenemos que

b† (α0) b (α0) =(a† − α∗

0

)(a− α0) = a†a− a†α0 − α∗

0a+ |α0|2

con lo cual

‖b (α0) |ψ (0)〉‖2 = 〈ψ (0)| b† (α0) b (α0) |ψ (0)〉 = 〈ψ (0)|a†a− a†α0 − α∗

0a+ |α0|2|ψ (0)〉

‖b (α0) |ψ (0)〉‖2 = 〈ψ (0)| a†a |ψ (0)〉 − α0 〈ψ (0)| a† |ψ (0)〉 − α∗0 〈ψ (0)| a |ψ (0)〉 + |α0|2

y usando las condiciones (9.20) tenemos que

‖b (α) |ψ (0)〉‖2 = |α0|2 − α0α∗0 − α∗

0α0 + |α0|2 = 0

como la norma del ket b (α) |ψ (0)〉 es nula entonces el ket como tal es nulo, por tanto

b (α) |ψ (0)〉 = 0 ⇒ (a− α0) |ψ (0)〉 = 0

a |ψ (0)〉 = α0 |ψ (0)〉 (9.21)

recıprocamente, si el ket normalizado |ψ (0)〉 satisface esta relacion, podemos devolvernos en los pasos y ver que lascondiciones (9.20) se satisfacen. Notese que el resultado b (α) |ψ (0)〉 = 0 es el esperado, ya que cuando el estado|ψ (0)〉 es cuasi-clasico, es razonable que la “desviacion” entre el comportamiento clasico y el cuantico se anule.

Lo anterior nos lleva a la conclusion de que el estado cuasi-clasico asociado con un movimiento clasico caracter-izado por el parametro α0, es tal que el vector de estado |ψ (0)〉 en t = 0 es un autovector del operador destrucciona con autovalor α0. Escribiremos los autovectores de a y su autovalores en la forma

a |α〉 = α |α〉 (9.22)

veremos ademas que la solucion de (9.22) es unica salvo constantes.

9.3. Propiedades de los estados |α〉Vamos a determinar las soluciones para el ket |α〉 de la Ec. (9.22). Para ello expandiremos el ket |α〉 en la base

de estados estacionarios del oscilador armonico

|α〉 =

∞∑

n=0

cn (α) |ϕn〉 (9.23)

aplicando el operador destruccion a ambos lados de la expansion y usando la Ec. (8.38), se obtiene

a |α〉 =

∞∑

n=0

cn (α) [a |ϕn〉] ⇒ a |α〉 =

∞∑

n=0

cn (α)[√n |ϕn−1〉

](9.24)

sustituyendo la Ec. (9.24) en la Ec. (9.22) y usando (9.23) resulta

∞∑

n=0

√ncn (α) |ϕn−1〉 = α

∞∑

k=0

ck (α) |ϕk〉

reemplazando n→ k + 1 en el miembro izquierdo, se tiene

∞∑

k=0

√k + 1ck+1 (α) |ϕk〉 = α

∞∑

k=0

ck (α) |ϕk〉

Page 248: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

248CAPITULO 9. ESTADOS COHERENTES CUASI-CLASICOS DEL OSCILADOR ARMONICO (OPCIONAL)

notese que aunque la suma de la izquierda debe ir desde k = −1, este primer termino es nulo. Apelando a laindependencia lineal de los |ϕk〉 se obtiene

ck+1 (α) =α√k + 1

ck (α) (9.25)

utilizando esta relacion iterativamente tenemos

ck (α) =α√kck−1 (α) =

α√k

[α√k − 1

ck−2 (α)

]=

α2

√k (k − 1)

ck−2 (α)

ck (α) =α2

√k (k − 1)

[α√k − 2

ck−3 (α)

]=

α3

√k (k − 1) (k − 2)

ck−3 (α)

ck (α) =αk√

k (k − 1) (k − 2) . . .× 2 × 1ck−k (α)

de modo que todos los coeficientes de la expansion de |α〉 se pueden generar a partir de c0 (α)

ck (α) =αk√k!c0 (α) (9.26)

Escogeremos a c0 (α) como real y positivo (fase cero). Adicionalmente, escogeremos c0 (α) de modo que |α〉 quedeadecuadamente normalizado. De acuerdo con (9.23), la normalizacion de |α〉 nos lleva a

1 = 〈α |α〉 =∞∑

k=0

c∗k (α)∞∑

n=0

cn (α) 〈ϕk |ϕn〉 =∞∑

k=0

∞∑

n=0

c∗k (α) cn (α) δkn

⇒∞∑

k=0

|ck (α)|2 = 1 (9.27)

reemplazando (9.26) en (9.27) se tiene

|c0 (α)|2∞∑

k=0

|α|2kk!

= 1 ⇒ |c0 (α)|2 e|α|2 = 1

c0 (α) = e−|α|2

2 (9.28)

reemplazando (9.26) y (9.28) en (9.23) queda finalmente

|α〉 =

∞∑

n=0

cn (α) |ϕn〉 =

∞∑

n=0

αn√n!c0 (α) |ϕn〉 =

∞∑

n=0

αn√n!e−

|α|2

2 |ϕn〉

|α〉 = e−|α|2

2

∞∑

n=0

αn√n!

|ϕn〉 (9.29)

9.3.1. Valores permitidos de la energıa para un estado coherente |α〉Los estados coherentes son autoestados de un operador que no es observable (el operador a no es hermıtico). Por

tanto sus valores propios pueden ser complejos y no corresponden a observables fısicos. Sin embargo, estos estadosson de cuadrado integrable y por tanto pertenecen al espacio de estados fısicos posibles. Asumamos entonces unoscilador en el estado |α〉 descrito por la Ec. (9.29). La probabilidad de obtener el valor Em = (m+ 1/2) ~ω para elsistema en el estado |α〉 se puede calcular de (9.29)

Pm (α) = |〈ϕm |α〉|2 =

∣∣∣∣∣e− |α|2

2

∞∑

n=0

αn√n!〈ϕm |ϕn〉

∣∣∣∣∣

2

Pm (α) = e−|α|2 |α|2mm!

Page 249: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

9.3. PROPIEDADES DE LOS ESTADOS |α〉 249

es facil ver que la probabilidad anterior cumple con la condicion

Pm (α) =|α|2m

(e−|α|2 |α|2(m−1)

(m− 1)!

)⇒

Pm (α) =|α|2m

Pm−1 (α)

de modo que la distribucion de la probabilidad es del tipo Poisson. Se puede verificar que el maximo de estaprobabilidad se obtiene cuando

m = la parte entera de |α|2 (9.30)

calcularemos ahora el valor esperado de la energıa el cual debe ser comparado con la energıa clasica. Para ellonotemos primero que de la Ec. (9.22), se tiene que

‖a |α〉‖2 = ‖α |α〉‖2 ⇒ 〈α| a†a |α〉 = 〈α|α∗α |α〉 ⇒〈α| a†a |α〉 = |α|2 (9.31)

con lo cual

〈H〉α = ~ω 〈α|(a†a+

1

2

)|α〉

〈H〉α = ~ω

(|α|2 +

1

2

)(9.32)

teniendo en cuenta el resultado (9.30), vemos que si |α| >> 1 (como corresponde al lımite clasico), la cantidad 〈H〉αes muy similar en valor relativo a la energıa En que corresponde al maximo de Pn (α). Con el fin de calcular elancho ∆H calcularemos

⟨H2⟩α

⟨H2⟩α

= ~2ω2 〈α|(a†a+

1

2

)2

|α〉 = ~2ω2 〈α|[(a†a)(

a†a)

+ a†a+1

4

]|α〉

= ~2ω2 〈α|NN |α〉 + ~2ω2 〈α|[a†a+

1

4

]|α〉 = ~2ω2〈Nα |Nα〉 + ~2ω2

(|α|2 +

1

4

)

⟨H2⟩α

= ~2ω2 ‖|Nα〉‖2 + ~2ω2

(|α|2 +

1

4

)(9.33)

donde hemos usado la Ec. (9.31) y el hecho de que N = a†a es hermıtico. Multiplicando (9.22) por a† se tiene que

a†a |α〉 = αa† |α〉 ⇒ N |α〉 = αa† |α〉 ⇒ ‖N |α〉‖2 = |α|2∥∥∥a† |α〉

∥∥∥2

⇒ ‖N |α〉‖2 = |α|2 〈α| aa† |α〉 ⇒ ‖N |α〉‖2 = |α|2 〈α|(a†a+ 1

)|α〉

‖N |α〉‖2 = |α|2(|α|2 + 1

)(9.34)

donde hemos usado nuevamente (9.31). Reemplazando (9.34) en (9.33) se obtiene

⟨H2⟩α

= ~2ω2 |α|2(|α|2 + 1

)+ ~2ω2

(|α|2 +

1

4

)

⟨H2⟩α

= ~2ω2

[|α|4 + 2 |α|2 +

1

4

](9.35)

y el ancho se obtiene usando (9.32) y (9.35)

(∆Hα)2 =

⟨H2⟩α− 〈H〉2α = ~2ω2

[|α|4 + 2 |α|2 +

1

4

]−[~ω

(|α|2 +

1

2

)]2

(∆Hα)2 = ~2ω2

[|α|4 + 2 |α|2 +

1

4− |α|4 − |α|2 − 1

4

]= ~2ω2 |α|2

(∆Hα) = ~ω |α| (9.36)

Page 250: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

250CAPITULO 9. ESTADOS COHERENTES CUASI-CLASICOS DEL OSCILADOR ARMONICO (OPCIONAL)

en el lımite cuasi-clasico el ancho relativo debe ser mucho menor que uno, con el fin de poder afirmar que la energıaesta bien definida. El ancho relativo se puede calcular de (9.32) y (9.36)

∆Hα

〈H〉α=

|α|(|α|2 + 1

2

) (9.37)

para el lımite cuasi-clasico |α| >> 1, se tiene que

∆Hα

〈Hα〉' |α|

|α|2=

1

|α| << 1 (9.38)

de modo que se puede considerar que la energıa esta bien definida en el lımite cuasi-clasico. Es inmediato ver que

〈N〉α = |α|2 ; ∆Nα = |α|lo cual nos dice que para obtener un estado cuasi-clasico |α| >> 1, se debe suporponer un enorme numero de estados|ϕn〉 ya que ∆Nα >> 1. Sin embargo, el valor relativo de la dispersion sobre N tambien es muy pequeno

∆Nα

〈N〉α' 1

|α| << 1

9.3.2. Calculo de los observables X, P en el estado |α〉Con el fin de realizar la comparacion con los valores clasicos, calcularemos 〈X〉 , 〈P 〉 , ∆X, ∆P . Para ello se

usan las expresiones de X y P en terminos de a y a† (ver Ecs. 8.7), junto con la Ec. (9.22)

〈X〉α =

√~

2mω〈α|(a† + a

)|α〉 =

√~

2mω

[〈α| a† |α〉 + 〈α| a |α〉

]=

√~

2mω(α∗ + α) =

√2~

mωRe (α)

〈P 〉α = i

√m~ω

2〈α|(a† − a

)|α〉 = i

√m~ω

2(α∗ − α) = (−2i) i

√m~ω

2

(α− α∗)2i

=√

2m~ωIm (α)

⟨X2⟩α

=~

2mω〈α|(a† + a

)2|α〉 =

~

2mω〈α|[(a†)2

+ a2 + a†a+ aa†]|α〉 =

~

2mω〈α|[(a†)2

+ a2 + 2N + 1

]|α〉

=~

2mω

[α∗2 + α2 + 2 |α|2 + 1

]=

~

2mω

[(α∗ + α)2 + 1

]

⟨P 2⟩α

= −m~ω

2〈α|(a† − a

)2|α〉 = −m~ω

2〈α|[(a†)2

+ a2 − 2N − 1

]|α〉 =

m~ω

2

[−α∗2 − α2 + 2 |α|2 + 1

]

=m~ω

2

[− (α− α∗)2 + 1

]

(∆Xα)2 =⟨X2⟩α− 〈X〉2α =

~

2mω

[(α∗ + α)2 + 1

]− ~

2mω(α∗ + α)2 =

~

2mω

(∆Pα)2 =⟨P 2⟩α− 〈P 〉2α =

m~ω

2

[− (α− α∗)2 + 1

]−[i

√m~ω

2(α∗ − α)

]2

=m~ω

2

[− (α− α∗)2 + 1

]+m~ω

2(α∗ − α)2 =

m~ω

2

resumiendo los anteriores resultados tenemos que

〈X〉α = 〈α|X |α〉 =

√2~

mωRe (α) ; 〈P 〉α = 〈α|P |α〉 =

√2m~ωIm (α) (9.39)

⟨X2⟩α

=~

2mω

[(α+ α∗)2 + 1

];⟨P 2⟩α

=m~ω

2

[1 − (α− α∗)2

](9.40)

∆Xα =

√~

2mω; ∆Pα =

√m~ω

2(9.41)

se observa que los anchos ∆Xα y ∆Pα no dependen de α y el producto de los anchos toma su valor mınimo

∆Xα · ∆Pα =~

2(9.42)

lo cual es muy deseable para un lımite cuasi-clasico.

Page 251: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

9.4. GENERADOR Y FUNCION DE ONDA DE LOS ESTADOS COHERENTES 251

9.4. Generador y funcion de onda de los estados coherentes

Teniendo en cuenta la Ec. (8.28) vemos que el estado coherente de la Ec. (9.29) se puede escribir en terminosdel operador construccion a partir del estado base del oscilador armonico

|α〉 = e−|α|2

2

∞∑

n=0

αn√n!

|ϕn〉 = e−|α|2

2

∞∑

n=0

αn√n!

(a†)n

√n!

|ϕ0〉 =

[e−

|α|2

2

∞∑

n=0

(αa†)n

n!

]|ϕ0〉

|α〉 =

[e−

|α|2

2 eαa†

]|ϕ0〉 ≡ D (α) |ϕ0〉 (9.43)

podemos generar a |α〉 a partir de |ϕ0〉 con un operador mas simetrico, para ello tenemos en cuenta que el operadordestruccion a aniquila el estado base, con lo cual tenemos que

e−α∗a |ϕ0〉 =

[1 − α∗a+

α∗2

2!a2 + . . .

]|ϕ0〉 = |ϕ0〉 (9.44)

de la Ec. (9.44) podemos reescribir la Ec. (9.43) en la forma

|α〉 =

[e−

|α|2

2 eαa†e−α

∗a

]|ϕ0〉

con lo cual se obtiene

|α〉 = D (α) |ϕ0〉 (9.45)

D (α) ≡ e−|α|2

2

eαa†e−α

∗a (9.46)

teniendo en cuenta que [αa†,−α∗a

]= −αα∗

[a†, a

]= |α|2 I

y usando la relacion (1.147), las Ecs. (9.45, 9.46) quedan

D (α) = eαa†−α∗a ; |α〉 = D (α) |ϕ0〉 (9.47)

este operador (conocido como operador de Weyl) es unitario

D† (α) = eα∗a−αa† ⇒ D (α)D† (α) = D† (α)D (α) = I

La Ec. (9.47) nos muestra que podemos ver al operador unitario D (α) como un operador “creacion” del estadocoherente |α〉 a partir del estado base del oscilador armonico. La Ec. (9.47) nos permite encontrar la funcion deonda asociada a los estados coherentes

ψα (x) = 〈x|α〉 = 〈x|D (α) |ϕ0〉 (9.48)

para calcular la funcion de onda, primero escribimos el operador αa† − α∗a en terminos de X y P usando las Ecs.(8.5)

αa† − α∗a =

√mω

~

(α− α∗√

2

)X − i√

m~ω

(α+ α∗√

2

)P

teniendo en cuenta que

[√mω

~

(α− α∗√

2

)X, − i√

m~ω

(α+ α∗√

2

)P

]= − i

2√m~ω

√mω

~(α− α∗) (α+ α∗) [X,P ]

=1

2

[α2 − α∗2

]

y usando de nuevo la relacion (1.147), el operador D (α) queda

D (α) = eαa†−α∗a = exp

[√mω

~

α− α∗√

2X

]exp

[− i√

m~ω

α+ α∗√

2P

]exp

[α∗2 − α2

4

]

Page 252: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

252CAPITULO 9. ESTADOS COHERENTES CUASI-CLASICOS DEL OSCILADOR ARMONICO (OPCIONAL)

sustituyendo este resultado en (9.48) se obtiene

ψα (x) = exp

[α∗2 − α2

4

]〈x| exp

[√mω

~

α− α∗√

2X

]exp

[− i√

m~ω

α+ α∗√

2P

]|ϕ0〉

ψα (x) = exp

[α∗2 − α2

4

]exp

[√mω

~

α− α∗√

2x

]〈x| exp

− i

~

[√~

2mω(α+ α∗)

]P

|ϕ0〉 (9.49)

ahora bien, el operador e−iλP/~ es el operador traslacion de λ a lo largo de x (siendo P la componente x del momento)ver seccion 1.44.2 Ec. (1.202), pag 93, de modo que

〈x| exp

− i

~

[√~

2mω(α+ α∗)

]P

=

⟨x−

√~

2mω(α+ α∗)

∣∣∣∣∣

con lo cual la Ec. (9.49) queda

ψα (x) = exp

[α∗2 − α2

4

]exp

[√mω

~

α− α∗√

2x

]ϕ0

(x−

√~

2mω(α+ α∗)

)(9.50)

si escribimos α y α∗ en terminos de 〈X〉α y 〈P 〉α segun las Ecs. (9.39), tenemos que

α− α∗ = 2i Im(α) = 2i〈P 〉α√2m~ω

; α+ α∗ = 2Re (α) = 2

√mω

2~〈X〉α (9.51)

α∗2 − α2 = − (α− α∗) (α+ α∗) = −2i〈X〉α 〈P 〉α

~(9.52)

reemplazando las Ecs. (9.51, 9.52) en la funcion de onda (9.50) tenemos que

ψα (x) = exp

[−i〈X〉α 〈P 〉α

2~

]exp

[√mω

~

2i 〈P 〉α√2√

2m~ωx

]ϕ0

(x−

√~

2mω

(2

√mω

2~〈X〉α

))

ψα (x) = eiθαei〈P 〉αx/~ϕ0 (x− 〈X〉α) ; θα ≡ −〈X〉α 〈P 〉α2~

(9.53)

la ecuacion (9.53) nos muestra que ψα (x) se puede obtener a partir de la funcion de onda ϕ0 (x) del estado basedel oscilador armonico en la siguiente forma: Se traslada esta funcion a lo largo de x en una cantidad 〈X〉α yse multiplica por la exponencial oscilante ei〈P 〉αx/~. El factor eiθa es irrelevante y puede ser omitido, notese sinembargo que el termino ei〈P 〉αx no es una fase global sino local ya que dependen de x, y por tanto es relevante. Estaexponencial nos asegura que el valor promedio de P en el estado ψα (x) sea 〈P 〉α.

Si reemplazamos la forma explıcita de ϕ0 (x) (Ec. 8.45, Pag. 237), en la Ec. (9.53) obtenemos

ψα (x) =(mωπ~

) 14eiθαei〈P 〉αx/~ exp

−1

2

~(x− 〈X〉α)2

=(mωπ~

) 14eiθαei〈P 〉αx/~ exp

[1

2

√2mω

~(x− 〈X〉α)

]2

ψα (x) = eiθα(mωπ~

) 14exp

−[x− 〈X〉α2∆Xα

]2

+ i 〈P 〉αx

~

(9.54)

donde hemos usado tambien la Ec. (9.41). La forma del paquete de onda asociada con el estado |α〉 esta dada por

|ψα (x)|2 =

√mω

π~exp

−1

2

[x− 〈X〉α

∆Xα

]2

(9.55)

con lo cual para cualquier estado coherente |α〉 obtenemos un paquete Gaussiano. Esto a su vez esta relacionadocon la propiedad de mınima incertidumbre que obtuvimos en la Ec. (9.42).

Page 253: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

9.5. LOS ESTADOS COHERENTES SON COMPLETOS PERO NO ORTOGONALES 253

9.5. Los estados coherentes son completos pero no ortogonales

Los estados coherentes o cuasi-clasicos |α〉 son autovectores del operador a, el cual no es hermıtico. Por tanto, noes claro si estos estados satisfacen relaciones de completez y ortogonalidad. Veremos que el conjunto de los estadoscoherentes |α〉 es completo pero no es ortogonal.

Consideremos primero el producto interno de dos estados cuasi-clasicos. Aplicando (9.29) tenemos

〈α∣∣α′⟩ =

[e−

|α|2

2

∞∑

m=0

α∗m√m!

〈ϕm|][

e−|α′|2

2

∞∑

n=0

α′n√n!

|ϕn〉]

= e−|α|2

2 e−|α′|2

2

[ ∞∑

m=0

∞∑

n=0

α′n√n!

α∗m√m!

〈ϕm|ϕn〉]

= e−|α|2

2 e−|α′|2

2

[ ∞∑

n=0

α′n√n!

α∗n√n!

]= e−

|α|2

2 e−|α′|2

2

[ ∞∑

n=0

(α′α∗)n

n!

]

〈α∣∣α′⟩ = e−

|α|2

2 e−|α′|2

2 eα∗α′

con lo cual resulta ∣∣〈α∣∣α′⟩∣∣2 = e−|α−α′|2 (9.56)

de modo que este producto escalar no es nunca cero. Los estados coherentes no son ortogonales.Veremos no obstante que los estados |α〉 poseen una relacion de completez de la forma

1

π

∫ ∫|α〉 〈α| d2α = 1 (9.57)

comenzaremos reemplazando |α〉 al lado izquierdo de (9.57) por su expresion en (9.29)

I ≡ 1

π

∫ ∫|α〉 〈α| d2α =

1

π

∫ ∫ [e−

|α|2

2

∞∑

n=0

αn√n!

|ϕn〉][

e−|α|2

2

∞∑

m=0

α∗m√m!

〈ϕm|]d2α

I =1

π

∫ ∫e−|α|2

[ ∞∑

n=0

∞∑

m=0

αnα∗m√n!√m!

|ϕn〉 〈ϕm|]d2α (9.58)

el complejo α lo podemos escribir como

α = ρeiϕ = x+ iy ; d2α = ρ dρ dϕ = dx dy = d Re (α) d Im (α) (9.59)

donde hemos tenido en cuenta la expresion del diferencial de area en coordenadas polares1. Sustituyendo laparametrizacion polar de la Ec. (9.59) en la integral (9.58), esta ultima queda como

I =1

π

∫ ∫e−|ρeiϕ|

2

[ ∞∑

n=0

∞∑

m=0

(ρeiϕ

)n (ρe−iϕ

)m√n!√m!

|ϕn〉 〈ϕm|]ρ dρ dϕ

I =1

π

∫ ∫e−|ρ|2

[ ∞∑

n=0

∞∑

m=0

ρn+mei(n−m)ϕ

√n!m!

|ϕn〉 〈ϕm|]ρ dρ dϕ

I =1

π

∞∑

n=0

∞∑

m=0

∫ ∞

0e−ρ

2ρn+m ρ dρ

1√n!m!

|ϕn〉 〈ϕm|∫ 2π

0dϕ ei(n−m)ϕ (9.60)

la integral sobre ϕ es inmediata ∫ 2π

0ei(n−m)ϕdϕ = 2πδnm

1Combinando las Ecs. (9.39, 9.59), podemos ver que d2α = d Re (α) d Im (α) = 12~d 〈X〉α d 〈P 〉α, con lo cual la Ec. (9.57) que

expresa la completez de los estados coherentes, se puede interpretar como una integral sobre el espacio de fase clasico.

Page 254: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

254CAPITULO 9. ESTADOS COHERENTES CUASI-CLASICOS DEL OSCILADOR ARMONICO (OPCIONAL)

de modo que la Ec. (9.60) queda en la forma

I = 2∞∑

n=0

∞∑

m=0

∫ ∞

0e−ρ

2ρn+m ρ dρ

1√n!m!

|ϕn〉 〈ϕm| δmn = 2∞∑

n=0

∫ ∞

0e−ρ

2ρn+n ρ dρ

1√n!n!

|ϕn〉 〈ϕn|

I =

∞∑

n=0

2

[∫ ∞

0e−ρ

2ρ2n ρ dρ

]1

n!|ϕn〉 〈ϕn|

haciendo el cambio de variable u = ρ2, du = 2ρ dρ tenemos

n

In1

n!|ϕn〉 〈ϕn| ; In = 2

∫ ∞

0ρ dρ e−ρ

2ρ2n =

∫ ∞

0du e−uun (9.61)

haciendo dV = du e−u y U = un integramos In por partes

In = −une−u∣∣∞0

−∫ ∞

0−e−u (nun−1) du = n

∫du e−uun−1

con lo cual encontramos una relacion de recurrencia para In

In = nIn−1

cuya solucion es

In = nIn−1 = n (n− 1) In−2 = n (n− 1) (n− 2) In−3 = . . . = [n× (n− 1) × (n− 2) × · · · × 2 × 1] In−nIn = n!I0

de la Ec. (9.61) tenemos que

I0 =

∫ ∞

0du e−u = −e−u

∣∣∞0

= 1 ⇒

In = n!I0 = n!

que al sustituırlo en (9.61) nos da

I =∑

n

|ϕn〉 〈ϕn| = 1

donde hemos usado la completez de las autofunciones del oscilador armonico. Con esto se demuestra la Ec. (9.57),que nos expresa la completez de los estados coherentes |α〉.

9.6. Evolucion temporal de los estados coherentes

Consideremos un oscilador armonico que en t = 0 esta en un estado coherente dado |ψ (0)〉 = |α0〉. Veremosla evolucion temporal de este estado y de los observables mas importantes. Ya hemos visto que 〈X〉 (t) y 〈P 〉 (t)permanecen iguales a sus valores clasicos para todo tiempo. De hecho, esta caracterıstica fue la motivacion para laconstruccion de estos estados.

Para calcular la evolucion temporal del estado del sistema, expandimos el estado inicial en autoestados delHamiltoniano del oscilador armonico usando (9.29)

|ψ (0)〉 = |α0〉 =∑

n

cn (0) |ϕn〉 ; cn (0) ≡ e−|α0|

2

2αn0√n!

(9.62)

Como el Hamiltoniano del oscilador armonico es independiente del tiempo, la evolucion temporal del estado sepuede calcular con la Ec. (5.67)

|ψ (t)〉 =∑

n

cn (0) e−iEnt/~ |ϕn〉 = e−|α0|

2

2

n

αn0√n!

e−i(n+ 12)ωt |ϕn〉

|ψ (t)〉 = e−iωt2 e−

|α0|2

2

n

αn0√n!

e−inωt |ϕn〉 = e−iωt2 e−

|α0e−iωt|22

n

(α0e

−iωt)n√n!

|ϕn〉 (9.63)

Page 255: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

9.6. EVOLUCION TEMPORAL DE LOS ESTADOS COHERENTES 255

comparando (9.63) con (9.62), vemos que el ket |ψ (t)〉 se obtiene del ket inicial |ψ (0)〉 = |α0〉 cambiando α0 por

α0e−iωt y multiplicando el ket resultante por la fase global (irrelevante) e−i

ωt2 , con lo cual |ψ (t)〉 se puede reescribir

como

|ψ (t)〉 = e−iωt/2∣∣α = α0e

−iωt⟩ (9.64)

por tanto el estado cuasi-clasico continua siendo autovector del operador a, para todo tiempo t. Su autovalor esα0e

−iωt que es el parametro α (t) descrito por las ecuaciones (9.4, 9.6) y que geometricamente es un fasor que rotaen el plano complejo con velocidad angular −ω. Recordemos que este fasor caracteriza en todo tiempo al osciladorarmonico clasico cuya evolucion pretendemos reproducir a traves del estado |ψ (t)〉. Los valores esperados de 〈X〉 y〈P 〉 para todo tiempo se obtienen a partir de (9.64) y (9.39)

〈X〉α(t) (t) =

√2~

mωRe[α0e

−iωt] ; 〈P 〉α(t) (t) =√

2m~ωIm[α0e

−iωt] (9.65)

y tal como se predijo, estas ecuaciones son similares a la evolucion clasica Ecs. (9.7).

Por otro lado, la energıa promedio es independiente del tiempo

〈H〉α(t) (t) = ~ω

[∣∣α0e−iωt∣∣2 +

1

2

]= ~ω

[|α0|2 +

1

2

](9.66)

finalmente, las raıces de las desviaciones medias cuadraticas ∆Hα(t),∆Xα(t) y ∆Pα(t) calculadas con las Ecs. (9.36,9.41) nos dan

∆H = ~ω |α0| ; ∆X =

√~

2mω; ∆P =

√m~ω

2(9.67)

vemos que los anchos no dependen del tiempo. En particular ∆X y ∆P permanecen siendo paquetes de mınimaincertidumbre para todo tiempo. No hay dispersion de los paquetes de onda. Veamos un poco mas en detalle laevolucion del paquete de onda, la funcion de onda ψ (x, t) para todo tiempo se puede calcular con las Ecs. (9.54,9.64)

ψ (x, t) = eiθα(mωπ~

)1/4e−iωt/2ei

x〈P 〉(t)~ e

−[x−〈X〉(t)

2∆X

]2

vemos que la forma del paquete es Gaussiana para todo tiempo t. Su forma no varıa en el tiempo puesto que

|ψ (t)|2 = |ϕ0 (x− 〈X〉 (t))|2

vemos que los estados cuasi-clasicos son tales que los anchos ∆X y ∆P permanecen como paquetes de mınimaincertidumbre y la forma del paquete permanece intacta cuando este se propaga. Esta ausencia de dispersion yde cambio del perfil del paquete es la que le da el nombre de “estados coherentes” a los estados cuasi-clasicos deloscilador armonico.

La Fig. 9.1 muestra el movimiento de un paquete de onda de un estado coherente. De acuerdo con la Ec. (9.65),el valor esperado de X oscila alrededor de x = 0 con periodo T = 2π/ω, y dado que el paquete de onda no sedistorsiona, este sera tambien el movimiento del paquete como un todo. En contraste, vimos en la seccion 2.13.1 queun paquete Gaussiano libre se distorsiona cuando se propaga, ya que su ancho aumenta a medida que se propaga(dispersion del paquete de onda). Vemos en contraste que un paquete Gaussiano sometido a un potencial parabolico(oscilador armonico) no posee dispersion. Esto se debe a que la tendencia del paquete a dispersarse es compensadapor el potencial, cuyo efecto es empujar al paquete hacia el origen desde regiones donde x (y por tanto V (x)) esgrande.

Adicionalmente, ya hemos visto en las secciones (9.3.1, 9.3.2) que cuando |α| >> 1, las raıces de las desviacionesmedias cuadraticas de X, P y H no cambian, son mucho menores que sus valores esperados asociados y ademasdichos valores esperados emulan en todo tiempo la evolucion clasica. De modo que escogiendo un valor de |α|lo suficientemente alto, obtenemos una evolucion temporal cuantica para la cual la posicion y momento de lososciladores son en valor relativo, tan definidos como es posible, ya que los paquetes son de mınima incertidumbre,y su valor caracterıstico tiene un comportamiento similar al clasico. Por tanto, en este lımite el estado |α〉 emulamuy bien las propiedades de un oscilador macroscopico (clasico) para el cual la posicion, momento y energıa estanbien definidos.

Page 256: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

256CAPITULO 9. ESTADOS COHERENTES CUASI-CLASICOS DEL OSCILADOR ARMONICO (OPCIONAL)

Figura 9.1: Propagacion de un paquete de onda Gaussiano sometido a un potencial parabolico y asociado a un estadocuasi-clasico. El paquete oscila alrededor del punto de equilibrio. La forma y el ancho del paquete Permanecenintactos en el tiempo.

9.7. Tratamiento mecano-cuantico de un oscilador armonico macroscopico

Consideraremos un ejemplo macroscopico que nos permita una apreciacion numerica de la discusion anterior. Seaun cuerpo de masa m = 1kg, suspendido de una cuerda de longitud l = 0,1m colocado en un campo gravitacionalg ' 10m/seg2. Sabemos que para pequenas oscilaciones el periodo de movimiento es

T = 2π

√l

g' 0,63seg ; ω = 10Rad/seg

asumamos que este oscilador realiza movimiento periodico de amplitud xM = 1cm. Nos preguntamos ahora por elestado mecano-cuantico que mejor representa esta oscilacion.

De acuerdo con la discusion anterior, dicho estado es del tipo |α〉. Combinando la relacion clasica entre energıay amplitud con la Ec. (9.32) (despreciando el factor 1/2 en esta ultima) se obtiene

E =1

2mω2x2

M = ~ω |α|2 ⇒

|α| =

√mω

2~xM

en donde el argumento de α depende de la fase inicial de movimiento. Para nuestro caso tenemos las siguientes

Page 257: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

9.7. TRATAMIENTO MECANO-CUANTICO DE UN OSCILADOR ARMONICO MACROSCOPICO 257

estimaciones numericas

|α| '√

5 × 1015 >> 1

∆X =

√~

2mω' 2,2 × 10−18m << xM

∆P =

√m~ω

2' 2,2 × 10−17kg m/s

la raız de la desviacion media cuadratica para la velocidad esta dada por

∆V ' 2,2 × 10−17m/s

el valor maximo de la velocidad del oscilador es 0,1m/s y la raız del valor medio cuadratico es de este mismo ordende magnitud. Por tanto, las incertidumbres en la posicion y velocidad son completamente despreciables con respectoa las cantidades involucradas en el problema. Por ejemplo ∆X es menor que un fermi (10−15m) que es el tamanoaproximado de un nucleo atomico. Es claro que esta cantidad es despreciable para una longitud macroscopica.

Finalmente, la energıa del oscilador se conoce con una excelente precision relativa, usando la Ec. (9.38) resulta

∆H

〈H〉 ' 1

|α| ' 0,4 × 10−15 << 1

todo esto nos muestra porque la mecanica clasica provee una adecuada descripcion del oscilador armonico macroscopi-co.

Page 258: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 10

Teorıa general del momento angular enmecanica cuantica

Es bien conocida la gran importancia que tiene el momento angular en mecanica clasica. En primer lugar esuna constante de movimiento cuando el sistema es aislado constituyendo uno de los principios de conservacion masfundamentales en la teorıa clasica. Ademas, tambien es una cantidad conservada para una partıcula sometida auna fuerza central, y trae como consecuencia el hecho de que el movimiento sea en un plano y que se conserve lavelocidad aerolar (segunda ley de Kepler).

Veremos que estas propiedades tienen su contrapartida cuantica. Por ejemplo, veremos mas adelante que parauna partıcula sometida a una interaccion central, los operadores L1, L2, L3 que surgen de cuantizar las cantidadesclasicas, son constantes de movimiento en el sentido cuantico, es decir no dependen explıcitamente del tiempo yconmutan con el Hamiltoniano. Veremos ademas que existe otro tipo de momento angular que no depende de R ni Pni de ninguna otra variable geometrica clasica. Estos momentos angulares que surgen directamente como observablescuanticos y no como la cuantizacion de observables clasicos se denominan momentos angulares intrınsecos. Estemomento angular intrınseco (tambien conocido como espın), esta cuantizado desde el principio y es esencial paraentender el mundo microscopico como veremos mas adelante.

De aquı en adelante denotaremos como momento angular orbital L a cualquier momento angular que provengade la cuantizacion de un momento angular clasico. Llamaremos momento angular de espın S o simplemente espın,a cualquier momento angular intrınseco de una partıcula. Finalmente, en sistemas complejos como nucleos, atomos,moleculas, etc. los momentos angulares orbitales de sus constituyentes se combinan y tambien se combinan conlos espines de sus constituyentes para formar el momento angular total J. La notacion J representara entoncesla resultante entre la suma de momentos orbitales e intrınsecos, pero tambien se usara para denotar un momentoangular generico cuando no hagamos distincion entre el momento angular intrınseco y orbital. Las reglas de adicionde los momentos angulares se estudiaran en capıtulos subsecuentes.

Existen una serie de propiedades de los momentos angulares que solo dependen de sus relaciones de conmutaciony que seran validas para cualquier momento angular sin importar su naturaleza. Veremos en particular, que todacomponente de un momento angular posee un espectro discreto, propiedad denominada “cuantizacion espacial”.Desarrollaremos en capıtulos posteriores, las aplicaciones concernientes tanto al momento angular orbital como alintrınseco.

10.1. Definicion de momento angular por sus propiedades de conmutacion

10.1.1. Cuantizacion del momento angular orbital

Para obtener los tres observables L1, L2, L3 asociados a un momento angular orbital clasico de componentesL1,L2,L3, donde

−→L = r× p (10.1)

Li = εijkxjpk ; i, j, k = 1, 2, 3 (10.2)

258

Page 259: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

10.1. DEFINICION DE MOMENTO ANGULAR POR SUS PROPIEDADES DE CONMUTACION 259

simplemente reemplazamos cada componente xj, pk por los correspondientes operadoresXj , Pk. La cantidad εijk es eltensor de Levi Civita. Notese que aunque aparece un producto de estos operadores, no es necesaria una simetrizacionpuesto que en (10.2) solo sobreviven los terminos con j 6= k de modo que los operadores en el producto conmutansegun las reglas canonicas de conmutacion (4.9). Por esta razon, no hay ambiguedad en el orden y el operador que seobtiene es automaticamente hermıtico. Visto de otra manera, la simetrizacion del producto coincide con el productooriginal cuando los operadores conmutan. Los observables cuanticos son entonces

Li = εijkXjPk ; i, j, k = 1, 2, 3 (10.3)

L = R ×P (10.4)

calculemos entonces los conmutadores entre los Li con base en las relaciones canonicas de conmutacion (4.9)

[L1, L2] = [X2P3 −X3P2, X3P1 −X1P3] = [X2P3, X3P1 −X1P3] − [X3P2, X3P1 −X1P3]

= [X2P3, X3P1] − [X2P3, X1P3] − [X3P2, X3P1] + [X3P2, X1P3]

= X2 [P3, X3P1] + [X2, X3P1]P3 −X2 [P3, X1P3] − [X2, X1P3]P3

−X3 [P2, X3P1] − [X3, X3P1]P2 +X3 [P2, X1P3] + [X3, X1P3]P2

[L1, L2] = X2 [P3, X3]P1 +X3 [X2, P1]P3 −X2 [P3, X1]P3 −X1 [X2, P3]P3

−X3 [P2, X3]P1 −X3 [X3, P1]P2 +X3 [P2, X1]P3 +X1 [X3, P3]P2

[L1, L2] = −i~X2P1 + i~X1P2 = i~ (R×P)3[L1, L2] = i~L3

procediendo de forma similar con los demas conmutadores se obtiene

[L1, L2] = i~L3 ; [L1, L3] = −i~L2 ; [L2, L3] = i~L1

o mas sinteticamente[Li, Lj ] = i~εijkLk (10.5)

este resultado se puede generalizar cuando tenemos N partıculas sin espın. El momento angular total del sistemaen mecanica cuantica es

L =N∑

i=1

L(i) ; L(i) ≡ R(i) ×P(i)

y cada momento angular individual L(i) satisface relaciones de conmutacion del tipo (10.5) y conmuta con L(j) parai 6= j, ya que son operadores actuando en el espacio de estados de partıculas diferentes. Por tanto para N partıculastendrıamos [

L(m)i , L

(n)j

]= i~εijkδmnL

(m)k

Se puede demostrar adicionalmente que el origen de las reglas de conmutacion (10.5) yace en las propiedadesgeometricas de las rotaciones en tres dimensiones. Esto esta relacionado con el hecho de que en mecanica clasica, elmomento angular junto con el torque forman las variables fundamentales de la dinamica rotacional.

10.1.2. Definicion de momento angular

De nuestro trabajo con el oscilador armonico hemos aprendido que muchas propiedades se pueden extraer de lasreglas de conmutacion entre los operadores sin utilizar una representacion especıfica. Esto nos induce a generalizar losresultados anteriores para definir un operador momento angular como cualquier tripla de observables J = (J1, J2, J3),que satisface las relaciones

[Ji, Jj ] = i~εijkJk (10.6)

sera de gran utilidad el operadorJ2 = J2

1 + J22 + J2

3

Page 260: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

260 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

este operador es Hermıtico ya que cada componente es hermıtica. Vale la pena enfatizar que el caracter de observablede los Ji forma parte esencial de la definicion de momento angular1. Calculemos primero el conmutador de J2 conJ, para lo cual calculamos para cada componente

[J2, J1

]=

[J2

1 + J22 + J2

3 , J1

]=[J2

2 , J1

]+[J2

3 , J1

]

= J2 [J2, J1] + [J2, J1] J2 + J3 [J3, J1] + [J3, J1] J3

= −i~J2J3 − i~J3J2 + i~J3J2 + i~J2J3[J2, J1

]= 0

y similarmente con las otras componentes de modo que

[J2,J

]= 0 (10.7)

toda la teorıa del momento angular en cuantica se basara completamente en las reglas de conmutacion (10.6,10.7). En particular, estas relaciones muestran que no es posible medir simultaneamente las tres componentes delmomento angular, pero sı es posible medir simultaneamente una sola componente y la cantidad J2. Es decir cualquiercomponente de J es una variable compatible con J2. Esto implicara que si asumimos que J2 y Ji son observables,podemos encontrar una base comun de vectores propios para J2 y uno de los Ji. Es usual elegir la componente deJ3, y decimos que tomamos a X3 como “eje de cuantizacion” de modo que construımos una base que diagonalicesimultaneamente a J2 y a J3.

10.2. Propiedades algebraicas del momento angular

Estudiaremos la estructura del espectro de J2 y J3 ası como la estructura de sus vectores propios comunes.Veremos que muchos de los argumentos se asemejan a los que se utilizaron para el oscilador armonico.

En primer lugar, inspirados por la definicion de los operadores a y a† en las Ecs. (8.4) introduciremos lossiguientes operadores

J+ ≡ J1 + iJ2 ; J− ≡ J1 − iJ2 (10.8)

J1 =1

2(J+ + J−) ; J2 =

1

2i(J+ − J−) (10.9)

y al igual que los operadores a y a†, los operadores J± no son hermıticos y son conjugados el uno del otro. En todoel estudio del momento angular trabajaremos con los operadores J2, J3, J+, J− por lo cual sera necesario encontrartodas las relaciones de conmutacion entre ellos

10.2.1. Algebra de los operadores J2, J3, J+, J−

Usando las Ecs. (10.6, 10.7, 10.8) podemos encontrar las relaciones de conmutacion requeridas

[J3, J±] = [J3, J1 ± iJ2] = [J3, J1] ± i [J3, J2] = i~J2 ± i (−i~J1) = ~ iJ2 ± J1[J3, J+] = ~J+ ; [J3, J−] = −~J−

[J+, J−] = [J1 + iJ2, J1 − iJ2] = [J1, J1 − iJ2] + i [J2, J1 − iJ2]

= [J1, J1] − i [J1, J2] + i [J2, J1] + [J2, J2] = 2i [J2, J1] = 2i (−i~J3)

[J+, J−] = 2~J3 (10.10)

[J2, J±

]=

[J2, J1 ± iJ2

]=[J2, J1

]± i[J2, J2

][J2, J±

]= 0

1Para un conjunto concreto de tres operadores, el caracter de observable solo podra verificarse cuando se sepa sobre que espacioactuan los operadores momento angular. Las reglas de conmutacion no especifican sobre que espacio actuan los momentos angulares.

Page 261: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

10.3. ESTRUCTURA DE VALORES Y VECTORES PROPIOS 261

tambien seran utiles los siguientes productos

J+J− = (J1 + iJ2) (J1 − iJ2) = J21 + J2

2 + iJ2J1 − iJ1J2

= J21 + J2

2 + J23 − J2

3 + i [J2, J1] = J2 − J23 + i (−i~J3)

J+J− = J2 − J23 + ~J3 (10.11)

el producto J−J+ se puede obtener explıcitamente o usando las Ecs. (10.10, 10.11)

J−J+ = J+J− − [J+, J−] = J2 − J23 + ~J3 − 2~J3

J−J+ = J2 − J23 − ~J3

resumiremos el algebra encontrada hasta ahora. Tenemos las definiciones

J ≡ (J1, J2, J3) ; J2 ≡ J21 + J2

2 + J23 (10.12)

J+ ≡ (J1 + iJ2) ; J− ≡ (J1 − iJ2) (10.13)

donde los Ji son observables con las siguientes propiedades algebraicas

[Ji, Jj ] = i~εijkJk ;[J2,J

]= 0 (10.14)

[J3, J+] = ~J+ ; [J3, J−] = −~J− (10.15)

[J+, J−] = 2~J3 ;[J2, J±

]= 0 (10.16)

J+J− = J2 − J23 + ~J3 ; J−J+ = J2 − J2

3 − ~J3 (10.17)

10.3. Estructura de valores y vectores propios

10.3.1. Notacion

Dado que J2 es la suma de cuadrados de tres operadores hermıticos, tal operador es positivo

〈ψ|J2 |ψ〉 = 〈ψ| J21 |ψ〉 + 〈ψ| J2

2 |ψ〉 + 〈ψ| J23 |ψ〉 = 〈ψ| J †

1J1 |ψ〉 + 〈ψ| J †2J2 |ψ〉 + 〈ψ| J †

3J3 |ψ〉= ‖J1 |ψ〉‖2 + ‖J2 |ψ〉‖2 + ‖J3 |ψ〉‖2 ≥ 0

este resultado era de esperarse ya que la variable clasica es el modulo al cuadrado de un vector el cual es no negativo.En particular eligiendo a |ψ〉 como un autovector de J2 vemos que

〈ψ|J2 |ψ〉 = 〈ψ| a |ψ〉 = a 〈ψ|ψ〉 = a ‖|ψ〉‖2 ≥ 0 ⇒ a ≥ 0

los autovalores deben ser no negativos (en analogıa con los autovectores de N en el oscilador armonico). Dado queJ tiene dimensiones de momento angular, el valor propio de J2 se puede parametrizar como a = µ~2 siendo µ unacantidad adimensional no negativa. Adicionalmente, se puede demostrar que para todo µ ≥ 0 la ecuacion

j (j + 1) = µ (10.18)

tiene una y solo una raız no negativa2. Por tanto la especificacion de µ determina completamente a j y viceversa.Por tanto, sin perdida de generalidad podemos denotar a los valores propios de J2 en la forma

J2 |ψ〉 = j (j + 1) ~2 |ψ〉 ; j ≥ 0

si consideramos que |ψ〉 es la base de vectores propios comunes a J2 y J3 denotaremos a los valores propios de J3

en la forma

J3 |ψ〉 = m~ |ψ〉siendo m una cantidad adimensional.

2La Ec. (10.18) tiene como solucion j± =(−1 ±√

1 + 4µ)/2. Si µ ≥ 0, la unica solucion no negativa para j es j+.

Page 262: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

262 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

Puesto que J2 y J3 son observables conmutantes, ellos hacen parte de un C.S.C.O pero no necesariamente loconstituyen por sı solos. Por esa razon denotaremos a los kets propios comunes a los dos con tres numeros cuanticos:j para rotular los valores propios de J2, m para rotular los valores propios de J3 y k asociado a la degeneracion.Naturalmente, estos ındices pueden ser de momento contınuos o discretos y k podrıa simbolizar varios ındices (losnecesarios para completar un C.S.C.O.).

En sıntesis escribiremos la ecuacion de valores propios en la forma

J2 |j,m, k〉 = j (j + 1) ~2 |j,m, k〉 ; J3 |j,m, k〉 = m~ |j,m, k〉 (10.19)

10.3.2. Caracterısticas generales de los valores propios de J2 y J3

Asumiremos que los estados propios estan normalizados y que J2 y J3 son observables. En analogıa con eloscilador armonico, vamos a caracterizar primero a los vectores J+ |j,m, k〉 y J− |j,m, k〉, por medio de sus normasal cuadrado

‖J+ |j,m, k〉‖2 = 〈j,m, k| J−J+ |j,m, k〉 ≥ 0 (10.20)

‖J− |j,m, k〉‖2 = 〈j,m, k| J+J− |j,m, k〉 ≥ 0 (10.21)

y usando las Ecs. (10.17, 10.19) resulta

‖J± |j,m, k〉‖2 = 〈j,m, k|(J2 − J2

3 ∓ ~J3

)|j,m, k〉

= 〈j,m, k|j (j + 1) ~2 −m2~2 ∓m~2

|j,m, k〉

= j (j + 1) ~2 −m2~2 ∓m~2

‖J± |j,m, k〉‖2 = ~2 j (j + 1) −m (m± 1) (10.22)

reemplazando (10.22) en (10.20, 10.21) se tiene que

j (j + 1) −m (m+ 1) = (j −m) (j +m+ 1) ≥ 0 (10.23)

j (j + 1) −m (m− 1) = (j −m+ 1) (j +m) ≥ 0 (10.24)

asumamos que j −m < 0, dado que j ≥ 0 entonces m > 0 y j +m + 1 > 0. Por tanto, (j −m) (j +m+ 1) < 0,contradiciendo la Ec. (10.23). Debemos rechazar la hipotesis de que j −m < 0.

Es necesario entonces que j −m ≥ 0, de esta hipotesis se obtiene que j −m + 1 > 0, y para satisfacer la Ec.(10.24) se requiere que (j +m) ≥ 0, tenemos entonces que las condiciones

j −m ≥ 0 y j +m ≥ 0 (10.25)

por construccion satisfacen (10.24). Solo falta ver que estas condiciones tambien cumplen con la desigualdad (10.23).Usando la segunda condicion j +m ≥ 0 vemos que implica j +m + 1 > 0, y esto junto con la primera condicionen (10.25) nos satisface la Ec. (10.23). Vemos entonces que las condiciones (10.25) son necesarias y suficientes paraque se cumplan las desigualdades (10.23) y (10.24). Finalmente, y teniendo en cuenta que j es no negativo, estascondiciones se pueden reescribir como

j −m ≥ 0 y j +m ≥ 0 ⇔ j ≥ m y j ≥ −m⇔ j ≥ |m| ⇔ −j ≤ m ≤ j

con lo cual obtenemos el siguiente lema

Lemma 4 Si j (j + 1) ~2 y m~ son valores propios de J2 y J3 asociados al ket propio comun |j,m, k〉 entonces j ym satisfacen la desigualdad

−j ≤ m ≤ j (10.26)

Ahora veremos con base en la Ec. (10.26), las caracterısticas de los kets J− |j,m, k〉 y J+ |j,m, k〉, siendo |j,m, k〉autovector comun de J2 y J3.

Page 263: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

10.3. ESTRUCTURA DE VALORES Y VECTORES PROPIOS 263

En primer lugar, veremos las condiciones necesarias y suficientes para la nulidad del vector J− |j,m, k〉. Esto sepuede hacer con base en la Ec. (10.22)

J− |j,m, k〉 = 0 ⇔ ‖J− |j,m, k〉‖2 = 0 ⇔ ~2 j (j + 1) −m (m− 1) = 0

⇔ (j −m+ 1) (j +m) = 0

cuyas soluciones son m = −j (su mınimo valor posible) y m = j + 1. Pero la segunda solucion contradice al lema 4Ec. (10.26). Por tanto

m = −j ⇔ J− |j,m, k〉 = 0 (10.27)

por tanto si m > −j el vector J− |j,m, k〉 sera no nulo siempre que se cumpla la Ec. (10.26). Esto se puede corroborarreemplazando m > −j en la Ec. (10.22) verificando que la norma de J− |j,m, k〉 no es nula. Ahora demostraremosque J− |j,m, k〉 es un ket propio de J2 y J3. Puesto que J2 y J− conmutan segun la Ec. (10.16), podemos escribir

[J2, J−

]|j,m, k〉 = 0 ⇒ J2J− |j,m, k〉 = J−J2 |j,m, k〉 ⇒ J2J− |j,m, k〉 = J−j (j + 1) ~2 |j,m, k〉

⇒ J2 [J− |j,m, k〉] = j (j + 1) ~2 [J− |j,m, k〉]por tanto J− |j,m, k〉 es ket propio de J2 con valor propio j (j + 1) ~2. Este resultado esta relacionado con el hechode que J2 y J− conmutan, como se aprecia en el teorema 1.66, pag. 50. Ahora veremos que J− |j,m, k〉 es tambienket propio de J3, para lo cual empleamos la Ec. (10.15)

[J3, J−] |j,m, k〉 = −~J− |j,m, k〉 ⇒ J3J− |j,m, k〉 = (J−J3 − ~J−) |j,m, k〉 ⇒J3J− |j,m, k〉 = (J−m− J−) ~ |j,m, k〉

⇒ J3 [J− |j,m, k〉] = (m− 1) ~ [J− |j,m, k〉]de modo que J− |j,m, k〉 es autovector de J3 con autovalor (m− 1) ~. Los anteriores resultados se pueden resumiren el siguiente lema

Lemma 5 Sea |j,m, k〉 un vector propio comun a J2 y J3 con valores propios j (j + 1) ~2 y m~. Se tiene que (a)m = −j si y solo si J− |j,m, k〉 = 0. (b) Si m > −j entonces J− |j,m, k〉 6= 0 y es autovector de J2 y J3 con valorespropios j (j + 1) ~2 y (m− 1) ~.

El siguiente paso natural es estudiar al vector J+ |j,m, k〉. De la Ec. (10.22) podemos ver las condiciones nece-sarias y suficientes para que J+ |j,m, k〉 sea nulo.

J+ |j,m, k〉 = 0 ⇔ ‖J+ |j,m, k〉‖2 = 0 ⇔ ~2 j (j + 1) −m (m+ 1) = 0

⇔ (j +m+ 1) (j −m) = 0

las soluciones son m = j y m = − (j + 1) pero la segunda solucion es incompatible con el lema 4 Ec. (10.26). Portanto

m = j ⇔ J+ |j,m, k〉 = 0 (10.28)

si m < j, y usando (10.16, 10.15) obtenemos[J2, J+

]|j,m, k〉 = 0 ⇒ J2J+ |j,m, k〉 = J+J2 |j,m, k〉 ⇒

J2 [J+ |j,m, k〉] = j (j + 1) ~2 [J+ |j,m, k〉]

[J3, J+] |j,m, k〉 = ~J+ |j,m, k〉 ⇒ J3J+ |j,m, k〉 = J+J3 |j,m, k〉 + ~J+ |j,m, k〉J3J+ |j,m, k〉 = m~J+ |j,m, k〉 + ~J+ |j,m, k〉

J3 [J+ |j,m, k〉] = (m+ 1) ~ [J+ |j,m, k〉]por tanto J+ |j,m, k〉 es vector propio de J2 y de J3 con valores propios j (j + 1) ~2 y (m+ 1) ~. Tenemos entoncesel siguiente lema

Lemma 6 Sea |j,m, k〉 un vector propio comun a J2 y J3 con valores propios j (j + 1) ~2 y m~. Se tiene que (a)m = j si y solo si J+ |j,m, k〉 = 0. (b) Si m < j entonces J+ |j,m, k〉 6= 0 y es autovector de J2 y J3 con valorespropios j (j + 1) ~2 y (m+ 1) ~.

Veremos que estos lemas permiten encontrar el espectro de J2 y J3.

Page 264: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

264 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

10.3.3. Determinacion de los valores propios de J2 y J3

Asumamos que |j,m, k〉 es un autovector de J2 y J3 con valores propios j (j + 1) ~2 y m~. El lema 4 nos diceque

−j ≤ m ≤ j

como el ket es fijo los valores de j y m son fijos. Es claro que existe un numero entero no negativo p, tal que

−j ≤ m− p < −j + 1 (10.29)

formamos ahora una sucesion de vectores|j,m, k〉 , J− |j,m, k〉 , (J−)2 |j,m, k〉 , . . . , (J−)p |j,m, k〉

(10.30)

demostraremos que estos son vectores propios no nulos de J2 y J3 y que para potencias mas altas de J−, se obtienenvectores nulos. Esto se realiza aplicando iterativamente el lema 5

Comenzamos aplicando el lema 5 a |j,m, k〉. Por hipotesis |j,m, k〉 es vector propio no nulo de J2 y J3 con valorespropios j (j + 1) ~2 y m~. Si m > −j podemos aplicar el lema 5 con lo cual J− |j,m, k〉 ≡ |j,m− 1, k〉 es vectorpropio no nulo de J2 y J3 con valores propios j (j + 1) ~2 y (m− 1) ~. Si m − 1 > −j podemos aplicar de nuevoel lema y J− |j,m− 1, k〉 = (J−)2 |j,m, k〉 ≡ |j,m− 2, k〉 es vector propio no nulo de J2 y J3 con valores propios

j (j + 1) ~2 y (m− 2) ~. En general si m− (n− 1) > −j entonces J−[(J−)n−1 |j,m, k〉

]= J− |j,m− (n− 1) , k〉 =

(J−)n |j,m, k〉 ≡ |j,m− n, k〉 es vector propio no nulo de J2 y J3 con valores propios j (j + 1) ~2 y (m− n) ~.Veremos que estas condiciones se satisfacen solo para n = 0, 1, . . . , p. Si asumimos que 0 ≤ n ≤ p entonces

m− (n− 1) = m− n+ 1 ≥ m− p+ 1 ≥ −j + 1

donde hemos usado (10.29) en el ultimo paso. Por tanto

m− (n− 1) ≥ −j + 1 > −j

de modo que la condicion m− (n− 1) > −j necesaria para aplicar el lema 5 se cumple cuando n = 0, 1, . . . , p.Ahora veamos lo que ocurre con el vector (J−)p+1 |j,m, k〉 = J− [(J−)p |j,m, k〉]. Puesto que (J−)p |j,m, k〉 es

autovector de J2 y J3 con valores propios j (j + 1) ~2 y (m− p) ~, el lema 4 Ec. (10.26) nos dice que (m− p) ≥ −j.Asumamos de momento que

(m− p) > −juna aplicacion adicional del lema 5 nos dice que J− [(J−)p |j,m, k〉] es autovector no nulo de J2 y J3 con valorespropios j (j + 1) ~2 y (m− p− 1) ~. Ahora aplicando la Ec. (10.29) se tiene que

m− p− 1 < −j

lo cual contradice al lema 4 Ec. (10.26). Por tanto debemos rechazar la hipotesis m − p > −j. Solo nos quedaentonces que m− p = −j y al aplicar el lema 5 se obtiene

(J−)p+1 |j,m, k〉 = J− |j,m− p, k〉 = 0

y todas las potencias mayores tambien se anulan. Esta anulacion evita el conflicto con el lema 4.De lo anterior se deduce que existe un entero no negativo p tal que

m− p = −j (10.31)

Por un razonamiento similar, existe un entero no negativo q, tal que

j ≤ m+ q < j + 1

y se puede demostrar que para este entero no negativo q, la sucesion

|j,m, k〉 , J+ |j,m, k〉 , (J+)2 |j,m, k〉 , . . . , (J+)q |j,m, k〉

(10.32)

Page 265: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

10.4. PROPIEDADES DE LOS VECTORES PROPIOS DE J2 Y J3 265

consiste de vectores no nulos, pero potencias mayores de J+ producen vectores nulos con lo cual se evita unacontradiccion con el lema 4. Esto implica a su vez que existe un entero no negativo q tal que

m+ q = j (10.33)

aquı aparece una diferencia con respecto al oscilador armonico, ya que ambos operadores J+ y J− tienen una sucesionlimitada de potencias que generan vectores no nulos. En el oscilador armonico, la sucesion de a† no esta limitada.Esto tiene que ver con el hecho de que J+ ( J−) es un operador que incrementa (decrementa) el valor de m dejando jsin cambiar. Pero para un j dado, m tiene lımite superior e inferior, por tanto hay lımites tanto para el decrementocomo para el incremento. Otra diferencia importante es la degeneracion y el hecho de que el conjunto J2, J3 noforma en general un C.S.C.O.

Combinando las Ecs. (10.31, 10.33) se tiene que

p+ q = 2j ⇒ j =p+ q

2

pero p+ q es un entero no negativo. Por tanto, j solo puede adquirir valores enteros o semienteros no negativo

j = 0,1

2, 1,

3

2, 2,

5

2, . . .

Estos son los valores posibles pero no hemos demostrado que tenga que tomarlos todos (de hecho no es ası engeneral). Adicionalmente, si existe un autovector no nulo |j,m, k〉 de J2 y J3, las sucesiones (10.30, 10.32) constande autovectores no nulos de J2 con valores propios j (j + 1) ~2 y tambien de J3 con autovalores dados por

−j~, (−j + 1) ~, (−j + 2) ~, . . . , (j − 2) ~, (j − 1) ~, j~

es decir tenemos 2j +1 valores posibles de m para un j dado. Puesto que estos valores se obtienen de las sucesionesya mencionadas, todos los 2j+1 valores de m posibles bajo la restriccion (10.26) son valores propios accesibles paraun valor dado de j.

Podemos sintetizar estos resultados en la siguiente forma: Sea J un momento angular arbitrario que obedecelas reglas de conmutacion (10.6). Si j (j + 1) ~2 y m~ denotan los autovalores de J2 y J3 asociados al ket comun|j,m, k〉. Tenemos que

Los unicos valores posibles de j son enteros o semienteros no negativos: 0, 12 , 1,

32 , 2,

52 , . . .. No necesariamente

j debe tomar todos estos valores.

Para un valor dado de j existen 2j + 1 valores posibles de m: −j, − j + 1, − j + 2, . . . , j − 2, j − 1, j. Lacantidad m es entera si j es entera y semientera si j es entera. Todos los valores de m son permitidos si unode ellos lo es.

10.4. Propiedades de los vectores propios de J2 y J3

Veremos que las propiedades algebraicas de los operadores J2, J3, J+, J−, nos permiten extraer informacionsobre los estados propios de J2 y J3 incluso sin especificar el espacio de Hilbert E sobre el cual actuan los operadores.Para ello solo requerimos dos hipotesis de trabajo: (1) Que J2 y J3 son observables con respecto al espacio E sobreel cual actuan, y (2) Que conocemos por algun medio experimental y/o teorico, los valores de j que son permitidosen nuestro sistema fısico (recordemos que j debe ser entero o semientero no negativo, pero no necesariamente debecubrir todos los valores enteros y semienteros no negativos).

Debemos recordar que para un j dado que este permitido, todos los valores de m permitidos por la Ec. (10.26)deben aparecer. En el oscilador armonico aprendimos que con un solo estado (el estado base) podemos generar todoslos estados propios por medio del operador construccion. En esta seccion desarrollaremos un metodo para generarlos autoestados de J2 y J3 a partir de un subconjunto de estos estados y de los operadores J+ y J−.

Page 266: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

266 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

10.4.1. Generacion de autoestados por medio de los operadores J+ y J−

Consideremos un operador momento angular J que actua sobre un espacio de estados E , y mostraremos unalgoritmo para construir una base ortonormal en E de vectores propios comunes a J2 y J3.

Tomemos un par de valores propios j (j + 1) ~2 y m~ que sean realizables fısicamente para nuestro sistemafısico. Los autovectores asociados |j,m, k〉 pueden ser degenerados en j,m lo cual se indica con el ındice k. Losvectores propios asociados al par (j,m) forman un autosubespacio E (j,m) de dimension g (j,m). Si g (j,m) > 1para al menos un par (j,m), entonces el conjunto J2, J3 no forma un C.S.C.O. Escogeremos en E (j,m) una baseortonormal de vectores |j,m, k〉 con k = 1, . . . , g (j,m).

Si m 6= j existe un subespacio E (j,m+ 1) de E compuesto por autovectores de J2, J3 con valores propiosj (j + 1) ~2 y (m+ 1) ~. Analogamente, si m 6= −j existe un subespacio E (j,m− 1) con autovectores de J2, J3

y valores propios j (j + 1) ~2, (m− 1) ~. Si m 6= j construiremos una base ortonormal en E (j,m+ 1) a partir dela base ya construıda para E (j,m). Similarmente, si m 6= −j generaremos una base ortonormal en E (j,m− 1)partiendo de la base en E (j,m).

En primer lugar mostraremos que para k1 6= k2 los vectores J+ |j,m, k1〉 y J+ |j,m, k2〉 son ortogonales. De igualforma se vera que J− |j,m, k1〉 y J− |j,m, k2〉 son ortogonales. Para ello calculamos el producto interno entre loskets en cuestion utilizando las formulas (10.17)

(J± |j,m, k2〉 , J± |j,m, k1〉) = 〈j,m, k2| J∓J± |j,m, k1〉 = 〈j,m, k2|(J2 − J2

3 ∓ ~J3

)|j,m, k1〉

=[j (j + 1) −m2 ∓m

]~2 〈j,m, k2| j,m, k1〉

(J± |j,m, k2〉 , J± |j,m, k1〉) = [j (j + 1) −m (m± 1)] ~2 〈j,m, k2| j,m, k1〉 (10.34)

y puesto que los vectores |j,m, ki〉 asociados a E (j,m) son ortonormales por hipotesis, se tiene

Theorem 10.1 Sean |j,m, k1〉 y |j,m, k2〉 dos autovectores ortogonales de J2 y J3 con valores propios j (j + 1) ~2,m~, y k1 6= k2. Entonces J± |j,m, k2〉 es ortogonal a J± |j,m, k1〉.

Si k1 = k2, la Ec. (10.34) nos permite calcular la norma de J± |j,m, k2〉

‖J± |j,m, k〉‖2 = [j (j + 1) −m (m± 1)] ~2

por tanto podemos construır vectores ortonormales asociados a |j,m± 1, k〉 para lo cual simplemente debemosnormalizar los vectores J± |j,m, k〉.

Comencemos con J+ |j,m, k〉, normalizando los vectores J+ |j,m, k〉 obtenemos un conjunto ortonormal enE (j,m+ 1) dado por

|j,m+ 1, k〉 ≡ J+ |j,m, k〉~√j (j + 1) −m (m+ 1)

(10.35)

multipliquemos (10.35) por J− usando (10.17)

J− |j,m+ 1, k〉 =J−J+ |j,m, k〉

~√j (j + 1) −m (m+ 1)

=

(J2 − J2

3 − ~J3

)|j,m, k〉

~√j (j + 1) −m (m+ 1)

=[j (j + 1) −m (m+ 1)] ~ |j,m, k〉√

j (j + 1) −m (m+ 1)

J− |j,m+ 1, k〉 = ~√j (j + 1) −m (m+ 1) |j,m, k〉 (10.36)

Vamos a demostrar que el conjunto ortonormal |j,m+ 1, k〉 en E (j,m+ 1) generado por todos los elementosde la base |j,m, k〉 de E (j,m) a traves de (10.35), constituye una base para E (j,m+ 1). La demostracion sehara por contradiccion, es decir asumiendo que |j,m+ 1, k〉 no es una base, segun el teorema 1.23, Pag. 24, estanegacion equivale a decir que existe un vector no nulo |j,m+ 1, α〉 en E (j,m+ 1) ortogonal a todos los vectores delconjunto.

Asumamos que existe un vector no nulo |j,m+ 1, α〉 en E (j,m+ 1) ortogonal a todos los elementos del conjuntoortonormal |j,m+ 1, k〉. Por tanto, α 6= k para todos los k ′s del conjunto anterior. Dado que m+1 6= −j, el vectorJ− |j,m+ 1, α〉 es no nulo en virtud del lema 5, y dicho vector yace en E (j,m). Ahora bien, puesto que α 6= k, el

Page 267: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

10.5. CONSTRUCCION DE UNA BASE ESTANDAR CON BASE EN UN C.S.C.O 267

teorema 10.1 dice que J− |j,m+ 1, α〉 sera ortogonal a todos los vectores J− |j,m+ 1, k〉. Por otro lado, la Ec. (10.36)nos dice que J− |j,m+ 1, k〉 es colineal con |j,m, k〉. En consecuencia, al barrer toda la base |j,m, k〉 obtenemosque el conjunto J− |j,m+ 1, k〉 generado de esta manera tambien es una base para E (j,m). De lo anterior vemosque J− |j,m+ 1, α〉 es un vector no nulo de E (j,m), ortogonal a todos los vectores de la base |j,m, k〉, pero estoes imposible en virtud del teorema 1.23. Por tanto, el conjunto de vectores |j,m+ 1, k〉 generado por la base|j,m, k〉 de E (j,m) por medio de (10.35) es completo.

De una forma similar se puede demostrar que cuando m 6= −j podemos definir vectores |j,m− 1〉 en la forma

|j,m− 1, k〉 ≡ J− |j,m, k〉~√j (j + 1) −m (m− 1)

(10.37)

para formar una base ortonormal en E (j,m− 1). Notese que (10.37) se obtiene de (10.36) reemplazando m→ m−1.Las Ecs. (10.35, 10.37) implican una escogencia de fase cero entre |j,m± 1, k〉 y el vector J± |j,m, k〉, de modo quela constante de proporcionalidad entre ambos es real y positiva. Esta convencion de fase cero es conocida comoconvencion de Cordon-Shortley.

En particular vemos que las Ecs. (10.35) establecen relaciones uno a uno y sobreyectivas entre las bases deE (j,m) y E (j,m+ 1). Igualmente las Ecs. (10.37) nos dan una relacion uno a uno y sobreyectiva entre las bases deE (j,m) y E (j,m− 1). En consecuencia, los espacios E (j,m) y E (j,m± 1) son de la misma dimensionalidad. Porinduccion se obtiene entonces que la dimensionalidad de cualquier E (j,m) solo depende de j

g (j,m) = g (j)

describamos un procedimiento sistematico para generar una base ortonormal para el espacio completo E . Paraun valor accesible de j encontramos un subespacio de la forma E (j,m) digamos E (j, j), y encontramos una baseortonormal de dicho espacio |j, j, k〉 ; k = 1, . . . , g (j). Ahora usando (10.37) contruımos iterativamente las basespara E (j, j − 1) , E (j, j − 2) , . . . , E (j,−j). La union de las bases de los 2j+1 subespacios asociados a j nos da unabase ortonormal para el subespacio E (j) dado por

E (j) = E (j, j) ⊕ E (j, j − 1) ⊕ E (j, j − 2) ⊕ . . .⊕ E (j,−j) (10.38)

es claro que el espacio E (j) es de dimensionalidad (2j + 1) g (j). Una vez generada la base para un E (j), cambiamos aotro valor accesible de j y repetimos el procedimiento, barriendo todos los valores accesibles de j. La base ortonormalpara E se obtiene de la union de las bases asociadas a cada valor de j puesto que

E = E (j1) ⊕ E (j2) ⊕ E (j3) ⊕ . . . (10.39)

siendo j1, j2, j3, . . . los valores accesibles de j en el sistema fısico considerado. Insistimos que este debe ser unsubconjunto del conjunto de todos los enteros y semienteros no negativos. La tabla 10.1 describe esquematicamenteel algoritmo para generar una base para E (j) a partir de la base para E (j, j).

La base generada con este algoritmo se conoce como la base estandar del espacio de estados E , para la cualexisten relaciones de completez y ortonormalidad

〈j,m, k∣∣j′,m′, k′

⟩= δjj′δmm′δkk′ ;

j

+j∑

m=−j

g(j)∑

k=1

|j,m, k〉 〈j,m, k| = I (10.40)

Por supuesto podemos empezar por E (j,−j) y construır con base en J+. Finalmente, podemos empezar por unE (j,m) con −j < m < j, en tal caso habra que generar con J+ “hacia arriba” hasta j y con J− “hacia abajo” hasta−j.

10.5. Construccion de una base estandar con base en un C.S.C.O

Un metodo muy utilizado para generar una base estandar consiste en usar un conjunto de observables

A1, A2, . . . , An

Page 268: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

268 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

k = 1 k = 2 . . . k = g (j)E (j, j) |j, j, 1〉 |j, j, 2〉 . . . |j, j, g (j)〉⇓ J− ⇓ J− ⇓ J− . . . ⇓ J−

E (j, j − 1) |j, j − 1, 1〉 |j, j − 1, 2〉 . . . |j, j − 1, g (j)〉⇓ J− ⇓ J− ⇓ J− . . . ⇓ J−

......

......

E (j,m) |j, j −m, 1〉 |j, j −m, 2〉 . . . |j, j −m, g (j)〉⇓ J− ⇓ J− ⇓ J− . . . ⇓ J−

......

......

E (j,−j) |j,−j, 1〉 |j,−j, 2〉 . . . |j,−j, g (j)〉E (j, k = 1) E (j, k = 2) E (j, k = g (j))

Cuadro 10.1: Construccion de la base estandar para E (j) de dimension (2j + 1) g (j). Comenzando con cada unode los g (j) vectores |j, j, k〉 de la primera fila, usamos el operador J− para construır los 2j + 1 vectores de cadacolumna. Los g (j) vectores de la m−esima fila, expanden al subespacio E (j,m). Los 2j + 1 vectores de la k−esimacolumna expanden al subespacio E (j, k). Hay un total de 2j + 1 subespacios de la forma E (j,m) y un total de g (j)subespacios de la forma E (j, k). El espacio total se puede obtener por suma directa de los E (j,m), o alternativamentepor suma directa de los E (j, k).

que junto con J2 y J3 formen un C.S.C.O. y que ademas conmuten con todas las componentes de J

[Ai,J] = 0 ; i = 1, . . . , n

un observable que conmute con las componentes de J se denomina un escalar. Por simplicidad asumiremos que unsolo escalar A es suficiente para formar un C.S.C.O con J2 y J3. Veamos la accion de A sobre un estado arbitrario|j,m, k〉 de E (j,m), definiendo |ψ〉 ≡ A |j,m, k〉 tenemos que

J2 |ψ〉 = J2A |j,m, k〉 = AJ2 |j,m, k〉 = j (j + 1) ~2A |j,m, k〉 = j (j + 1) ~2 |ψ〉J3 |ψ〉 = J3A |j,m, k〉 = AJ3 |j,m, k〉 = m~A |j,m, k〉 = m~ |ψ〉

donde hemos usado el hecho de que A conmuta con J2 y J3. Tenemos entonces que |ψ〉 ≡ A |j,m, k〉 es autovectorde J2 y J3 con autovalores j (j + 1) ~2 y m~ y por lo tanto pertenece a E (j,m). Por tanto cada subespacio E (j,m)es globalmente invariante bajo la accion de un operador A que conmute con J2 y J3. Si ahora escogemos un valorde j, el subespacio E (j, j) sera en particular invariante bajo A y podemos diagonalizar la restriccion de A sobreE (j, j), con cierta base ortonormal |j, j, k〉 de E (j, j),3 de modo que

A |j, j, k〉 = ajk |j, j, k〉 (10.41)

el conjunto |j, j, k〉 ; j fijo; k = 1, . . . , g (j) es una base ortonormal de E (j, j), a partir de la cual se puedeconstruır la base ortonormal para E (j). Aplicando este procedimiento para cada valor accesible de j obtenemos labase ortonormal |j,m, k〉 para el espacio completo E .

Los resultados anteriores no requieren que A sea escalar, solo requieren que conmute con J2 y J3. Sea |j,m, k〉la base de vectores de E (j,m) obtenida por la aplicacion sucesiva de J− sobre la base |j, j, k〉. Veremos que si Aes un escalar, los kets |j,m, k〉 ademas de ser vectores propios de J2 y J3 tambien seran vectores propios de A.Para ver esto observemos que para un escalar A se tiene

[A, J−] = [A, J1 − iJ2] = [A, J1] − i [A, J2] = 0 (10.42)

Usando (10.41, 10.42) se obtiene

A [J− |j, j, k〉] = J−A |j, j, k〉 = ajk [J− |j, j, k〉]3Recordemos que A es hermıtico y por tanto normal. Para todo operador normal existe una representacion ortonormal que lo diago-

naliza.

Page 269: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

10.5. CONSTRUCCION DE UNA BASE ESTANDAR CON BASE EN UN C.S.C.O 269

J− |j, j, k〉 es autovector de A con el mismo autovalor que |j, j, k〉 (teorema 1.66). Equivalentemente, |j, j − 1, k〉 esautovector de A con el mismo autovalor que |j, j, k〉. Aplicando sucesivamente este proceso vemos que los kets dadospor

|j, j, k〉 , |j, j − 1, k〉 , . . . , |j,−j, k〉son vectores propios de A con valor propio ajk por tanto podemos escribir

A |j,m, k〉 = ajk |j,m, k〉 ; m = j, j − 1, . . . ,−j + 1, − j (10.43)

el espectro de A es entonces el mismo para todos los subespacios E (j,m) con j fijo, pero depende en general tantode j como de k, de modo que un conjunto de numeros cuanticos (j,m, k) define unıvocamente a un vector |j,m, k〉de E , como corresponde a un C.S.C.O.

Notese que un observable que conmute con J2 y J3 no necesariamente conmuta con J1 y J2. En particular, elconjunto (J2, J3, A) podrıa formar un C.S.C.O. sin que A conmute con J1 y/o J2. En tal caso sin embargo, J± noconmuta con A y por tanto J± |j,m, k〉 no necesariamente es autovector de A con el mismo valor propio de |j,m, k〉.Por tanto, cuando A conmuta con J2 y J3 pero no es escalar, la base |j,m, k〉 obtenida por aplicacion sucesiva deJ− sobre |j, j, k〉 debe ser rotada a otra base |j,m, α〉 para diagonalizar a la restriccion de A sobre E (j,m). Encambio cuando A es escalar esta ultima rotacion no es necesaria.

10.5.1. Descomposicion de E en subespacios del tipo E (j, k)

En los procedimientos anteriores hemos descompuesto el espacio completo E en la forma dada por la combinacionde las Ecs. (10.38, 10.39)

E = E (j1, j1) ⊕ E (j1, j1 − 1) ⊕ E (j1, j1 − 2) ⊕ . . . ⊕ E (j1,−j1) ⊕E (j2, j2) ⊕ E (j2, j2 − 1) ⊕ E (j2, j2 − 2) ⊕ . . . ⊕ E (j2,−j2) ⊕E (j3, j3) ⊕ E (j3, j3 − 1) ⊕ E (j3, j3 − 2) ⊕ . . . ⊕ E (j3,−j3) ⊕ . . .

siendo j1, j2, j3, . . . los valores permitidos de j para el sistema en estudio. Esta es una descomposicion en subespaciosdel tipo E (j,m). Sin embargo los subespacios E (j,m) tienen ciertas desventajas, por un lado su dimension g (j)depende del sistema fısico especıfico ya que esta dimension nos da cuenta de la degeneracion asociada al par (j,m),por tanto g (j) es desconocido al menos en el caso general. Adicionalmente un subespacio del tipo E (j,m) no esinvariante ante J, por ejemplo

J1 |j,m, k〉 =1

2(J+ + J−) |j,m, k〉 =

1

2c+ |j,m+ 1, k〉 +

1

2c− |j,m− 1, k〉 (10.44)

de acuerdo con (10.40) este estado es ortonormal a |j,m, k〉 y no es nulo ya que por lo menos uno de los estados|j,m+ 1, k〉 , |j,m− 1, k〉 tiene que ser no nulo y ambos son ortogonales entre sı.

Examinando la tabla (10.1) vemos que cada subespacio del tipo E (j,m) es generado por la expansion de losg (j) vectores de la m−esima fila de la tabla (los g (j) valores posibles de k). Vemos sin embargo que hay otra manerade agrupar los vectores: podemos generar un subespacio con los (2j + 1) vectores de una columna fija de la tabla,con lo cual obtenemos un subespacio del tipo E (j, k) puesto que en este caso es el par (j, k) el que permanece fijoen la expansion.

La descomposicion de E quedarıa en la forma

E = E (j1, k = 1) ⊕ E (j1, k = 2) ⊕ . . .⊕ E (j1, k = g (j1)) ⊕E (j2, k = 1) ⊕ E (j2, k = 2) ⊕ . . .⊕ E (j2, k = g (j2)) ⊕E (j3, k = 1) ⊕ E (j3, k = 2) ⊕ . . .⊕ E (j3, k = g (j3)) ⊕ . . . (10.45)

los subespacios E (j, k) poseen las propiedades siguientes: (a) la dimension de E (j, k) es 2j + 1 de modo que paraun j dado su dimension se conoce sin importar el sistema fısico que se este trabajando. (b) E (j, k) es globalmenteinvariante bajo J. Incluso se puede demostrar que E (j, k) es irreducible como subespacio invariante de J, es decirno hay un subespacio propio de E (j, k) que sea invariante bajo J.

Nos limitaremos a demostrar la invarianza de E (j, k) bajo J. Una base para este espacio es de la forma|j,m, k〉 ; m = −j,−j + 1, . . . , j − 1, j. Para J3 es inmediato, para J1 tomamos el resultado de la Ec. (10.44)

Page 270: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

270 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

notando que los dos kets son estados con el mismo valor de j, k y solo difieren en m. Por tanto J1 |j,m, k〉 pertenecea E (j, k). Para J2 el argumento es similar. En general E (j, k) sera invariante bajo cualquier funcion del tipo F (J),lo cual se puede ver simplemente de la expansion de Taylor de F (J) y de que E (j, k) es invariante ante cualquierpotencia de J.

10.6. Representaciones matriciales de los operadores momento angular

Los elementos matriciales de los Ji en la base estandar |j,m, k〉, se pueden calcular a traves de la accion delos operadores J3, J± sobre los kets propios |j,m, k〉 de J2 y J3 descritos por las Ecs. (10.19, 10.35, 10.37)

J3 |j,m, k〉 = m~ |j,m, k〉 ; J± |j,m, k〉 = ~√j (j + 1) −m (m± 1) |j,m± 1, k〉 (10.46)

combinando las Ecs. (10.9, 10.46) encontramos la accion de J1 y J2 sobre los kets de la base

J1

∣∣j′,m′, k′⟩

=1

2(J+ + J−)

∣∣j′,m′, k′⟩

=~

2

[√j′ (j′ + 1) −m′ (m′ + 1)

∣∣j′,m′ + 1, k′⟩

+√j′ (j′ + 1) −m′ (m′ − 1)

∣∣j′,m′ − 1, k′⟩]

(10.47)

J2

∣∣j′,m′, k′⟩

=1

2i(J+ − J−)

∣∣j′,m′, k′⟩

=~

2i

[√j′ (j′ + 1) −m′ (m′ + 1)

∣∣j′,m′ + 1, k′⟩

−√j′ (j′ + 1) −m′ (m′ − 1)

∣∣j′,m′ − 1, k′⟩]

(10.48)

de las Ecs. (10.46, 10.47, 10.48) y la ortonormalidad de la base, los elementos matriciales de J i y J± quedan

〈j,m, k| J3

∣∣j′,m′, k′⟩

= m~δkk′δjj′δmm′ (10.49)

〈j,m, k| J±∣∣j′,m′, k′

⟩= ~

√j (j + 1) −m′ (m′ ± 1)δkk′δjj′δm,m′±1 (10.50)

〈j,m, k| J1

∣∣j′,m′, k′⟩

=1

2〈j,m, k| (J+ + J−)

∣∣j′,m′, k′⟩

=~

2δkk′δjj′

[√j (j + 1) −m′ (m′ + 1)δm,m′+1

+√j (j + 1) −m′ (m′ − 1)δm,m′−1

](10.51)

〈j,m, k| J2

∣∣j′,m′, k′⟩

=1

2i〈j,m, k| (J+ − J−)

∣∣j′,m′, k′⟩

=~

2iδkk′δjj′

[√j (j + 1) −m′ (m′ + 1)δm,m′+1

−√j (j + 1) −m′ (m′ − 1)δm,m′−1

](10.52)

lo cual muestra que los elementos matriciales de J solo dependen de j y m pero no de k. Este hecho implica que larepresentacion matricial de las componentes de J en la base estandar |j,m, k〉 tiene una forma particularmentesimple cuando descomponemos E en subespacios del tipo E (j, k). Las Ecs. (10.49, 10.50, 10.51, 10.52) muestran queun operador Ji (o una funcion de la forma F (J)) tiene elementos matriciales nulos cuando el elemento enlaza doskets base asociados a espacios E (j1, k1) y E (j2, k2) con j1 6= j2 y/o con k1 6= k2. Por tanto la matriz sera diagonalpor bloques donde los bloques son todos de dimension 2j+1 (que es la dimension de un espacio E (j, k)) en la forma

E (j, k) · · · E (j, k′) E (j′, k′) · · ·E (j, k)

matriz(2j + 1) × (2j + 1)

0 0 0

E (j, k′) 0matriz

(2j + 1) × (2j + 1)0 0

...

E (j′, k′) 0 0matriz

(2j′ + 1) × (2j′ + 1)0

... 0 0 0 0

(10.53)

Page 271: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

10.6. REPRESENTACIONES MATRICIALES DE LOS OPERADORES MOMENTO ANGULAR 271

comenzando por el valor de j1 mas bajo permitido construımos las matrices asociadas a E (j1, k1) para el k = k1 masbajo permitido, luego manteniendo j1 fijo recorremos los posibles valores de k, una vez terminado este recorrido,continuamos con el siguiente valor permitido j2 de j, recorriendo el ındice k nuevamente y ası sucesivamente. Lasmatrices asociadas a estos subespacios son de dimension 2ji + 1.

Por tanto, lo que debemos hacer es calcular las matrices de dimension finita (2j + 1)×(2j + 1) que representan acada operador en cada subespacio E (j, k). Adicionalmente, estas matrices no dependen de k y por tanto no dependendel sistema fısico bajo estudio. Solo dependen de j y del operador que se quiere representar.

En sıntesis, la representacion matricial de una componente Ji del momento angular en la base estandar, se puedecalcular dentro de un subespacio de la forma E (j, k) sin alusion alguna al sistema fısico que se esta trabajando. La

matrices del tipo (Ji)(j) son en consecuencia de caracter universal y representan al operador Ji dentro del subespacio

E (j, k) para todos los posibles valores de j es decir j = 0, 12 , 1, . . .. Cuando tenemos un sistema fısico especıfico,

debemos determinar cuales de estos valores de j son permitidos y el numero de subespacios E (j, k) asociados concada j, es decir el grado de degeneracion (2j + 1) g (j). La matriz representativa de Ji sera entonces diagonal porbloques con la estructura descrita en la Ec. (10.53), y se puede construır a partir de las matrices universales definidas

para cada subespacio E (j, k). Para cada valor de j, tendremos g (j) bloques identicos de (Ji)(j), es decir todos los

valores posibles de k, una vez que para un j dado se barren los valores posibles de k, se cambia al siguiente valoraccesible j ′ y se construyen g (j ′) bloques identicos de (Ji)

(j′) y ası sucesivamente.

10.6.1. Representaciones matriciales del tipo (Ji)(j) en la base estandar para j arbitrario

De lo anterior, los elementos matriciales para j arbitrario de un operador (Ji)(j) dentro de un subespacio E (j, k)

estan dados por

〈j,m, k| J3

∣∣j′,m′, k′⟩

= m~δkk′δjj′δmm′ (10.54)

〈j,m, k| J2∣∣j′,m′, k′

⟩= j (j + 1) ~2δkk′δjj′δmm′ (10.55)

〈j,m, k| J±∣∣j′,m′, k′

⟩= ~

√j (j + 1) −m′ (m′ ± 1)δkk′δjj′δm,m′±1 (10.56)

〈j,m, k| J1

∣∣j′,m′, k′⟩

=~

2δkk′δjj′

[√j (j + 1) −m′ (m′ + 1)δm,m′+1

+√j (j + 1) −m′ (m′ − 1)δm,m′−1

](10.57)

〈j,m, k| J2

∣∣j′,m′, k′⟩

=~

2iδkk′δjj′

[√j (j + 1) −m′ (m′ + 1)δm,m′+1

−√j (j + 1) −m′ (m′ − 1)δm,m′−1

](10.58)

vemos que la matriz de (J3)(j) es diagonal, esto se debe a que se eligio a X3 como el eje de cuantizacion (la

base estandar consta de vectores propios de J2 y J3), sus elementos son los 2j + 1 valores de m~. Para las matrices

(J1,2)(j) los unicos elementos no nulos son los que estan por encima y por debajo de la diagonal. (J1)

(j) es una matriz

simetrica y real en tanto que (J2)(j) es antisimetrica y puramente imaginaria. La matriz

(J2)(j)

es naturalmentediagonal ya que esta es una base de vectores propios de J2, y ademas sus elementos diagonales son identicos, de

modo que(J2)(j)

es j (j + 1) ~2I, siendo I la matriz identidad de dimension (2j + 1) × (2j + 1). La matriz (J+)(j)

solo tiene elementos no nulos por encima de la diagonal, en tanto que la matriz (J−)(j) solo tiene elementos no nulospor debajo de la diagonal.

Puesto que todas las direcciones del espacio son equivalentes, es claro que la eleccion del eje de cuantizaciones arbitraria. De esto se desprende que todos los Ji deben tener los mismos valores propios. Los vectores propiosseran sin embargo diferentes ya que los Ji no conmutan entre sı. En consecuencia, dentro de un subespacio dadoE (j, k) los autovalores de J1, J2, J3 son j~, (j − 1) ~, . . . , (−j + 1) ~,−j~. Estos tambien seran los valores propios decualquier componente de la forma Jn = J · n siendo n un vector unitario de direccion arbitraria. Los autovectorescomunes de J2 y J1 son combinaciones lineales de los |j,m, k〉 con j y k fijos. Lo mismo ocurre con los vectorespropios comunes a J2 y J2.

Page 272: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

272 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

En conclusion una base ortonormal |j,m, k〉 del espacio de estados compuesta por vectores comunes a J2 y J3

J2 |j,m, k〉 = j (j + 1) ~2 |j,m, k〉 ; J3 |j,m, k〉 = m~ |j,m, k〉

se denomina un base estandar si la accion de J± sobre estos vectores esta dada por

J± |j,m, k〉 = ~√j (j + 1) −m (m± 1) |j,m± 1, k〉

10.6.2. Representaciones matriciales en la base estandar para j = 0

Los subespacios E (j = 0, k) son de dimension 2 (0) + 1 = 1. Y el unico valor posible de m es cero. Las matrices

(Ji)(j) son numeros y de acuerdo con las Ecs. (10.57, 10.58, 10.54) estos numeros son cero.

10.6.3. Representaciones matriciales en la base estandar para j = 1/2

Los subespacios E (j = 1/2, k) son de dimension 2 (1/2)+1 = 2. Las matrices dentro de un subespacio E (j = 1/2, k) sonde dimension 2 × 2 y los vectores base los elegiremos en el orden m1 = 1/2, m2 = −1/2. Las representaciones ma-triciales se obtienen usando las Ecs. (10.57, 10.58, 10.54, 10.55), teniendo en cuenta que estamos interesados en lasrepresentaciones dentro de un subespacio E (j = 1/2, k) de modo que k = k ′. Con estas consideraciones calcularemosla representacion matricial de J1 usando (10.57)

(J1)pq ≡⟨

1

2,mp, k

∣∣∣∣ J1

∣∣∣∣1

2,mq, k

⟩=

~

2δkkδ 1

2, 12

[√1

2

(1

2+ 1

)−mq (mq + 1) δmp,mq+1

+

√1

2

(1

2+ 1

)−mq (mq − 1) δmp,mq−1

]

(J1)pq =~

2

[√3

4−mq (mq + 1) δmp,mq+1 +

√3

4−mq (mq − 1) δmp,mq−1

]

de aquı en adelante se omite el ındice k ya que las representaciones matriciales no dependen de tal ındice. Estasexpresiones muestran que los elementos diagonales son cero, por tanto

(J1)(1/2)11 ≡

⟨1

2,1

2

∣∣∣∣ J1

∣∣∣∣1

2,1

2

⟩= 0

(J1)(1/2)22 ≡

⟨1

2,−1

2

∣∣∣∣ J1

∣∣∣∣1

2,−1

2

⟩= 0

y los terminos no diagonales son

(J1)(1/2)12 ≡

⟨1

2,1

2

∣∣∣∣ J1

∣∣∣∣1

2,−1

2

⟩=

~

2

[√3

4−(−1

2

)(−1

2+ 1

)δ 1

2,− 1

2+1

+

√3

4−(−1

2

)(−1

2− 1

)δ 1

2,− 1

2−1

]

(J1)(1/2)12 =

~

2

√3

4+

1

4δ 1

2, 12

=~

2

(J1)(1/2)21 ≡

⟨1

2,−1

2

∣∣∣∣ J1

∣∣∣∣1

2,1

2

⟩=

~

2

[√3

4− 1

2

(1

2+ 1

)δ− 1

2, 12+1

+

√3

4− 1

2

(1

2− 1

)δ− 1

2, 12−1

]

(J1)(1/2)21 =

~

2

Page 273: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

10.6. REPRESENTACIONES MATRICIALES DE LOS OPERADORES MOMENTO ANGULAR 273

este elemento se podıa tambien calcular teniendo en cuenta que la matriz de J1 es simetrica real. La matriz repre-sentativa queda entonces

(J1)(1/2) =

~

2

(0 11 0

)

de manera similar se calculan los elementos matriciales de los otros operadores, el resultado es

(J1)(1/2) =

~

2

(0 11 0

); (J2)

(1/2) =~

2

(0 −ii 0

); (J3)

(1/2) =~

2

(1 00 −1

)(10.59)

(J2)(1/2)

=3

4~2

(1 00 1

); (J+)(1/2) = ~

(0 10 0

); (J−)(1/2) = ~

(0 01 0

)(10.60)

10.6.4. Representaciones matriciales en la base estandar para j = 1

Los subespacios E (j = 1, k) son de dimension 2 (1) + 1 = 3. Las matrices son de dimension 3 × 3. Ordenaremoslos vectores base con m1 = 1, m2 = 0, m3 = −1.

Calculemos por ejemplo la representacion de J2 usando (10.58), esta ecuacion muestra que los terminos de ladiagonal son cero ası como aquellos en donde los ındices difieren en mas de una unidad, por tanto

(J2)(1)11 = (J2)

(1)22 = (J2)

(1)33 = (J2)

(1)13 = (J2)

(1)31 = 0

para los otros elementos usamos (10.58) con j = 1, k = k ′, y omitimos k

〈1,mp| J2 |1,mq〉 =~

2i

[√1 (1 + 1) −mq (mq + 1) δmp,mq+1 −

√1 (1 + 1) −mq (mq − 1) δmp,mq−1

]

〈1,mp| J2 |1,mq〉 =~

2i

[√2 −mq (mq + 1) δmp,mq+1 −

√2 −mq (mq − 1) δmp,mq−1

]

teniendo en cuenta ademas que la matriz asociada a J2 es antisimetrica, solo tendremos que calcular dos terminos

(J2)(1)12 = 〈1,m1| J2 |1,m2〉 = 〈1, 1| J2 |1, 0〉 =

~

2i

[√2 δ1,0+1 −

√2 δ1,0−1

]=

~√2i

[δ1,1 − δ1,−1] =~√2i

(J2)(1)12 = − i~√

2= − (J2)

(1)21

(J2)(1)23 = 〈1,m2| J2 |1,m3〉 = 〈1, 0| J2 |1,−1〉 =

~

2i

[√2 − (−1) [(−1) + 1] δ0,−1+1

−√

2 − (−1) [(−1) − 1] δ0,−1−1

(J2)(1)23 =

~

2i

√2 ⇒

(J2)(1)23 = − i~√

2= − (J2)

(1)23 ⇒

la matriz queda entonces

(J2)(1) =

~√2

0 −i 0i 0 −i0 i 0

de manera similar se obtienen las otras matrices resultando

(J1)(1) =

~√2

0 1 01 0 10 1 0

; (J2)

(1) =~√2

0 −i 0i 0 −i0 i 0

(J3)(1) = ~

1 0 00 0 00 0 −1

;

(J2)(1)

= 2~2

1 0 00 1 00 0 1

(J+)(1) = ~

0√

2 0

0 0√

20 0 0

; (J−)(1) = ~

0 0 0√2 0 0

0√

2 0

Page 274: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

274 CAPITULO 10. TEORIA GENERAL DEL MOMENTO ANGULAR EN MECANICA CUANTICA

se puede verificar que las representaciones matriciales construıdas obedecen las reglas de conmutacion (10.6). Se

puede verificar que los autovalores de las matrices (Ji)(1/2) son todos iguales y estan dados por ±~/2. Similarmente,

los valores propios de las matrices (Ji)(1) son todos iguales y corresponden a +~, 0,−~. En sıntesis todas las carac-

terısticas generales discutidas al final de la seccion 10.6.1 se cumplen para las matrices calculadas explıcitamente.

Page 275: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 11

Propiedades de los momentos angularesorbitales

Aplicaremos la teorıa general desarrollada en el capıtulo 10 al caso del momento angular orbital que sirvio orig-inalmente para encontrar el algebra con la cual se definio un momento angular generalizado. Utilizaremos la base|r〉 para mostrar que los valores propios de L2 son de la forma l (l + 1) ~2 son l entero no negativo. Es decirlas consideraciones fısicas excluiran a los valores semienteros en tanto que todos los valores enteros no negativosaparecen en el espectro. Encontraremos tambien las funciones propias en la base |r〉 y sus principales propiedades.

En la representacion |r〉 los observables R y P corresponden a multiplicacion por r y al operador diferencial−i~∇ respectivamente. La cuantizacion de las tres componentes del momento angular en la base |r〉 se representacomo

L = R ×P = −i~r×∇L1 =

~

i

(x2

∂x3− x3

∂x2

); L2 =

~

i

(x3

∂x1− x1

∂x3

); L3 =

~

i

(x1

∂x2− x2

∂x1

)(11.1)

L± ≡ L1 ± iL2 (11.2)

sera mas conveniente trabajar en coordenadas polares esfericas, ya que mas adelante veremos que el operadormomento angular solo operara sobre los angulos θ, ϕ y no sobre la variable r.

x1 = r sin θ cosϕ ; x2 = r sin θ sinϕ ; x3 = r cos θ

r ≥ 0 ; 0 ≤ θ ≤ π ; 0 ≤ ϕ < 2π (11.3)

un elemento de volumen d3r = dx dy dz en coordenadas esfericas esta dado por

d3r = r2 dr dΩ ; dΩ = sin θ dθ dϕ (11.4)

donde dΩ es un elemento diferencial de angulo solido en la direccion de los angulos θ y ϕ.A partir de (11.3) calculamos las derivadas parciales

∂x1

∂r= sin θ cosϕ ;

∂x1

∂θ= r cos θ cosϕ ;

∂x1

∂ϕ= −r sin θ sinϕ

∂x2

∂r= sin θ sinϕ ;

∂x2

∂θ= r cos θ sinϕ ;

∂x2

∂ϕ= r sin θ cosϕ

∂x3

∂r= cos θ ;

∂x3

∂θ= −r sin θ ;

∂x3

∂ϕ= 0

y las relaciones entre derivadas parciales esfericas y cartesianas nos dan

∂r=

∂x1

∂r

∂x1+∂x2

∂r

∂x2+∂x3

∂r

∂x3= sin θ cosϕ

∂x1+ sin θ sinϕ

∂x2+ cos θ

∂x3

∂θ=

∂x1

∂θ

∂x1+∂x2

∂θ

∂x2+∂x3

∂θ

∂x3= r cos θ cosϕ

∂x1+ r cos θ sinϕ

∂x2− r sin θ

∂x3

∂ϕ=

∂x1

∂ϕ

∂x1+∂x2

∂ϕ

∂x2+∂x3

∂ϕ

∂x3= −r sin θ sinϕ

∂x1+ r sin θ cosϕ

∂x2

275

Page 276: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

276 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

en forma matricial

∂r∂θ∂ϕ

=

sin θ cosϕ sin θ sinϕ cos θr cos θ cosϕ r cos θ sinϕ −r sin θ−r sin θ sinϕ r sin θ cosϕ 0

∂1

∂2

∂3

calculando la inversa de esta matriz se obtiene

∂1

∂2

∂3

=

cosϕ sin θ cos θ cosϕr − sinϕ

r sin θ

sin θ sinϕ cos θ sinϕr

cosϕr sin θ

cos θ − sin θr 0

∂r∂θ∂ϕ

(11.5)

reemplazando (11.3, 11.5) en (11.1) obtenemos

i

~L1 = x2∂3 − x3∂2 = r sin θ sinϕ

(cos θ ∂r −

sin θ

r∂θ

)− r cos θ

(sin θ sinϕ ∂r +

cos θ sinϕ

r∂θ +

cosϕ

r sin θ∂ϕ

)

= − sin2 θ sinϕ ∂θ − cos2 θ sinϕ ∂θ −cos θ cosϕ

sin θ∂ϕ

i

~L1 = − sinϕ ∂θ −

cosϕ

tan θ∂ϕ (11.6)

y se proceden de forma similar con las otras componentes

i

~L2 = x3∂1 − x1∂3 = r cos θ

(cosϕ sin θ ∂r +

cos θ cosϕ

r∂θ −

sinϕ

r sin θ∂ϕ

)− r sin θ cosϕ

(cos θ ∂r −

sin θ

r∂θ

)

= cos2 θ cosϕ ∂θ − cos θsinϕ

sin θ∂ϕ + sin2 θ cosϕ ∂θ

i

~L2 = cosϕ ∂θ −

sinϕ

tan θ∂ϕ (11.7)

i

~L3 = x1∂2 − x2∂1 = r sin θ cosϕ

(sin θ sinϕ ∂r +

cos θ sinϕ

r∂θ +

cosϕ

r sin θ∂ϕ

)

−r sin θ sinϕ

(cosϕ sin θ ∂r +

cos θ cosϕ

r∂θ −

sinϕ

r sin θ∂ϕ

)

= sin θ cos θ cosϕ sinϕ∂θ + cos2 ϕ ∂ϕ − sin θ cos θ sinϕ cosϕ ∂θ + sin2 ϕ ∂ϕi

~L3 = ∂ϕ (11.8)

con las Ecs. (11.6, 11.7, 11.8), se puede evaluar L2 =(L2

1 + L22 + L2

3

), lo cual es mas sencillo si lo ponemos actuar

sobre una funcion arbitraria ψ (r, θ, ϕ)

Page 277: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

277

L2ψ =

[i~

(sinϕ

∂θ+

cosϕ

tan θ

∂ϕ

)]2

ψ +

[i~

(− cosϕ

∂θ+

sinϕ

tan θ

∂ϕ

)]2

ψ +

[−i~ ∂

∂ϕ

]2

ψ

= −~2

(sinϕ

∂θ+

cosϕ

tan θ

∂ϕ

)(sinϕ

∂θ+

cosϕ

tan θ

∂ϕ

−~2

(− cosϕ

∂θ+

sinϕ

tan θ

∂ϕ

)(− cosϕ

∂θ+

sinϕ

tan θ

∂ϕ

)ψ − ~2∂

∂ϕ2

= −~2 sinϕ∂

∂θ

(sinϕ

∂ψ

∂θ+

cosϕ

tan θ

∂ψ

∂ϕ

)− ~2 cosϕ

tan θ

∂ϕ

(sinϕ

∂ψ

∂θ+

cosϕ

tan θ

∂ψ

∂ϕ

)

+~2 cosϕ∂

∂θ

(− cosϕ

∂ψ

∂θ+

sinϕ

tan θ

∂ψ

∂ϕ

)− ~2 sinϕ

tan θ

∂ϕ

(− cosϕ

∂ψ

∂θ+

sinϕ

tan θ

∂ψ

∂ϕ

)− ~2∂

∂ϕ2

= −~2 sinϕ

(sinϕ

∂θ

∂ψ

∂θ+ cosϕ

∂ψ

∂ϕ

∂θ

1

tan θ+

cosϕ

tan θ

∂θ

∂ψ

∂ϕ

)

−~2 cosϕ

tan θ

(∂ψ

∂θ

∂ϕsinϕ+ sinϕ

∂ϕ

∂ψ

∂θ+

1

tan θ

∂ψ

∂ϕ

∂ϕcosϕ+

cosϕ

tan θ

∂ϕ

∂ψ

∂ϕ

)

+~2 cosϕ

(− cosϕ

∂θ

∂ψ

∂θ+ sinϕ

∂ψ

∂ϕ

∂θ

1

tan θ+

sinϕ

tan θ

∂θ

∂ψ

∂ϕ

)

−~2 sinϕ

tan θ

(−∂ψ∂θ

∂ϕcosϕ− cosϕ

∂ϕ

∂ψ

∂θ+

1

tan θ

∂ψ

∂ϕ

∂ϕsinϕ+

sinϕ

tan θ

∂ϕ

∂ψ

∂ϕ

)− ~2∂

∂ϕ2

L2ψ = −~2

(sin2 ϕ

∂2ψ

∂θ2+ sinϕ cosϕ

∂ψ

∂ϕ

∂θ

1

tan θ+

sinϕ cosϕ

tan θ

∂θ

∂ψ

∂ϕ

)

−~2

(cos2 ϕ

tan θ

∂ψ

∂θ+

cosϕ sinϕ

tan θ

∂ϕ

∂ψ

∂θ− cosϕ sinϕ

tan2 θ

∂ψ

∂ϕ+

cos2 ϕ

tan2 θ

∂2ψ

∂ϕ2

)

+~2

(− cos2 ϕ

∂2ψ

∂θ2+ cosϕ sinϕ

∂ψ

∂ϕ

∂θ

1

tan θ+

cosϕ sinϕ

tan θ

∂θ

∂ψ

∂ϕ

)

−~2

(sin2 ϕ

tan θ

∂ψ

∂θ− sinϕ cosϕ

tan θ

∂ϕ

∂ψ

∂θ+

sinϕ cosϕ

tan2 θ

∂ψ

∂ϕ+

sin2 ϕ

tan2 θ

∂2ψ

∂ϕ2

)− ~2∂

∂ϕ2

agrupando derivadas se tiene

L2ψ

−~2= sin2 ϕ

∂2ψ

∂θ2+ cos2 ϕ

∂2ψ

∂θ2+

cos2 ϕ

tan2 θ

∂2ψ

∂ϕ2+

sin2 ϕ

tan2 θ

∂2ψ

∂ϕ2+∂2ψ

∂ϕ2

+sinϕ cosϕ

tan θ

∂θ

∂ψ

∂ϕ− sinϕ cosϕ

tan θ

∂ϕ

∂ψ

∂θ+

cosϕ sinϕ

tan θ

∂ϕ

∂ψ

∂θ− cosϕ sinϕ

tan θ

∂θ

∂ψ

∂ϕ

+sinϕ cosϕ∂ψ

∂ϕ

∂θ

1

tan θ− cosϕ sinϕ

∂ψ

∂ϕ

∂θ

1

tan θ+

cos2 ϕ

tan θ

∂ψ

∂θ+

sin2 ϕ

tan θ

∂ψ

∂θ

−cosϕ sinϕ

tan2 θ

∂ψ

∂ϕ+

sinϕ cosϕ

tan2 θ

∂ψ

∂ϕ

L2ψ

−~2=

∂2ψ

∂θ2+

1

tan2 θ

∂2ψ

∂ϕ2+∂2ψ

∂ϕ2+

1

tan θ

∂ψ

∂θ

=

[∂2

∂θ2+

(1

tan2 θ+ 1

)∂2

∂ϕ2+

1

tan θ

∂θ

L2ψ

−~2=

[∂2

∂θ2+

1

sin2 θ

∂2

∂ϕ2+

1

tan θ

∂θ

]ψ (11.9)

Page 278: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

278 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

11.1. Momentos angulares orbitales como operadores diferenciales en coor-

denadas esfericas

Las Ecs. (11.6, 11.7, 11.8) nos dicen que las componentes del momento angular en coordenadas esfericas seescriben en la forma

L1 = i~

(sinϕ

∂θ+

cosϕ

tan θ

∂ϕ

)(11.10)

L2 = i~

(− cosϕ

∂θ+

sinϕ

tan θ

∂ϕ

)(11.11)

L3 =~

i

∂ϕ(11.12)

y las Ecs. (11.9, 11.2) nos dicen que los operadores L2, L± quedan

L2 = −~2

(∂2

∂θ2+

1

tan θ

∂θ+

1

sin2 θ

∂2

∂ϕ2

)(11.13)

L+ = ~eiϕ(∂

∂θ+ i cot θ

∂ϕ

)(11.14)

L− = ~e−iϕ(− ∂

∂θ+ i cot θ

∂ϕ

)(11.15)

en la representacion |r〉 las funciones propias asociadas a los valores propios l (l + 1) ~2 de L2 y m~ de L3 cumplen

L2ψ (r, θ, ϕ) = l (l + 1) ~2ψ (r, θ, ϕ) ; L3ψ (r, θ, ϕ) = m~ψ (r, θ, ϕ) (11.16)

y al reemplazar (11.13, 11.12) en las Ecs. (11.16) estas ultimas se convierten en ecuaciones diferenciales parcialescuya solucion son las funciones propias

−(∂2

∂θ2+

1

tan θ

∂θ+

1

sin2 θ

∂2

∂ϕ2

)ψ (r, θ, ϕ) = l (l + 1)ψ (r, θ, ϕ) (11.17)

−i ∂∂ϕ

ψ (r, θ, ϕ) = m~ψ (r, θ, ϕ) (11.18)

donde l es en general entero o semientero no negativo y m toma solo los valores −l,−l + 1, . . . , l − 1, l.Notese que en las ecuaciones (11.17, 11.18) no hay operador derivada asociado a r. Por tanto r se puede considerar

un parametro y asumir una separacion de variables de la forma

ψlmk (r, θ, ϕ) = f (r)Ylm (θ, ϕ) (11.19)

insertando (11.19) en las ecuaciones diferenciales (11.17, 11.18) queda

−(∂2

∂θ2+

1

tan θ

∂θ+

1

sin2 θ

∂2

∂ϕ2

)Ylm (θ, ϕ) = l (l + 1) Ylm (θ, ϕ) (11.20)

−i~ ∂

∂ϕYlm (θ, ϕ) = m~Ylm (θ, ϕ) (11.21)

que estan expresando la ecuacion de valores propios

L2Ylm (θ, ϕ) = l (l + 1) Ylm (θ, ϕ) ; L3Ylm (θ, ϕ) = m~Ylm (θ, ϕ)

f (r) es una funcion de r que aparece como constante de integracion para las ecuaciones diferenciales (11.17, 11.18).Es importante tener en cuenta que f (r) debe ser tal que ψlm (r, θ, ϕ) = f (r)Ylm (θ, ϕ) sea de cuadrado integrable.El hecho de que f (r) sea arbitrario nos indica que L2 y L3 no forman un C.S.C.O. en el espacio Er de funcionesde r es decir de funciones en r, θ, ϕ. En virtud de esto deberıamos introducir un ındice adicional en las Ecs. (11.20,

Page 279: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

11.2. VALORES PERMITIDOS DE L Y M 279

11.21) para las soluciones indicando la posible degeneracion de estas. Sin embargo, veremos que estas solucionesseran unicas para l y m dados salvo por un factor constante. Esto indica que toda la degeneracion estara en el factorf (r) en la Ec. (11.19).

Para normalizar la funcion completa ψlmk (r, θ, ϕ) es conveniente normalizar la parte angular Ylm (θ, ϕ) y la parteradial f (r) separadamente. Estas relaciones de normalizacion se manifestaran en ecuaciones de la forma

∫ 2π

0dϕ

∫sin θ |Ylm (θ, ϕ)|2 dθ = 1

∫ ∞

0r2 |f (r)|2 dr = 1

11.2. Valores permitidos de l y m

La Ec. (11.21) para Ylm (θ, ϕ) muestra que Ylm (θ, ϕ) es igual a

Ylm (θ, ϕ) = Flm (θ) eimϕ (11.22)

podemos cubrir todo el espacio barriendo ϕ entre 0 y 2π. Notese que si Ylm (θ, ϕ) no fuera contınua en algun valorde θ, ϕ, no serıa diferenciable y no podrıa ser funcion propia de los operadores diferenciales L3 y L2. En particularla continuidad en ϕ = 0 nos lleva a

Ylm (θ, ϕ = 0) = Ylm (θ, ϕ = 2π)

que implica ademase2imπ = 1 (11.23)

m solo puede ser entero o semientero. Si m es semientero se puede parametrizar como m = (n+ 1/2) con n =0, 1, 2, . . ., en este caso se tiene

e2imπ = e2(n+ 12 )iπ = e2niπeiπ = −1

de modo que si m es semientero viola la condicion (11.23). Por otro lado, sabemos que l y m son ambos enteros oambos semienteros. En consecuencia, tanto m como l solo pueden tomar valores enteros.

La siguiente pregunta natural es si l puede tomar todos los valores enteros no negativos. Para ello tendremos encuenta que segun la teorıa general (lema 6, Pag. 263) se debe satisfacer

L+Yll (θ, ϕ) = 0 (11.24)

ahora reemplazando (11.14) y (11.22), en la Ec. (11.24) tenemos

~eiϕ(∂

∂θ+ i cot θ

∂ϕ

)[Fll (θ) e

ilϕ]

= 0

(∂Fll (θ)

∂θ+ i (il) cot θ Fll (θ)

)eilϕ = 0

finalmente d

dθ− l cot θ

Fll (θ) = 0 (11.25)

teniendo en cuenta que

cot θ dθ =d (sin θ)

sin θ(11.26)

la solucion general de la ecuacion esFll (θ) = cl (sin θ)

l (11.27)

siendo cl una constante de normalizacion. Se puede demostrar inversamente que esta funcion es funcion propia deL2 y L3 con autovalores l (l + 1) ~2 y l~. Usando (11.12) y (11.22) vemos que

L3Yll (θ, ϕ) =~

i

∂ϕ

[Fll (θ) e

ilϕ]

=il~

iFll (θ) e

ilϕ

Page 280: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

280 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

L3Yll (θ, ϕ) = l~Yll (θ, ϕ) (11.28)

multiplicando (11.24) por L− y usando (10.17) resulta

L−L+Yll (θ, ϕ) = 0 ⇒(L2 − L2

3 − ~L3

)Yll (θ, ϕ) = 0 ⇒

⇒ L2Yll (θ, ϕ) =(L2

3 + ~L3

)Yll (θ, ϕ) = (L3 + ~)L3Yll (θ, ϕ)

y usando (11.28) mostramos que

L2Yll (θ, ϕ) = (L3 + ~) (l~)Yll (θ, ϕ) = (l~ + ~) (l~)Yll (θ, ϕ)

L2Yll (θ, ϕ) = l (l + 1) ~2Yll (θ, ϕ)

por tanto para cada valor entero no negativo de l, existe una funcion Yll unica dentro de factores constantes de laforma

Yll (θ, ϕ) = cl (sin θ)l eilϕ (11.29)

y a traves de la accion iterativa de L− podemos construır Yl,l−1, . . . , Yl,m, . . . , Yl,−l. En sıntesis, para cada par (l,m)con l entero no negativo y m entero con la condicion −l ≤ m ≤ l; existe una y solo una funcion Y lm (θ, ϕ) (dentrode factores constantes), que se puede calcular de (11.29) y que es funcion propia de L2 y L3 con valores propiosl (l + 1) ~2 y m~. A estas autofunciones se les denomina armonicos esfericos.

11.3. Propiedades fundamentales de los armonicos esfericos

Algunas de las propiedades de los armonicos esfericos se pueden extraer de la teorıa general. Por ejemplo, de laEc. (10.46) tenemos que

L±Ylm (θ, ϕ) = ~√l (l + 1) −m (m± 1)Yl,m±1 (θ, ϕ)

utilizando las expresiones diferenciales de L± Ecs. (11.14, 11.15) junto con (11.22), expresamos esta propiedad enforma diferencial

eiϕ(∂

∂θ−m cot θ

)Ylm (θ, ϕ) =

√l (l + 1) −m (m+ 1)Yl,m+1 (θ, ϕ)

e−iϕ(− ∂

∂θ−m cot θ

)Ylm (θ, ϕ) =

√l (l + 1) −m (m− 1)Yl,m−1 (θ, ϕ)

11.3.1. Ortonormalidad y completez

Las Ecuaciones (11.20, 11.21) determinan a los armonicos esfericos salvo por un factor multiplicativo. Podemosescoger este factor de manera que se normalicen estas autofunciones. La condicion de ortonormalidad se escribecomo1 ∫

Y ∗l′m′ (θ, ϕ) Ylm (θ, ϕ) dΩ = δll′δmm′

teniendo en cuenta la expresion del angulo solido (11.4) esta se escribe como

∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

l′m′ (θ, ϕ) Ylm (θ, ϕ) = δll′δmm′ (11.30)

es un hecho ademas que cualquier funcion de θ y ϕ se puede expandir en terminos de los armonicos esfericos

f (θ, ϕ) =∞∑

l=0

+l∑

m=−lclmYlm (θ, ϕ) ; clm = 〈lm| f〉 =

∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) f (θ, ϕ)

1La constante de normalizacion para Ylm (θ, ϕ) arbitrario se puede calcular determinando la constante de normalizacion para Yll (θ, ϕ)en la Ec. (11.29) y usando la Ec. (10.37) de la Pag. 267, que garantiza la normalizacion de cada Ylm (θ, ϕ) generado a traves de L− apartir de Yll (θ, ϕ).

Page 281: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

11.4. CONSTRUCCION DE BASES ESTANDAR DE LA FUNCION DE ONDA ESPACIAL DE UNA PARTICULA SIN ESPIN281

por tanto los armonicos esfericos son una base ortonormal en el espacio EΩ de funciones de θ y ϕ. Esto se expresacon relaciones de completez que aplican en este espacio

∞∑

l=0

+l∑

m=−lYlm (θ, ϕ)Y ∗

lm

(θ′, ϕ′) = δ

(cos θ − cos θ′

)δ(ϕ− ϕ′) =

δ (θ − θ′) δ (ϕ− ϕ′)sin θ

la inclusion de δ (cos θ − cos θ′) en la relacion de completez se debe a que el elemento diferencial de angulo solido seescribe como dΩ = sin θ dθ dϕ = −d (cos θ) dϕ.

11.3.2. Propiedades de paridad y conjugacion

El cambio r → −r en coordenadas cartesianas se expresa como (x1, x2, x3) → (−x1,−x2,−x3). En coordenadasesfericas esta transformacion de paridad se expresa en la forma

r → r , θ → π − θ , ϕ→ π + ϕ

se puede demostrar que

Ylm (π − θ, π + ϕ) = (−1)l Ylm (θ, ϕ)

de modo que los armonicos esfericos tienen paridad definida, la cual es independiente de m. Si l es par (impar) todossus 2l+ 1 armonicos esfericos asociados son pares (impares). Tambien se puede demostrar que bajo conjugacion losarmonicos esfericos tienen la propiedad

Y ∗lm (θ, ϕ) = (−1)m Yl,−m (θ, ϕ)

11.4. Construccion de bases estandar de la funcion de onda espacial de una

partıcula sin espın

En general L2 y L3 no forman un C.S.C.O. de modo que los subespacios Er (l,m) no son en general unidimen-sionales. Por tanto aplicaremos el algoritmo descrito en la seccion 10.4.1 para construir una base estandar paraEr.

Comenzamos entonces por el subespacio Er (l, l) que serıa el espacio de las autofunciones de L2 y L3 con valorespropios l (l + 1) ~2 y l~. El punto de partida es construır una base ortonormal en Er (l, l) que denotaremos porψl,l,k (r) donde k es el ındice que recorre la base cuando L2 y L3 no forman un C.S.C.O.

El siguiente paso consiste en aplicar iterativamente el operador L− sobre todos los elementos ψl,l,k (r) deEr (l, l) para generar una base ortonormal sobre los subespacios

Er (l, l − 1) , Er (l, l − 2) , . . . , Er (l,m) , . . . , Er (l,−l + 1) , Er (l,−l)

Todos los elementos de estas bases cumplen con las Ecs. (10.19, 10.46), que en este contexto se escriben como

L2ψl,m,k (r) = l (l + 1) ~2ψl,m,k (r) ; L3ψl,m,k (r) = m~ψl,m,k (r) (11.31)

L±ψl,m,k (r) = ~√l (l + 1) −m (m± 1)ψl,m±1,k (r) (11.32)

pero ya hemos visto que todas las funciones propias de L2 y L3 correspondientes a un par especıfico (l,m) poseen lamisma dependencia angular denotada por Ylm (θ, ϕ). Es decir la variacion de k para l,m fijos, solo hace que varıe ladependencia radial de ψl,m,k (r). De las Ecuaciones (11.19) ya dedujimos que las funciones propias ψl,m,k (r) tienenla forma

ψl,m,k (r) = Rl,m,k (r) Ylm (θ, ϕ) (11.33)

apliquemos el operador L± sobre la Ec. (11.33) teniendo en cuenta que tales operadores solo actuan sobre lacomponente angular

L±ψl,m,k (r) = Rl,m,k (r) L±Ylm (θ, ϕ) = ~√l (l + 1) −m (m± 1)Rl,m,k (r) Yl,m±1 (r)

Page 282: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

282 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

comparando con la Ec. (11.32) vemos que la funcion radial debe satisfacer para todo r la condicion

Rl,m±1,k (r) = Rl,m,k (r)

la aplicacion sucesiva de L± nos lleva a que R (r) no puede depender de m. Este resultado se puede enunciar de lasiguiente manera: Si ψl,m,k (r) constituye una base estandar de Er, su funcion radial asociada no puede dependerde m de modo que estas funciones se escriben como

ψl,m,k (r) = Rl,k (r) Ylm (θ, ϕ) (11.34)

Podrıamos estar tentados a pensar que la funcion radial solo depende de la degeneracion k. Sin embargo, lafuncion radial tambien depende en general de l por la siguiente razon: una funcion de la forma f (r) g (θ, ϕ) solopuede ser contınua en el origen (r = 0, θ y ϕ arbitrarios) si g (θ, ϕ) se reduce a una constante o si f (r) tiende acero cuando r → 0 con f (0) = 0. Para ver esto, basta con observar que si g (θ, ϕ) es no trivial, entonces el lımite def (r) g (θ, ϕ) cuando r → 0 dependera de la direccion por la cual nos aproximemos al origen si f (r) no tiende a cerocuando r → 0. De lo anterior vemos que si requerimos que ψl,m,k (r) sea contınuo, entonces solo las funciones radialescon l = 0 pueden ser no nulas en el origen (puesto que Y00 es constante). Si ademas requerimos diferenciabilidadhasta cierto orden en el origen obtendremos condiciones sobre Rl,k (r) que dependen de l.

Las relaciones de ortonormalidad de estas funciones se escriben en la forma∫d3r ψ∗

l,m,k (r) ψl′,m′,k′ (r) =

∫ ∞

0r2 dr R∗

l,k (r) Rl′,k′ (r)

×∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ)Yl′m′ (θ, ϕ) = δkk′δll′δmm′

y dado que los armonicos esfericos son ortonormales Ec. (11.30) tenemos que

∫ ∞

0r2 dr R∗

l,k (r) Rl′,k′ (r)

[∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) Yl′m′ (θ, ϕ)

]= δkk′δll′δmm′

δll′δmm′

∫ ∞

0r2 dr R∗

l,k (r) Rl′,k′ (r) = δkk′δll′δmm′ (11.35)

∫ ∞

0r2 dr R∗

l,k (r)Rl,k′ (r) = δkk′ (11.36)

de modo que las funciones radiales Rl,k (r) estan normalizadas con respecto a r y dos funciones radiales asociadasal mismo valor de l pero con diferente valor de k son ortogonales.

Notese que la relacion (11.36) proviene del hecho de que las funciones ψl,l,k (r) = Rl,k (r)Yll (θ, ϕ) que se esco-gieron como base en el subespacio Er (l, l) son ortonormales. Por tal razon, es esencial que el ındice l sea el mismo enambas funciones radiales de la ecuacion (11.36). Si l 6= l ′ entonces ψl,m,k y ψl′,m′,k′ deben ser ortogonales puesto quecorresponden a funciones propias de L2 con diferente valor propio, pero la ortogonalidad de los armonicos esfericosya garantiza la ortogonalidad de las ψ ′s cuando l 6= l′, de modo que en general la integral a la izquierda de (11.36)toma cualquier valor, esto se puede apreciar haciendo l 6= l ′ en (11.35).

11.5. Valores esperados y desviaciones medias cuadraticas de observablescuando el sistema esta en un estado |l, m, k〉

Supongamos que una partıcula sin espın esta en el estado |l,m, k〉 que es autoestado de L2 y L3 con valorespropios l (l + 1) ~2 y m~. Por tanto, el cuadrado de su momento angular y su proyeccion a lo largo de X3 estan biendefinidos. Supongamos ahora que queremos medir las proyecciones a lo largo de los otros dos ejes L1 y L2; puestoque estos observables no conmutan con L3, los estados |l,m, k〉 no son en general autoestados de L1 ni de L2, portanto las predicciones sobre sus autovalores seran solo probabilısticas.

Calculemos entonces los valores esperados y las raıces de las desviaciones medias cuadraticas de L1 y L2. Paraello expresamos estos observables en terminos de los operadores escalera L± invirtiendo las Ecs. (11.34)

L1 =1

2(L+ + L−) ; L2 =

1

2i(L+ − L−)

Page 283: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

11.5. VALORES ESPERADOS Y DESVIACIONES MEDIAS CUADRATICAS DE OBSERVABLES CUANDO EL SISTEMA ESTA EN UN ESTADO |L,M,K〉283

por tanto L1 |l,m, k〉 es una combinacion lineal de los estados |l,m+ 1, k〉 y |l,m− 1, k〉, similarmente ocurre conL2 |l,m, k〉, esto nos lleva por tanto a que

〈l,m, k|L1 |l,m, k〉 = 〈l,m, k|L2 |l,m, k〉 = 0 (11.37)

para calcular las desviaciones medias cuadraticas debemos calcular los valores esperados de L21, L

22

〈l,m, k|L21 |l,m, k〉 =

1

4〈l,m, k| (L+ + L−) (L+ + L−) |l,m, k〉

=1

4〈l,m, k|

[L2

+ + L2− + L+L− + L−L+

]|l,m, k〉

〈l,m, k|L22 |l,m, k〉 = −1

4〈l,m, k| (L+ − L−) (L+ − L−) |l,m, k〉

= −1

4〈l,m, k|

[L2

+ + L2− − L+L− − L−L+

]|l,m, k〉

los terminos con L2± no contribuyen puesto que L2

+ |l,m, k〉 = c± |l,m± 2, k〉. Por tanto ambos valores esperadosson identicos. Usando la Ec. (10.17) se obtiene

〈l,m, k|L21 |l,m, k〉 = 〈l,m, k|L2

2 |l,m, k〉 =1

4〈l,m, k| [L+L− + L−L+] |l,m, k〉

=1

4〈l,m, k|

[2L2 − 2L2

3

]|l,m, k〉 =

~2

2

[l (l + 1) −m2

](11.38)

las desviaciones medias cuadraticas son

(∆L1)2 = (∆L2)

2 = 〈l,m, k|L21 |l,m, k〉 − [〈l,m, k|L1 |l,m, k〉]2 =

~2

2

[l (l + 1) −m2

]

en resumen cuando la partıcula esta en el estado |l,m, k〉, los valores esperados y raıces de las desviaciones mediascuadraticas de L1 y L2 son

〈l,m, k|L1 |l,m, k〉 = 〈l,m, k|L2 |l,m, k〉 = 0

∆L1 = ∆L2 = ~

√1

2[l (l + 1) −m2]

Este resultado posee el siguiente analogo clasico: asumamos un momento angular clasico de modulo |L| = L =~√l (l + 1) y cuya tercera componente L3 es igual a m~. Si graficamos a L en un espacio de configuracion con ejes

L1, L2, L3 colocando el vector L con la cola en el origen, podemos describir tal vector en coordenadas esfericas conangulo polar θ y angulo azimutal ϕ

L1 = L sin θ cosϕ ; L2 = L sin θ sinϕ ; L3 = L cos θ

L21 + L2

2 = L2 sin2 θ

de acuerdo con nuestras hipotesisL = ~

√l (l + 1) ; L3 = m~

por tanto

L21 + L2

2 = L2 − L23 = l (l + 1) ~2 −m2~2 =

[l (l + 1) −m2

]~2

√L2

1 + L22 = L sin θ = ~

√[l (l + 1) −m2]

y las componentes del momento angular son

L1 = L sin θ cosϕ = ~√

[l (l + 1) −m2] cosϕ

L2 = L sin θ sinϕ = ~√

[l (l + 1) −m2] sinϕ

L3 = L cos θ = ~√l (l + 1) cos θ

Page 284: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

284 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

asumamos ahora que los valores de L y θ son conocidos y que el angulo azimutal ϕ es una variable aleatoria quepuede tomar cualquier valor en el intervalo [0, 2π) con igual probabilidad en todo el rango. Si promediamos sobre ϕtenemos

L1 =~

√[l (l + 1) −m2]

∫ 2π

0cosϕ dϕ = 0

L2 =~

√[l (l + 1) −m2]

∫ 2π

0sinϕ dϕ = 0

L1 = L2 = 0 (11.39)

adicionalmente

L21 =

~2

[l (l + 1) −m2

] ∫ 2π

0cos2 ϕ dϕ =

~2

2

[l (l + 1) −m2

]

L22 =

~2

[l (l + 1) −m2

] ∫ 2π

0sin2 ϕ dϕ =

~2

2

[l (l + 1) −m2

]

L21 = L2

2 =~2

2

[l (l + 1) −m2

](11.40)

vemos que los promedios clasicos de L1, L2, L21 , L

22 dados por las Ecs. (11.39, 11.40) son identicos a los valores

esperados cuanticos dados en las Ecs. (11.37, 11.38) para una partıcula en el estado |l,m, k〉. Por tanto, en loque concierne a los valores de 〈L1〉, 〈L2〉 ,

⟨L2

1

⟩,⟨L2

2

⟩, una partıcula cuantica en el estado |l,m, k〉 se comporta de

manera similar a una particula clasica con momento angular de magnitud L = ~√l (l + 1) y con tercera componente

L3 = m~ para el cual ϕ es una variable aleatoria con distribucion uniforme de probabilidad sobre el intervalo [0, 2π).No obstante, este analogo clasico tambien tiene sus limitaciones. Por ejemplo en este modelo clasico puesto que

ϕ es aleatoria y puede tomar cualquier valor en el contınuo nos lleva a que L1 y L2 puede tomar cualquier valorentre −~

√[l (l + 1) −m2] y ~

√[l (l + 1) −m2]. En contraste, para el caso cuantico los valores accesibles de todas las

componentes para una medida individual de la partıcula en el estado |l,m, k〉 estan cuantizados. Especıficamente,hemos visto que los valores accesibles de L1 y L2 coinciden con los de L3, puesto que l es fijo hay 2l + 1 valoresaccesibles que son l~, (l − 1) ~, . . . , (−l + 1) ~,−l~.

11.6. Probabilidades asociadas a la medida de L2 y L3 en un estado arbitrario

Consideremos una partıcula cuyo estado esta descrito por la funcion de onda normalizada dada por

〈r |ψ〉 = ψ (r) = ψ (r, θ, ϕ)

calcularemos ahora la probabilidad de obtener un valor especıfico l (l + 1) ~2 de L2 y/o un valor especıfico m~ deL3.

Puesto que L2 y L3 son variables compatibles, podemos hacer una medicion simultanea de estas cantidades.Denotaremos PL2,L3

(l,m) la probabilidad de obtener los valores l (l + 1) ~2 y m~ en una medicion simultanea dedichas cantidades. Para ello expandimos ψ (r) en autoestados de L2 y L3, para lo cual escogeremos una base estandarde la forma (11.34)

ψl,m,k (r) = Rl,k (r)Ylm (θ, ϕ)

esta expansion es entonces

ψ (r) =∑

k

l

m

cl,m,kRl,k (r)Ylm (θ, ϕ) (11.41)

donde los coeficientes de Fourier de la expansion son los usuales

cl,m,k = 〈l,m, k |ψ〉 =

∫d3r ψ∗

l,m,k (r) ψ (r)

=

∫ ∞

0r2dr R∗

l,k (r)

∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) ψ (r, θ, ϕ) (11.42)

Page 285: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

11.6. PROBABILIDADES ASOCIADAS A LA MEDIDA DE L2 Y L3 EN UN ESTADO ARBITRARIO 285

de acuerdo con los postulados, la probabilidad PL2,L3(l,m) esta dada por

PL2,L3(l,m) =

k

|cl,m,k|2 (11.43)

si medimos L2 solamente, la probabilidad PL2 (l) de obtener l (l + 1) ~2 es

PL2 (l) =l∑

m=−lPL2,L3

(l,m) =∑

k

l∑

m=−l|cl,m,k|2 (11.44)

ahora, si medimos L3 unicamente, la probabilidad de obtener m~ es

PL3 (m) =∑

l≥|m|PL2,L3

(l,m) =∑

k

l≥|m||cl,m,k|2 (11.45)

estrictamente la condicion l ≥ |m| se satisface automaticamente ya que no hay coeficientes c l,k,m con l < |m|.Adicionalmente, si tenemos en cuenta que L2, Li, L± son operadores diferenciales que solo actuan sobre las

variables angulares, solo la dependencia angular en ψ (r) sera relevante para calcular estas probabilidades. Enconsecuencia, r se puede ver como un parametro para estos calculos (cantidad arbitraria pero fija). Si consideramosque ψ (r, θ, ϕ) es funcion de las variables θ, ϕ y que r es un parametro, entonces como toda funcion de θ y ϕ sepodra expandir en armonicos esfericos con coeficientes que dependen del parametro r

ψ (r, θ, ϕ) =∑

l

m

al,m (r)Ylm (θ, ϕ) (11.46)

alm (r) = 〈lm|ψ〉 =

∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) ψ (r, θ, ϕ) (11.47)

si comparamos las expansiones (11.41, 11.46) vemos que los cl,m,k son los coeficientes de la expansion de al,m (r) enlas funciones Rl,k (r)

al,m (r) =∑

k

cl,m,kRl,k (r) (11.48)

usando (11.42) y (11.47) se obtiene

cl,m,k =

∫ ∞

0r2dr R∗

l,k (r)

[∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) ψ (r, θ, ϕ)

]

cl,m,k =

∫ ∞

0r2 dr R∗

l,k (r) al,m (r) (11.49)

la Ec. (11.49) es la inversa de (11.48). De hecho la Ec. (11.49) se puede obtener multiplicando (11.48) por r 2R∗l,k (r),

integrando en r y utilizando la relacion de ortonormalidad (11.36). Usando las Ecs. (11.36, 11.48) se obtiene

∫ ∞

0r2dr |al,m (r)|2 =

∫ ∞

0r2dr

[∑

k

c∗l,m,kR∗l,k (r)

][∑

k′

cl,m,k′Rl,k′ (r)

]

∫ ∞

0r2dr |al,m (r)|2 =

k

k′

c∗l,m,kcl,m,k′∫ ∞

0r2dr R∗

l,k (r)Rl,k′ (r) =∑

k,k′

c∗l,m,kcl,m,k′δkk′

∫ ∞

0r2dr |al,m (r)|2 =

k

|cl,m,k|2

por lo tanto, la probabilidad PL2,L3(l,m) descrita por la Ec. (11.43) se puede reescribir como

PL2,L3(l,m) =

∫ ∞

0r2 dr |al,m (r)|2 (11.50)

Page 286: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

286 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

de lo cual se puede deducir las probabilidades PL2 (l) y PL3 (m)

PL2 (l) =l∑

m=−l

∫ ∞

0r2dr |al,m (r)|2 ; PL3 (m) =

l≥|m|

∫ ∞

0r2dr |al,m (r)|2 (11.51)

en sıntesis, para calcular las probabilidades asociadas a las medidas de los observables L2 y L3 podemos considerara la funcion de onda solo como funcion de las variables θ, ϕ y expandir dicha funcion en armonicos esfericos comose ve en la Ec. (11.46). Los coeficientes de esta expansion se usan entonces para calcular las probabilidades como seve en las Ecs. (11.50, 11.51).

Ahora bien, la Ec. (11.12) nos muestra que el operador L3 solo depende del angulo azimutal ϕ. Por tanto, parael calculo de PL3 (m) podemos considerar a ϕ como la unica variable en ψ (r) siendo r y θ parametros en la funcionde onda. Para ver esto basta con observar que los armonicos esfericos son el producto de una funcion de solo θ poruna funcion de solo ϕ

Ylm (θ, ϕ) = Zlm (θ)eimϕ√

2π(11.52)

con esta parametrizacion cada una de las funciones del producto esta normalizada, esto se ve teniendo en cuentaque ∫ 2π

0dϕe−imϕ√

eim′ϕ

√2π

= δmm′

si sustituımos esto en la relacion de ortonormalidad para los armonicos esfericos Ec. (11.30) encontramos que

∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

l′m′ (θ, ϕ) Ylm (θ, ϕ) = δll′δmm′

∫ 2π

0dϕ

∫ π

0sin θ dθ

[Z∗l′m′ (θ)

e−im′ϕ

√2π

] [Zlm (θ)

eimϕ√2π

]= δll′δmm′

[∫ 2π

0

e−im′ϕ

√2π

eimϕ√2π

] ∫ π

0sin θ dθ Z∗

l′m′ (θ)Zlm (θ) = δll′δmm′

δmm′

∫ π

0sin θ dθ Z∗

l′m′ (θ)Zlm (θ) = δll′δmm′ (11.53)

∫ π

0sin θ dθ Z∗

l,m (θ)Zl′,m (θ) = δll′ (11.54)

notese que en esta relacion solo aparece un numero cuantico m ya que si m 6= m ′ ambos miembros en (11.53) seanulan para cualquier valor de la integral que aparece a la izquierda de (11.53), de modo que a priori esta integralpuede tomar cualquier valor.

Tomaremos entonces para el calculo de PL3 a la funcion de onda ψ (r) como una funcion que solo depende de ϕcomo variable y que depende solo parametricamente de θ y r. Su expansion de Fourier sera

ψ (r, θ, ϕ) =∑

m

bm (r, θ)eimϕ√

2π; bm (r, θ) =

1√2π

∫ 2π

0dϕ e−imϕψ (r, θ, ϕ) (11.55)

si reescribimos las Ecs. (11.46, 11.47) con la parametrizacion (11.52) obtenemos

ψ (r, θ, ϕ) =∑

l

m

al,m (r)Zlm (θ)eimϕ√

2π(11.56)

alm (r) = 〈lm|ψ〉 =

∫ 2π

0dϕ

∫ π

0sin θ dθ Z∗

lm (θ)e−imϕ√

2πψ (r, θ, ϕ) (11.57)

si comparamos las Ecs. (11.55) con las Ecs. (11.56, 11.57) vemos que los alm con m fijo son los coeficientes de laexpansion de bm (r, θ) sobre las funciones Zlm (θ) para tal valor de m

bm (r, θ) =∑

l

al,m (r) Zlm (θ) ; alm (r) =

∫ π

0sin θ dθ Z∗

lm (θ) bm (r, θ) (11.58)

Page 287: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

11.7. EJEMPLOS DE CALCULOS DE PROBABILIDAD PARA L2 Y L3 287

multiplicando a ambos lados de (11.58) por sin θ dθ y por el conjugado de cada miembro e integrando resulta

bm (r, θ) b∗m (r, θ) sin θ dθ =

[∑

l

al,m (r) Zlm (θ)

][∑

l′

a∗l′,m (r) Z∗l′m (θ)

]sin θ dθ

∫ π

0|bm (r, θ)|2 sin θ dθ =

l

l′

al,m (r) a∗l′,m (r)

∫ π

0Zlm (θ) Z∗

l′m (θ) sin θ dθ

y usando (11.54) resulta∫ π

0|bm (r, θ)|2 sin θ dθ =

l

l′

al,m (r) a∗l′,m (r) δll′

∫ π

0|bm (r, θ)|2 sin θ dθ =

l

|al,m (r)|2 (11.59)

y sustituyendo (11.59) en la segunda de las ecuaciones (11.51), la probabilidad PL3 (m) queda en la forma

PL3 (m) =

∫ ∞

0r2dr

∫ π

0sin θ dθ |bm (r, θ)|2 (11.60)

Por lo tanto, en lo que respecta al calculo de PL3 (m) se puede considerar que para la funcion de onda, lascantidades r y θ son parametros y la unica variable es ϕ. Con esta consideracion, la expansion de Fourier se haceen la forma indicada en (11.55) y los coeficientes de la expansion se utilizan para calcular PL3 (m) como se observaen la Ec. (11.60).

Por otro lado, vemos que para calcular PL2 los dos angulos θ y ϕ son relevantes ya que el operador diferencialasociado (11.13) depende de ambos angulos. Por tanto la unica cantidad que se puede considerar como parametropara este calculo es r y debemos emplear la formula (11.51).

11.7. Ejemplos de calculos de probabilidad para L2 y L3

11.7.1. Funcion de onda parcialmente separable

Supongamos que la funcion de onda ψ (r) de una partıcula tiene la forma

ψ (r, θ, ϕ) = f (r) g (θ, ϕ) (11.61)

siempre es posible normalizar cada funcion por separado de modo que∫ ∞

0r2 dr |f (r)|2 = 1 ;

∫ 2π

0dϕ

∫ π

0sin θ dθ |g (θ, ϕ)|2 = 1 (11.62)

la expansion (11.46, 11.47) se escribe entonces en la forma

f (r) g (θ, ϕ) =∑

l

m

al,m (r)Ylm (θ, ϕ) ; alm (r) = f (r)

∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) g (θ, ϕ)

f (r) g (θ, ϕ) = f (r)∑

l

m

dl,mYlm (θ, ϕ) ; alm (r) ≡ f (r) dlm (11.63)

quedando entonces

g (θ, ϕ) =∑

l

m

dl,mYlm (θ, ϕ) ; dlm ≡∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) g (θ, ϕ)

usando la segunda Ec. (11.63), la probabilidad PL2,L3dada en (11.50) queda en la forma

PL2,L3(l,m) =

∫ ∞

0r2 dr |al,m (r)|2 = |dl,m|2

∫ ∞

0r2 dr |f (r)|2

PL2,L3(l,m) = |dl,m|2 ; dlm ≡

∫ 2π

0dϕ

∫ π

0sin θ dθ Y ∗

lm (θ, ϕ) g (θ, ϕ) (11.64)

donde hemos usado la condicion de normalizacion radial (11.62). Esta probabilidad es totalmente independiente dela parte radial de la funcion de onda f (r).

Page 288: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

288 CAPITULO 11. PROPIEDADES DE LOS MOMENTOS ANGULARES ORBITALES

11.7.2. Funcion de onda totalmente separable

Consideremos ahora el caso en el cual la funcion de onda admite una separacion total

ψ (r, θ, ϕ) = f (r)h (θ) k (ϕ) (11.65)

de nuevo asumimos que cada funcion esta normalizada por aparte

∫ ∞

0r2 dr |f (r)|2 =

∫ π

0sin θ dθ |h (θ)|2 =

∫ 2π

0dϕ |k (ϕ)|2 = 1 (11.66)

Por supuesto la Ec. (11.65) es un caso especial de (11.61) de modo que los resultados precedentes son validos aquı.Pero la separacion adicional nos permite simplificar el calculo de PL3 , pues la expansion (11.55) queda en este casoen la forma

f (r)h (θ) k (ϕ) =∑

m

bm (r, θ)eimϕ√

2π; bm (r, θ) =

1√2πf (r)h (θ)

∫ 2π

0dϕ e−imϕk (ϕ)

f (r)h (θ) k (ϕ) = f (r)h (θ)∑

m

cmeimϕ√

2π; bm (r, θ) ≡ cm f (r)h (θ) (11.67)

quedando finalmente

k (ϕ) =∑

m

cmeimϕ√

2π; cm ≡ 1√

∫ 2π

0dϕ e−imϕk (ϕ) (11.68)

ahora aplicando (11.67 y 11.68) a la Ec. (11.60) para el calculo de PL3 se obtiene

PL3 (m) =

∫ ∞

0r2dr

∫ π

0sin θ dθ |bm (r, θ)|2 =

∫ ∞

0r2dr

∫ π

0sin θ dθ |cm f (r)h (θ)|2

= |cm|2∫ ∞

0r2dr |f (r)|2

∫ π

0sin θ dθ |h (θ)|2

y usando las condiciones de normalizacion (11.66) se tiene

PL3 (m) = |cm|2 ; cm ≡ 1√2π

∫ 2π

0dϕ e−imϕk (ϕ) (11.69)

11.7.3. Comportamiento de la probabilidad con θ y ϕ

Hasta ahora solo se ha considerado una estructura especıfica de separacion de variables en la funcion de onda enforma de las Ecs. (11.61, 11.65). Tomaremos ahora ejemplos concretos que cumplan con alguna de estas ecuaciones,por ejemplo asumamos que la funcion de onda es de la forma (11.65) pero totalmente independiente de θ y ϕ

h (θ) =1√2

; k (ϕ) =1√2π

(11.70)

con lo cual la Ec. (11.65) se convierte en

ψ (r) = f (r)1√4π

= f (r)Y00 (θ, ϕ)

de modo que una medida de L2 y/o L3 da el valor cero con total certeza.Ahora modifiquemos solo la dependencia con θ

h (θ) =

√3

2cos θ ; k (ϕ) =

1√2π

ψ (r) = f (r)

√3

4πcos θ = Y10 (θ, ϕ)

Page 289: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

11.7. EJEMPLOS DE CALCULOS DE PROBABILIDAD PARA L2 Y L3 289

de nuevo tenemos certeza total sobre los valores de L2 y L3 en una medida (l = 1,m = 0). Para L2 obtenemos2~2 y para L3 tendremos cero. Vemos que la modificacion de la dependencia de θ no modifica las prediccionesconcernientes a L3 puesto que tales predicciones solo dependen del angulo ϕ.

Ahora modificamos la dependencia de ϕ (con respecto al primer problema) de modo que

h (θ) =1√2

; k (ϕ) =eiϕ√2π

ψ (r) = f (r)eiϕ√4π

la dependencia angular ya no esta dada por un solo armonico esferico. Aplicando (11.69) vemos que PL3 (m) nos da

PL3 (m) = |cm|2 ; cm ≡ 1√2π

∫ 2π

0dϕ e−imϕk (ϕ) =

1

∫ 2π

0dϕ e−imϕeiϕ = δm1

PL3 (m) = δm1

por tanto m solo puede tomar el valor m = 1, vemos entonces que las predicciones sobre L3 han cambiado por laintroduccion de la dependencia azimutal. Las predicciones sobre L2 cambian tambien con respecto a las dadas por(11.70). Para calcular PL2 es necesario expandir eiϕ/

√4π en armonicos esfericos. Se puede verificar que todos los

armonicos con l impar y m = 1 aparecen en dicha expansion. Por tanto, ya no hay certeza en la medida de L2 sinouna distribucion de probabilidad. Tal como ya se discutio, la dependencia de ϕ entra en las predicciones sobre L2.

Page 290: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 12

Interacciones centrales en mecanica cuantica

En mecanica cuantica es frecuente encontrarse con el problema de dos partıculas interactuantes como es el casode la interaccion electron nucleo en un atomo hidrogenoide (sistema consistente en un nucleo y un electron). Cuandola interaccion entre las dos partıculas se puede describir por un potencial que solo depende de la posicion relativaentre ambas, es posible demostrar al igual que en mecanica clasica, que el problema se puede reducir al estudiode una sola partıcula ficticia. Ademas cuando la interaccion entre las partıculas depende solo de la distancia entreellas, el sistema equivalente es la partıcula ficticia sujeta a un potencial central.

Una vez que el problema se reduce al problema equivalente de una partıcula, se consideraran las propiedadesmecano cuanticas de una partıcula sujeta a un potencial central V (r). Este problema esta ıntimamente relacionadocon el problema del momento angular, ya que el hecho de que V (r) sea invariante ante rotaciones alrededor delorigen significara que el Hamiltoniano H conmuta con todas las componentes del momento angular orbital L, esdecir es un escalar. Esto simplificara considerablemente el problema de valores propios ya que sera posible construıruna base comun de funciones propias de H,L2 y L3. Esto a su vez permitira que la dependencia angular de laecuacion de valores propios se convierta en el problema de valores propios del momento angular orbital que ya seha estudiado en detalle. Por tanto, el problema se reducira a encontrar la dependencia radial.

12.1. El problema de dos cuerpos y su reduccion al problema equivalente de

una partıcula en Mecanica Clasica

Figura 12.1: Variables de posicion fundamentales en el problema de dos cuerpos.

Consideremos un sistema de dos masas puntuales m1 y m2 como lo indica la Fig. 12.1, donde las unicas fuerzasque actuan sobre ellas son las debidas al potencial mutuo U . La isotropıa del espacio nos sugiere que si las masas noposeen alguna propiedad vectorial, la interaccion entre ellas debe ir dirigida a lo largo de la lınea que las une, estoindica que el potencial debe ser funcion del valor absoluto de la coordenada relativa r2 − r1 ≡ r. Este sistema tiene

290

Page 291: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

12.1. EL PROBLEMA DE DOS CUERPOS Y SU REDUCCION AL PROBLEMA EQUIVALENTE DE UNA PARTICULA EN MECANICA CLASICA291

seis grados de libertad y por tanto requiere de seis coordenadas generalizadas. Quizas el sistema de coordenadasgeneralizadas mas conveniente lo constituye las coordenadas de posicion del centro de masa R, y las coordenadasque determinan al vector relativo r. Estas coordenadas se pueden escribir en terminos de las coordenadas de posicionde las partıculas r1 y r2

r ≡ r2 − r1 ; R ≡m1r1 +m2r2

m1 +m2(12.1)

estas ecuaciones se pueden invertir para obtener

r1 = R− m2

m1 +m2r

r2 = R +m1

m1 +m2r (12.2)

tambien son utiles las coordenadas de posicion de las partıculas relativas al centro de masa r ′1 y r′2

r1 = R + r′1 ; r2 = R + r′2 (12.3)

con lo cual

r′1 = − m2

m1 +m2r

r′2 =m1

m1 +m2r (12.4)

En esta seccion consideraremos una situacion algo mas general en donde el potencial puede depender tambien delas derivadas temporales del vector relativo r. El Lagrangiano del sistema se puede escribir como

L = T(R, r

)− U (r, r, ..)

es bien sabido que la energıa cinetica de un sistema clasico de partıculas se puede escribir como la energıa cineticadel centro de masa mas la energıa cinetica con respecto al centro de masa

T(R, r

)=

1

2m1r

21 +

1

2m2r

22 =

1

2m1r

′21 +

1

2m2r

′22 +

1

2MR2 (12.5)

dondeM ≡ m1+m2. Usando (12.4) se puede escribir la energıa cinetica en terminos de las coordenadas generalizadaselegidas i.e. las componentes de R y r

T =1

2

m1m2

Mr2 +

1

2MR2

el Lagrangiano queda de la forma

L =1

2MR2 +

1

2

m1m2

Mr2 − U (r, r, ..) (12.6)

se puede ver que las coordenadas de R son todas cıclicas, es decir no aparecen en el Lagrangiano pero sı aparecenlas coordenadas R. Si elegimos como coordenadas generalizadas las tres componentes cartesianas de R, vemos quelos tres momentos lineales (que serıan los momentos canonicos) son constantes y por tanto, R = cte, de modo queel centro de masa esta en reposo o movimiento rectilıneo uniforme1

R = R0 + Rt (12.7)

si nuestro sistema original de referencia es inercial, entonces el sistema con origen en el centro de masa tambien loes. Podemos entonces ver el movimiento a partir del centro de masa en cuyo caso el Lagrangiano queda

L =1

2µr2 − U (r, r, ..) (12.8)

1Desde el punto de vista Newtoniano esto se puede ver por el hecho de que el sistema esta aislado, de modo que el centro de masa nopuede estar acelerado. En terminos de simetrıas, se dice que el sistema tiene invarianza traslacional que conduce a la conservacion delmomento lineal.

Page 292: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

292 CAPITULO 12. INTERACCIONES CENTRALES EN MECANICA CUANTICA

donde hemos definidoµ ≡ m1m2

M(12.9)

como la masa reducida del sistema. El Lagrangiano (12.8) es el equivalente al Lagrangiano que se obtendrıa situvieramos una partıcula de masa µ sometida a una fuerza que apunta siempre hacia un punto fijo (fuerza central),y a una distancia r del centro de fuerza. Por lo tanto el problema de dos cuerpos sometidos a fuerzas centralesmutuas, se puede reducir a un problema de una sola partıcula que interactua con un centro de fuerzas.

No debemos olvidar sin embargo, que la partıcula equivalente a la cual esta asociada el Lagrangiano (12.8),NO existe, no hay ninguna partıcula de masa µ y las trayectorias que se encuentran son para esta partıculaimaginaria. Para encontrar la trayectoria de las partıculas originales con respecto al sistema inercial original, esnecesario devolverse tomando las Ecs. (12.2, 12.7) junto con las soluciones que encontremos para r. No obstante,si ocurre que m1 << m2 entonces tanto la trayectoria como la masa imaginarias van a ser muy semejantes a latrayectoria y masa real de m1.

Ahora queremos construır un Hamiltoniano equivalente para cuantizar mas adelante. Usando (12.6) suponiendoque U solo depende de r, podemos calcular los momentos conjugados asociados a las componentes de R y de r, loscuales estan dados por

Pi =∂L

∂Xi

=∂

∂Xi

[1

2MXkXk +

1

2µxkxk − V (r)

]=

1

2MδikXk +

1

2MXkδik = MXi

pi =∂L

∂xi=

∂xi

[1

2MXkXk +

1

2µxkxk − V (r)

]= µxi

tenemos entonces que

P = MR = m1r1 +m2r2 = p1 + p2 (12.10)

p = µr =m1m2

m1 +m2(r2 − r1) =

m1m2r2 −m2m1r1

m1 +m2=m1p2 −m2p1

m1 +m2(12.11)

p

µ=

p2

m2− p1

m1(12.12)

P es el momento total y p es el momento relativo de las dos partıculas. El Hamiltoniano clasico se escribe como

H (R,P, r,p) =P2

2M+

p2

2µ+ V (r) (12.13)

empleando las ecuaciones de Hamilton encontramos que

P = 0 ; p = −∇V (r) (12.14)

la primera ecuacion nos dice que el centro de masa tiene movimiento rectilıneo uniforme como ya se habia observado.La segunda ecuacion es la segunda ley de Newton aplicada a la partıcula imaginaria de masa µ. Puesto que elcentro de masa es tambien inercial, podemos ubicarnos allı para ver las ecuaciones de movimiento, en cuyo caso elHamiltoniano queda

H (r,p) =p2

2µ+ V (r) (12.15)

que es el equivalente al Lagrangiano (12.8) para la partıcula µ con posicion r y momento p (excepto que ya asumimosque el potencial solo depende de r). Notese que el primer termino a la derecha de las Ecs. (12.6, 12.13) junto con laprimera de las Ecs. (12.14) nos permite interpretar al par R,P como variables conjugadas a una segunda partıculaimaginaria de masa M y que viaja a la velocidad constante del centro de masa ocupando para todo tiempo laposicion del centro de masa2.

Tambien se observa que la Ec. (12.12) nos dice que la velocidad p/µ de la partıcula imaginaria es igual a ladiferencia entre la velocidades de las dos partıculas es decir su velocidad relativa, lo cual es consistente con derivarla primera de las Ecs. (12.1) con respecto al tiempo.

2En sıntesis hemos cambiado el problema de dos cuerpos (reales) acoplados por el problema de dos cuerpos (imaginarios) totalmentedesacoplados.

Page 293: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

12.2. REDUCCION DEL PROBLEMA DE DOS CUERPOS EN MECANICA CUANTICA 293

12.2. Reduccion del problema de dos cuerpos en mecanica cuantica

Cuando se realiza un proceso de cuantizacion no es obvio a priori que el problema de dos cuerpos se reduzcaal problema de un solo cuerpo. La razon estriba en que debemos cuantizar las variables asociadas a las partıculasreales, es decir debemos cuantizar (R1,P1) y (R2,P2), despues de esto podemos pasar a las coordenadas de centrode masa que denotamos por (RC ,PC) y las coordenadas relativas (Rr,Pr). Sin embargo, para poder interpretarconsistentemente estas nuevas coordenadas como equivalentes a dos partıculas imaginarias, es necesario que dichasnuevas coordenadas sean canonicas (es decir que obedezcan las reglas canonicas de conmutacion). Adicionalmente,para que el movimiento de estas dos partıculas imaginarias se pueda desacoplar, es necesario que las variables(RC ,PC) conmuten con las variables (Rr,Pr). Veremos sin embargo, que estas condiciones sı se satisfacen parael problema cuantico de dos cuerpos, de modo que la reduccion al problema de un cuerpo tambien es posible enmecanica cuantica.

Asociaremos los operadores R1,P1 y R2,P2 que describen la posicion y el momento de las dos partıculas y quesatisfacen las relaciones canonicas

[P

(i)j , P (k)

m

]=[X

(i)j , X(k)

m

]= 0 ;

[X

(i)j , P (k)

m

]= δjmδiki~ ; i, k = 1, 2 ; j,m = 1, 2, 3 (12.16)

donde i, k rotulan partıculas en tanto que j,m rotulan componentes. Definimos ahora los observables RC y Rr enforma analoga a las Ecs. (12.1)

RC =m1R1 +m2R2

m1 +m2; Rr = R2 −R1 (12.17)

y los momentos tienen expresiones de la forma (12.10, 12.11)

PC = P1 + P2 ; Pr =m1P2 −m2P1

m1 +m2(12.18)

los conmutadores entre las componentes de RC , Rr,PC ,Pr se pueden calcular con base en las definiciones (12.17,12.18) y las reglas de conmutacion (12.16) y se obtiene

[X

(i)j , X(k)

m

]=

[P

(i)j , P (k)

m

]= 0 ;

[X

(i)j , P (k)

m

]= δjmδiki~ ; i, k = 1, 2 ; j,m = 1, 2, 3

X(1)j ≡ (RC)j ; X

(2)j ≡ (Rr)j ; P

(1)j ≡ (PC)j ; P

(2)j ≡ (Pr)j

es decir tanto el par RC ,PC , como el par Rr,Pr obedecen reglas canonicas de conmutacion. Ademas todo observabledel conjunto RC ,PC conmuta con todo observable del conjunto Rr,Pr.

Lo anterior nos permite interpretar al par RC ,PC , y al par Rr,Pr como los observables posicion y momento dedos partıculas ficticias distintas al igual que en el caso clasico.

12.2.1. Autovalores y autofunciones del Hamiltoniano

Usando las reglas de cuantizacion el Hamiltoniano para dos cuerpos sometidos a una fuerza central esta dadopor

H =P2

1

2m1+

P22

2m2+ V (R2 −R1)

teniendo en cuenta que este Hamiltoniano no acopla observables de momento con observables de posicion, el calculopara llegar del conjunto (R1,P1,R2,P2) al conjunto (RC ,PC ,Rr,Pr) es identico al del caso clasico puesto quetodos los productos que aparecen conmutan. El resultado es entonces totalmente analogo a (12.13)

H =P2C

2M+

P2r

2µ+ V (Rr)

este Hamiltoniano se puede separar en la forma

H = HC +Hr ; HC ≡ P2C

2M; Hr ≡

P2r

2µ+ V (Rr)

[HC ,Hr] = 0 ⇒ [HC ,H] = 0 ; [Hr,H] = 0

Page 294: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

294 CAPITULO 12. INTERACCIONES CENTRALES EN MECANICA CUANTICA

Asumiendo que H, HC , Hr son observables, tal conjunto tendra entonces una base comun de kets propios.

HC |ϕ〉 = EC |ϕ〉 ; Hr |ϕ〉 = Er |ϕ〉 ; H |ϕ〉 = E |ϕ〉H = HC +Hr ⇒ E = EC +Er (12.19)

consideremos la base |rC , rr〉, donde los elementos de esta base son vectores propios comunes a los observablesRC y Rr. En esta base, un estado se representa por la funcion de onda ϕ (rC , rr) que es funcion de seis variables.Los operadores RC y Rr se representan por multiplicacion de las funciones de onda por las variables rC y rr

respectivamente, en tanto que PC y Pr se representan por los gradientes

PC → −i~∇C ≡ −i~(

∂xC,1,

∂xC,2,

∂xC,3

)

Pr → −i~∇r ≡ −i~(

∂xr,1,

∂xr,2,

∂xr,3

)

el espacio de estados E puede ser considerado como el producto tensorial

E = ErC ⊗ Err

donde los espacios ErC , Err estan asociados a RC y Rr respectivamente. HC y Hr son entonces extensiones a E deHamiltonianos originalmente definidos en ErC y Err respectivamente. Podemos entonces encontrar una base |ϕ〉 quecumple las Ecs. (12.19) en la forma siguiente

|ϕ〉 = |ϕC〉 ⊗ |ϕr〉 ; |ϕC〉 ∈ ErC ; |ϕr〉 ∈ Err

HC |ϕC〉 = EC |ϕC〉 ; Hr |ϕr〉 = Er |ϕr〉 ; H |ϕ〉 = (EC +Er) |ϕ〉

las dos primeras ecuaciones se pueden escribir en la base |rC〉 y |rr〉 respectivamente y se obtiene

− ~2

2M∇2CϕC (rC) = ECϕC (rC) (12.20)

[− ~2

2µ∇2

r + V (rr)

]ϕr (rr) = Erϕr (rr) (12.21)

la Ec. (12.20) muestra que la partıcula equivalente para la descripcion del centro de masa es libre como en lamecanica clasica. Sus soluciones son del tipo onda plana

ϕC (rC) =1

(2π~)3/2ei~pC ·rC ; EC =

p2C

2M≥ 0

el espectro de energıa es no negativo y contınuo y corresponde a la energıa cinetica del movimiento del sistema comoun todo.

La Ec. (12.21) describe la dinamica de la partıcula imaginaria de masa µ con posicion equivalente a la posicionrelativa entre las dos partıculas. Describe entonces el comportamiento del sistema de dos partıculas en el sistema dereferencia del centro de masa. Si el potencial solo depende de |r2 − r1| y no de la direccion de este vector relativo,la partıcula µ estara sujeta a un potencial central V (r). El problema se reduce entonces a resolver la dinamica dela partıcula µ.

El momento angular del sistema es

J = L1 + L2 ; L1 = R1 ×P1 ; L2 = R2 ×P2

se puede demostrar que este momento angular total tambien se puede escribir como

J = LC + Lr ; LC = RC ×PC ; Lr = Rr ×Pr

Adicionalmente, se puede demostrar que LC y Lr satisfacen las reglas de conmutacion de un momento angular.Naturalmente, las componentes de LC conmutan con las de Lr. Una vez mas, estas propiedades nos permiteninterpretar consistentemente a LC y a Lr como momentos angulares de partıculas cuanticas imaginarias.

Page 295: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

12.3. EL PROBLEMA CLASICO DE UNA PARTICULA SOMETIDA A UNA FUERZA CENTRAL 295

12.3. El problema clasico de una partıcula sometida a una fuerza central

Asumamos una partıcula clasica sometida a una fuerza de la forma3

F = −∇V (r) = −dVdr

ur

dado que la fuerza es paralela al vector posicion (siempre que el origen se elija en el centro de fuerza) tenemos que~τ = r×F = 0 y puesto que ~τ = dL/dt, se tiene que L = cte. El momento angular clasico es entonces una constantede movimiento para una partıcula clasica sometida a una fuerza central. La trayectoria esta contenida entoncesen un plano que pasa por el centro de fuerzas y que es perpendicular al momento angular. La velocidad se puededescomponer en una componente radial (paralela a r) y una transversal (perpendicular a r). La velocidad radialtiene como magnitud

vr =dr

dt

y la magnitud de la velocidad tangencial esta dada por

|vθ| = |v sin δ| = |ur × v| =1

r|r× v|

siendo δ el angulo entre ur y v. El modulo del momento angular es

|L| = |r× µv| = µr |vθ| ⇒

|vθ| =|L|µr

la energıa total (cinetica mas potencial) es

E =1

2µv2 + V (r) =

1

2µv2

r +1

2µv2

θ + V (r)

E =1

2µv2

r +1

( |L|µr

)2

+ V (r)

E =1

2µv2

r +L2

2µr2+ V (r) (12.22)

El Hamiltoniano clasico en coordenadas esfericas se escribe como

H =p2r

2µ+

1

2µr2

(p2ϕ

sin2 θ+ p2

θ

)+ V (r)

L2 =p2ϕ

sin2 θ+ p2

θ

La energıa cinetica en (12.22) se dividio en dos terminos la energıa cinetica radial y la transversal. Notese que ladependencia angular del Hamiltoniano se puede absorber en L2 teniendo en cuenta que esta es una constante demovimiento

H =p2r

2µ+

L2

2µr2+ V (r) (12.23)

la absorcion de los angulos y sus momentos conjugados en L2 esta relacionada con el hecho de que V (r) no dependede los angulos. El Hamiltoniano es la energıa del sistema en este caso como se aprecia al comparar (12.22) con(12.23). Podemos entonces tratar al Hamiltoniano como funcion solo de r y pr tomando a L2 como parametro.Tenemos entonces solo dos ecuaciones de Hamilton

r =∂H

∂pr; pr = −∂H

∂r

3De aquı en adelante simplificaremos la notacion y usaremos r,p en lugar de rr y pr para las variables dinamicas fundamentales delproblema de una partıcula.

Page 296: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

296 CAPITULO 12. INTERACCIONES CENTRALES EN MECANICA CUANTICA

tomando el Hamiltoniano (12.23) estas ecuaciones quedan

dr

dt=

prµ

;dprdt

=L2

µr3− dV

dr

d2r

dt2=

1

µ

dprdt

; µd2r

dt2=

L2

µr3− dV

dr(12.24)

si definimos el potencial efectivo

Veff (r) = V (r) +L2

2µr2

el Hamiltoniano (12.23) y las ecuaciones de movimiento (12.24) quedan

H =p2r

2µ+ Veff (r) ; µ

d2r

dt2= −dVeff

dr

que es equivalente a un problema unidimensional sujeto a la interaccion descrita por el potencial efectivo (teniendoen cuenta que r va entre 0 e ∞). Veremos como se traducen estas caracterısticas en la mecanica cuantica.

12.4. Hamiltoniano cuantico

De aquı en adelante nos concentraremos en la ecuacion (12.21) de valores propios para el Hamiltoniano en larepresentacion de la coordenada relativa |rr〉. Por tanto simplificamos su notacion en la forma

[− ~2

2µ∇2 + V (r)

]ϕ (r) = Eϕ (r) (12.25)

puesto que el potencial V solo depende de la distancia r de la partıcula al origen, las coordenadas esfericas son masadecuadas para el problema. El Laplaciano en coordenadas esfericas se escribe

∇2 =1

r

∂2

∂r2r +

1

r2

(∂2

∂θ2+

1

tan θ

∂θ+

1

sin2 θ

∂2

∂ϕ2

)(12.26)

esta expresion da el Laplaciano solo para r 6= 0 y no esta definida para r = 0, lo cual se debe a la posicionprivilegiada del origen en coordenadas esfericas (el origen corresponde a r = 0 para cualquier valor de θ, ϕ), masadelante impondremos condiciones sobre la funcion de onda en el origen. De la Ec. (11.13) vemos que el Laplaciano(12.26) se puede escribir en terminos de L2

∇2 =1

r

∂2

∂r2r − L2

~2r2

de modo que el Hamiltoniano cuantico se puede escribir

H = − ~2

2µ∇2 + V (r) =

~2

(1

r

∂2

∂r2r − L2

~2r2

)+ V (r)

H = − ~2

2µr

∂2

∂r2r +

L2

2µr2+ V (r) (12.27)

que es el analogo del Hamiltoniano clasico (12.23). El operador diferencial L2 contiene toda la dependencia angular.

El problema de valores propios del Hamiltoniano queda escrito en la forma

[− ~2

2µr

∂2

∂r2r +

L2

2µr2+ V (r)

]ϕ (r, θ, ϕ) = E ϕ (r, θ, ϕ) (12.28)

Page 297: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

12.5. SOLUCION GENERAL DEL PROBLEMA DE VALORES PROPIOS 297

12.5. Solucion general del problema de valores propios

Puesto que las componentes de L solo actuan en la variables angulares, conmutan con todos los operadores quesolo dependan de r. Ademas, sabemos que Li conmuta con L2. Por tanto de acuerdo con (12.27), las tres componentesde L conmutan con el Hamiltoniano y como no dependen explıcitamente del tiempo, son todas constantes demovimiento en el sentido cuantico (seccion 5.8.2)

[H,L] = 0 ;∂L

∂t=d 〈L〉dt

= 0

por tanto H es un operador escalar con respecto a las rotaciones alrededor del origen, lo cual proviene de la invarianzadel potencial bajo rotaciones alrededor del origen. Por supuesto H tambien conmuta con L2. Sin embargo, aunquetenemos a nuestra disposicion cinco constantes de movimiento (L, L2,H), no podemos usarlas todas para solucionarel problema de valores propios (12.28) ya que no todos estos operadores conmutan entre sı. Solo podremos usar L2,L3 (u otra componente) y H. Si asumimos que H, L2, L3 son observables, existira una base comun de funcionespropias en el espacio Er de una partıcula. Por lo tanto podemos sin retringir la generalidad del problema requerirque la funciones de onda en (12.28) tambien sean funciones de onda de L2 y L3

Hϕ (r) = Eϕ (r) ; L2ϕ (r) = l (l + 1) ~2ϕ (r) ; L3ϕ (r) = m~ϕ (r) (12.29)

pero ya conocemos la forma de la parte angular de las autofunciones comunes de L2 y L3 (seccion 11.4). La Ec.(11.34) nos indica que estas funciones son de la forma

ϕ (r) = Rlk (r)Ylm (θ, ϕ) (12.30)

donde este ϕ (r) es solucion de las dos ultimas ecuaciones (12.29) sin importar la forma de la parte radial. Por tanto,solo queda resolver el problema de determinar R (r) a fin de que ϕ (r) sea autofuncion del Hamiltoniano.

12.5.1. La ecuacion radial

Si sustituımos (12.30) en la Ec. (12.28) de valores propios del Hamiltoniano

[− ~2

2µr

∂2

∂r2r +

L2

2µr2+ V (r)

]Rlk (r)Ylm (θ, ϕ) = E Rlk (r)Ylm (θ, ϕ)

Ylm (θ, ϕ)

[− ~2

2µr

∂2

∂r2r + V (r)

]Rlk (r) +Rlk (r)

L2Ylm (θ, ϕ)

2µr2= E Rlk (r)Ylm (θ, ϕ)

y teniendo en cuenta que los armonicos esfericos son autofunciones de L2 con valor propio l (l + 1) ~2 se tiene

Ylm (θ, ϕ)

[− ~2

2µr

∂2

∂r2r + V (r)

]Rlk (r) +Rlk (r)

l (l + 1) ~2Ylm (θ, ϕ)

2µr2= E Rlk (r)Ylm (θ, ϕ)

la ecuacion radial toma finalmente la forma[− ~2

2µr

d2

dr2r +

l (l + 1) ~2

2µr2+ V (r)

]Rlk (r) = E Rlk (r) (12.31)

en realidad una solucion de (12.31), sustituıda en (12.30) no necesariamente representa una solucion de la ecuacionde valores propios (12.25) del Hamiltoniano. Esto se debe a que la expresion (12.26) para el Laplaciano no esnecesariamente valida en r = 0. Debemos por tanto asegurarnos que la solucion R (r) de (12.31) sea lo suficientementeregular en el origen para que (12.30) sea en realidad solucion de (12.25). Notese ademas que aunque la Ec. (12.31) nodepende de los angulos, sı depende de l, en realidad para cada valor de l tenemos un operador diferente en (12.31).

De las Ecs. (12.29), podemos decir que el problema de valores propios de L2, L3,H lo resolvemos para cada parde valores fijos de l y m. Esto implica que en el espacio de estados Er resolvemos el problema para cada subespacioE (l,m) asociado a valores fijos de l y m. La Ec. (12.31) nos muestra que cuando estudiamos la parte radial (que esla unica desconocida) de las funciones propias del Hamiltoniano, la ecuacion asociada depende de l pero no de m,es decir la ecuacion (12.31) es identica para todos los 2l+1 subespacios E (l,m) con l fijo. Denotaremos por E l,k los

Page 298: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

298 CAPITULO 12. INTERACCIONES CENTRALES EN MECANICA CUANTICA

autovalores del operador Hl definido por (12.31) y que correspondera a los autovalores del Hamiltoniano dentro deun subespacio dado E (l,m). El ındice k (discreto o contınuo) indica los diferentes valores propios asociados al mismonumero cuantico l, los valores posibles de k indican la dimensionalidad de cada subespacio E (l,m). En (12.31) hemosdenotado las funciones propias de Hl con los ındices Rl,k (r). Debe notarse sin embargo que los ındices de la funcionradial no tienen que ser los mismos de los valores propios El,k puesto que podrıamos tener varias funciones radialespropias de Hl para un valor propio dado El,k en cuyo caso la funcion radial requerirıa un ındice adicional. Sinembargo, demostraremos mas adelante que para cada l, k solo existe una funcion radial linealmente independiente.

Por otra parte, para la Ec. (12.31)

[− ~2

2µr

d2

dr2r +

l (l + 1) ~2

2µr2+ V (r)

]Rlk (r) = El,k Rlk (r)

Definimos el cambio de variable

Rl,k (r) =1

rul,k (r) (12.32)

y multiplicamos a ambos lados por r

r

[− ~2

2µr

d2

dr2r +

l (l + 1) ~2

2µr2+ V (r)

] [1

rul,k (r)

]= rEl,k

1

rul,k (r)

r

− ~2

2µr

d2

dr2

[r1

rul,k (r)

]+l (l + 1) ~2

2µr2

[1

rul,k (r)

]+ V (r)

1

rul,k (r)

= El,k ul,k (r)

− ~2

d2

dr2ul,k (r) +

l (l + 1) ~2

2µr2ul,k (r) + V (r)ul,k (r)

= El,k ul,k (r)

quedando finalmente − ~2

d2

dr2+l (l + 1) ~2

2µr2+ V (r)

ul,k (r) = El,k ul,k (r) (12.33)

de nuevo la Ec. (12.33) es analoga a un problema unidimensional de un partıcula de masa µ sometida al potencialefectivo Veff definido por

Veff = V (r) +l (l + 1) ~2

2µr2

teniendo en cuenta que r solo puede tomar valores no negativos. El termino l (l + 1) ~2/(2µr2

)es siempre positivo

de modo que si correspondiera a una interaccion real corresponderıa a una fuerza repulsiva, por este motivo seconoce como potencial centrıfugo. Debe tenerse en cuenta sin embargo, que el termino centrıfugo no corresponde auna verdadera interaccion sino a una porcion de la energıa cinetica (energıa cinetica transversal). Cuando l = 0 eltermino centrıfugo esta ausente. Para una interaccion Coulombiana V (r) = −e2/r, si l 6= 0 el termino centrıfugodomina para valores pequenos de r de modo que el potencial efectivo es repulsivo a cortas distancias.

12.5.2. Comportamiento de la solucion radial en el origen

Ya hemos mencionado que debemos examinar las soluciones R (r) de la ecuacion radial (12.31) en el origen paragarantizar que estas tambien sean soluciones de la Ec. (12.25) puesto que en el paso de (12.25) a (12.31) se ha usadoel Laplaciano en coordenadas esfericas (12.26) que no esta definido en el origen.

Asumiremos que el potencial V (r) es tal que

lımr→0

r2V (r) = 0 (12.34)

es decir, permanece finito o diverge menos rapido que 1/r2. Esta hipotesis es valida en la mayorıa de los casos y enparticular para el potencial de Coulomb. Consideremos una solucion de la Ec. (12.31) asumamos que en el origense comporta en la forma

lımr→0

Rl,k (r) ∼ Crs (12.35)

Page 299: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

12.6. ESTADOS ESTACIONARIOS DE UNA PARTICULA EN UN POTENCIAL CENTRAL 299

sustituyendo (12.35) en (12.31) tenemos

[− ~2

2µr

d2

dr2r +

l (l + 1) ~2

2µr2+ V (r)

]Crs = El,k Cr

s

− ~2

2µr

d2

dr2rs+1 +

l (l + 1) ~2

2µr2rs + V (r) rs = El,k r

s

−s (s+ 1)~2

2µrrs−1 +

l (l + 1) ~2

2µr2rs + V (r) rs = El,k r

s

−s (s+ 1)~2

2µrs−2 +

l (l + 1) ~2

2µrs−2 + [V (r) −El,k] r

s = 0

rs−2

−s (s+ 1)

~2

2µ+l (l + 1) ~2

2µ+ [V (r) −El,k] r

2

= 0

asumimos que r 6= 0 de modo que

−s (s+ 1)~2

2µ+l (l + 1) ~2

2µ+ [V (r) −El,k] r

2 = 0

tomando el lımite cuando r → 0 y teniendo en cuenta la condicion (12.34)

−s (s+ 1) + l (l + 1) = 0

(l − s) (s+ l + 1) = 0 (12.36)

por tanto tenemos dos soluciones posibles

s = l o s = − (l + 1) (12.37)

es decir que para un valor propio dado El,k hay dos soluciones linealmente independientes de la ecuacion de segundoorden (12.31), que se comportan como rl y como 1/rl+1 en la vecindad del origen respectivamente. La solucion1/rl+1 claramente diverge en el origen para todos los valores de l. Adicionalmente, se puede demostrar que lafuncion Ylm (θ, ϕ) /rl+1 no es una solucion de la ecuacion de valores propios (12.25) para r = 0, esto se debe a queel laplaciano de Ylm (θ, ϕ) /rl+1 involucra la l−esima derivada de δ (r). Por tales razones, la solucion 1/r l+1 debeser descartada.

De lo anterior las soluciones aceptables para (12.33) deben ir a cero en el origen para todo l ya que

lımr→0

ul,k (r) = lımr→0

[rRl,k (r)] ∼ Crl+1

de modo que a la Ec. (12.33) se le debe agregar la condicion

ul,k (0) = 0 (12.38)

en la Ec. (12.33) r va entre 0 e infinito. Sin embargo, es posible asumir el problema como un problema unidimensionalequivalente en donde r tome todos los valores reales pero con potencial efectivo infinito para valores negativos der. En tal caso, la funcion de onda toma valores identicamente ceros en la parte negativa de r y la condicion (12.38)asegura la continuidad de la funcion de onda en r = 0.

12.6. Estados estacionarios de una partıcula en un potencial central

Hemos visto que cuando el potencial V (r) es independiente de θ y ϕ podemos requerir que las autofuncionesdel Hamiltoniano sean tambien autofunciones de L2 y L3. Esto permite aseverar que la dependencia angular vienedada por las autofunciones de L2 y L3 es decir los armonicos esfericos

ϕl,m,k (r) = Rl,k (r)Ylm (θ, ϕ) =1

rul,k (r) Ylm (θ, ϕ) (12.39)

Page 300: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

300 CAPITULO 12. INTERACCIONES CENTRALES EN MECANICA CUANTICA

por tanto, la ecuacion de valores propios del Hamiltoniano que involucra a r, θ, ϕ puede ser reemplazada por unaecuacion diferencial que solo involucra a r y que depende del parametro l, Ec. (12.33), dicha ecuacion junto conla condicion (12.38) nos dictamina la dependencia radial de la funcion de onda. Notese que estas caracterısticasemulan el comportamiento clasico.

Las funciones ϕl,m,k (r, θ, ϕ) deben ser de cuadrado integrable

∫|ϕl,m,k (r, θ, ϕ)|2 r2 dr dΩ = 1

la estructura de la funcion de onda Ec. (12.39) permite separar la parte radial y la angular

∫|ϕl,m,k (r, θ, ϕ)|2 r2 dr dΩ =

∫ ∞

0r2 dr |Rl,m,k (r)|2

∫|Ylm (θ, ϕ)|2 dΩ = 1

y puesto que los armonicos esfericos estan normalizados entonces la funcion radial esta normalizada por aparte

∫ ∞

0r2 dr |Rl,m,k (r)|2 =

∫ ∞

0dr |ul,m,k (r)|2 = 1 (12.40)

en realidad es conveniente aceptar en algunos casos autofunciones que no sean de cuadrado integrable. Esto ocurrecuando al menos parte del espectro de H es contınuo, en cuyo caso requerimos que las funciones de onda seanortonormales en el sentido extendido es decir

∫ ∞

0r2 dr R∗

l,k′ (r)Rl,k (r) =

∫ ∞

0dr u∗l,k′ (r)ul,k (r) = δ

(k − k′

)(12.41)

siendo k un ındice contınuo.En las Ecs. (12.40, 12.41), los integrandos convergen en su lımite inferior r = 0 debido a la condicion (12.38).

Esto es fısicamente necesario ya que la probabilidad de encontrar a la partıcula en cualquier volumen de dimen-sion finita permanece finita (en particular para un volumen que contiene al origen)4. Por tanto, es solo debido alcomportamiento de la funcion de onda en r → ∞ que la integral (12.41) diverge en k = k ′ cuando el espectro escontınuo.

Las Ecs. (12.39) nos dicen que las funciones propias del Hamiltoniano de una partıcula inmersa en un potencialcentral V (r) dependen de por lo menos tres ındices l,m, k (k podrıa representar varios ındices contınuos o discretos).La funcion ϕl,m,k (r) en (12.39) es autofuncion simultanea de H,L2, L3 con autovalores El,k, l (l + 1) ~2 y m~. Ak se le conoce como numero cuantico radial, l se denomina numero cuantico azimutal y m el numero cuanticomagnetico. La parte radial Rl,k (r) = ul,k/r de la autofuncion ası como el autovalor El,k no dependen del numerocuantico magnetico m y estan dadas por la ecuacion radial (12.33) junto con la condicion (12.38). Por otro lado, laparte angular de la funcion de onda (armonicos esfericos) depende de l y m pero no de k, dicha parte angular esindependiente de la forma del potencial V (r).

12.6.1. Degeneracion de los niveles de energıa

Consideraremos ahora el problema de la degeneracion de los niveles de energıa. Las 2l+1 funciones ϕ l,m,k (r, θ, ϕ)con l y k fijos y m variando entre −l y l son autofunciones de H con el mismo valor propio E l,k, dado que estas2l+ 1 funciones corresponden a valores propios diferentes de L3 seran claramente ortogonales. En consecuencia haypor lo menos un degeneracion de orden 2l + 1 del valor propio El,k, tal degeneracion es independiente de la formadel potencial y por esta razon se denomina una degeneracion esencial. La degeneracion esencial se debe al hecho deque H contiene a L2 pero no a L3 y a que el Hamiltoniano es siempre invariante rotacional (escalar). Puesto que Hcontiene a L2 pero no a L3, se tiene que m no aparece en la ecuacion radial que proviene del problema de valorespropios del Hamiltoniano pero sı aparece l.

No obstante, es posible que El,k correspondiente a la ecuacion radial con operador Hl coincida con El′,k′ deotra ecuacion radial (l 6= l′). Esto ocurre para ciertos potenciales, y se conoce como degeneraciones accidentales. Enparticular, el potencial de Coulomb que describe a los atomos hidrogenoides exhibe degeneraciones accidentales.

4Notese que si no se hubiera descartado la posibilidad de que lımr→0Rl,k (r) ∼ 1/rl+1, hubiesemos tenido comportamiento divergenteen el origen.

Page 301: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

12.6. ESTADOS ESTACIONARIOS DE UNA PARTICULA EN UN POTENCIAL CENTRAL 301

La ecuacion radial (12.33) para un l fijo, al ser una ecuacion de segundo orden posee a priori dos solucioneslinealmente independientes. Sin embargo, la condicion (12.38) ha surgido de eliminar una de ellas puesto que sedescarto el comportamiento del tipo lımr→0Rl,k (r) = 1/rl+1. Por tanto solo tenemos una solucion linealmenteindependiente para cada El,k. Debemos tambien considerar el comportamiento de las soluciones para r → ∞. SiV (r) → 0 cuando r → ∞ los valores de El,k para los cuales la solucion clasica es acotada ( y que cuanticamentecumplen la condicion 12.38) forman un conjunto discreto, como veremos mas adelante para el atomo de Hidrogeno.

Si asumimos que los operadores H,L2 y L3 son observables, la discusion anterior nos muestra que consti-tuyen un C.S.C.O. ya que para valores fijos de El,k solo hay una funcion radial linealmente independiente, ypara l y m fijos la funcion angular (armonico esferico) es unica. Por tanto, para un conjunto dado de autovaloresEl,k, l (l + 1) ~2,m~ existe una unica funcion normalizada (dentro de factores de fase) del tipo ϕl,m,k (r). El auto-valor de L2 dictamina la forma especıfica de la ecuacion radial, el autovalor de H nos determina la funcion radialRl,k (r) de forma unica y m determina junto con l el armonico esferico (solucion angular).

Page 302: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 13

Atomos hidrogenoides

El problema de mayor interes de la interaccion central entre dos cuerpos lo constituyen los atomos Hidrogenoidesconsistentes en un nucleo y un electron. Tal es el caso del atomo de Hidrogeno y sus isotopos el deuterio y el tritio.Ası mismo tambien son atomos hidrogenoides los iones con un solo electron como el He+, Li++ etc. Veremos masadelante que los atomos alcalinos (con un solo electron en el ultimo nivel de energıa) se pueden tratar tambien comoHidrogenoides si consideramos que los electrones internos actuan como un apantallamiento del nucleo y que el sistemanucleo-electrones internos actua como un “nucleo efectivo” para el electron externo. De momento trabajaremos conel caso mas simple.

13.1. El atomo de Hidrogeno

El atomo de Hidrogeno consiste en un electron y un proton que interactuan de manera esencialmente elec-trostatica, es decir bajo un potencial de la forma

V (r) = − q2

4πε0r= −e

2

r;

q2

4πε0≡ e2

siendo r la distancia entre el proton y el electron, q corresponde a la carga electronica en unidades SI en tanto que ees el valor en unidades cgs. Numericamente tenemos los siguientes valores aproximados para la masa mp del proton,me del electron y la carga q del proton

mp = 1,7 × 10−27kg ; me = 0,91 × 10−30kg ; q = 1,6 × 10−19Coulombs

puesto que se trata de dos partıculas sujetas a una interaccion central, podemos reducirlo al problema de unapartıcula relativa de masa µ y donde el vector posicion de la partıcula imaginaria es el vector posicion relativo entrelas dos. Usaremos un Hamiltoniano del tipo (12.15)

H (r,p) =p2

2µ− e2

r

puesto que mp >> me la masa reducida del sistema sera practicamente la masa del electron

µ ≡ memp

mp +me=

me

1 + memp

∼= me

(1 − me

mp

)∼= me

y el centro de masa del sistema esta practicamente en la posicion del proton. Por tanto la partıcula imaginariaasociada al centro de masa, tiene practicamente las caracterısticas del proton (la masa del proton es casi la masatotal del sistema y el centro de masa esta practicamente en la posicion del proton). La partıcula imaginaria de masareducida tiene practicamente las caracterısticas del electron, ya que la masa reducida del sistema es casi la masadel electron y la posicion del electron con respecto al centro de masa es practicamente su posicion con respecto alproton. Adoptaremos la posicion de que el proton esta en el centro de masa y que el electron es la partıcula relativa.

Con el fin de fijar el valor de ciertos parametros, usaremos el modelo semi-clasico de Bohr que si bien no escompatible con nuestros postulados, permitira definir conceptos y parametros utiles para el estudio de los espectros

302

Page 303: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

13.2. PROBLEMA DE VALORES PROPIOS DEL ATOMO DE HIDROGENO 303

atomicos. Dentro de este modelo el electron viaja en una orbita circular de radio r alrededor del proton, la energıatotal es la energıa cinetica mas la potencial electrostatica y obedece la segunda ley de Newton. Adicionalmente, elmomento angular del electron esta cuantizado en unidades de ~, estas suposiciones se condensan en

E =1

2µv2 + V (r) ; µ

v2

r= −∇V (r) ; l = n~ ; V (r) = −e

2

r

E =1

2µv2 − e2

r; µ

v2

r=e2

r2; µvr = n~ ; n entero positivo

las orbitas posibles son solo aquellas que cumplen la regla de cuantizacion del momento angular. Con este postuladoBohr explico la existencia de niveles discretos de energıa. Calculemos los valores cuantizados de En, rn y vn. Paraello primero se calcula la energıa de ionizacion EI que es la energıa que se le debe dar al atomo de Hidrogeno en suestado base para remover su electron. Tambien se pueden estimar con base en el modelo, el radio del atomo para elestado base (radio de Bohr a0) y la velocidad del electron v0 en el estado base, tales cantidades dan

EI =µe4

2~2; a0 =

~2

µe2; v0 =

e2

~(13.1)

con estos parametros de entrada los valores cuantizados de En, rn y vn son

En = − 1

n2EI ; rn = n2a0 ; vn =

1

nv0 (13.2)

los valores experimentales de EI y de los niveles de energıa En estuvieron en concordancia con la teorıa de Bohr.Un estimativo de la energıa de ionizacion y del radio que caracteriza las dimensiones atomicas es

EI ∼= 13,6eV , a0∼= 0,52 A

puede verse que el principio de incertidumbre explica la existencia de un estado base estable y permite ademas laestimacion del orden de magnitud de la energıa base y de la extension espacial de su funcion de onda.

13.2. Problema de valores propios del atomo de Hidrogeno

Dado que el potencial es central, podemos aplicar los resultados del capıtulo 12. En la representacion |r〉 laecuacion de valores propios del Hamiltoniano es

[− ~2

2m∇2 − e2

r

]ϕ (r) = Eϕ (r)

la funcion propia ϕ (r) admite la forma

ϕl,m,k (r) =1

rul,k (r)Ylm (θ, ϕ)

donde ul,k (r) esta dado por la ecuacion (12.33)

[− ~2

d2

dr2+l (l + 1) ~2

2µr2− e2

r

]ul,k (r) = El,kul,k (r) (13.3)

a la cual le debemos agregar la condicion (12.38)

ul,k (0) = 0 (13.4)

El espectro de H posee una parte discreta (energıas negativas) y una parte contınua (energıas positivas). El espectrocontınuo esta asociado con el hecho de que para E > 0 la region accesible clasica no esta acotada, en este casolas autofunciones asociadas no seran de cuadrado integrable. En contraste, para E < 0, la naturaleza discreta delespectro esta asociada con el hecho de que la region accesible clasicamente es acotada, en tal caso las funcionespropias son de cuadrado integrable.

Page 304: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

304 CAPITULO 13. ATOMOS HIDROGENOIDES

Es comodo trabajar de modo que a0 y EI sean las unidades de longitud y energıa, lo cual se logra introduciendolos parametros adimensionales

ρ =r

a0; λl,k =

√−El,kEI

(13.5)

Vamos a examinar los estados acotados de energıa negativa por lo cual el signo negativo dentro del radical es dehecho necesario. Usando la primera de las Ecs. (13.5) en la ecuacion radial (13.3), esta se escribe como

[− ~2

d2

d (a0ρ)2 +

l (l + 1) ~2

2µ (a0ρ)2 − e2

a0ρ

]ul,k (ρ) = El,kul,k (ρ)

[− ~2

2µa20

d2

dρ2+l (l + 1) ~2

2µa20

1

ρ2− e2

a0ρ−El,k

]ul,k (ρ) = 0

multiplicando la ecuacion por −2µa20/~

2 se obtiene

d2

dρ2− l (l + 1)

ρ2+

2µa0

~2

e2

ρ+

2µa20

~2El,k

ul,k (ρ) = 0

y usando las Ecs. (13.1)

d2

dρ2− l (l + 1)

ρ2+

~2

(~2

µe2

)e2

ρ+

~2

(~2

µe2

)2

El,k

ul,k (ρ) = 0

d2

dρ2− l (l + 1)

ρ2+

2

ρ+

2~2

µe4El,k

ul,k (ρ) = 0

d2

dρ2− l (l + 1)

ρ2+

2

ρ−(−El,kEI

)ul,k (ρ) = 0

finalmente usando la segunda de las Ecs. (13.5) la ecuacion radial queda

[d2

dρ2− l (l + 1)

ρ2+

2

ρ− λ2

l,k

]ul,k (ρ) = 0 (13.6)

Un analisis asintotico cualitativo del comportamiento de ul,k (ρ) nos permitira simplificar la forma de la Ec.(13.6). Cuando ρ → ∞, los terminos proporcionales a 1/ρ y 1/ρ2 se vuelven despreciables y la Ec. (13.6) seconvierte en [

d2

dρ2− λ2

l,k

]ul,k (ρ) = 0

cuyas soluciones son e±ρλl,k . Sin embargo, mas adelante veremos que incluso en este lımite no se puede despreciarcompletamente a los terminos 1/ρ y 1/ρ2 lo cual nos llevara a soluciones del tipo ρne±ρλl,k .

No obstante, este analisis asintotico cualitativo permite encontrar una forma aproximada de la solucion esperadaen la asıntota. Notese que la solucion eρλl,k es divergente en ρ → ∞ lo cual nos permite predecir que este tipo desolucion sera descartada. Todo lo anterior nos induce a realizar el siguiente cambio de variable

ul,k (ρ) = e−ρλl,kyl,k (ρ) (13.7)

naturalmente este cambio de variable no significa ninguna perdida de generalidad, ni descarta ningun tipo desolucion. Simplemente, parece simplificar a priori la forma funcional de la solucion que de antemano consideramoscomo aceptable. Realizando el cambio de variable (13.7) en la Ec. (13.6) nos queda

d2

dρ2

[e−ρλl,kyl,k (ρ)

]+

[− l (l + 1)

ρ2+

2

ρ− λ2

l,k

]e−ρλl,kyl,k (ρ) = 0 (13.8)

Page 305: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

13.3. SOLUCION DE LA ECUACION RADIAL POR SERIES DE POTENCIAS 305

calculamos la derivada

d2

dρ2

[e−ρλl,kyl,k (ρ)

]=

d

[−λl,ke−ρλl,kyl,k (ρ) + e−ρλl,k

dyl,k (ρ)

]

=

[(−λl,k)2 e−ρλl,kyl,k (ρ) − λl,ke

−ρλl,k dyl,k (ρ)

−λl,ke−ρλl,kdyl,k (ρ)

dρ+ e−ρλl,k

d2yl,k (ρ)

dρ2

]

= e−ρλl,k[λ2l,k − 2λl,k

d

dρ+

d2

dρ2

]yl,k (ρ)

reemplazando esta derivada en (13.8) se obtiene

e−ρλl,k[λ2l,k − 2λl,k

d

dρ+

d2

dρ2− l (l + 1)

ρ2+

2

ρ− λ2

l,k

]yl,k (ρ) = 0

simplificando y reorganizando queda finalmente

d2

dρ2− 2λl,k

d

dρ+

[2

ρ− l (l + 1)

ρ2

]yl,k (ρ) = 0 (13.9)

y la condicion (13.4) queda

yl,k (0) = 0 (13.10)

13.3. Solucion de la ecuacion radial por series de potencias

13.3.1. Serie de potencias radial y relaciones de recurrencia

Consideraremos la expansion de yl,k (ρ) en series de potencias

yl,k (ρ) = ρs∞∑

q=0

cqρq (13.11)

donde por definicion c0 es el primer coeficiente no nulo en la expansion

c0 6= 0

La condicion (13.10) implica que s es estrictamente positivo. De modo que s es la mımima potencia de ρ que apareceen la expansion (13.11). Calculemos la primera y segunda derivada de la expansion (13.11)

dyl,k (ρ)

dρ=

d

∞∑

q=0

cqρq+s

=

∞∑

q=0

(q + s) cqρq+s−1 (13.12)

d2yl,k (ρ)

dρ2=

d

∞∑

q=0

(q + s) cqρq+s−1

=

∞∑

q=0

(q + s) (q + s− 1) cqρq+s−2 (13.13)

reemplazando (13.11, 13.12, 13.13) en (13.9) resulta

d2yl,k (ρ)

dρ2− 2λl,k

dyl,k (ρ)

dρ+

[2

ρ− l (l + 1)

ρ2

]yl,k (ρ) = 0

∞∑

q=0

(q + s) (q + s− 1) cqρq+s−2 − 2λl,k

∞∑

q=0

(q + s) cqρq+s−1 +

[2

ρ− l (l + 1)

ρ2

] ∞∑

q=0

cqρq+s = 0

Page 306: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

306 CAPITULO 13. ATOMOS HIDROGENOIDES

∞∑

q=0

(q + s) (q + s− 1) cqρq+s−2 − 2λl,k

∞∑

q=0

(q + s) cqρq+s−1 +

∞∑

q=0

2cqρq+s−1 − l (l + 1)

∞∑

q=0

cqρq+s−2 = 0

∞∑

q=0

[(q + s) (q + s− 1) − l (l + 1)] cqρq+s−2 +

∞∑

q=0

[2 − 2λl,k (q + s)] cqρq+s−1 = 0

escribiendo separadamente el primer termino de la primera sumatoria

0 = [s (s− 1) − l (l + 1)] c0ρs−2 +

∞∑

q=1

[(q + s) (q + s− 1) − l (l + 1)] cqρq+s−2

+∞∑

q=0

[2 − 2λl,k (q + s)] cqρq+s−1 (13.14)

para la primera sumatoria hacemos q ′ = q − 1 de modo que

∞∑

q=1

[(q + s) (q + s− 1) − l (l + 1)] cqρq+s−2 =

∞∑

q′=0

[(q′ + s+ 1

) (q′ + s

)− l (l + 1)

]cq′+1ρ

q′+s−1 (13.15)

reemplazando (13.15) en (13.14) y teniendo en cuenta que los ındices son mudos resulta

0 = [s (s− 1) − l (l + 1)] c0ρs−2 +

∞∑

q=0

[(q + s+ 1) (q + s) − l (l + 1)] cq+1ρq+s−1

+∞∑

q=0

2 [1 − λl,k (q + s)] cqρq+s−1

[s (s− 1) − l (l + 1)] c0ρs−2 +

∞∑

q=0

[(q + s+ 1) (q + s) − l (l + 1)] cq+1 + 2 [1 − λl,k (q + s)] cq ρq+s−1 = 0

para que la serie sea cero para todo ρ, es necesario y suficiente que cada coeficiente de la expansion sea cero lo cualnos conduce a

[s (s− 1) − l (l + 1)] c0 = 0

[(q + s+ 1) (q + s) − l (l + 1)] cq+1 + 2 [1 − λl,k (q + s)] cq = 0 ; q = 0, 1, . . . ,∞

que se pueden reescribir como

(s− l − 1) (s+ l) c0 = 0 (13.16)

[(q + s+ 1) (q + s) − l (l + 1)] cq+1 = 2 [λl,k (q + s) − 1] cq ; q = 0, 1, . . . ,∞ (13.17)

y teniendo en cuenta que c0 6= 0 por definicion, la Ec. (13.16) nos dice que s solo puede tomar dos valores

s = l + 1 o s = −l

pero recordando que s debe ser estrictamente positivo para garantizar un comportamiento aceptable en el origen(condicion 13.10), el unico valor aceptable como solucion es

s = l + 1 (13.18)

Esto es consistente con la discusion de la seccion 12.5.2. Reemplazando s = l + 1 en (13.17) se obtiene

[(q + l + 2) (q + l + 1) − l (l + 1)] cq+1 = 2 [λl,k (q + l + 1) − 1] cq ; q = 0, 1, . . . ,∞

haciendo q′ = q + 1 esta relacion se convierte en

[(q′ + l + 1

) (q′ + l

)− l (l + 1)

]cq′ = 2

[λl,k

(q′ + l

)− 1]cq′−1 ; q′ = 1, 2, . . . ,∞

Page 307: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

13.3. SOLUCION DE LA ECUACION RADIAL POR SERIES DE POTENCIAS 307

teniendo en cuenta que q′ es ındice mudo y reorganizando terminos se obtiene

q (q + 2l + 1) cq = 2 [(q + l)λl,k − 1] cq−1 ; q = 1, 2, . . . ,∞ (13.19)

la Ec. (13.19) define una relacion de recurrencia para los coeficientes de la expansion (13.11). Si fijamos c0 podemoscalcular todos los demas coeficientes con esta recurrencia. Por otro lado, de la Ec. (13.19) se obtiene

cqcq−1

=2 [(q + l) λl,k − 1]

q (q + 2l + 1)(13.20)

que claramente tiende a cero cuando q → 0, por tanto la serie converge para todo ρ (criterio del cociente paraseries). Por tanto, hemos determinado para todo λl,k una solucion de (13.9) que satisface la condicion (13.10).

13.3.2. Condicion asintotica ρ → ∞ y truncamiento de la serie

Ya hemos mirado la condicion en el origen pero no en ρ → ∞. Si el termino entre parentesis a la derecha de(13.19) no es cero para ningun valor entero q, la expansion (13.11) sera una verdadera serie ya que la relacion derecurrencia generara infinitos coeficientes cq, para q grande podemos ver de (13.20) que

lımq→∞

cqcq−1

=2qλl,kq2

→ 2λl,kq

(13.21)

ahora la expansion en series de potencias de la funcion e2ρλl,k es

e2ρλl,k =

∞∑

q=0

dqρq ; dq =

(2λl,k)q

q!⇒ dq

dq−1=

2λl,kq

(13.22)

comparando (13.21) con (13.22) se puede demostrar que para valores grandes de ρ, la serie se comporta en la formae2ρλl,k . De la Ec. (13.7), la funcion radial ul,k (r) se comporta como

ul,k (ρ) ∼ eρλl,k

la cual no es fısicamente aceptable1. Por tanto, no es aceptable una solucion en serie (cantidad infinita de terminosno nulos). En consecuencia, es necesario que la expansion (13.11) sea truncada y se convierta en una sumatoria(polinomio). En tal caso la Ec. (13.7) nos dice que el comportamiento asintotico de u l,k (r) es el producto de unpolinomio por una funcion e−ρλl,k el cual es aceptable.

Definiremos ck como el primer coeficiente nulo de la expansion. Esto equivale a decir que existe un valorentero positivo k tal que ck−1 6= 0, pero el termino entre parentesis a la derecha de (13.19) es cero para q = k. Ental caso, la relacion de recurrencia (13.19), nos indica que el coeficiente ck sera nulo y que los terminos subsecuentestambien seran nulos. La expansion (13.11) sera un polinomio ya que la relacion de recurrencia generara un numerofinito de coeficientes cq. Para un valor fijo de l, rotulamos el correspondiente valor de λl,k con este entero k. Es claroque k ≥ 1, puesto que c0 6= 0. Igualando a cero el termino entre parentesis a la derecha de (13.19) cuando q = k seobtiene

λl,k =1

l + k(13.23)

reemplazando estos valores permitidos de λl,k en la Ec. (13.5) para la energıa se obtiene

1

l + k=

√−El,kEI

El,k = − EI

(l + k)2; k = 1, 2, 3, . . . (13.24)

1Esta funcion radial diverge cuando ρ → ∞. Ademas no es de cuadrado integrable, en tanto que para soluciones de energıa negativa(acotadas clasicamente), se esperan funciones de cuadrado integrable. Ademas, estas funciones ni siquiera son ortonormales en el sentidoextendido.

Page 308: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

308 CAPITULO 13. ATOMOS HIDROGENOIDES

Tomando en cuenta (13.11, 13.18), y el hecho de que cq = 0 para q ≥ k, la funcion yl,k (ρ) queda en la forma

yl,k (ρ) = ρl+1k−1∑

q=0

cqρq (13.25)

tenemos entonces que yl,k (ρ) es un polinomio donde la menor potencia es ρl+1 y la maxima potencia es ρl+k.

13.3.3. Coeficientes del polinomio radial en terminos de c0

La relacion de recurrencia (13.19) permite encontrar los coeficientes del polinomio a partir de c0, reemplazando(13.23) en (13.19) la relacion de recurrencia queda

q (q + 2l + 1) cq = 2

[(q + l)

1

l + k− 1

]cq−1 =

2 (q + l) − 2 (l + k)

(l + k)cq−1

q (q + 2l + 1) cq =2q + 2l − 2l − 2k

(l + k)cq−1

cq = − 2 (k − q)

q (q + 2l + 1) (l + k)cq−1 (13.26)

demostraremos por induccion que

cq = (−1)q(

2

l + k

)q (k − 1)!

(k − q − 1)!

(2l + 1)!

q! (q + 2l + 1)!c0 (13.27)

primero para q = 1, la relacion (13.26) nos dice que2

c1 = − 2 (k − 1)

1 × (1 + 2l + 1) (l + k)c0 = −

(2

l + k

)(k − 1)

1

1 × (1 + 2l + 1)c0

c1 = (−1)1(

2

l + k

)1 (k − 1)!

(k − 2)!

(2l + 1)!

1! × (1 + 2l + 1)!c0

c1 = (−1)1(

2

l + k

)1 (k − 1)!

(k − 1 − 1)!

(2l + 1)!

1! (1 + 2l + 1)!c0 (13.28)

comparando (13.28) con (13.27) vemos que (13.27) se cumple para q = 1. Ahora asumimos que se cumple para q ydemostraremos que se cumple para q + 1. Usando (13.26) con q → q + 1 se obtiene

cq+1 = − 2 (k − q − 1)

(q + 1) (q + 2l + 2) (l + k)cq

cq = −(q + 1) (q + 2l + 2) (l + k)

2 (k − q − 1)cq+1 (13.29)

reemplazando (13.29) en (13.27) tenemos

cq = (−1)q(

2

l + k

)q (k − 1)!

(k − q − 1)!

(2l + 1)!

q! (q + 2l + 1)!c0

−(q + 1) (q + 2l + 2) (l + k)

2 (k − q − 1)cq+1 = (−1)q

(2

l + k

)q (k − 1)!

(k − q − 1)!

(2l + 1)!

q! (q + 2l + 1)!c0

cq+1 = (−1) (−1)q2

(l + k)

(2

l + k

)q (k − 1)! (k − q − 1)

(k − q − 1)!

(2l + 1)!

q! (q + 1) (q + 2l + 1)! (q + 2l + 2)c0

cq+1 = (−1)q+1

(2

l + k

)q+1 (k − 1)!

(k − q − 2)!

(2l + 1)!

(q + 1)! (q + 2l + 2)!c0

cq+1 = (−1)q+1

(2

l + k

)q+1 (k − 1)!

[k − (q + 1) − 1]!

(2l + 1)!

(q + 1)! [(q + 1) + 2l + 1]!c0 (13.30)

2Tambien podemos ver que para q = 0, la Ec. (13.27) conduce a c0 = c0. Por tanto podemos comenzar la induccion con q = 0.

Page 309: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

13.3. SOLUCION DE LA ECUACION RADIAL POR SERIES DE POTENCIAS 309

comparando (13.30) con (13.27) vemos que si la relacion (13.27) se cumple para q entonces se cumple para q+ 1, locual demuestra la validez de (13.27).

13.3.4. Calculo de c0 y de la funcion radial para l = 0, k = 1

Ahora falta evaluar a c0, lo cual se logra con la ecuacion de normalizacion (12.40). Notese que la Ec. (13.23)nos dice que l = k = 0 esta prohibido, por tanto calcularemos explıcitamente la funcion radial mas simple que esul=0,k=1 (r). Comenzaremos empleando las ecuaciones (13.25) con l = 0, k = 1

yl,k (ρ) = ρl+1k−1∑

q=0

cqρq ⇒ y01 (ρ) = ρ0+1

0∑

q=0

cqρq = c0ρ

verifiquemos explıcitamente que ck = c1 = 0. Usando (13.26) para l = 0 y q = k = 1 se obtiene

cq = − 2 (k − q)

q (q + 2l + 1) (l + k)cq−1 ⇒ c1 = − 2 (1 − 1)

1 × [1 + 2 (0) + 1] (0 + 1)c0 = 0

ahora usando (13.7, 13.23) y la relacion entre ρ y r Ec. (13.5)

u0,1 (ρ) = e−ρλ0,1y0,1 (ρ) ; λ0,1 =1

0 + 1= 1 ⇒ u0,1 (ρ) = c0ρe

−ρ

u0,1 (r) =c0a0re−r/a0

finalmente usamos la ecuacion de normalizacion (12.40) y elegimos c0 con fase cero (constante real positiva)

∫ ∞

0|ul,k (r)|2 dr = 1 ⇒

∫ ∞

0|u01 (r)|2 dr = 1 ⇒ c20

a20

∫ ∞

0r2e−2r/a0dr = 1

∫ ∞

0r2e−2r/a0dr = −1

4a0e

− 2a0r (a2

0 + 2a0r + 2r2)∣∣∣∣

0

=1

4a3

0 ⇒

c20a30

4a20

= 1 ⇒ c20a0

4= 1

c(0,1)0 =

2√a0

(13.31)

donde hemos tenido en cuenta que c0 en general depende de los valores de l y k. Finalmente la funcion radial Rl,k (r)esta dada por (12.32), para el caso de l = 0, k = 1 se tiene que

R0,1 (r) =1

ru0,1 (r) =

1

r

c(0,1)0

a0re−r/a0 =

2√a0

1

a0e−r/a0

R0,1 (r) =2

a3/20

e−r/a0

13.3.5. Calculo de c0 y de la funcion radial para l = 0, k = 2

Calculemos ahora Rl,k (r) con l = 0, k = 2. Usando las Ecs. (13.25) con l = 0, k = 2

yl,k (ρ) = ρl+1k−1∑

q=0

cqρq ⇒ y0,2 (ρ) = ρ0+1

1∑

q=0

cqρq = ρ (c0 + c1ρ)

usando (13.26) para l = 0, k = 2, q = 1, 2 se obtiene

cq = − 2 (k − q)

q (q + 2l + 1) (l + k)cq−1 ⇒ c1 = − 2 (2 − 1)

(1 + 1) (0 + 2)c0 = −1

2c0 ⇒

c2 = − 2 (2 − 2)

2 (2 + 1) (0 + 2)c1 = 0

Page 310: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

310 CAPITULO 13. ATOMOS HIDROGENOIDES

verificando una vez mas que ck = c2 = 0. Con estos coeficientes y0,2 (ρ) queda

y0,2 (ρ) = ρ

(c0 −

1

2c0ρ

)= c0ρ

(1 − 1

)

y usando (13.7, 13.23, 13.5)

u0,2 (ρ) = e−ρλ02y0,2 (ρ) ; λ0,2 =1

0 + 2=

1

2⇒ u0,2 (ρ) = c0ρ

(1 − 1

)e−

12ρ

u0,2 (r) = c0r

a0

(1 − r

2a0

)e− r

2a0 (13.32)

ahora debemos calcular el c0 que normaliza a u0,2 (r) de acuerdo con las Ecs. (13.32, 12.40) eligiendo fase cero parac0 ∫ ∞

0|u0,2 (r)|2 dr = 1 ⇒ c20

∫ ∞

0

(r

a0

)2(1 − r

2a0

)2

e− ra0 dr = 1

evaluando la integral

∫ ∞

0

(r

a0

)2(1 − r

2a0

)2

e− ra0 dr = − 1

4a30

e− 1a0r (

8a40 + 8a3

0r + 4a20r

2 + r4)∣∣∣∣

0

= 2a0

por tanto

c20 (2a0) = 1 ⇒ c(0,2)0 =

1√2a0

reemplazando en (13.32) queda

u0,2 (r) =1√2a0

r

a0

(1 − r

2a0

)e− r

2a0 =2r

(2a0)3/2

(1 − r

2a0

)e− r

2a0

R0,2 (r) =2

(2a0)3/2

(1 − r

2a0

)e− r

2a0

13.3.6. Calculo de c0 y de la funcion radial para l = k = 1

Como ultimo ejemplo evaluamos Rl,k (r) para l = k = 1. Usando (13.25) con l = k = 1

yl,k (ρ) = ρl+1k−1∑

q=0

cqρq ; y1,1 (ρ) = ρ1+1

0∑

q=0

cqρq

y1,1 (ρ) = c0ρ2

usando (13.7, 13.23, 13.5)

u1,1 (ρ) = e−ρλ1,1y1,1 (ρ) ; λ1,1 =1

1 + 1=

1

2⇒ u1,1 (r) = c0

r2

a20

e− r

2a0 (13.33)

normalizando u1,1 (r) con las Ecs. (13.33, 12.40) con c0 positivo

∫ ∞

0|u1,1 (r)|2 dr = 1 ⇒ c20

∫ ∞

0

r4

a40

e− ra0 dr = 1

evaluando la integral

∫ ∞

0

(r4

a40

e− ra0

)dr = − 1

a30

e− ra0

(r4 + 4r3a0 + 12r2a2

0 + 24ra30 + 24a4

0

)∣∣∣∣∞

0

= 24a0

Page 311: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

13.4. PARAMETROS ATOMICOS 311

con lo cual resulta

c20 (24a0) = 1 ⇒ c(1,1)0 =

1√24a0

=1

2

1√6a0

quedando

u1,1 (r) =1

2

1√6a0

r2

a20

e− r

2a0 =1

2√

2√

3

r2

a5/20

e− r

2a0 =1

(2a0)3/2

√3

r2

a0e− r

2a0

quedando finalmente

R1,1 (r) =1

(2a0)3/2

1√3

r

a0e− r

2a0

La Ec. (13.24) nos muestra que en el atomo de Hidrogeno, l y k no definen un nivel de energıa por separado, esconveniente introducir un numero cuantico de la forma

n ≡ l + k (13.34)

de modo que n determina unıvocamente el valor de la energıa segun se observa en (13.24) ya que en tal caso tenemos

En = −EIn2

; n = 1, 2, 3, . . .

Puesto que determinar n y l es equivalente a determinar k y l, sera mas conveniente reemplazar a k por n. Enconsecuencia, utilizaremos los numeros cuanticos n, l,m en lugar de k, l,m de aquı en adelante. En virtud de que ndefine la energıa, se denomina el numero cuantico principal, de aquı en adelante citaremos los numeros cuanticosusando primero el numero cuantico principal, luego el numero cuantico azimutal y finalmente el numero cuanticomagnetico i.e. n, l,m.

13.4. Parametros atomicos

Las formulas para la funcion de onda han sido escritas tomando a a0 (radio de Bohr) como unidad de longitudque nos dara una idea de la extension espacial de las funciones de onda de los estados acotados del atomo deHidrogeno. Similarmente, la energıa de ionizacion EI se utilizara para obtener el orden de magnitud de los nivelesde energıa. Las ecuaciones (13.1) se pueden reescribir como

EI =µe4

2~2=µe4c2

2~2c2=

1

2

(e2

~c

)2

µc2 ; a0 =~2

µe2=

~2c

µe2c=

~c

e2

(~

µc

)

que se pueden reescribir como

EI =1

2α2µc2 , a0 =

1

αλel ; α ≡ e2

~c=

q2

4πε0~c; λel ≡

~

µc(13.35)

la constante adimensional α se conoce como constante de estructura fina. Por otro lado puesto que µ ' me se tieneque λel es aproximadamente la longitud de onda de compton del electron. Numericamente

α ' 1

137; λel '

~

mec' 3,8 × 10−3A

la segunda de las Ecs. (13.35) nos dice que el radio de Bohr (radio atomico tıpico) es unas dos ordenes de magnitudmayor que la longitud de onda de Compton del electron. La primera de las Ecs. (13.35) se escribe numericamentecomo

EI ' 1

2α2mec

2 ' 1

2

(1

137

)2

mec2 ⇒ EI ' 2. 7 × 10−5mec

2

mec2 ' 0,5 × 106eV

de modo que la energıa de enlace tıpica de un atomo es unas 10−5 veces menor que la energıa en reposo delelectron mec

2.EI << mec

2

esta relacion es indispensable para poder justificar una aproximacion no relativista al problema. Los efectos rela-tivistas son pequenos pero observables. Debido a que los efectos relativistas son pequenos pueden calcularse a travesde la teorıa de perturbaciones.

Page 312: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

312 CAPITULO 13. ATOMOS HIDROGENOIDES

13.5. Resumen de resultados

Para el atomo de Hidrogeno, que es un problema de dos cuerpos (un proton y un electron) reducimos el problemaal de una partıcula equivalente de masa aproximadamente igual a la masa me del electron (masa reducida µ delsistema) y en donde el centro de masa esta aproximadamente en la posicion del proton. Es conveniente expresar losresultados en terminos del radio de Bohr a0 y la energıa de ionizacion EI los cuales en terminos de las constantesfısicas universales vienen dados por

EI =µe4

2~2=

1

2α2µc2 ; a0 =

~2

µe2=

1

α

(~

µc

)' 1

αλel (13.36)

α ≡ e2

~c=

q2

4πε0~c; λel ≡

~

mec(13.37)

Siendo α la constante de estructura fina y λel la longitud de onda de Compton del electron. Teniendo en cuenta laEc. (13.34)

n ≡ l + k

enunciaremos los resultados en terminos de los numeros cuanticos n, l,m. Un estado sera rotulado usando el orden|n, l,m〉, es decir usando primero el numero cuantico principal n, luego el numero cuantico azimutal l y finalmenteel numero cuantico magnetico m.

La funcion de onda asociada es de la forma

ϕn,l,m (r, θ, ϕ) = Rn,l (r)Ylm (θ, ϕ) =un,l (r)

rYlm (θ, ϕ) (13.38)

un,l (ρ) = e−ρλnyn,l (ρ) ; ρ ≡ r

a0; λn ≡

√−EnEI

=1

n; Ylm (θ, ϕ) = Zl,m (θ)

eimϕ√2

(13.39)

y los valores de energıa son

En = −EIn2

; n = 1, 2, 3, . . . (13.40)

siendo Ylm (θ, ϕ) los armonicos esfericos. La solucion de la funcion radial yn,l (ρ) es un polinomio dado por

yn,l (ρ) = ρl+1n−l−1∑

q=0

cqρq (13.41)

donde los coeficientes cq se pueden encontrar a partir de c0, con la siguiente formula de recurrencia

cq = − 2 (n− l − q)

q (q + 2l + 1)ncq−1 (13.42)

cq = (−1)q(

2

n

)q (n− l − 1)!

(n− l − q − 1)!

(2l + 1)!

q! (q + 2l + 1)!c0 (13.43)

finalmente la constante c0 (que en general depende de los valores de n y l) se determina como constante de normal-izacion para la funcion radial un,l (r) ∫ ∞

0|un,l (r)|2 dr = 1 (13.44)

a manera de ejemplo escribimos explıcitamente algunas funciones radiales

Rn=1,l=0 (r) = 2 (a0)−3/2 e−r/a0 ; R2,0 (r) = 2 (2a0)

−3/2

(1 − r

2a0

)e− r

2a0 (13.45)

R2,1 (r) = (2a0)−3/2 1√

3

r

a0e− r

2a0 (13.46)

Page 313: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

13.6. DISCUSION DE LOS RESULTADOS 313

13.6. Discusion de los resultados

La Ec. (13.40) nos da el espectro de energıas del atomo de Hidrogeno

El,k = − EI

(l + k)2; k = 1, 2, 3, ... (13.47)

y nos muestra que para un l fijo existen infinitos valores de energıa asociados a k = 1, 2, 3, .... Adicionalmente,para cada par l, k la energıa posee al menos una degeneracion de orden 2l + 1 debido a los diferentes valores dem asociados a l fijo, esta degeneracion debida a la ausencia del numero cuantico m en la ecuacion radial, se denominadegeneracion esencial puesto que es propia de cualquier interaccion central. No obstante, tambien estan presentesdegeneraciones accidentales propias de la interaccion especıfica, ya que la Ec. (13.47) nos dice que dos autovaloresEl,k y El′,k′ asociados a ecuaciones radiales distintas (l 6= l ′) seran iguales si l′ + k′ = l + k.

Usando ahora los numeros cuanticos n, l,m, la Ec. (13.47) queda

En = −EIn2

(13.48)

utilizando la terminologıa espectroscopica un valor de n especifica una capa o nivel electronico.

Puesto que k es un entero positivo, hay un numero finito de valores de l asociados a un valor dado de n. De ladefinicion de n Ec. (13.34) y los valores permitidos de k (1, 2, 3, ...) es claro que

l = 0, 1, 2, ..., n − 1 ; n = 1, 2, 3, ...

Cada combinacion especıfica n, l se denomina una subcapa o subnivel electronico. Puesto que hay n valores de lpara un n dado se dice que cada capa o nivel n contiene n subcapas o subniveles. Ahora bien, puesto que L2, L3 yH forman un C.S.C.O. se tiene que un estado esta definido unıvocamente por una tripla (n, l,m). En consecuencia,cada subnivel (n, l) contiene 2l + 1 estados diferentes asociados a los diferentes valores de m para l fijo.

Dado que n especifica unıvocamente a la energıa y (n, l,m) especifica completamente al estado, la degeneracionde la energıa para un n dado es el numero total de valores de l,m para dicho valor de n

gn =

n−1∑

l=0

(2l + 1) =

(2

n−1∑

l=0

l

)+ n =

2n (n− 1)

2+ n

gn = n2

veremos mas adelante que la presencia del momento angular intrınseco del electron nos duplica este valor. Si tenemosen cuenta adicionalmente el espın del proton, tendrıamos un factor de dos adicional.

Usando una vez mas la notacion espectroscopica, los valores de l se denotan con una letra del alfabeto en lasiguiente forma

l = 0 ↔ s , l = 1 ↔ p , l = 2 ↔ d , l = 3 ↔ f , l = 4 ↔ g

la notacion espectroscopica rotula un subnivel por el numero n seguido por la letra que caracteriza al valor de l.Por ejemplo, para el nivel base n = 1 (que no es degenerado segun la Ec. (13.48) y que se conoce como “nivel K”)solo l = 0 es posible, de modo que solo tiene el subnivel 1s. El primer estado excitado n = 2 (conocido como “nivelL”) permite l = 0, 1 de modo que contiene los subniveles 2s y 2p. El segundo estado excitado (“nivel M”) posee lossubniveles 3s, 3p, 3d.

Hemos visto que un estado se especifica con los numeros cuanticos n, l,m. Donde n, l especifica la dependenciaradial y l,m la dependencia angular. Veamos ahora las caracterısticas de la dependencia angular.

13.6.1. Dependencia angular

Si bien la funcion de onda

ϕ (r, θ, ϕ) = Rn,l (r)Ylm (θ, ϕ) = Rn,l (r)Zl,m (θ)eimϕ√

2

Page 314: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

314 CAPITULO 13. ATOMOS HIDROGENOIDES

depende de ambos angulos, puesto que la mayorıa de observables dependen del modulo al cuadrado de la funcionde onda, debemos calcular la dependencia angular de |Ylm (θ, ϕ)|2 este modulo nos da

|Ylm (θ, ϕ)|2 =

∣∣∣∣Zl,m (θ)eimϕ√

2

∣∣∣∣2

=1

2|Zl,m (θ)|2

vemos entonces que este modulo al cuadrado tiene simetrıa azimutal. Por tanto se obtiene una superficie de rev-olucion alrededor del eje Z de cuantizacion. |Y00|2 es constante y por tanto esfericamente simetrico. |Y1m (θ, ϕ)|2 es

proporcional a cos2 θ; |Y2m (θ, ϕ)|2 es proporcional a(3 cos2 θ − 1

)2etc.

La funcion radial Rn,l (r) caracteriza a cada subnivel y se puede calcular con los resultados de la seccion 13.5introduciendo nuestro cambio de notacion de Rl,m,k (r) a Rn,l,m (r) .

El comportamiento de Rn,l (r) en la vencindad del origen es del tipo rl, de modo que solo los estados quepertenecen a un subnivel s (l = 0) tienen una densidad de probabilidad diferente de cero en el origen. A medidaque l aumenta, es mayor la region alrededor del proton para la cual la probabilidad de encontrar el electron esdespreciable, es de esperarse que esto aumente el valor esperado del radio atomico3. Esto tiene consecuencias enprocesos fısicos tales como la captura de electrones por nucleos y la estructura hiperfina de las lıneas espectrales.

Vale la pena recordar que el concepto de subnivel aparece en el modelo semiclasico de Sommerfeld que asignaa cada valor de n (numero cuantico de Bohr) un numero n de orbitas elıpticas de la misma energıa y diferentemomento angular. La orbita asociada al maximo momento angular para un n dado es circular. Puesto que el modelosemiclasico de Sommerfeld fue exitoso para predecir la degeneracion de los niveles de energıa, es logico pensar queel modelo de Bohr se reproduce para los estados con l = n− 1 (maximo valor del momento angular para n dado).En particular vamos a mostrar que para l = n− 1 se obtiene la segunda expresion (13.2) para los radios de Bohr.La probabilidad de encontrar al electron en un volumen dV que en coordenadas esfericas se caracteriza por

dV = r2 dr sin θ dθ dϕ = r2dr dΩ

estara dada por

dPn,l,m (r, θ, ϕ) = |ϕn,l,m (r, θ, ϕ)|2 r2 dr dΩ = |Rn,l (r)|2 r2 dr × |Yl,m (θ, ϕ)|2 dΩsi queremos encontrar la probabilidad de encontrar al electron entre r y r + dr dentro de un cierto angulo solidotenemos que esta probabilidad esta dada por

dPn,l,m (r) = |Rn,l (r)|2 r2 dr ×1

2

∫ ϕ2

ϕ1

∫ θ2

θ1

|Zl,m (θ)|2 sin θ dθ

dPn,l,m (r) = Ml,m |Rn,l (r)|2 r2 dr ; Ml,m ≡ ϕ2 − ϕ1

2

∫ θ2

θ1

|Zl,m (θ)|2 sin θ dθ (13.49)

donde [ϕ1, ϕ2] y [θ1, θ2] definen el intervalo de los angulos que generan el angulo solido dentro del cual se quiereevaluar la probabilidad.

Ahora evaluaremos esta probabilidad para l = n− 1. Aplicando l = n− 1 en (13.41)

yn,n−1 (ρ) = ρ(n−1)+10∑

q=0

cqρq = c0ρ

n

Con esto y usando la tercera de las Ecs. (13.39) se calcula la funcion radial

un,n−1 (ρ) = e−ρλn,n−1c0ρn ; λn =

1

n

un,n−1 (ρ) = c0e− ρnρn = c0e

− ra0n

(r

a0

)n

Rn,n−1 (r) = c0e− ra0n

1

r

(r

a0

)n=c0a0e− ra0n

a0

r

(r

a0

)n

Rn,n−1 (r) =c0a0

(r

a0

)n−1

e− ra0n (13.50)

3Esto se asemeja al comportamiento clasico en el cual el aumento de la magnitud del momento angular produce un aumento en elradio promedio de una orbita cerrada.

Page 315: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

13.6. DISCUSION DE LOS RESULTADOS 315

n→ ∞ E = 0 E = 0 E = 0 E = 0

n = 4 4s 4p 4d 4f

n = 3 3s 3p 3d

n = 2 2s 2p

n = 1 (E = EI) 1s

l = 0 (s) l = 1 (p) l = 2 (d) l = 3 (f)

Cuadro 13.1: Niveles de energıa (negativos) para estados acotados del atomo de hidrogeno. Los niveles sobre una filaposeen la misma energıa (mismo numero cuantico principal n). En n = 1 la energıa corresponde en valor absoluto ala energıa de ionizacion, y para n muy grande la energıa tiende a cero por la izquierda. A medida que se incrementan disminuye la brecha entre los valores de energıa permitidos.

nivel 1s ϕ1,0,0 (r) = 1√πa30

e−r/a0

nivel 2s ϕ2,0,0 (r) = 1√8πa30

(1 − r

2a0

)e−r/2a0

nivel 2p

ϕ2,1,1 (r) = − 1

8√πa30

ra0e−r/2a0 sin θ eiϕ

ϕ2,1,0 (r) = 1

4√

2πa30

ra0e−r/2a0 cos θ

ϕ2,1,−1 (r) = 1

8√πa30

ra0e−r/2a0 sin θ e−iϕ

Cuadro 13.2: Funciones de onda asociadas al estado base (n = 1) y al primer estado excitado (n = 2).

finalmente la probabilidad se obtiene de (13.49) y (13.50)

dPn,n−1,m (r) = Mn−1,m |Rn,n−1 (r)|2 r2 dr ; Mn−1,m ≡ ϕ2 − ϕ1

2

∫ θ2

θ1

|Zn−1,m (θ)|2 sin θ dθ

dPn,n−1,m (r) = Mn−1,m

[c0a0

(r

a0

)n−1

e− ra0n

]2

r2 dr = c20 Mn−1,m

[(r

a0

)n−1

e− ra0n

]2(r

a0

)2

dr

dPn,n−1,m (r) = c20 Mn−1,m e− 2ra0n

(r

a0

)2n−2 ( r

a0

)2

dr

la densidad de probabilidad radial para l = n− 1 es

ρn,n−1 (r) ≡ dPn,n−1,m (r)

dr= c20 Mn−1,m

(r

a0

)2n

e− 2ra0n

esta densidad de probabilidad tiene un maximo en

r = rn = n2a0

que es el radio de Bohr para una orbita de energıa En.La tabla 13.1, ilustra los niveles de energıa y la degeneracion de algunos estados. La tabla 13.2 muestra las

expresiones de la funcion de onda para los primeros niveles de energıa.

Page 316: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 14

Corrientes de probabilidad en atomoshidrogenoides, acoples con camposmagneticos

14.1. Corrientes de probabilidad para las soluciones estacionarias del atomode Hidrogeno

Siguiendo los resultados de la seccion 3.3.5, expresamos la funcion de onda estacionaria en forma polar

ϕ (r) = α (r) eiξ(r) ; α (r) ≥ 0, 0 ≤ ξ (r) < 2π (14.1)

de modo que la densidad de probabilidad ρ (r) y la densidad de corriente de probabilidad J (r) estan dadas por laEcs. (3.32, 3.33)

ρ (r) = α2 (r) ; J (r) =~

µα2 (r) ∇ξ (r) (14.2)

Teniendo en cuenta la estructura de las soluciones estacionarias Ecs. (13.38, 13.39) el modulo α (r) y la fase ξ (r)para las soluciones hidrogenoides estacionarias estan dadas por

αn.l,m (r) = |Rn,l (r)| |Ylm (θ, ϕ)| =1√2|Rn,l (r)| |Zlm (θ)| ; ξ (r) = mϕ (14.3)

es importante tener en cuenta que µ denota la masa y m denota el autovalor m~ de L3. Aplicando las Ecs. (14.2)y usando la expresion para el gradiente en coordenadas esfericas tenemos que:

Jn,l,m (r) =~

µα2 (r) ∇ξ (r) =

~

µρn,l,m (r)

[ur

∂r+ uθ

1

r

∂θ+ uϕ

1

r sin θ

∂ϕ

](mϕ)

Jn,l,m (r) =~

µρn,l,m (r)

m

r sin θuϕ (14.4)

donde uϕ es el vector unitario ortogonal al plano formado por r y u3 en el sentido en el cual se incrementa el anguloazimutal ϕ. La Ec. (14.4) nos dice que el sentido de rotacion de la corriente esta dictaminado por el signo de my de sin θ ya que las demas cantidades son todas positivas. La Ec. (14.4) nos dice que la corriente en cada puntoM definida por el vector posicion r, es perpendicular al plano definido por r y u3. El fluıdo de probabilidad rotaalrededor del eje X3. Puesto que |J| no es proporcional a r sin θ ρ (r) el sistema no rota como un todo. Es decir, lavelocidad angular de la corriente es diferente en cada punto. Si queremos ver la estructura de la corriente asociadaa un estado estacionario para un plano perpendicular a u3 (es decir para θ fijo) vemos que si sin θ > 0, tenemosrotacion del fluıdo de probabilidad alrededor de u3 en el sentido antihorario (horario) si m > 0, (m < 0). Si m = 0no hay corriente de probabilidad en ningun punto del espacio.

Tomemos un elemento de volumen d3r situado en el punto r, su contribucion al momento angular con respectoal origen (en el centro del nucleo) es:

dL = µr× Jn,l,m (r) d3r

316

Page 317: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

14.1. CORRIENTES DE PROBABILIDAD PARA LAS SOLUCIONES ESTACIONARIAS DEL ATOMO DE HIDROGENO317

el momento angular total se obtiene por integracion. Por simetrıa todas las componentes en X1 y X2 se anulan ysolo sobrevive la componente sobre X3 la cual vendra dada por

L3 = µ

∫d3r u3 · [r× Jn,l,m (r)] = m~

∫d3r

ρn,l,m (r)

r sin θu3 · [r× uϕ] = m~

∫d3r

ρn,l,m (r)

r sin θuϕ · [u3 × r]

= m~

∫d3r

ρn,l,m (r)

r sin θuϕ · [r sin θ uϕ] = m~

∫d3r ρn,l,m (r) = m~

∫d3r |ψ (r)|2

L3 = m~

donde hemos usado la Ec. (14.4), la identidad a·(b× c) = c·(a× b), y la Ec. (3.25) para la densidad de probabilidad.De lo anterior se concluye que el autovalor m~ de L3 puede interpretarse como el momento angular clasico asociadoal movimiento rotacional del fluıdo de probabilidad.

14.1.1. Efecto sobre la corriente debido a la introduccion de un campo magnetico

Asumamos ahora que al atomo de Hidrogeno se le aplica un campo magnetico constante B. Tal campo puedeser descrito por el siguiente potencial vectorial

A (r) = −1

2r×B (14.5)

estudiaremos la corriente de probabilidad asociada al estado base. Por simplicidad asumiremos que el campomagnetico no modifica al estado base. Puesto que el Hamiltoniano H depende de B, esto no es del todo cor-recto, pero puede demostrarse que para B = Bu3 en el gauge descrito por la Ec. (14.5), las funciones ϕn,l,m (r) sonauto funciones de H dentro de terminos de segundo orden en B, los cuales son despreciables para campos tıpicos delaboratorio. Aplicaremos entonces la expresion de la densidad de corriente para una partıcula inmersa en un campoelectromagnetico descrita por las Ecs. (5.49, 5.50) donde hacemos φ (R, t) = 0, aplicaremos ademas las Ecs. (14.1,14.2)

Jn,l,m =1

µRe

ϕ∗n,l,m (r)

[~

i∇− qA (r)

]ϕn,l,m (r)

=

1

µRe

α (r) e−iξ(r)

[~

i∇− qA (r)

]α (r) eiξ(r)

=1

µRe

α (r) e−iξ(r)

~

i∇[α (r) eiξ(r)

]− qα (r) e−iξ(r)A (r) α (r) eiξ(r)

=1

µRe

α (r) e−iξ(r) eiξ(r)

~

i∇α (r) + α2 (r) e−iξ(r)

~

i∇eiξ(r) − qα2 (r) A (r)

=1

µRe

~

iα (r) ∇α (r) + α2 (r) e−iξ(r)eiξ(r)

i~

i∇ξ (r)

− qα2 (r) A (r)

=1

µRe−i~α (r) ∇α (r) + ~α2 (r) ∇ξ (r)

− qα2 (r) A (r) =

α2 (r)

µ~ ∇ξ (r) − qA (r)

Jn,l,m =ρn,l,mµ

[~ ∇ξn,l,m (r) − qA (r)] (14.6)

sustituyendo (14.5) en la Ec. (14.6) con B = Bu3, el estado base tendra una corriente dada por

J1,0,0 =ρ1,0,0

µ

[~ ∇ξ1,0,0 (r) +

qB

2r× u3

]=ρ1,0,0

µ

~

[ur∂ (mϕ)

∂r+ uθ

1

r

∂ (mϕ)

∂θ+ uϕ

1

r sin θ

∂ (mϕ)

∂ϕ

]

m=0

+qB

2r× u3

= ρ1,0,0

~ [m]m=0

µ+ r ×

(qB

2µu3

)=ρ1,0,0

2

(−qBµ

u3

)× r

J1,0,0 =ρ1,0,0

2(~ωc × r) ; ~ωc ≡ −qB

µu3 (14.7)

donde hemos usado la Ec. (14.3). El vector ~ωc es la frecuencia de ciclotron. La velocidad equivalente del fluıdoesta dada por J1,0,0 = ρ1,0,0v1,0,0 con lo cual la velocidad equivalente nos da

v1,0,0 =~ωc2

× r ≡ ~ωf × r (14.8)

Page 318: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

318CAPITULO 14. CORRIENTES DE PROBABILIDAD EN ATOMOS HIDROGENOIDES, ACOPLES CON CAMPOS MAGNETICOS

La Ec. (14.7) nos muestra que la corriente de probabilidad en el estado base no es cero en presencia de un campomagnetico, es claro que esta corriente se anula al hacer B = 0. Las Ecs. (14.7, 14.8) nos muestran que el fluıdo deprobabilidad, gira como un todo1 alrededor de B (o de u3) con un frecuencia angular2 ~ωf = ~ωc/2. Fısicamente,este resultado se debe a la presencia del campo electrico E (r) transiente que se induce cuando se “enciende” elcampo magnetico. Bajo la influencia de este campo electrico transitorio el electron permanece aproximadamente ensu estado base y comienza a rotar alrededor del proton, con una velocidad angular que depende solo del valor de By no de la forma precisa en que se enciende el campo magnetico. Por supuesto, una vez que la corriente se genera (ydesaparece el campo electrico transitorio), el campo magnetico permanente puede sostenerla via fuerza de Lorentz,ya que la carga ahora esta en movimiento.

Es importante mencionar que si usamos un gauge diferente al dado por la Ec. (14.5) las funciones de onda serıandiferentes, y en la Ec. (14.6) existirıan otras contribuciones a primer orden en B. Sin embargo, en cualquier gauge sedebe reproducir la Ec. (14.7) a primer orden en B, puesto que los resultados fısicos no pueden depender del gauge.

La Ec. (14.7), tambien se puede escribir en terminos de los parametros atomicos usando la funcion de ondaexplıcita del estado base del atomo de Hidrogeno que aparace en la tabla 13.2 pagina 315

J1,0,0 =|ϕ1,0,0|2

2(~ωc × r) =

e−2r/a0

2πa30

(−qBµ

u3 × r

)= −qB

µ

e−2r/a0

2πa30

(r sin θ uϕ)

J1,0,0 = −qBe−2r/a0

2πµa30

r sin θ uϕ (14.9)

aquı vemos ademas que la densidad de corriente es proporcional a ρ (r) r sin θ, lo cual nos ratifica que el fluıdo deprobabilidad gira como un todo.

14.2. Atomo de hidrogeno en un campo magnetico uniforme: paramagnetismo,diamagnetismo y efecto Zeeman

Estudiaremos ahora los efectos que surgen cuando el atomo de hidrogeno esta inmerso en un campo magnetico.Para los campos magneticos tıpicos de laboratorio, el gradiente de dichos campos es tal que B no varıa apreciable-mente en distancias comparables a la escala atomica. Por tanto, para muchos casos tomar este campo como uniformesera una buena aproximacion, y ası lo haremos de aquı en adelante. Estudiaremos entonces el espectro de un electronsujeto a la interaccion electrica interna debida al nucleo y a un campo magnetico externo. Si bien la solucion exactade la ecuacion de Schrodinger es muy compleja en este caso, esta sera soluble bajo ciertas aproximaciones.

Una aproximacion importante es la de ignorar los efectos debidos a la masa finita del nucleo, esta aproximacionesta justificada dado que el proton es mucho mas pesado que el electron. Es importante observar que bajo lainfluencia de un campo magnetico no es rigurosamente posible reducir el problema de dos cuerpos acoplados alproblema de dos cuerpos desacoplados uno en el centro de masa con la masa del sistema y otro con la masa reducidadel sistema y la dinamica del vector relativo. Por tanto, al tener en cuenta los efectos de masa finita del nucleo noes suficiente con reemplazar la masa del electron por la masa reducida del sistema.

Usaremos ademas el hecho de que para campos magneticos tıpicos de laboratorio el corrimiento del espec-tro atomico debido al campo magnetico externo es mucho menor al causado por el campo electrico interno. Loscorrimientos de los niveles atomicos son mucho menores que las separaciones entre niveles del atomo libre.

El estudio de los efectos de introducir un campo magnetico nos permitira comprender como surge el paramag-netismo y el diamagnetismo en la mecanica cuantica

14.2.1. Hamiltoniano del sistema

Consideremos un electron sin espın de masa me y carga q sujeto a un potencial central V (r) y a un potencialvectorial magnetico A (r). Su Hamiltoniano es

H =1

2me[P − qA (R)]2 + V (R) (14.10)

1Es claro de las Ecs. (14.7, 14.8), que la velocidad angular ~ωf del fluıdo no depende de la posicion en este caso.2La frecuencia de ciclotron es la que tendrıa un electron clasico que solo estuviera bajo la interaccion con el campo magnetico. El

hecho de que la corriente de la nube electronica tenga la mitad de este valor, se debe al efecto adicional del campo electrico generado porel nucleo.

Page 319: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

14.2. ATOMO DE HIDROGENO EN UN CAMPO MAGNETICO UNIFORME: PARAMAGNETISMO, DIAMAGNETISMO Y EFECTO ZEEMAN319

si el campo magnetico B es uniforme, el potencial vectorial se puede escribir como

A (r) = −1

2r×B (14.11)

para introducir esta cantidad en el Hamiltoniano (14.10) calcularemos el siguiente factor

[P − qA (R)]2 =[P − q

2R ×B

]2= P2 +

q2

4(R ×B)2 +

q

2[P · (R ×B) + (R×B) · P] (14.12)

ahora bien, B es un vector constante y no un operador, por tanto conmuta con todos los operadores. Adicionalmente,tenemos que

P · (R ×B) = PiεijkRjBk ; (R×B) · P = εijkRjBkPi ; (R×P)i = εijkRjPk

suma sobre ındices repetidos. Los unicos terminos no nulos de esta sumatoria corresponden a aquellos en dondetodos los ındices son diferentes, por tanto Rj conmuta con Pi para los terminos no nulos, de modo que

P · (R ×B) = (R×B) · P ; R ×P = −R×P

En consecuencia, a las expresiones anteriores se les puede aplicar las identidades vectoriales usuales. Utilizando

a · (b × c) = c · (a× b)

(a× b) · (c × d) = (a · c) (b · d) − (a · d) (b · c)

en la Ec. (14.12) queda

[P − qA (R)]2 = P2 +q2

4(R ×B) · (R ×B) +

q

2[2P · (R ×B)]

= P2 +q2

4[(R ·R) (B · B) − (R · B) (B ·R)] + q [B · (P×R)]

[P − qA (R)]2 = P2 +q2

4

[R2B2 − (R · B)2

]− qB · (R ×P) (14.13)

Ahora bien, la proyeccion r⊥ de un vector arbitrario r sobre un plano perpendicular a B se escribe

|r⊥| = |r| sin θ ⇒ r2⊥ = r2 sin2 θ = r2

(1 − cos2 θ

)= r2 − r2B2 cos2 θ

B2⇒

r2⊥ = r2 − (r ·B)2

B2

donde θ es el angulo entre r y B. Con base en esto definimos el operador vectorial R⊥ como la proyeccion de Rsobre un plano perpendicular a B

R2⊥ ≡ R2 − (R ·B)2

B2(14.14)

en particular si B = Bu3 tenemos queR2

⊥ = X21 +X2

2

reemplazando (14.14) en (14.13) y recordando que R×P es el momento angular orbital cuantico, tenemos

[P − qA (R)]2 = P2 +q2B2

4R2

⊥ − qL ·B (14.15)

reemplazando (14.15) en el Hamiltoniano (14.10) tenemos

H =1

2me

[P2 +

q2B2

4R2

⊥ − qL ·B]

+ V (R)

H ≡ H0 +H1 +H2 ; H0 ≡ P2

2me+ V (R) , H1 ≡ −µB

~[L ·B] , H2 ≡ q2B2

8meR2

⊥ (14.16)

µB ≡ q~

2me; R2

⊥ ≡ R2 − (R · B)2

B2(14.17)

Page 320: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

320CAPITULO 14. CORRIENTES DE PROBABILIDAD EN ATOMOS HIDROGENOIDES, ACOPLES CON CAMPOS MAGNETICOS

donde H0 es el Hamiltoniano “no perturbado” asociado al atomo de Hidrogeno libre. Notese que cuando B 6= 0el momento mecanico ya no es P sino [P− qA (R)], por tanto la energıa cinetica sera [P − qA (R)]2 /2me. Aunmas, el termino P2/2me depende del gauge escogido. Puede demostrarse que en el gauge definido por la Ec. (14.11)P2/2me es la energıa cinetica “relativa” Π2

R/2me donde ~ΠR es el momento mecanico de la partıcula con respecto aun sistema rotante de Larmor que rota alrededor de B con velocidad angular ωL = −qB/2me. Ası mismo, se puededemostrar que el termino H2 corresponde a la energıa cinetica Π2

E/2me relativa a la velocidad de arrastre de este

marco de referencia, en tanto que el termino H1 esta asociado al termino cruzado ~ΠR · ~ΠE/me.

14.2.2. Estimacion numerica de las contribuciones H0, H1 y H2

Haremos un estimativo numerico de las diferencias de energıa ∆E (y las frecuencias correspondientes ∆E/h),asociadas a cada Hamiltoniano. Hemos visto que las diferencias de energıa ∆E0 asociadas a H0 (atomo de Hidrogenolibre) son del orden de magnitud de la energıa de ionizacion EI como se aprecia en la Ec. (13.40). Utilizando lasEcs. (13.36) se tiene que

∆E0 ' EI =me

2~2e4 =

me

2~2

(~2

mea0

)2

∆E0 ' ~2

2mea20

;∆E0

h' 1014Hz

ahora usando las Ecs. (14.16) paraH1 y teniendo en cuenta que los momentos angulares son del orden de la constantede Planck, se obtiene

∆E1

h' µB

~

[~B]

h= µB

B

h=

q~

2me

B

h=

qB

4πme=

1

qB

2me

∆E1

h' ωL

2π; ωL ≡ qB

2me

donde hemos tenido en cuenta (14.17). La cantidad ωL se refiere a la velocidad angular de Larmor. Podemos verque ωL/2π es la mitad de la frecuencia de ciclotron. Para campos tıpicos de laboratorio asumiremos B . 105gauss,con lo cual se obtiene

∆E1

h' ωL

2π. 1011Hz ⇒

∆E1 < < ∆E0

ahora evaluaremos el orden de magnitud de ∆E2 asociado a H2. Los elementos matriciales del operador R2⊥ =

X21 +X2

2 son de dimensiones atomicas y por tanto del orden de magnitud de a0 (radio de Bohr). Por tanto, de laEc. (14.16) se obtiene

∆E2 ' q2B2

8mea2

0 ⇒ ∆E2

∆E1' q2B2

8mea2

0

hωL=q2B2

8mea2

0

h

2me

qB⇒

∆E2

∆E1' πqBa2

0

2h

por otro lado∆E1

∆E0' h

qB

2me

2mea0

~2=qBa2

0

~=

2πqBa20

hvemos que

∆E2

∆E1∼ ∆E1

∆E0

de modo que las diferencias de energıa presentan una clara jerarquıa

∆E2 << ∆E1 << ∆E0

los efectos del campo magnetico son en la practica mucho menores que los del campo electrico interno, ademassera en general suficiente tener en cuenta solo el termino H1 y el termino H2 solo se tendra en cuenta cuando H1 seanule.

Aunque el termino H1 es mas importante, analizaremos primero el termino H2 ya que esto permitira justificaralgunas aproximaciones que se usan cuando solo se considera H1

Page 321: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

14.2. ATOMO DE HIDROGENO EN UN CAMPO MAGNETICO UNIFORME: PARAMAGNETISMO, DIAMAGNETISMO Y EFECTO ZEEMAN321

14.2.3. Termino diamagnetico

Hemos dicho que solo consideraremos el efecto de H2 cuando se anule el efecto de H1. Tal es el caso cuandotenemos un estado de momento angular cero en el atomo de Hidrogeno. En la seccion 14.1.1 vimos que la presencia deun campo magnetico uniforme modifica la corriente de probabilidad asociada al electron. Esta corriente tiene simetrıaaxial con respecto al eje B. La corriente gira como un todo alrededor de B en la direccion horaria (antihoraria)cuando q > 0 (q < 0). La corriente electrica que se genera tiene asociado un momento magnetico 〈M2〉 que comoveremos es antiparalelo a B y por tanto esta asociado a una energıa de acople positiva que explica el origen deltermino H2.

Para ver esto recurrimos a calcular clasicamente el momento magnetico M2 asociado a una carga q en movimientocircular de radio r. Si la velocidad de la carga es v su movimiento equivale a una corriente de la forma

i = qv

2πr

la superficie definida por el circuito es S = πr2 de modo que el momento magnetico esta dado por

|M| = |i× S| =qrv

2(14.18)

ahora bien el momento angular λ viene dado por

~λ = r×mev = r× (P − qA (r)) = ~L− qr×A (r)

donde ~L es el momento angular canonico. Puesto que la velocidad es tangencial, la magnitud de ~λ esta dada por

|λ| =∣∣∣ ~L− qr×A (r)

∣∣∣ = merv

podemos escribir la Ec. (14.18) en la forma

~M =q

2meλ =

q

2me

[~L− qr×A (r)

](14.19)

puesto que estamos estudiando el caso L = 0, usando el gauge (14.11) el momento magnetico queda3

~M2 = − q2

2mer×A (r) =

q2

4mer × (r×B) =

q2

4me

[(r ·B) r− r2B

]

vemos que ~M2 es proporcional a B. Por otro lado, si bien ~M2 no es colineal con B, es facil ver que en el estadobase del atomo de hidrogeno (en el cual ~L = 0), el valor esperado de M2 (donde M2 es la cuantizacion de ~M2) esantiparalelo a B. En consecuencia, ~M2 representa el momento magnetico inducido por B en el atomo4. Su energıade acople con B viene dada por

W2 = −∫ B

0

~M2

(B′) · dB′ = −1

2~M2 (B) · B = − 1

2

q2

4me

[(r · B) r− r2B

]·B

W2 =q2

8me

[r2B2 − (r ·B)2

]=q2B2

8me

[r2 − (r · B)2

B2

]

y usando la Ec. (14.17) tenemos

W2 =q2

8mer2⊥B2

cuya cuantizacion conduce al Hamiltoniano H2 descrito en la Ec. (14.16). Vemos entonces que H2 describe el acopleentre el campo B y el momento magnetico ~M2 inducido por B en el atomo. Puesto que de acuerdo con la ley deLenz el momento inducido se opone al campo aplicado5, la energıa de acople es positiva. H2 se denomina el terminodiamagnetico del Hamiltoniano.

3Debe tenerse en cuenta que cuando m = 0, el momento angular que se anula es el canonico y no el mecanico. Esto tiene que ver conel hecho de que es el momento angular canonico el que se cuantiza.

4Vale recordar que la modificacion de la corriente (con respecto a la que se genera para el atomo libre) se forma gracias al campoelectrico transiente que se induce cuando se conecta el campo magnetico. Ademas, en el estado base no hay corriente ni momento dipolarmagnetico permanente.

5En realidad se opone al cambio de flujo, pero cuando el campo se conecta aumenta desde cero hacia B de modo que el aumento deflujo va en la direccion del campo.

Page 322: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

322CAPITULO 14. CORRIENTES DE PROBABILIDAD EN ATOMOS HIDROGENOIDES, ACOPLES CON CAMPOS MAGNETICOS

14.2.4. Termino paramagnetico

Asumiremos ahora que ~L 6= 0 de modo que el Hamiltoniano H1 es el dominante (con respecto a H2). La relacion(14.19) nos indica la relacion general entre el momento angular canonico λ y el momento magnetico ~M. Por otrolado, hemos demostrado que la contribucion de H2 sobre ~M esta dada por la Ec. (14.19) con ~L = 0. Por tanto para~L 6= 0 tal ecuacion se puede escribir como

~M = ~M1+ ~M2 ; ~M1 ≡ q

2me

~L , ~M2 ≡ − q2

2mer×A (r)

pero el analisis numerico indica que para el atomo de hidrogeno, la contribucion del Hamiltoniano H1 domina sobrela contribucion de H2 siempre que la primera sea no nula (i.e. ~L 6= 0). Por lo tanto, si ~L 6= 0 podemos aproximar elmomento magnetico en la forma

~M ' ~M1 =q

2me

~L (14.20)

de modo que ~L es practicamente paralelo a ~M y ambos son perpendiculares al plano de la orbita clasica. La energıade acople con B esta dada por

W1 = − ~M1 · B (14.21)

Al cuantizar las relaciones (14.20, 14.21) se obtiene

M1 =q

2meL ; H1 = −M1 · B = − q

2meL · B (14.22)

que coincide con la Ec. (14.16), de modo que el Hamiltoniano H1 corresponde al acople entre el campo magneticoB y el momento magnetico atomico permanente puesto que M1 es independiente de B, es decir M1 existe aunqueno exista campo magnetico. En consecuencia, M1 se genera a traves de la corriente asociada al atomo de Hidrogenolibre (ver seccion 14.1).

De acuerdo con la Ec. (14.22), los autovalores del operador M1 vienen dados por(

q

2me

)m~ ≡ mµB

de modo que µB es el “cuanto fundamental” de momento magnetico como lo es ~ del momento angular. Es estehecho lo que le da relevancia al magneton de Bohr µB. Mas adelante veremos que ademas del momento angularorbital L, el electron posee un momento angular intrınseco o espın S, que tambien posee un momento magneticoasociado MS proporcional a S en la forma

MS = 2µB~

S

de hecho la necesidad de introducir este momento magnetico adicional para explicar la estructura fina del atomo deHidrogeno, es una de las evidencias experimentales de la existencia del espın del electron (ver seccion 15.4.2).

Finalmente, es importante mencionar que el dominio de los efectos paramagneticos sobre los diamagneticos(cuando los primeros son no nulos) se debe al pequeno tamano del radio atomico, que a su vez genera una superficiey un flujo muy pequenos. Por ejemplo, para un electron libre sometido a un campo magnetico, las contribucionesparamagnetica y diamagnetica tienen la misma importancia relativa.

14.3. Efecto Zeeman

Hemos visto los nuevos terminos que aparecen en el Hamiltoniano del atomo de Hidrogeno cuando se introduceun campo magnetico uniforme. A continuacion veremos como estos nuevos terminos modifican el espectro del atomode Hidrogeno. En particular, examinaremos la forma en que se modifica la emision de la lınea optica conocida como

la “lınea de resonancia” (λ ' 1200oA) con la inclusion del campo magnetico. Veremos que no solo se cambia la

frecuencia sino tambien la polarizacion de las lıneas atomicas. Esto se conoce como efecto Zeeman.Sin embargo, es necesario aclarar que para predecir el espectro real es necesario incluır el momento angular

intrınseco o espın del electron (e incluso del proton) del cual surge la estructura fina e hiperfina del espectro ymodifica sustancialmente las componentes de la lınea de resonancia. A esto se le conoce usualmente como efectoZeeman anomalo. No obstante, la discusion que realizaremos aquı sera valida cualitativamente.

Page 323: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

14.3. EFECTO ZEEMAN 323

14.3.1. Corrimiento de los niveles atomicos con la correccion paramagnetica

Estudiaremos la transicion entre el estado base y el estado mas bajo con momento angular no nulo es decirentre los niveles 1s (n = 1, l = m = 0) y 2p (n = 2, l = 1,m = 1, 0,−1)6. Esta transicion corresponde a la lıneade resonancia del atomo de hidrogeno. Aunque el momento angular en el estado base es cero, no lo es en el estado2p, por tanto despreciaremos la respuesta diamagnetica cuando se coloca un campo magnetico B, incluyendo sololas correcciones de H1. Si denotamos |ϕn,l,m〉 los estados comunes de H0, L

2 y L3, se puede ver de inmediato que siB = Bu3 entonces |ϕn,l,m〉 tambien es autoestado del Hamiltoniano perturbado H0 +H1

(H0 +H1) |ϕn,l,m〉 =(H0 −

µB~

L · B)|ϕn,l,m〉 =

(H0 −

µB~BL3

)|ϕn,l,m〉

(H0 +H1) |ϕn,l,m〉 = (En −mµBB) |ϕn,l,m〉

por tanto si ignoramos el termino diamagnetico, los |ϕn,l,m〉 son aun estados estacionarios de H0 + H1, solo semodifican los valores de energıa. Calculemos el espectro de los estados involucrados en la lınea de resonancia

(H0 +H1) |ϕ1,0,0〉 = E1 |ϕ1,0,0〉 = −EI |ϕ1,0,0〉 ; (H0 +H1) |ϕ2,1,m〉 = (E2 −mµBB) |ϕ2,1,m〉

(H0 +H1) |ϕ1,0,0〉 =

(−EI

4−mµBB

)|ϕ2,1,m〉

el nivel de energıa 2p en presencia de B suele escribirse en la forma

EB2p = −EI4

−mµBB = −EI +3

4EI −m

q~

2meB = −EI +

3EI4~

~ +m~

(− qB

2me

)

EB2p = −EI + ~ (Ω +mωL) ; Ω ≡ 3EI4~

=E2 −E1

~

donde Ω es claramente la frecuencia de la lınea de resonancia en ausencia de B. En tanto que en presencia de B talfrecuencia de resonancia es (Ω +mωL).

14.3.2. Oscilaciones dipolares electricas

El momento dipolar electrico cuantizado del atomo esta dado por

D = qR

para calcular el valor esperado 〈D〉 calculamos los elementos matriciales de B. Bajo paridad el operador D setransforma a −D (ya que bajo paridad R → −R y q → q). El momento dipolar es por tanto un operador impar.Adicionalmente los estados ϕn,l,m (r) tiene paridad bien definida en la base |r〉, esto se debe a que los armonicosesfericos tiene paridad definida teniendo paridad +1 (−1) para l par (impar). En particular se tiene que

〈ϕ1,0,0|D |ϕ1,0,0〉 =⟨ϕ2,1,m′

∣∣D |ϕ2,1,m〉 = 0 ; ∀m,m′ (14.23)

los elementos de matriz no nulos asociados a la lınea de resonancia son entonces no-diagonales. Para calcular loselementos de matrix 〈ϕ2,1,m|D |ϕ1,0,0〉 = q 〈ϕ2,1,m|R |ϕ1,0,0〉 escribiremos a x1, x2, x3 en terminos de armonicosesfericos

x1 = r sin θ cosϕ = r

√2π

3[Y1,−1 (θ, ϕ) − Y1,1, (θ, ϕ)] (14.24)

x2 = r sin θ sinϕ = ir

√2π

3[Y1,−1 (θ, ϕ) + Y1,1 (θ, ϕ)] (14.25)

x3 = r cos θ = r

√4π

3Y1,0 (θ, ϕ) (14.26)

6La transicion mas baja corresponde al paso de 1s a 2s pero en este caso la respuesta diamagnetica es dominante ya que el momentoangular en cero en ambos estados.

Page 324: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

324CAPITULO 14. CORRIENTES DE PROBABILIDAD EN ATOMOS HIDROGENOIDES, ACOPLES CON CAMPOS MAGNETICOS

el calculo de los elementos matriciales involucra una integral radial y una angular, en virtud de la separabilidad delas funciones de onda estacionarias. La integral radial la definimos como una cantidad χ

χ ≡∫ ∞

0R2,1 (r)R1,0 (r) r3 dr (14.27)

la parte angular consiste en productos escalares de armonicos esfericos que se pueden calcular facilmente debido asus propiedades de ortogonalidad. Por ejemplo, calculemos el elemento matricial 〈ϕ2,1,1|Dx1 |ϕ1,0,0〉 en la base |r〉,para lo cual aplicamos la Ec. (5.3)

〈ϕ2,1,1|Dx1 |ϕ1,0,0〉 = q 〈ϕ2,1,1|X1 |ϕ1,0,0〉 = q

∫ϕ∗

2,1,1 (r) x1 ϕ1,0,0 (r) d3r

= q

∫ [R2,1 (r) Y ∗

1,1 (θ, ϕ)]r

√2π

3[Y1,−1 (θ, ϕ) − Y1,1, (θ, ϕ)]

[R1,0 (r) Y0,0 (θ, ϕ)] r2 dr dΩ

= q

√2π

3

[∫ ∞

0R2,1 (r)R1,0 (r) r3 dr

]∫dΩ Y ∗

1,1 (θ, ϕ) [Y1,−1 (θ, ϕ) − Y1,1, (θ, ϕ)] Y0,0 (θ, ϕ)

= q

√2π

∫dΩ

[Y ∗

1,1 (θ, ϕ) Y1,−1 (θ, ϕ) − Y ∗1,1 (θ, ϕ)Y1,1, (θ, ϕ)

] 1√4π

=q√6χ δ1,1δ1,−1 − δ1,1δ1,1

〈ϕ2,1,1|Dx1 |ϕ1,0,0〉 = − q√6χ

donde hemos usado las Ecs. (14.24, 14.27) y la ortonormalidad de los armonicos esfericos. Procediendo de manerasimilar con los otros elementos matriciales se obtiene

〈ϕ2,1,1|Dx1 |ϕ1,0,0〉 = −〈ϕ2,1,−1|Dx1 |ϕ1,0,0〉 = − qχ√6

; 〈ϕ2,1,0|Dx1 |ϕ1,0,0〉 = 0 (14.28)

〈ϕ2,1,1|Dx2 |ϕ1,0,0〉 = 〈ϕ2,1,−1|Dx2 |ϕ1,0,0〉 =iqχ√

6; 〈ϕ2,1,0|Dx2 |ϕ1,0,0〉 = 0 (14.29)

〈ϕ2,1,1|Dx3 |ϕ1,0,0〉 = 〈ϕ2,1,−1|Dx3 |ϕ1,0,0〉 = 0 ; 〈ϕ2,1,0|Dx3 |ϕ1,0,0〉 =qχ√

3(14.30)

se concluye que si el sistema esta en un estado estacionario, la cantidad 〈D〉 es cero ya que los elementos diagonalesse anulan. Supondremos entonces que el sistema esta inicialmente en una superposicion del estado base 1s y uno delos estados 2p.

ψ (0) = cosα |ϕ1,0,0〉 + sinα |ϕ2,1,m〉

donde m asume uno de sus valores permitidos 1, 0,−1. Consideraremos a α como un parametro real, aplicando laevolucion temporal de un sistema conservativo calculamos la evolucion temporal de este estado

|ψm (t)〉 = eiEI t/~ cosα |ϕ1,0,0〉 + ei[EI−~(Ω+mωL)] t/~ sinα |ϕ2,1,m〉= eiEI t/~

cosα |ϕ1,0,0〉 + e−i(Ω+mωL) t sinα |ϕ2,1,m〉

|ψm (t)〉 = cosα |ϕ1,0,0〉 + e−i(Ω+mωL) t sinα |ϕ2,1,m〉 (14.31)

donde hemos omitido la fase global irrelevante en el ultimo paso. Calcularemos 〈D〉 cuando el sistema esta en elestado |ψm (t)〉 en el tiempo t. Usando las Ecs. (14.23, 14.28, 14.29, 14.30, 14.31), obtendremos el valor esperado de

Page 325: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

14.3. EFECTO ZEEMAN 325

D para los casos m = 1, 0,−1. Para m = 1 obtenemos

〈ψm=1 (t)|Dx1 |ψm=1 (t)〉 =[cosα 〈ϕ1,0,0| + ei(Ω+ωL) t sinα 〈ϕ2,1,1|

]Dx1

[cosα |ϕ1,0,0〉 + e−i(Ω+ωL) t sinα |ϕ2,1,1〉

]

= cos2 α 〈ϕ1,0,0|Dx1 |ϕ1,0,0〉 + e−i(Ω+ωL) t cosα sinα 〈ϕ1,0,0|Dx1 |ϕ2,1,1〉+ei(Ω+ωL) t sinα cosα 〈ϕ2,1,1|Dx1 |ϕ1,0,0〉 + sin2 α 〈ϕ2,1,1|Dx1 |ϕ2,1,1〉

= − qχ

2√

6e−i(Ω+ωL) t sin 2α− qχ

2√

6ei(Ω+ωL) t sin 2α

= − qχ√6

sin 2α

[e−i(Ω+ωL) t + ei(Ω+ωL) t

2

]

〈ψm=1 (t)|Dx1 |ψm=1 (t)〉 = − qχ√6

sin 2α cos [(Ω + ωL) t]

y se procede de manera similar com m = 0,−1. Los resultados son:

〈Dx1〉m=1 = − qχ√6

sin 2α cos [(Ω + ωL) t] ; 〈Dx2〉m=1 = − qχ√6

sin 2α sin [(Ω + ωL) t] ; 〈Dx3〉1 = 0 (14.32)

〈Dx1〉m=0 = 〈Dx2〉m=0 = 0 ; 〈Dx3〉m=0 =qχ√

3sin 2α cos Ωt (14.33)

〈Dx1〉m=−1 =qχ√

6sin 2α cos [(Ω − ωL) t] ; 〈Dx2〉m=−1 = − qχ√

6sin 2α sin [(Ω − ωL) t] ; 〈Dx3〉m=−1 = 0(14.34)

estas ecuaciones muestran que: (a) El vector 〈D〉m=1 (t) rota en el plano X1X2 alrededor de X3, en direccionantihoraria con velocidad angular Ω +ωL.(b) El vector 〈D〉m=0 (t) oscila a lo largo de X3 con frecuencia angular Ω.(c) El vector 〈D〉m=−1 (t) rota en el plano X1X2 alrededor de X3 pero en direccion horaria con velocidad angularΩ − ωL.

14.3.3. Frecuencia y polarizacion de la radiacion emitida

En los tres casos m = 1, 0,−1; el valor medio del dipolo electrico es una funcion oscilante del tiempo. Por lotanto, dicho dipolo debe radiar.

Puesto que las dimensiones atomicas son mucho menores que la longitud de onda optica, la radiacion de losatomos a grandes distancias se puede tratar como la de un dipolo puntual. Asumiremos que la radiacion emitida oabsorbida por el atomo durante la transicion entre el estado |ϕ2,1,m〉 y el estado base, se puede predecir correctamenteutilizando la teorıa clasica de la radiacion. Un tratamiento riguroso del problema requiere la cuantizacion del campoelectromagnetico (electrodinamica cuantica), que predice el comportamiento de los fotones y la forma en que estos seemiten en la radiacion. Sin embargo, los resultados obtenidos por el metodo semi-clasico que abordaremos (en dondela materia se trata cuanticamente y la radiacion se trata clasicamente), predicen la distribucion de la radiacion enmuy buena aproximacion.

Supondremos que tenemos una muestra que contiene un gran numero de atomos de hidrogeno y que los excitamosde alguna manera7 al estado 2p. En la mayorıa de experimentos la excitacion de los atomos es isotropica y los tresestados |ϕ2,1,m〉 ocurren con la misma probabilidad. En primer lugar, estudiaremos la distribucion angular de laradiacion y de la polarizacion para cada m fijo, y posteriormente se superponen los resultados para encontrar elespectro que se observa.

Cuando m = 1, la frecuencia angular de la radiacion emitida es Ω + ωL segun la Ec. (14.32). De modo que elcampo magnetico corre ligeramente la frecuencia de la lınea optica (recordemos que Ω es la frecuencia de la lıneaoptica en ausencia de B). De acuerdo con la teorıa electromagnetica clasica, un dipolo rotante como 〈D〉1 (t) emiteradiacion en la direccion u3 con polarizacion circular de helicidad positiva σ+. Por otro lado, la radiacion emitidaen el plano X1X2 esta linealmente polarizada (paralela a este plano) en otras direcciones la polarizacion es elıptica.

Para m = 0, el dipolo oscila linealmente en la direccion u3. Las Ecs. (14.33) muestran que la frecuencia angulares Ω, es decir igual a la asociada a la ausencia de B, esto se debe a que el corrimiento de la frecuencia debida alcampo es proporcional a m. En este caso la electrodinamica clasica predice que su polariacion es lineal en todas las

7Por ejemplo, haciendo incidir un haz de luz muy monocromatica cuyos fotones tengan una energıa igual a la necesaria para realizarla transicion 1s→ 2p.

Page 326: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

326CAPITULO 14. CORRIENTES DE PROBABILIDAD EN ATOMOS HIDROGENOIDES, ACOPLES CON CAMPOS MAGNETICOS

direcciones. En particular, para una direccion de propagacion sobre el plano X1X2, esta polarizacion es paralela au3 (polarizacion π). Ademas no se emite radiacion en la direccion u3, ya que un dipolo que oscila linealmente noradıa en la direccion de su eje de oscilacion.

En el caso m = −1, las Ecs. (14.34) muestra que la frecuencia angular de la radiacion emitida es Ω − ωL. Ladsitribucion angular de la radiacion es similar al caso m = 1. Sin embargo, puesto que el dipolo 〈D〉m=−1 gira en ladireccion opuesta a 〈D〉m=1, la polarizacion elıptica y circular tiene helicidad opuesta a la correspondiente a m = 1.

Si ahora asumimos que hay un numero igual de atomos con m = 1, 0,−1, tenemos que se emiten tres frecuenciasbien definidas en todas direcciones (Ω+mωL con m = 1, 0,−1). La polarizacion asociada a m = 0 es lineal y la de lasotras dos es en general elıptica. Notese que en la direccion de propagacion perpendicular a B las tres polarizacionesson lineales, la de m = 0 esta polarizada en la direccion de B y las otras dos en direccion perpendicular a B. Las Ecs.(14.32, 14.33, 14.34) nos muestran ademas que la intensidad de la lınea central m = 0 es dos veces la de cada una delas lıneas corridas. En la direccion paralela a B solo hay radiacion debida a m = ±1 con frecuencias (Ω ± ωL) /2π,ambas asociadas a polarizacion circular pero de helicidad opuesta σ±.

Hemos visto que un campo magnetico constante remueve parcialmente la degeneracion asociada a la energıa deun atomo de hidrogeno, ya que la energıa ahora depende de los numeros cuanticos n y m. Es este efecto el que leda el nombre de numero cuantico magnetico al valor propio de L3 (y de cualquier momento angular J3).

Page 327: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 15

Momento angular intrınseco

15.1. Comportamiento clasico de atomos paramagneticos inmersos en uncampo magnetico

Asumamos que el atomo bajo estudio es neutro de modo que no esta sujeto a la fuerza de Lorentz cuando sele aplica un campo magnetico B. Para una gran cantidad de atomos neutros inmersos en un campo magnetico B,es posible demostrar que el momento dipolar magnetico electronico (primer termino en la expansion multipolarmagnetica de la distribucion) es proporcional al momento angular electronico para un nivel atomico dado1

~M = γL (15.1)

la constante de proporcionalidad se denomina factor giromagnetico del nivel bajo consideracion. La fuerza resultanteF sobre el atomo neutro se puede obtener de una energıa potencial W

W = − ~M· B ; F = ∇(~M ·B

)

El torque asociado (tomando el origen en la posicion del centro del atomo) es

~τ = ~M×B

y puesto que el teorema del momento angular nos dice que

dL

dt= ~τ

se tiene quedL

dt= ~M×B = γL×B

esto nos muestra que L es perpendicular a su razon de cambio y adicionalmente, la razon de cambio es perpendicularal campo magnetico B. Si B es constante en el tiempo en el punto donde se evalua, esto indica que L no cambia demagnitud y precesa alrededor del eje definido por el campo magnetico, el angulo θ entre B y L permanece constantey la velocidad angular de precesion es ω = γ |B|. Ahora bien, puesto que ~M es paralelo a L y sus magnitudes estanrelacionadas por una constante, concluımos que tambien ~M conserva su magnitud y precesa con el mismo anguloθ y la misma velocidad angular ω alrededor de B.

Si definimos al eje X3 a lo largo de B, para calcular la fuerza F podremos en buena aproximacion despreciar enW los terminos proporcionales a M1 y M2 tomando a M3 como constante. Esto se debe a la tendencia natural delos atomos a alinear su momento magnetico con el campo magnetico, si bien existen componentes “laterales” M1 yM2 estas tienden a cancelarse cuando se toma un promedio temporal que comprenda muchos periodos de precesiony dado que las frecuencias de precesion son tan altas, solo estos promedios temporales de M1 y M2 juegan unpapel en W y estos promedios son cero, ya que todas las direcciones ocurren en la precesion con igual magnitud.

1Antes del advenimiento de la teorıa cuantica, la espectroscopıa permitıa distinguir entre diferentes estados de un atomo.

327

Page 328: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

328 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

Adicionalmente, cuando se tiene en cuenta el efecto sobre muchas partıculas, la cancelacion estadıstica funciona aunmejor. La fuerza sera entonces aproximadamente

F = ∇ (M3B3) = M3∇B3

notese que la fuerza resultante serıa cero si el campo es uniforme independientemente de su intensidad. Por tanto,una fuerza significativa requiere un alto gradiente del campo. Si asumimos por simplicidad que B3 solo varıa a lolargo de X3, es decir si ∂B3/∂x1 = ∂B3/∂x2 = 0 la fuerza sobre el atomo sera paralela al eje X3 y proporcionala M3. Si asumimos que tenemos una gran cantidad de atomos, se espera que los momentos magneticos de estosesten orientados aleatoriamente antes de la aplicacion del campo, pues tales orientaciones estaran dictaminadas porfluctuaciones termicas que son de naturaleza aleatoria2 . Por tanto, antes de la aplicacion del campo todos los valoresde M3 entre − |M| y |M| estan presentes, en otras palabras, el angulo θ entre B y ~M puede tomar cualquier valorentre 0 y π.

15.2. Experimento de Stern-Gerlach

Figura 15.1: (a) En el experimento de Stern-Gerlach, los atomos de plata que se emiten a alta temperatura del hornoE son colimados en F para luego ser deflectados por el gradiente de campo magnetico creado por el electroiman A.Finalmente, el atomo es registrado en el punto N de la pantalla P. (b) Vista frontal del electroiman. El haz incidesobre el eje X2.

Stern y Gerlach realizaron un experimento en 1922 para estudiar la deflexion de un haz de atomos neutrosparamagneticos en un campo magnetico de alto gradiente.

El montaje se muestra en la Fig. 15.1a. En un horno E se colocan atomos neutros de plata (que son param-agneticos) y se calientan a alta temperatura, luego se dejan escapar por un pequeno agujero y se propagan en lınearecta en el alto vacıo del montaje. El agujero colimador permite solo el paso de atomos en cierta direccion queelegimos como eje X2. El haz colimado en esta forma entra entonces a un electroiman A para ser deflectado antesde impactar la pantalla P .

2Esto implica despreciar posibles correlaciones entre los diferentes momentos magneticos de los atomos.

Page 329: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

15.3. RESULTADOS DEL EXPERIMENTO Y EL MOMENTO ANGULAR INTRINSECO 329

De acuerdo con la teorıa clasica, si queremos producir una deflexion apreciable, el electroiman debe producir uncampo B de alto gradiente. Una forma de lograrlo es a traves de un iman configurado como se ilustra en la Fig.15.1b. El campo magnetico generado tiene un plano de simetrıa (el plano X2X3) que contiene la direccion inicial delhaz colimado. Si despreciamos efectos de borde el campo magnetico no tiene componente en la direccion X2, portanto el efecto sobre el haz es el mismo en cualquier punto sobre el eje X2 dentro del electroiman. La componentemas grande de B es en la direccion de X3, ademas la variacion del campo a lo largo de X3 es muy fuerte, estoocurre gracias a la configuracion angulosa del polo norte que produce una gran acumulacion de lıneas de campoen la vecindad del angulo, en tanto que en el polo sur la densidad de lıneas es mucho menor. Puesto que el campomagnetico es solenoidal (∇·B = 0), este debe adquirir una componente en la direccion X1 que varıa con la distanciax1 al plano de simetrıa X2X3.

La simetrıa del electroiman muestra claramente que ∂B3/∂x2 = 0 ya que el campo magnetico no depende dex2. Ademas ∂B3/∂x1 = 0 en todos los puntos del plano de simetrıa X2X3.

En virtud de que el experimento reune todas las condiciones descritas en la seccion 15.1, concluımos que ladeflexion HN de un atomo que golpea la pantalla es proporcional a M3 y por tanto a L3. En consecuencia,medir HN es equivalente a medir M3 o L3. Puesto que los momentos magneticos de los atomos de plata estabandistribuıdos isotropicamente antes de entrar en el electroiman, los valores de M3 toman todos los valores posibles(para una gran cantidad de atomos) entre − |M| y |M|. Por tanto, esperamos que se forme sobre la pantalla unpatron contınuo simetrico con respecto a H, sobre la pantalla P . En otras palabras, se espera que haya impactossobre todos los puntos en el intervalo N1, N2 de manera mas o menos uniforme, donde N1 (cota maxima) correspondeal caso en que M3 toma el valor maximo M3 = |M| y N2 corresponde al caso en el cual M3 toma el valor mınimoM3 = − |M|. Desde el punto de vista experimental efectos tales como la dispersion de las velocidades y el tamanofinito del colimador ocasionaran que atomos con el mismo valor de M3 no golpeen en el mismo punto, sino enuna vecindad de un punto que corresponde a la velocidad promedio de una partıcula que pasa por el centro delcolimador. Por tanto el resultado clasico predice una distribucion como la lınea punteada de la Fig. 15.2, que va unpoco mas alla de N1 y N2 por aspectos experimentales.

15.3. Resultados del experimento y el momento angular intrınseco

En el experimento no se observo una distribucion homogenea a lo largo de [N1, N2] como predecıa el modeloclasico. Lo que se observo fueron dos manchas bien definidas centradas en N1 y N2 simetricas con respecto a H,como lo muestran las lıneas contınuas de la Fig. 15.2. Puesto que el ancho de estas manchas era mucho menor que elancho de N1 y N2; esto hacıa sospechar que la deflexion estaba “cuantizada” en dos haces bien definidos. Este hechose puede confirmar disminuyendo el tamano del colimador y/o disminuyendo la dispersion de velocidades del haz(con un filtro de velocidades colocado antes del electroiman). Si la cuantizacion existe, lo anterior debe disminuir elancho de las manchas alrededor de N1 y N2. La formacion de dos zonas de impacto “cuantizadas” esta en francacontradiccion con la teorıa clasica.

Podrıa pensarse por ejemplo que esta cuantizacion proviene de la cuantizacion del momento angular clasico (quea su vez conducirıa a la cuantizacion de M si asumimos que se mantiene la relacion 15.1) hay varias razones pararechazar este hipotesis como veremos a continuacion.

En primer lugar, mostraremos que bajo las condiciones de este experimento no es necesario tratar los grados delibertad de posicion y momento cuanticamente. Para esto debemos verificar que para describir el movimiento de losatomos de plata, es posible construır paquetes de onda cuyo ancho ∆x3 y cuya dispersion ∆p3 sean completamentedespreciables con respecto a la escala de longitudes y momentos que se manejan en el experimento. Estos anchosdeben cumplir el principio de incertidumbre

∆x3∆p3 & ~

la masa M de un atomo de plata es de 1,8 × 10−25kg. Los anchos ∆x3 y ∆v3 = ∆p3/M deben ser tales que

∆x3∆v3 &~

M' 10−9M.K.S.A. (15.2)

ahora veamos cuales son las longitudes y velocidades tıpicas en el experimento. El ancho del colimador F es deunos 10−4m, la separacion entre N1 y N2 entre las manchas es de varios milımetros. La distancia sobre la cual

Page 330: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

330 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

Figura 15.2: La lınea contınua nos muestra las dos manchas bien localizadas alrededor de los puntos N1 y N2, quese obtuvieron en el experimento de Stern-Gerlach. La lınea punteada nos muestra la prediccion clasica.

el campo magnetico varıa apreciablemente se puede deducir de los valores del campo en medio del electroiman(B ' 104gauss) y su gradiente (∂B/∂x3 ' 105gauss/cm), que nos da

B

∂B/∂x3' 10−3mt

ahora la velocidad de un atomo de plata que abandona el horno a una temperatura de 103K es del orden de 500m/s.Para haces bien colimados, la dispersion de las velocidades a lo largo de X3 no es mucho menor a varios metros porsegundo. De lo anterior, es posible encontrar valores de ∆x3 y ∆v3 que satisfagan la relacion (15.2) que provienede la relacion de incertidumbre, y que al mismo tiempo sean mucho menores que todas las escalas de longitud yvelocidad del experimento. Por tanto, los observables r y p se pueden tratar como clasicos y podemos pensar enpaquetes casi puntuales que se mueven sobre trayectorias clasicas. La cuantizacion de estos observables (o de otrosque dependan de estos como el momento angular) darıa una enorme cantidad de valores propios que simularıan uncontınuo, esto estarıa muy lejos de explicar una cuantizacion tan drastica en tan solo dos estados.

Una segunda razon es que los momentos angulares orbitales cuanticos l (l + 1) ~2 solo pueden tener valores de lenteros. Esto implica que el numero de proyecciones posibles a lo largo de X3 para un l dado, es siempre un numeroimpar (2l + 1). Lo anterior entrarıa en conflicto con la idea de tener un numero par de “auto resultados” que eneste caso son dos.

Si asumimos que la deflexion aun se da por el acople del campo con un momento angular (es decir que aun hayun momento angular que cumpla la Ec. 15.1) este momento angular debe tener solo dos proyecciones posibles a lolargo de X3, es decir

2j + 1 = 2

Page 331: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

15.4. EVIDENCIA EXPERIMENTAL DEL MOMENTO ANGULAR INTRINSECO DEL ELECTRON 331

lo cual nos lleva a j = 1/2. De esto se concluye que si el observable asociado a la deflexion observada es aun unmomento angular, no puede ser un momento angular orbital, ya que para estos los valores semienteros estan excluıdospor razones de periodicidad. El observable asociado no proviene entonces de la cuantizacion de un momento angularclasico y se conoce como momento angular intrınseco o espın.

15.4. Evidencia experimental del momento angular intrınseco del electron

Existen numerosas evidencias experimentales de la existencia del espın en los electrones. En particular, laspropiedades magneticas de muchas sustancias requieren tener en cuenta esta propiedad. A manera de ejemplo, laexplicacion del ferromagnetismo requiere el espın del electron como componente esencial.

En esta seccion solo citaremos dos propiedades a nivel atomico que evidencian la existencia de un momentoangular intrınseco del electron: La estructura fina de las lıneas espectrales atomicas y el efecto Zeeman anomalo

15.4.1. Estructura fina de las lıneas espectrales

La teorıa del atomo de Hidrogeno desarrollada en el capıtulo 13 considero al electron como una partıcula puntualcuyo estado se puede describir con una funcion de onda espacial ϕ (x, y, z). Los resultados obtenidos en el capıtulo13 describen el espectro de emision y absorcion del atomo de Hidrogeno con buena precision, ası como los nivelesde energıa y las reglas de seleccion que nos indican las frecuencias de Bohr permitidas en el espectro.

Sin embargo, un estudio de alta resolucion del espectro nos revela ciertas diferencias que aunque pequenas sonobservables. Estas diferencias se deben principalmente a dos aspectos: las correcciones relativistas y los efectos deintroducir un campo magnetico que interactue con el atomo.

En lo que respecta a la estructura fina del espectro del atomo de hidrogeno, se observo que cada lınea poseevarias componentes, es decir para un nivel de energıa dado n hay realmente varias energıas muy cercanas entre sı.Por supuesto, las diferencias entre energıas de un mismo nivel son mucho menores que las diferencias entre energıasde niveles distintos, razon por la cual la concordancia con los experimentos de baja resolucion era buena. Por lotanto, debe introducirse alguna correccion a la teorıa desarrollada en el capıtulo 13 para explicar el desdoblamientode las lıneas espectrales allı predichas.

15.4.2. Efecto Zeeman anomalo

Cuando un atomo se coloca en un campo magnetico uniforme, cada una de las lıneas (es decir, cada componentede la estructura fina) se desdobla en ciertas lıneas equidistantes, donde la brecha es proporcional al campo magnetico,esto se conoce como efecto Zeeman. Este efecto se puede explicar usando el formalismo cuantico hasta ahora descrito.La explicacion teorica se basa en la relacion del momento dipolar magnetico M con el momento angular orbital delelectron

M =µB~

L ; µB =q~

2me(15.3)

donde µB se conoce como el “magneton de Bohr”. Sin embargo, la teorıa presentada en el capıtulo 13 solo esta enconcordancia con el experimento en algunos casos que llamaremos “efecto Zeeman” normal. En otros casos, sinembargo aparece un “efecto Zeeman anomalo” que resulta particularmente sustancial en atomos con numero atomicoimpar (en particular, el atomo de Hidrogeno), ya que sus niveles se dividen en un numero par de subniveles en tantoque la teorıa predice que el numero de subniveles debe ser impar ya que es igual a 2l+1 con l entero. Si asumimos queen el efecto Zeeman anomalo el desdoblamiento continua siendo generado por un momento angular J2, es necesarioque el valor propio j (j + 1) ~2 de este momento angular corresponda a j semi-entero para poder explicar que elnumero de subniveles 2j + 1 sea par.

Notese que un experimento del tipo Stern-Gerlach no serıa practico para la medicion del momento angularelectronico debido a que el electron tiene carga neta (monopolo electrico), y la interaccion del momento dipolarmagnetico del electron con el campo es mucho mas debil que la interaccion de Lorentz descrita por qv ×B.

Page 332: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

332 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

15.5. Introduccion del momento angular intrınseco en el formalismo de la

mecanica cuantica no relativista

Para poder introducir el momento angular intrınseco en el formalismo no relativista de la mecanica cuanticasera necesario introducir algunos postulados adicionales. La teorıa no relativista para incorporar al espın fue desar-rollada por Pauli. Mas adelante, Dirac desarrollo una teorıa relativista que desemboco en la llamada ecuacion deDirac, en la cual el espın aparece en forma natural debido a la covarianza de la ecuacion con el grupo de transfor-maciones de Lorentz. Si bien, el espın tambien se puede deducir de las transformaciones no relativistas del grupode Galileo, la aparicion del espın es mucho mas natural en las teorıas relativistas.

Sin embargo, dado que la teorıa de Pauli es mas simple que la de Dirac y que estamos desarrollando una teorıano relativista, introduciremos el espın con los postulados de Pauli.

Antes de Pauli, Uhlenbeck y Goudsmit en 1925 propusieron que el electron poseıa un efecto de rotacion quegeneraba un momento angular intrınseco que llamaron espın (del ingles spin que significa rotacion o giro). Se postulaentonces que existe un momento dipolar magnetico MS que esta asociado con el momento angular intrınseco o espın(denotado por S) en la forma

MS = 2µB~

S (15.4)

que tiene la misma estructura que la relacion (15.3) para el momento angular orbital, pero con un factor de dos, quenos dice que el factor giromagnetico de espın es dos veces mayor que el factor giromagnetico orbital. Esta relacionse impuso por razones estrictamente fenomenologicas, con el fin de ajustar la concordancia teorıa experimento.

Mas adelante, Pauli establecio una forma de incorporar este momento angular intrınseco en el formalismo de lamecanica cuantica no relativista agregando unos postulados sobre estos observables.

Hasta el momento, hemos cuantizado solo observables que dependen de los observables basicos R y P y quedenominaremos observables orbitales, lo cuales actuan en el espacio de estados Er que es isometrico e isomorfocon el espacio F de las funciones de onda. Similarmente denominamos espacio orbital de estados a Er.

Dentro de los postulados de Pauli, anadiremos a estos observables orbitales un conjunto de observables de espınen la siguiente forma

(I) El operador de espın S ≡ (S1, S2, S3) es un momento angular, es decir cumple con las reglas de conmutacion(10.6)

[Si, Sj ] = i~εijkSk

(II) Estos operadores de espın actuan en un espacio de estados de espın Es, en el cual los observables S2 yS3 constituyen un C.S.C.O. Por tanto, Es es expandido por los estados propios comunes de S2 y S3

S2 |s,ms〉 = s (s+ 1) ~2 |s,ms〉 ; S3 |s,ms〉 = ms~ |s,ms〉

de acuerdo con la teorıa general del momento angular, sabemos que s debe ser entero o semientero y que ms tomatodos los valores incluıdos entre −s y s en saltos de unidad. Sabemos tambien que ms es entero (semi-entero) si ysolo si s es entero (semi-entero).

III) Una partıcula dada esta caracterizada por un valor unico de espın s y diremos que esta partıcula tiene espıns.

Puesto que |s,ms〉 con s fijo es una base para el espacio de estados de espın Es, dicho espacio es de dimensionfinita 2s + 1. Notese ademas que todos los elementos de Es son estados propios de S2 con el mismo valor propios (s+ 1) ~2.

IV) El espacio de estados E de una partıcula es el producto tensorial3 de Er con Es

E = Er ⊗ Es

consecuentemente, todos los observables de espın conmutan con todos los observables orbitales. Ademas exceptopara s = 0, esto implica que para la caracterizacion del estado de una partıcula no sera suficiente especificar un ketde Er. Por ejemplo, los observables X1, X2, X3 constituyen un C.S.C.O. en Er pero no en E , para formar un C.S.C.O.en E debemos agregar un C.S.C.O. del espacio Es, por ejemplo S2 y algun Si (usualmente S3).

3Para detalles sobre productos tensoriales ver seccion 1.32, page 61.

Page 333: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

15.6. PROPIEDADES DE UN MOMENTO ANGULAR 1/2 333

Adicionalmente, de las propiedades del producto tensorial, el producto tensorial de los elementos de una base|ϕn〉 en Er con los elementos de una base χi en Es sera una base de E = Er ⊗ Es

|ϕn, χi〉 ≡ |ϕn〉 ⊗ |χi〉

Esto implica que todo estado de una partıcula es una combinacion lineal de estos productos tensoriales

|ψ〉 =∑

n

i

cn,i |ϕn, χi〉 =∑

n

i

cn,i |ϕn〉 ⊗ |χi〉 ; cn,i = 〈ϕn, χi |ψ〉

debemos recordar sin embargo, que no todo estado |ψ〉 ∈ E proviene del producto tensorial de un estado |ϕ〉 ∈ Er

con un estado |χ〉 ∈ Es. Es decir que la relacion

|ψ〉 = |ϕ〉 ⊗ |χ〉 ; |ϕ〉 ∈ Er ; |χ〉 ∈ Es ; |ψ〉 ∈ E (15.5)

no es valida en general. Sin embargo, cuando la relacion (15.5) es valida para un cierto |ψ〉 es claro que

|ψ〉 =∑

n

i

cn,i |ϕn, χi〉 ; cn,i = 〈ϕn |ϕ〉 〈χi |χ〉

Estos postulados conciernen a una teorıa general de espın. El siguiente postulado esta dirigido mas especifica-mente al espın del electron

(V) El electron es una partıcula de espın 1/2 (s = 1/2) y su momento dipolar magnetico intrınseco esta dadopor

MS = (2s+ 1)µB~

S = 2µB~

S

que coincide con (15.4).

Adicionalmente, los constituyentes nucleares (protones y neutrones) tambien son partıculas de espın 1/2 aunquesu factor giromagnetico es diferente al del electron. Tambien existen partıculas de espın 0, 1/2, 1, 3/2, 2, ...

A priori podrıamos estar tentados a pensar que el espın es un efecto del tamano del electron que genera laposibilidad de que esta partıcula produzca rotaciones. En tal caso, ademas de los observables de posicion (del centrode masa del electron), sera necesario anadir tres observables asociados a la rotacion (por ejemplo una cuantizacionadecuada de los angulos de Euler). Sin embargo, las rotaciones espaciales deben cumplir relaciones de periodicidadsimilares a las que se imponen para los armonicos esfericos, lo cual nos exige que s sea entero. La presencia deespın semientero indica que este observable no tiene un origen rotacional, ni puede provenir de la cuantizacion deun momento angular clasico que sea funcion exclusiva de R y P. En el presente tratamiento, el electron continuasiendo una partıcula puntual y el espın no tiene analogo clasico.

15.6. Propiedades de un momento angular 1/2

Puesto que los electrones ası como los nucleones son partıcula de espın 1/2, el espacio de estados Es=1/2 mereceespecial atencion. En esta seccion nos ocuparemos de estudiar solo el espacio E1/2 y en el siguiente nos ocuparemosde caracterizar el espacio de estados completo E = E 1/2 ⊗ Er

El espacio de estados E1/2 es de dimension dos. Los autoestados comunes de S2 y S3, que conforman una baseortonormal en E1/2 estan dados por

∣∣∣∣s =1

2, ms =

1

2

⟩,

∣∣∣∣s =1

2, ms = −1

2

⟩≡∣∣∣∣

1

2,

1

2

⟩,

∣∣∣∣1

2, − 1

2

Simplificaremos la notacion para estos autoestados comunes de S2 y S3 en la forma

∣∣∣∣1

2,

1

2

⟩≡ |+〉 ;

∣∣∣∣1

2, − 1

2

⟩≡ |−〉

Page 334: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

334 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

es comun referirse a los autoestados |±〉, como estado con espın “arriba” y “abajo” respectivamente4. Es claro que

S2 |±〉 =1

2

(1

2+ 1

)~2 |±〉 ; S3 |±〉 = ±1

2~ |±〉

S2 |±〉 =3

4~2 |±〉 ; S3 |±〉 = ±1

2~ |±〉 (15.6)

con relaciones de ortonormalidad y completez

〈+ |+〉 = 〈− |−〉 = 1 ; 〈+ |−〉 = 0 ; |+〉 〈+| + |−〉 〈−| = Is (15.7)

el estado mas general de espın es entonces una combinacion lineal de esta base

|χ〉 = c+ |+〉 + c− |−〉 (15.8)

siendo c± numeros complejos. Dado que ambos estados |±〉 son autoestados de S2 con el mismo autovalor, cualquiercombinacion lineal de ellos tambien lo es. Por tanto, todos los estados de Es son autoestados de S2 con el mismovalor propio (3/4) ~2, esto implica que S2 es proporcional al operador identidad de Es

S2 =3

4~2Is

definiendo los operadores escalera Ec. (10.13), tenemos

S± = S1 ± iS2 (15.9)

Invirtiendo la relaciones (15.9) escribimos

S1 =S+ + S−

2; S2 =

S+ − S−2i

(15.10)

La accion de los operadores S± sobre los vectores base esta dada por las Ecs. (10.46) con j = s = 1/2

S+ |+〉 = S− |−〉 = 0 ; S+ |−〉 = ~ |+〉 ; S− |+〉 = ~ |−〉 (15.11)

Los operadores Si,S2, S± poseen el algebra de cualquier momento angular Ecs. (10.14-10.17). Sin embargo, hay

algunas propiedades algebraicas adicionales propias de j = s = 1/2. En lo que sigue tomaremos j = s = 1/2.

Las expresiones (15.10) junto con (15.11) nos permiten demostrar ciertas propiedades de los S i y de S±. Cal-culemos primero S2

1 , S22 , S1S2, S2S1

S21 =

1

4

(S2

+ + S2− + S+S− + S−S+

); S2

2 = −1

4

(S2

+ + S2− − S+S− − S−S+

)(15.12)

S1S2 =1

4i

(S2

+ − S+S− + S−S+ − S2−)

; S2S1 =1

4i

(S2

+ + S+S− − S−S+ − S2−)

S1S2 =S2

+ − [S+, S−] − S2−

4i; S2S1 =

S2+ + [S+, S−] − S2

−4i

S1S2 =S2

+ − 2~S3 − S2−

4i; S2S1 =

S2+ + 2~S3 − S2

−4i

(15.13)

donde hemos usado (10.16). Similarmente podemos calcular los otros productos

S1S3 =1

2(S+S3 + S−S3) ; S3S1 =

1

2(S3S+ + S3S−) (15.14)

S2S3 =1

2i(S+S3 − S−S3) ; S3S1 =

1

2i(S3S+ − S3S−) (15.15)

4Este es por supuesto un abuso del lenguaje, ya que ambos estados poseen el mismo espın y se diferencian solo en su momentomagnetico intrınseco.

Page 335: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

15.6. PROPIEDADES DE UN MOMENTO ANGULAR 1/2 335

un estado arbitrario de Es esta dado por (15.8). Por tanto la accion de los operadores S± sobre un estado arbitrariode Es se obtiene combinando (15.11) con (15.8)

S2+ |χ〉 = S2

+ [c+ |+〉 + c− |−〉] = c−S2+ |−〉 = ~c−S+ |+〉 = 0

S2− |χ〉 = S2

− [c+ |+〉 + c− |−〉] = c+S2− |+〉 = ~c+S− |−〉 = 0

S+S− |χ〉 = S+S− [c+ |+〉 + c− |−〉] = c+S+S− |+〉 = ~c+S+ |−〉 = ~2c+ |+〉 = ~2P+ |χ〉S−S+ |χ〉 = S−S+ [c+ |+〉 + c− |−〉] = c−S−S+ |−〉 = ~c−S− |+〉 = ~2c− |−〉 = ~2P− |χ〉

(S+S− + S−S+) |χ〉 = ~2 [P+ + P−] |χ〉 = ~2 |χ〉

y como |χ〉 es arbitrario, se obtiene

S2+ = S2

− = 0 ; S+S− = ~2P+ ; S−S+ = ~2P− ; (S+S− + S−S+) = ~2Is (15.16)

donde hemos definido los proyectores P± de modo que

Es = E+ ⊕ E− ; |χ〉 = |χ〉+ + |χ〉− ; |χ〉± ∈ E± , |χ〉 ∈ EsP± |χ〉 = |χ〉± = c± |±〉

usando (15.16) en (15.12) se obtiene

S21 =

1

4

(S2

+ + S2− + S+S− + S−S+

)=

1

4~2Is

S22 = −1

4

(S2

+ + S2− − S+S− − S−S+

)=

1

4~2Is

S23 = S2 − S2

1 − S22 =

3

4~2Is −

1

4~2Is −

1

4~2Is =

1

4~2Is

⇒ S21 = S2

2 = S23 =

1

4~2Is (15.17)

Ahora utilizando (15.16) en (15.13) se obtiene

S1S2 = − i

4

(S2

+ − 2~S3 − S2−)

= i~

2S3 ; S2S1 = − i

4

(S2

+ + 2~S3 − S2−)

= −i~2S3

⇒ S1S2 + S2S1 = 0 ; S1S2 =i~

2S3 (15.18)

empleando (15.11) en (15.14) tenemos

S1S3 |χ〉 =1

2(S+S3 + S−S3) [c+ |+〉 + c− |−〉] =

1

2(S+ + S−) [c+S3 |+〉 + c−S3 |−〉]

=~

4(S+ + S−) [c+ |+〉 − c− |−〉] =

~c+4

(S+ + S−) |+〉 − ~c−4

(S+ + S−) |−〉

=~2c+

4|−〉 − ~2c−

4|+〉

S1S3 |χ〉 =~2

4[c+ |−〉 − c− |+〉] (15.19)

S3S1 |χ〉 =1

2(S3S+ + S3S−) [c+ |+〉 + c− |−〉] =

c+2

(S3S+ + S3S−) |+〉 +c−2

(S3S+ + S3S−) |−〉

=~c+2S3 |−〉 +

~c−2S3 |+〉 = −~2c+

4|−〉 +

~2c−4

|+〉 = −~2

4[c+ |−〉 − c− |+〉]

S3S1 |χ〉 = −~2

4[c+ |−〉 − c− |+〉] (15.20)

comparando (15.19) con (15.20) teniendo en cuenta que |χ〉 es arbitrario se obtiene

S1S3 + S3S1 = 0

Page 336: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

336 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

ahora miremos la accion de S2 sobre |χ〉

S2 |χ〉 =S+ − S−

2i[c+ |+〉 + c− |−〉] = c+

S+ − S−2i

|+〉 + c−S+ − S−

2i|−〉 = −c+

~

2i|−〉 + c−

~

2i|+〉

S2 |χ〉 =i~

2[c+ |−〉 − c−~ |+〉] (15.21)

comparando (15.21) con (15.20) resulta

S3S1 =i~

2S2 (15.22)

similarmente se puede demostrar que

S2S3 + S3S2 = 0 ; S2S3 =i~

2S1 (15.23)

15.6.1. Resumen de resultados

Los observables Si,S2, S± poseen el algebra de un momento angular Ecs. (10.14-10.17). Pero hay algunas

propiedades algebraicas adicionales especıficas de j = s = 1/2. Definiendo el anticonmutador de dos operadorescomo

A,B ≡ AB +BA

Este algebra especıfica esta dada por

S2+ = S2

− = 0 ; S+S− = ~2P+ ; S−S+ = ~2P− ; S+, S− = ~2Is (15.24)

S21 = S2

2 = S23 =

1

4~2Is ; SiSj =

i~

2εijkSk ; Si, Sj = 0 ; i 6= j (15.25)

vale la pena enfatizar que la ultima de las relaciones (15.25) nos dice que para s = 1/2, los operadores de espın S ison anticonmutantes.

15.6.2. Representacion matricial de los observables de espın

Un operador que actua en Es se puede representar en la base |+〉 , |−〉 con una matriz 2 × 2. En particular,usando (15.6, 15.9, 15.11) se puede construır la representacion matricial de los S±, Si y S2 (ver tambien las Ecs.10.59, 10.60 Pag. 273). Esta representacion matricial se puede resumir en la forma

(S) =~

2σ ; σ1 =

(0 11 0

); σ2 =

(0 −ii 0

); σ3 =

(1 00 −1

)

(S2)

=3

4~2Is ≡

3

4~2σ0 ; (S+) = ~

(0 10 0

)≡ ~σ+ ; (S−) = ~

(0 01 0

)≡ ~σ−

puesto que las matrices (~/2) σi y las matrices ~σ± son representaciones de los operadores Si y S± deben cumplirel algebra de estos operadores Ecs. (15.24, 15.25)

[σi, σj ] = 2iεijkσk ; σ21 = σ2

2 = σ23 = 12×2

σi, σj = 0 ; σiσj = iεijkσk for i 6= j

σ2+ = σ2

− = 0 ; σ+σ− = P+ ; σ−σ+ = P− ; σ+σ− + σ−σ+ = Is (15.26)

estas relaciones se pueden verificar explıcitamente. Tambien se puede verificar explıcitamente que

Trσi = 0 ; det (σi) = −1 ; i = 1, 2, 3 (15.27)

Las Ecs. (15.27) son independientes de la base ya que la traza y el determinante son invariantes ante transformacionesde similaridad. Podemos verificar tambien la siguiente identidad

(~σ·A) (σ · B) = 12×2 (A · B) + iσ· (A×B) ; ~σ ≡ (σ1, σ2, σ3) (15.28)

Page 337: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

15.7. DESCRIPCION NO RELATIVISTA COMPLETA DE OPERADORES Y ESTADOS DE PARTICULAS CON ESPIN 1/2337

donde A y B son vectores arbitrarios u operadores vectoriales cuyas tres componentes conmutan con las componentesde S. No es necesario que A y B conmuten, pero si no conmutan, el orden de aparicion de los operadores en (15.28)debe ser estricto. La Ec. (15.28) se puede demostrar usando las propiedades (15.26) y la hipotesis de que lascomponentes de A y B conmutan con las σi. Usaremos sımbolos explıcitos de sumatoria para efectos de claridad

(σ ·A) (σ ·B) =∑

m

n

(σmAm) (σnBn) =∑

m

(σmAm) (σmBm) +∑

m

n6=m(σmAm) (σnBn)

=∑

m

σ2mAmBm +

m

n6=mσmσnAmBn =

m

12×2AmBm +∑

m

n6=m

[∑

k

iεmnkσk

]AmBn

= 12×2

m

AmBm + i∑

k

σk∑

m

n6=mεmnkAmBn = 12×2 (A ·B) + i

k

σk (A×B)k

(σ ·A) (σ ·B) = 12×2 (A · B) + iσ· (A×B)

Finalmente, si definimos el conjunto de matrices

σµ ≡ (σ0, σ) = (I, σ1, σ2, σ3) (15.29)

cualquier matriz compleja 2 × 2 se puede escribir como una combinacion lineal compleja de estas cuatro matrices

M2×2 = cµσµ ; µ = 0, 1, 2, 3

sumando sobre ındices repetidos. Esto se debe a que las cuatro matrices σµ son linealmente independientes y senecesitan cuatro elementos (complejos) para determinar una matriz compleja 2×2. Por lo tanto, las cuatro matricesσµ forman una base para el espacio vectorial complejo de todas las matrices complejas 2 × 2.

15.7. Descripcion no relativista completa de operadores y estados de partıcu-

las con espın 1/2

Hemos visto como se describen los estados y operadores de Er y de Es por aparte. Pero la descripcion completadel sistema cuantico requiere construır un unico espacio de estados para el formalismo. El espacio de estadoscompleto E para una partıcula de espın 1/2, se construye como el producto tensorial de Er y Es

E = Er ⊗ Es

15.7.1. Construccion de los estados

Si tenemos un operador definido en Er podemos extenderlo al espacio E mediante el producto tensorial con laidentidad de Es. Si A es un operador que transforma sobre Er podemos extenderlo a un operador A′ que transformasobre E en la forma

A′ ≡ A⊗ Is

similarmente un operador B de Es se puede extender a un operador sobre E con la prescripcion

B′ = Ir ⊗B

Sin embargo, no cambiaremos la notacion para estas extensiones y las seguiremos llamando A y B. En particular,podemos obtener un C.S.C.O. en E como la yuxtaposicion de un C.S.C.O. en Er con un C.S.C.O. en Es. Por ejemplo,en Es el conjunto S2, S3 forma un C.S.C.O. a esto le podemos anadir un C.S.C.O. de Er para obtener un C.S.C.O.de E . Como ejemplos tenemos

X1, X2, X3,S

2, S3

;P1, P2, P3,S

2, S3

;L2, L3,H,S

2, S3

(15.30)

puesto que todos los kets de E son kets propios de S2, este operador podrıa ser omitido y aun tendrıamos un C.S.C.O.en E . Esto se debe a que estrictamente S3 por sı solo ya forma un C.S.C.O. en Es. Sin embargo, es usual dejar S2

Page 338: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

338 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

dentro del C.S.C.O. ya que si bien es deseable que este contenga el mınimo de operadores posible, no es obligatorioque ası sea.

Vamos a escribir las relaciones con el primero de los C.S.C.O. en la Ec. (15.30). Una base en E se obtiene comoel producto tensorial de las bases en cada espacio

|r, ε〉 ≡ |x1, x2, x3, ε〉 = |r〉 ⊗ |ε〉 , |ε〉 ∈ Es

las componentes xi varıan entre −∞ e ∞ y ε toma los valores +1 o −1 (ındice discreto que realmente significams = ±1/2). Por definicion |r, ε〉 es una base de autovectores comunes a

X1, X2, X3,S

2, S3

en E

Xi |r, ε〉 = xi |r, ε〉 ; S2 |r, ε〉 =3

4~2 |r, ε〉 ; S3 |r, ε〉 = ε

~

2|r, ε〉 ; ε ≡ ±1

puesto que esto es un C.S.C.O. cada |r, ε〉 es unico salvo factores constantes. Dado que |r〉 es ortonormal en Er enel sentido extendido, y |ε〉 es ortonormal en Es (ver Ecs. 15.7) entonces |r, ε〉 es ortonormal en E en el sentidoextendido

〈r′ε′ |r, ε〉 =(⟨

r′∣∣⊗⟨ε′∣∣) (|r〉 ⊗ |ε〉) = 〈r′ |r〉 〈ε′ |ε〉

〈r′ε′ |r, ε〉 = δ(r− r′

)δεε′

la relacion de completez que nos dice que |r, ε〉 es una base en E es

ε

∫d3r |r, ε〉 〈r, ε| =

∫d3r |r,+〉 〈r,+| +

∫d3r |r,−〉 〈r,−| = IE

por tanto, todo estado |ψ〉 ∈ E se puede expandir en |r, ε〉

|ψ〉 = IE |ψ〉 =∑

ε

∫d3r |r, ε〉 〈r, ε|ψ〉

|ψ〉 =∑

ε

∫d3r ψε (r) |r, ε〉 , ψε (r) ≡ 〈r, ε|ψ〉 (15.31)

donde ψε (r) son las coordenadas o componentes (transformadas de Fourier) en la base |r, ε〉. Estas coordenadaso componentes, dependen de tres ındices contınuos r y del ındice discreto ε. Por tanto, una funcion de onda en E seespecifica a traves de dos funciones de onda espaciales correspondientes a los dos estados de espın

ψ (r) = ψ+ (r) + ψ− (r) (15.32)

ψ± (r) ≡ 〈r,± |ψ〉 (15.33)

como ψ+ (r) y ψ− (r) son estados ortogonales, es usual escribirlos en forma de un arreglo de dos componentesconocido como espinor

[ψ] (r) =

(ψ+ (r)ψ− (r)

)(15.34)

el bra 〈ψ| asociado al espacio dual E ∗ se obtiene con el hermıtico conjugado de la Ec. (15.31)

〈ψ| =∑

ε

∫d3r ψ∗

ε (r) 〈r, ε|

conjugando las Ecs. (15.32, 15.33) vemos que

ψ∗ (r) = ψ∗+ (r) + ψ∗

− (r) ; ψ∗± (r) ≡ 〈ψ |r,±〉

nos dice que el bra 〈ψ| esta representado por dos funciones ψ∗± (r) que se pueden escribir en forma de espinor como

el adjunto de (15.34)[ψ]† (r) =

(ψ∗

+ (r) ψ∗− (r)

)(15.35)

Page 339: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

15.7. DESCRIPCION NO RELATIVISTA COMPLETA DE OPERADORES Y ESTADOS DE PARTICULAS CON ESPIN 1/2339

el producto escalar entre dos estados |ψ〉 y |ϕ〉, se puede escribir como

〈ψ |ϕ〉 = 〈ψ| IE |ϕ〉 =∑

ε

∫d3r 〈ψ |r, ε〉 〈r, ε|ϕ〉 =

∫d3r

[∑

ε

〈ψ |r, ε〉 〈r, ε|ϕ〉]

〈ψ |ϕ〉 =

∫d3r [〈ψ |r,+〉 〈r,+|ϕ〉 + 〈ψ |r,−〉 〈r,−|ϕ〉]

〈ψ |ϕ〉 =

∫d3r

[ψ∗

+ (r)ϕ+ (r) + ψ∗− (r)ϕ− (r)

]

esto tambien se puede escribir en la forma

〈ψ |ϕ〉 =

∫d3r

[(ψ∗

+ (r) ψ∗− (r)

)( ϕ+ (r)ϕ− (r)

)]

〈ψ |ϕ〉 =

∫d3r [ψ]† (r) [ϕ] (r)

donde hemos usado (15.34, 15.35). Esta expresion se asemeja a la que se obtiene para el producto interno de dos ketsen Er, pero teniendo en cuenta que en vez de funciones de onda escalares tenemos espinores de dos componentes, demodo que se debe realizar la multiplicacion matricial antes de integrar en el espacio. En particular la normalizacionqueda en la forma

〈ψ |ψ〉 = |ψ|2 =

∫d3r [ψ]† (r) [ψ] (r) =

∫d3r

[|ψ+ (r)|2 + |ψ− (r)|2

]= 1 (15.36)

hemos visto que un vector de E no necesariamente es el producto tensorial de un vector en Er por otro en Es. Sinembargo, esto es valido para algunos vectores (en particular los vectores base |r, ε〉), si el vector |ψ〉 en cuestion esde este tipo

|ψ〉 = |ϕ〉 ⊗ |χ〉 ; |ϕ〉 ∈ Er , |χ〉 ∈ Esel espinor asociado tendra una forma simple ya que

|ϕ〉 =

∫d3r ϕ (r) |r〉 ; |χ〉 = c+ |+〉 + c− |−〉

usando las Ecs. (15.32, 15.33) se tiene que

ψ± (r) ≡ 〈r,± |ψ〉 = [〈r| ⊗ 〈±|] [|ϕ〉 ⊗ |χ〉] = 〈r |ϕ〉 〈± |χ〉 = ϕ (r) 〈±| [c+ |+〉 + c− |−〉]ψ± (r) = c±ϕ (r)

y los espinores dados en (15.34, 15.35) quedan

[ψ] (r) =

(c+ϕ (r)c−ϕ (r)

)= ϕ (r)

(c+c−

)

[ψ]† (r) = ϕ∗ (r)(c∗+ c∗−

)

si en particular |χ〉 = |+〉 entonces c+ = 1, c− = 0. Resultando

|ψ〉 = |ϕ〉 ⊗ |+〉 ⇒ ψ+ (r) ≡ 〈r |ϕ〉 〈+ |+〉 = ϕ (r) ; ψ− (r) ≡ 〈r |ϕ〉 〈− |+〉 = 0

[ψ] (r) = ϕ (r)

(10

); [ψ]† (r) = ϕ∗ (r)

(1 0

)

similarmente, si |χ〉 = |−〉[ψ] (r) = ϕ (r)

(01

); [ψ]† (r) = ϕ∗ (r)

(0 1

)

Page 340: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

340 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

15.7.2. Construccion de operadores

Veremos como se puede caracterizar la accion de los operadores en E . Para ello trabajaremos primero operadoresoriginalmente definidos en Es, despues operadores definidos en Er y finalmente operadores mixtos.

Operadores espinoriales

Asumamos que el operador As esta definido originalmente solo por su accion sobre Es

As |ε〉 =∣∣ε′⟩

; |ε〉 ,∣∣ε′⟩∈ Es

Su extension como operador sobre E se escribe

A′s ≡ As ⊗ Ir

definimos la accion del operador extendido en la forma

A′s |ψ〉 =

∣∣ψ′⟩ ; |ψ〉 ,∣∣ψ′⟩ ∈ E

expandiendo |ψ〉 en la base |r, ε〉

|ψ〉 =∑

ε

∫d3r ψε (r) |r, ε〉

A′s |ψ〉 =

ε

∫d3r ψε (r)

[A′s |r, ε〉

]

la accion de A′s sobre |r, ε〉 es muy clara, ya que

A′s |r, ε〉 = (As ⊗ Ir) [|r〉 ⊗ |ε〉] = (Ir |r〉) ⊗ [As |ε〉] = |r〉 ⊗

∣∣ε′⟩

A′s |r, ε〉 =

∣∣r,ε′⟩

A′s |ψ〉 =

ε

∫d3r ψε (r)

∣∣r,ε′⟩

la extension del operador solo afectara a la parte espinorial de |r, ε〉 y la transformara de la misma forma que lohace el operador original, en tanto que la parte espacial permanece intacta. Estos operadores se pueden representarcomo matrices 2×2 y de aquı en adelante usamos A para denotar al operador extendido5. Tomemos como ejemploa S+, este operador actuando sobre un estado arbitrario |ψ〉 de E nos da

S+ |ψ〉 =∑

ε

∫d3r ψε (r) [S+ |r,ε〉] =

∫d3r ψ+ (r) [S+ |r,+〉] + ψ− (r) [S+ |r,−〉]

S+ |ψ〉 =

∫d3r ψ− (r) [S+ |r,−〉]

donde hemos usado que S+ |+〉 = 0 y por tanto S+ |r,+〉 = 0. Y como S+ |−〉 = ~ |+〉 se tiene finalmente

∣∣ψ′⟩ ≡ S+ |ψ〉 = ~

∫d3r ψ− (r) |r,+〉

las componentes espinoriales de |ψ ′〉 son entonces

ψ′+ (r) ≡ 〈r,+

∣∣ψ′⟩ = 〈r,+| ~∫d3r′ ψ−

(r′) ∣∣r′,+

⟩= ~

∫d3r′ ψ−

(r′)〈r,+

∣∣r′,+⟩

= ~

∫d3r′ ψ−

(r′)〈r∣∣r′⟩〈+ |+〉

= ~

∫d3r′ ψ−

(r′)δ(r− r′

)= ~ψ− (r)

5Por supuesto la representacion matricial de A′s es estrictamente de dimension infinita, pero dado que A′

s = As ⊗ 1r, se tiene que laparte no trivial de la matriz es de dimension finita.

Page 341: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

15.7. DESCRIPCION NO RELATIVISTA COMPLETA DE OPERADORES Y ESTADOS DE PARTICULAS CON ESPIN 1/2341

de manera similar podemos obtener ψ ′− (r), con lo cual resulta

ψ′+ (r) ≡ 〈r,+

∣∣ψ′⟩ = ~ψ− (r) ; ψ′− (r) ≡ 〈r,−

∣∣ψ′⟩ = 0

[ψ′] (r) = ~

(ψ− (r)

0

)

pero esto tambien se puede escribir como

[ψ′] (r) = ~

(0 10 0

)(ψ+ (r)ψ− (r)

)

[ψ′] (r) = ~σ+ [ψ] (r)

es decir la misma representacion matricial sirve para definir a S+ tanto en Es como en E . ¿Cual es la diferencia?.Formalmente, en Es cada elemento de la matriz es un numero. En cambio en E cada elemento matricial representa aun operador que actua sobre Er, por ejemplo, la matriz σ+ como representacion extendida, rigurosamente significalo siguiente

σ′+ =

(0r Ir0r 0r

)

es decir cada elemento matricial representa a los operadores nulo e identidad del espacio Er. No obstante, desde elpunto de vista practico esta notacion es innecesaria.

Operadores orbitales

El procedimiento es similar. Asumamos Ax que actua sobre Er, definiendo su extension y su accion sobre un ket|ψ〉 de E obtenemos

Ax |r〉 =∣∣r′⟩

; |r〉 ,∣∣r′⟩∈ Er

A′x ≡ Ax ⊗ Is ; A′

x |r, ε〉 =∣∣r′, ε

|ψ〉 =∑

ε

∫d3r ψε (r) |r, ε〉

∣∣ψ′⟩ ≡ A′x |ψ〉 =

ε

∫d3r ψε (r)

[A′x |r, ε〉

]=∑

ε

∫d3r ψε (r)

∣∣r′, ε⟩

∣∣ψ′⟩ ≡ A′x |ψ〉 =

∫d3r

ψ+ (r)

[A′x |r,+〉

]+ ψ− (r)

[A′x |r,−〉

]

como A′x |r,+〉 actua sobre un espacio identico a |r〉 (ya que actua sobre un subespacio unidimensional de Es),

podemos escribir Ax |r,+〉. Igual ocurre para Ax |r,−〉

ψ′+ (r) ≡ 〈r,+

∣∣ψ′⟩ = 〈r,+|∫d3r′

ψ+

(r′) [Ax∣∣r′,+

⟩]+ ψ−

(r′) [Ax∣∣r′,−

⟩]

=

∫d3r′

[〈r,+|ψ+

(r′)Ax∣∣r′,+

⟩]+[〈r,+|ψ−

(r′)Ax∣∣r′,−

⟩]

=

∫d3r′

Ax (r)

[ψ+

(r′)〈r,+

∣∣r′,+⟩]

+ ψ−(r′) [Ax〈r,+

∣∣r′,−⟩]

=

∫d3r′′

Ax (r) ψ+

(r′)δ(r − r′

)= Ax (r) ψ+ (r)

donde Ax (r) denota la forma del operador Ax en la base |r〉, con lo cual se obtiene

ψ′+ (r) ≡ 〈r,+

∣∣ψ′⟩ = Ax (r)ψ+ (r)

ψ′− (r) ≡ 〈r,−

∣∣ψ′⟩ = Ax (r)ψ− (r)

Page 342: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

342 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

[ψ′] (r) =

(Ax (r) 0

0 Ax (r)

)(ψ+ (r)ψ− (r)

)=[Ax (r) ⊗ Is

][ψ] (r)

que nos muestra la forma correcta para la extension del operador Ax

Por tanto, la representacion matricial 2 × 2 del operador es proporcional a la identidad, puesto que no haycambio en los estados espinoriales. Los operadores actuan sobre la parte espacial tal como lo hace el operadororiginal. Tomemos como ejemplo a los operadores X1, P1

ψ′ε (r) = 〈r, ε|X1 |ψ〉 = x1ψε (r)

ψ′′

ε (r) = 〈r, ε|P1 |ψ〉 =~

i

∂x1ψε (r)

sus representaciones matriciales son

[X1] =

(x1 00 x1

); [P1] =

~

i

(∂∂x1

0

0 ∂∂x1

)

de nuevo cada elemento de la matriz es un operador sobre Er aunque esta vez es un operador no trivial. En estecaso el operador trivial es sobre los espinores y por eso la matriz es proporcional a la identidad.

Operadores mixtos

Si un operador es de caracter mixto, sera una matriz 2×2 no trivial que actua sobre Es y en donde cada elementomatricial es un operador no trivial sobre Er. Algunos ejemplos de operadores mixtos que aparecen en cuantica sonL3S3, S · P. De acuerdo con la teorıa de representaciones, las representaciones matriciales deben manifestar lapreservacion del producto

[L3S3] = [L3] [S3] =

[~

iIs∂

∂ϕ

] [~

2Irσ3

]

=

[~

i

(∂∂ϕ 0

0 ∂∂ϕ

)][~

2

(1 00 −1

)]

[L3S3] =~2

2i

(∂∂ϕ 0

0 − ∂∂ϕ

)

[S · P] = [S1P1] + [S2P2] + [S3P3] = [S1] [P1] + [S2] [P2] + [S3] [P3]

=

[~

2σ1

] [~

i

∂x1

]+

[~

2σ2

] [~

i

∂x2

]+

[~

2σ3

] [~

i

∂x3

]

=~2

2i

(σ1

∂x1+ σ2

∂x2+ σ3

∂x3

)

[S ·P] =~2

2i

[(0 11 0

)∂

∂x1+

(0 −ii 0

)∂

∂x2+

(1 00 −1

)∂

∂x3

]

[S ·P] =~2

2i

[(0 ∂

∂x1∂∂x1

0

)+

(0 −i ∂

∂x2

i ∂∂x2

0

)+

(∂∂x3

0

0 − ∂∂x3

)]

[S ·P] =~2

2i

(∂∂x3

∂∂x1

− i ∂∂x2

∂∂x1

+ i ∂∂x2

− ∂∂x3

)

vale enfatizar que por construccion, operadores de espacios distintos conmutan.En sıntesis, para un operador arbitrario A de E tal que

A |ψ〉 =∣∣ψ′⟩

Page 343: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

15.8. REPRESENTACION EN LA BASE |P, ε〉 343

podemos asociarle una matriz 2 × 2 en la forma[ψ′] (r) = [A] [ψ] (r)

donde la estructura de la matriz representa la transformacion sobre el espacio de espines y cada elemento de lamatriz representa un operador en el espacio de coordenadas. Un elemento matricial 〈ψ|A |ϕ〉 estara dado por

〈ψ|A |ϕ〉 =

∫d3r [ψ]† (r) [A] [ϕ] (r)

expresion similar a la que se encuentra para el espacio de coordenadas, pero teniendo en cuenta que en vez defunciones de onda escalares aquı tenemos espinores de dos componentes. Los productos matriciales deben hacersepara entonces evaluar la integral. Esta representacion solo se usara cuando sea particularmente simple. En generalal igual que en Er suele ser mejor trabajar con los operadores y estados en abstracto hasta donde sea posible.

15.8. Representacion en la base |p, ε〉Un tratamiento similar se puede desarrollar si escojemos los C.S.C.O como P1, P2, P3,S

2, S3. En tal caso la basees |p, ε〉 el producto escalar con la base |r, ε〉 nos da

〈r, ε∣∣p, ε′

⟩= 〈r |p〉 〈ε

∣∣ε′⟩

=ei

p·r~

(2π~)3/2δεε′ (15.37)

a cada vector |ψ〉 se le asocia un espinor de dos componentes

[ψ](p) ≡

(ψ+ (p)ψ− (p)

); ψ± (p) = 〈p,± |ψ〉

de acuerdo con (15.37) ψ± (p) es la transformada de Fourier de ψ± (r).

ψε (p) = 〈p, ε |ψ〉 =∑

ε′

∫d3r 〈p, ε

∣∣r, ε′⟩ ⟨

r, ε′∣∣ψ〉

ψε (p) =∑

ε′

∫d3r

e−ip·r~

(2π~)3/2δεε′ψε′ (r)

ψε (p) =1

(2π~)3/2

∫d3r e−i

p·r~ ψε (r)

los operadores tambien se representan por matrices 2×2. Cuando el operador original es espinorial la representacionmatricial es identica a la que se encontro para la base |r, ε〉.

15.9. Calculos de probabilidad para estados de espın 1/2

Aplicaremos los postulados de la mecanica cuantica para los observables sobre el espacio de estados E . Imag-inemos que queremos medir simultaneamente la posicion y la componente del espın de un partıcula de espın 1/2a lo largo de X3. Puesto que r, S3 constituye un C.S.C.O. hay un unico estado asociado a cada medida de estosobservables, x1, x2, x3,±~

2 . La probabilidad dP (r,+) de que la partıcula se encuentre dentro de un volumen d3ralrededor del punto r con su espın “arriba” (que es una forma de designar el caso en el cual la componente del espına lo largo de X3 es +~/2), esta dada por

dP (r,+) = |〈r,+|ψ〉|2 d3r = |ψ+ (r)|2 d3r

donde hemos asumido que la funcion de onda esta normalizada en la forma (15.36). Similarmente la probabilidad deque la partıcula se encuentre dentro de un volumen d3r centrado en r con su espın “abajo” (es decir con la componentedel espın a lo largo de X3 igual a −~/2), esta dada por

dP (r,−) = |〈r,−|ψ〉|2 d3r = |ψ− (r)|2 d3r

Page 344: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

344 CAPITULO 15. MOMENTO ANGULAR INTRINSECO

Si lo que queremos es medir la componente del espın a lo largo de X1, debemos tener en cuenta que los autoestados(normalizados) de S1 vienen dados por

|±〉S1=

1√2

[|r,+〉 ± |r,−〉] (15.38)

siendo |±〉 los autoestados de S3. Podemos verificar que estos son autoestados de S1 en la siguiente forma

S1 |±〉S1=

1√2S1 [|r,+〉 ± |r,−〉] =

1

2√

2(S+ + S−) [|r,+〉 ± |r,−〉] =

1

2√

2[S− |r,+〉 ± S+ |r,−〉] =

~

2√

2[|r,+〉 ± |r,−〉]

S1 |±〉S1=

~

2|±〉S1

La probabilidad de encontrar al electron en el volumen d3r centrado en r y con componente positiva de espın a lolargo de X1 es

dPS1 (r,+) = |S1 〈r,+|ψ〉|2 d3r =

∣∣∣∣1√2

[〈r,+| + 〈r,−|] |ψ〉∣∣∣∣2

=1

2|[〈r,+|ψ〉 + 〈r,−|ψ〉]|2

dPS1 (r,+) =1

2|ψ+ (r) + ψ− (r)|2 d3r (15.39)

Por supuesto, podemos estar interesados en calcular la probabilidad de que la partıcula posea un momentocentrado en p en un volumen (de momento) d3p y con componente de espın a lo largo de Z de ±~/2. Para ellousamos las componentes del estado |ψ〉 en la base |p, ε〉, que nos da las transformadas de Fourier de ψ± (r)

ψ± (p) ≡ 〈p,± |ψ〉

la probabilidad ya mencionada sera entonces

dP (p,±) = |〈p,± |ψ〉|2 d3p =∣∣ψ± (p)

∣∣2 d3p

Por otro lado, podemos estar interesados en hacer mediciones incompletas en el sentido de que los observablesasociados a las medidas no formen un C.S.C.O. es decir que las medidas no conducen a determinar el estado demanera unica. Cuando las medidas son incompletas hay varios estados ortogonales asociados al mismo resultado ydebe sumarse los cuadrados de los modulos de las amplitudes correspondientes.

Como ejemplo, si no nos interesa conocer el espın, la probabilidad dP (r) de encontrar a la partıcula en elvolumen d3r centrado en r es igual a

dP (r) =|〈r,+|ψ〉|2 + |〈r,−|ψ〉|2

d3r =

|ψ+ (r)|2 + |ψ− (r)|2

d3r

dado que los dos estados ortogonales |r,+〉 y |r,−〉 estan asociados al mismo resultado r donde sus amplitudes deprobabilidad son ψ+ (r) y ψ− (r).

Ahora supongamos que queremos saber la probabilidad de que la partıcula tenga componente S3 igual a +~/2,pero sin importar su ubicacion ni el valor de las demas variables orbitales. Hay un conjunto infinito de estadosortogonales |r,+〉 asociados a este resultado, cuyas probabilidades deben ser sumadas

P+ =

∫d3r |〈r,+|ψ〉|2 =

∫d3r |ψ+ (r)|2

si por ejemplo queremos encontrar la probabilidad de obtener un espın +~/2 a lo largo de X1, debemos integrar laEc. (15.39) en todo el espacio.

Page 345: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 16

Adicion de momentos angulares

16.1. El problema clasico de la adicion del momento angular

Cuando tenemos un sistema de partıculas el momento angular total del sistema es la suma de los momentosangulares individuales

L =

n∑

i=1

ri × pi (16.1)

cuando no hay fuerzas externas, el torque externo sobre el sistema es cero, y el momento angular total es constantede movimiento. Algo similar ocurre cuando el torque neto con respecto a un origen dado es cero, ya que el momentoangular alrededor del mismo origen sera constante de movimiento. En el ultimo caso sin embargo, hay que teneren cuenta que en general al cambiar el origen, el torque puede ser diferente de cero y el momento angular ya nosera constante de movimiento.

Cuando el sistema este aislado, el momento angular total se conserva, sin embargo no necesariamente se con-servara el momento angular de cada partıcula, si hay fuerzas internas ellas causaran un cambio en los momentosangulares individuales, de forma que la suma total sea constante. Solo cuando las partıculas no son interactuantespodemos garantizar la conservacion de los momentos angulares individuales, ya que en este caso cada partıculaforma un sistema aislado.

Otro escenario en donde se conserva el momento lineal es en fuerzas centrales. Si tenemos dos partıculas nointeractuantes cada una interactuando con el mismo centro de fuerzas (originada por una tercera partıcula muchomas masiva que las otras), el momento angular de cada partıcula se conserva puesto que cada una esta sometida auna fuerza central. Pero si hay una interacciona entre las dos partıculas, la fuerza neta sobre la partıcula 1 ya no esen general central, por tanto su momento angular ya no necesariamente es constante de movimiento, similarmenteocurre para la partıcula 2. No obstante, si se cumple el principio de accion y reaccion en su forma fuerte, el momentoangular total de las dos partıculas se conserva por la cancelacion de los torques internos. En conclusion, en un sistemaaislado de partıculas interactuantes solo el momento angular total se conserva pero no los momentos individuales.Veremos que este fenomeno tiene su contrapartida cuantica.

16.2. Momento angular total en mecanica cuantica

Trabajaremos el sistema de dos partıculas en mecanica cuantica. Primero asumiremos que no son interactuantes.El Hamiltoniano en la base de |r1, r2〉 esta dado por

H0 = H1 +H2

H1 = − ~2

2µ1∇2

1 + V (r1) ; H2 = − ~2

2µ2∇2

2 + V (r2) (16.2)

donde µi son las masas, V (r) el potencial central al cual estan sometidas, y ∇2i indica el Laplaciano tomado con las

coordenadas de la partıcula i. Del capıtulo 12 sabemos que L(1) conmuta con H1, y teniendo en cuenta que todos losobservables relacionados con una partıcula conmutan con todos los observables relacionados con la otra, se obtiene

[L(1),H1

]=[L(1),H2

]= 0 (16.3)

345

Page 346: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

346 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

argumento similar se tiene para L(2). Estos nos indica que

[L(1),H0

]=[L(2),H0

]= 0

y como L(α) no depende explıcitamente del tiempo, se tiene que cada momento angular es constante de movimientopor aparte, tal como en el caso clasico. Ahora asumimos que las dos partıculas interactuan por medio de un potencialW (|r2 − r1|) que solo depende de la distancia entre las partıculas, esto implica por supuesto asumir la validez dela ley de accion y reaccion. La distancia |r2 − r1| se escribe

|r2 − r1| =

√(x

(1)i − x

(2)i

)(x

(1)i − x

(2)i

)(16.4)

suma sobre ındices repetidos, el Hamiltoniano se escribe como

H = H1 +H2 +W (|r2 − r1|)

con Hi dados por (16.2). Las relaciones (16.3) nos dan

[L(1),H

]=[L(1),H1 +H2 +W (|r2 − r1|)

]=[L(1),W (|r2 − r1|)

]

analicemos por ejemplo la componente L(1)3 , para calcular el conmutador con W debemos aplicar el conmutador a

una funcion de onda arbitraria ψ (r)

[L

(1)3 ,W

]ψ (r) =

~

i

(x

(1)1

∂x(1)2

− x(1)2

∂x(1)1

)(Wψ) −W

~

i

(x

(1)1

∂x(1)2

− x(1)2

∂x(1)1

=~

i

(x

(1)1

∂W

∂x(1)2

− x(1)2

∂W

∂x(1)1

)ψ +

~

i

(x

(1)1

∂ψ

∂x(1)2

− x(1)2

∂ψ

∂x1

)W

−W ~

i

(x

(1)1

∂ψ

∂x(1)2

− x(1)2

∂ψ

∂x(1)1

)

=~

i

(x

(1)1

∂W

∂x(1)2

− x(1)2

∂W

∂x(1)1

)ψ (r)

y como ψ (r) es arbitraria se concluye que

[L

(1)3 ,W (|r2 − r1|)

]=

~

i

(x

(1)1

∂W

∂x(1)2

− x(1)2

∂W

∂x(1)1

)

esta expresion no es necesariamente cero, de modo que L(1) no es en general constante de movimiento. Ahora bien,si definimos el momento angular total L con una expresion analoga al caso clasico Ec. (16.1) tenemos

L = L(1) + L(2)

obtenemos un operador cuyas tres componentes son constantes de movimiento. Por ejemplo, se ve que

[L3,H] =[L

(1)3 + L

(2)3 ,H

]

[L3,H] =~

i

(x

(1)1

∂W

∂x(1)2

− x(1)2

∂W

∂x(1)1

+ x(2)1

∂W

∂x(2)2

− x(2)2

∂W

∂x(2)1

)(16.5)

Page 347: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

16.2. MOMENTO ANGULAR TOTAL EN MECANICA CUANTICA 347

y puesto que W solo depende de |r2 − r1| dada por (16.4) tenemos que

∂W

∂x(1)i

=∂W

∂ |r2 − r1|∂ |r2 − r1|∂x

(1)i

=∂W

∂ |r2 − r1|

√(x

(1)k − x

(2)k

)(x

(1)k − x

(2)k

)

∂x(1)i

=∂W

∂ |r2 − r1|2(x

(1)k − x

(2)k

)∂

∂x(1)i

(x

(1)k − x

(2)k

)

2

√(x

(1)k − x

(2)k

)(x

(1)k − x

(2)k

) =∂W

∂ |r2 − r1|

(x

(1)k − x

(2)k

)δik

√(x

(1)k − x

(2)k

)(x

(1)k − x

(2)k

)

∂W

∂x(1)i

=∂W

∂ |r2 − r1|x

(1)i − x

(2)i

|r2 − r1|

similarmente se calcula ∂W/∂x(2)i se obtiene entonces

∂W

∂x(1)i

=∂W

∂ |r2 − r1|∂ |r2 − r1|∂x

(1)i

=∂W

∂ |r2 − r1|x

(1)i − x

(2)i

|r2 − r1|

∂W

∂x(2)i

=∂W

∂ |r2 − r1|∂ |r2 − r1|∂x

(2)i

=∂W

∂ |r2 − r1|x

(2)i − x

(1)i

|r2 − r1|(16.6)

reemplazando (16.6) en (16.5), resulta

[L3,H] =~

i

1

|r2 − r1|∂W

∂ |r2 − r1|[x

(1)1

(x

(1)2 − x

(2)2

)− x

(1)2

(x

(1)1 − x

(2)1

)

+x(2)1

(x

(2)2 − x

(1)2

)− x

(2)2

(x

(2)1 − x

(1)1

)]

por tanto tenemos que[L3,H] = 0

y similarmente para las otras componentes. De modo que aunque L(1) y L(2) no son individualmente constantes demovimiento, sı lo es su suma L(1) + L(2) definida como el momento total del sistema, al igual que en el caso clasico.

En lo anterior asumimos que las partıculas no tienen espın. Vamos a tomar como segundo ejemplo a una partıculacon espın sujeta a una interaccion de tipo central. El Hamiltoniano para una partıcula sometida a una fuerza centralEc. (12.25) conmuta con el momento angular orbital L de la partıcula y como todos los operadores de espın conmutancon todos los operadores orbitales, entonces S tambien conmuta con el Hamiltoniano. Por tanto, L y S son cadauna constantes de movimiento. Sin embargo, puede demostrarse que las correcciones relativistas introducen en elHamiltoniano un acoplamiento espın-orbita que es un termino de la forma

HSO = ξ (r)L · S

siendo ξ (r) una funcion conocida de la variable r. Por el momento no analizaremos la procedencia fısica de estetermino, pero sı sus consecuencias. El Hamiltoniano ahora es

H ′ = H + ξ (r)L · S

Y se puede ver que ni L ni S conmutan con el nuevo Hamiltoniano[L3,H

′] = [L3,H +HSO] = [L3,HSO] = ξ (r) [L3, L1S1 + L2S2 + L3S3][L3,H

′] = ξ (r) [L3, L1S1 + L2S2] = ξ (r) [L3, L1]S1 + ξ (r) [L3, L2]S2[L3,H

′] = i~ξ (r) L2S1 − L1S2

similarmente[S3,H

′] = [S3,HSO] = ξ (r) [S3, L1S1 + L2S2 + L3S3][S3,H

′] = ξ (r) [S3, L1S1 + L2S2] = ξ (r)L1 [S3, S1] + ξ (r)L2 [S3, S2][S3,H

′] = i~ξ (r) L1S2 − L2S1 = −[L3,H

′]

Page 348: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

348 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

vemos entonces que [S3 + L3,H

′] = 0

e igualmente para las otras componentes. De esto se deduce que

J ≡ L + S

es una constante de movimiento a pesar de que L y S no lo son. Llamaremos a J el momento angular total delsistema.

Hay varias semejanzas entre los dos ejemplos realizados. En ambos tenemos dos momentos angulares parciales J (1)

y J(2) que conmutan entre sı. En ambos casos conocemos una base de autovectores de J2(1), J

(1)3 ,J2

(2), J(2)3 . Tambien

ocurre en los dos ejemplos que cada momento angular no es constante de movimiento (cuando los subsistemas unoy dos se acoplan) pero su suma sı lo es, definiendo

J ≡ J(1) + J(2)

J conmuta con el Hamiltoniano del sistema. Notese que la base de autovectores (conocida) de J2(1), J

(1)3 ,J2

(2), J(2)3

no diagonaliza al Hamiltoniano puesto que este no conmuta con J(1)3 ni con J

(2)3 . En contraste J2 y J3 sı conmutan

con el Hamiltoniano, por tanto una base comun de J2 y J3 hara que la matriz del Hamiltoniano sea diagonal porbloques1, tantos bloques como autosubespacios asociados a los conjuntos de autovalores de J2 y J3. Por tanto, laestructura de la matriz sera mas simple en la base de vectores propios comunes a J2 y J3 que en la base de vectores

comunes a J2(1), J

(1)3 ,J2

(2), J(2)3 .

Puesto que el punto de partida es la base conocida de vectores propios comunes de J2(1), J

(1)3 ,J2

(2), J(2)3 nuestra

tarea sera entonces construır a partir de esta, una nueva base de vectores comunes a J2 y J3, esto nos enfrentara conel problema de las reglas de adicion o composicion de los momentos angulares J(1) y J(2). Abordaremos inicialmenteel problema de la adicion de dos momentos angulares con j(1) = j(2) = 1/2.

16.3. La adicion de dos momentos angulares es otro momento angular

Si tenemos dos momentos angulares arbitrarios J(1) y J(2) ambos sobre espacios diferentes, la suma (de losoperadores extendidos) es tambien un momento angular. Como cada J(α) es un momento angular, se tiene que

[J

(1)i , J

(1)j

]= iεijkJ

(1)k ;

[J

(2)i , J

(2)j

]= iεijkJ

(2)k

ahora se tiene que

[Ji, Jj ] =[J

(1)i + J

(2)i , J

(1)j + J

(2)j

]=[J

(1)i , J

(1)j + J

(2)j

]+[J

(2)i , J

(1)j + J

(2)j

]

[Ji, Jj ] =[J

(1)i , J

(1)j

]+[J

(1)i , J

(2)j

]+[J

(2)i , J

(1)j

]+[J

(2)i , J

(2)j

]

dado que los momentos angulares J(1) y J(2) conmutan por ser de espacios diferentes, se tiene que

[Ji, Jj ] =[J

(1)i , J

(1)j

]+[J

(2)i , J

(2)j

]= iεijkJ

(1)k + iεijkJ

(2)k = iεijk

[J

(1)k + J

(2)k

]

[Ji, Jj ] = iεijkJk

lo cual muestra que si J(1) y J(2) son dos momentos angulares arbitrarios que conmutan entre sı, entonces el operador

J ≡ J(1) + J(2)

tambien es un momento angular. Todas las propiedades generales de un momento angular seran validas entoncespara J. Tendremos ademas otras propiedades para conmutadores mixtos (que involucren por ejemplo un momentoangular total y un momento angular parcial). En particular, veamos las propiedades de conmutacion de J2

J2 =(J(1) + J(2)

)2= J2

(1) + J2(2) + 2J(1) · J(2) (16.7)

1De hecho existira una base que diagonaliza a los tres operadores simultaneamente.

Page 349: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

16.3. LA ADICION DE DOS MOMENTOS ANGULARES ES OTRO MOMENTO ANGULAR 349

donde hemos tenido en cuenta que J(1) y J(2) conmutan. El producto escalar se puede expresar en terminos de los

operadores escalera J(1)± ,J

(2)± y los operadores J

(1)3 y J

(2)3 .

J(1) · J(2) = J(1)1 J

(2)1 + J

(1)2 J

(2)2 + J

(1)3 J

(2)3 (16.8)

=1

4

(J

(1)+ + J

(1)−)(

J(2)+ + J

(2)−)

+1

4i2

(J

(1)+ − J

(1)−)(

J(2)+ − J

(2)−)

+ J(1)3 J

(2)3

=1

4

[J

(1)+ J

(2)+ + J

(1)+ J

(2)− + J

(1)− J

(2)+ + J

(1)− J

(2)− − J

(1)+ J

(2)+ + J

(1)+ J

(2)−

+J(1)− J

(2)+ − J

(1)− J

(2)−

]+ J

(1)3 J

(2)3

J(1) · J(2) =1

2

(J

(1)+ J

(2)− + J

(1)− J

(2)+

)+ J

(1)3 J

(2)3 (16.9)

La idea ahora es comparar los conjuntos conmutantes

J2

(1), J(1)3 , J2

(2), J(2)3

;J2, J3

donde el primero consiste de momentos angulares parciales y el segundo de momentos angulares totales. Puesto queJ(1) y J(2) conmutan con J2

(1) y J2(2), tambien conmuta J

[J,J2

(1)

]=[J,J2

(2)

]= 0

en particular J2 y J3 conmutan con J2(1) y J2

(2)

[J3,J

2(1)

]=

[J3,J

2(2)

]= 0 (16.10)

[J2,J2

(1)

]=

[J2,J2

(2)

]= 0 (16.11)

por otro lado, es obvio que J3 conmuta con J(1)3 y J

(2)3

[J3, J

(1)3

]=[J3, J

(2)3

]= 0 (16.12)

pero J2 no conmuta ni con J(1)3 ni con J

(2)3 , lo cual vemos usando (16.7, 16.8)

[J2, J

(1)3

]=

[J2

(1) + J2(2) + 2J(1) · J(2), J

(1)3

]= 2

[J(1) · J(2), J

(1)3

]

[J2, J

(1)3

]= 2

[J

(1)1 J

(2)1 + J

(1)2 J

(2)2 , J

(1)3

]= 2

[J

(1)1 J

(2)1 , J

(1)3

]+ 2

[J

(1)2 J

(2)2 , J

(1)3

]

= 2J(1)1

[J

(2)1 , J

(1)3

]+ 2

[J

(1)1 , J

(1)3

]J

(2)1 + 2J

(1)2

[J

(2)2 , J

(1)3

]+ 2

[J

(1)2 , J

(1)3

]J

(2)2

[J2, J

(1)3

]= −2i~J

(1)2 J

(2)1 + 2i~J

(1)1 J

(2)2

quedando finalmente [J2, J

(1)3

]= 2i~

[J

(1)1 J

(2)2 − J

(1)2 J

(2)1

](16.13)

y puesto que J es un momento angular, se cumple que

[J2,J

]= 0

y por tanto [J2, J

(1)3 + J

(2)3

]= 0 ⇒

[J2, J

(1)3

]= −

[J2, J

(2)3

]

el analisis anterior nos muestra que el siguiente conjunto de operadores conmuta entre sı

J2, J3, J2

(1), J2(2)

Page 350: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

350 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

16.4. Adicion de dos momentos angulares con j(1) = j(2) = 1/2

Cada espacio E (k)1/2

asociado a j(k) fijo, es un espacio de dos dimensiones. Por tanto, su producto tensorial

E = E (1)1/2⊗E (2)

1/2 sera de 4 dimensiones. Denotaremos a la base ortonormal “natural” en este espacio por |ε1〉 ⊗ |ε2〉 ≡|ε1, ε2〉 y en forma explıcita escribimos

|ε1, ε2〉 = |+,+〉 , |+,−〉 , |−,+〉 , |−,−〉 (16.14)

estos vectores son autoestados de los observables J2(1), J

(1)3 ,J2

(2), J(2)3 . Estrictamente estos operadores deben ser las

extensiones tensoriales de los operadores originales.

J2(1) |ε1, ε2〉 = J2

(2) |ε1, ε2〉 =3

4~2 |ε1, ε2〉 (16.15)

J(1)3 |ε1, ε2〉 = ε1

~

2|ε1, ε2〉 ; J

(2)3 |ε1, ε2〉 = ε2

~

2|ε1, ε2〉 (16.16)

el conjunto

J2(1), J

(1)3 ,J2

(2), J(2)3 (16.17)

forma para el espacio E = E (1)1/2⊗E (2)

1/2, un C.S.C.O. “natural”, en el sentido de que este es el C.S.C.O. que se desprende

de la base “natural” de E . En otras palabras, la base (16.14) esta compuesta por vectores propios comunes al C.S.C.O.J2

(1), J(1)3 ,J2

(2), J(2)3

. Estrictamente J2

(1),J2(2) pueden ser excluıdos ya que son proporcionales a la identidad2.

Tambien hemos visto que los 4 observables

J2(1),J

2(2),J

2, J3 (16.18)

conmutan entre sı. Veremos ahora que este conjunto tambien es un C.S.C.O. en E = E (1)1/2 ⊗ E (2)

1/2. Adicionar dos

momentos angulares implica construır el sistema ortonormal de autovectores comunes al conjunto (16.18). Este

conjunto diferira de (16.14) ya que J2 no conmuta con J(1)3 ,J

(2)3 . Denotaremos los vectores de la nueva base en la

forma |J,M〉 donde los autovalores de J2(1),J

2(2) (que permanecen iguales) estan implıcitos3. Estos vectores satisfacen

las relaciones

J2(1) |J,M〉 = J2

(2) |J,M〉 =3

4~2 |J,M〉 (16.19)

J2 |J,M〉 = J (J + 1) ~2 |J,M〉 (16.20)

J3 |J,M〉 = M~ |J,M〉 (16.21)

ya que J es un momento angular, entonces J debe ser entero o semientero no negativo, M debe estar entre −J y Jvariando en saltos unidad. El problema es entonces encontrar los valores que J y M pueden tomar con base en losvalores de j1, j2 y m1,m2, ası como expresar la base |J,M〉 en terminos de la base conocida (16.14).

A continuacion resolveremos el problema diagonalizando las matrices 4×4 que representan a J2 y a J3 en la base|ε1, ε2〉. Mas adelante se empleara un metodo mas general que se puede usar en espacios vectoriales de dimensionarbitraria.

16.4.1. Autovalores de J3 y su degeneracion

Notese que para los observables J2(1,2) todos los vectores en el espacio E = E (1)

1/2⊗E (2)1/2 son autovectores, por tanto

|J,M〉 ya son autovectores de estos observables.

2Notese que la ecuacion (16.15) nos dice que J2(1) = J2

(2), entendidos como extensiones sobre el espacio tensorial, ya que actuan demanera identica sobre todos los elementos de la base. Esto tambien se puede ver teniendo en cuenta que ambos son proporcionales a la

identidad en sus respectivos espacios, de modo que sus extensiones son J2(1) =

(3/4~2E(1)

)⊗E(2) y J2

(2) = E(1) ⊗(3/4~2E(2)

)de modo

que J2(1) = J2

(2) = 3/4~2E(1×2).3La notacion completa serıa

∣∣J,M(j(1), j(2)

)⟩= |J,M (1/2, 1/2)〉.

Page 351: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

16.4. ADICION DE DOS MOMENTOS ANGULARES CON J(1) = J(2) = 1/2 351

Por otro lado, las Ecs. (16.10, 16.12) nos dicen que J3 conmuta con los cuatro observables del C.S.C.O. dadospor la Ec. (16.17). Por tanto, esperamos que los vectores base |ε1, ε2〉 sean automaticamente autovectores de J3.Usando (16.16) se encuentra que

J3 |ε1, ε2〉 =(J

(1)3 + J

(2)3

)|ε1, ε2〉 = (ε1 + ε2)

~

2|ε1, ε2〉

vemos entonces que |ε1, ε2〉 es autovector de J3 con autovalor

M~ =1

2(ε1 + ε2) ~ (16.22)

puesto que ε1 y ε2 toman los valores ±1, vemos que M toma los valores +1, 0,−1.Los valores M = ±1 son no degenerados. Solo un autovector corresponde a cada uno de ellos: |+,+〉 corresponde

a +1 y |−,−〉 corresponde a −1. En otras palabras para que M = +1 solo hay una posibilidad ε1 = ε2 = +1, elcaso M = −1 solo es posible si ε1 = ε2 = −1. En contraste, M = 0 tiene degeneracion dos, a el corresponden losestados |+,−〉 y |−,+〉. Esto se traduce en que hay dos soluciones para M = 0, ε1 = −ε2 = 1 y ε1 = −ε2 = −1.Cualquier combinacion lineal de los vectores |+,−〉 y |−,+〉 es un autoestado de J3 con autovalor M = 0.

Estos resultados se ven claramente en la representacion matricial de J3 en la base |ε1, ε2〉. Ordenando losvectores en la forma de la Ec. (16.14) esta matriz es

(J3) = ~

1 0 0 00 0 0 00 0 0 00 0 0 −1

16.4.2. Diagonalizacion de J2

Aplicaremos J2 a los vectores de la base (16.14), para lo cual usaremos las Ecs. (16.7, 16.9)

J2 =(J(1) + J(2)

)2= J2

(1) + J2(2) + J

(1)+ J

(2)− + J

(1)− J

(2)+ + 2J

(1)3 J

(2)3

los 4 vectores |ε1, ε2〉 son autovectores de J2(1), J2

(2), J(1)3 y J

(2)3 como se ve en la Ecs. (16.15, 16.16), y la accion de los

operadores escalera viene dada por la Ecs. (15.11), por tanto podemos evaluar J2 |ε1, ε2〉 para todos los elementosde la base |ε1, ε2〉

J2 |+,+〉 =

(3

4~2 +

3

4~2

)|+,+〉 +

1

2~2 |+,+〉

= 2~2 |+,+〉 (16.23)

J2 |+,−〉 =

(3

4~2 +

3

4~2

)|+,−〉 − 1

2~2 |+,−〉 + ~2 |−,+〉

= ~2 [|+,−〉 + |−,+〉] (16.24)

J2 |−,+〉 =

(3

4~2 +

3

4~2

)|−,+〉 − 1

2~2 |−,+〉 + ~2 |+,−〉

= ~2 [|+,−〉 + |−,+〉] (16.25)

J2 |−,−〉 =

(3

4~2 +

3

4~2

)|−,−〉 +

1

2~2 |−,−〉

= 2~2 |−,−〉 (16.26)

la matriz representativa de J2 en la base |ε1, ε2〉 en el orden dado por (16.14) esta dada por

(J2)

= ~2

2 0 0 00 1 1 00 1 1 00 0 0 2

Page 352: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

352 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

puesto que J2 conmuta con J3, la matriz tendra elementos no cero solo entre autovectores de J3 asociados con elmismo autovalor, lo cual explica los ceros de la matriz. De acuerdo con los resultados de la seccion 16.4.1, los unicoselementos no diagonales de J2 que son diferentes de cero, son aquellos que relacionan a los vectores |+,−〉 , |−,+〉,los cuales estan asociados al mismo valor de M (M = 0).

Ahora para diagonalizar esta matriz podemos tener en cuenta que es diagonal por bloques partiendose en tressubmatrices

A1×1 0 0

0 B2×2 00 0 C1×1

La matrices unidimensionales son las asociadas a los vectores |±,±〉 que son autovectores de J2, como se ve en lasEcs. (16.23,16.26). Los autovalores asociados son 2~2. Ahora debemos diagonalizar la submatriz

B2×2 = ~2

(1 11 1

)

que representa a J2 dentro del subespacio dos dimensional generado por |+,−〉 , |−,+〉, es decir el autosubespaciode J3 que corresponde a M = 0. Los autovalores λ~2 = J (J + 1) ~2 de esta matriz se encuentran con la ecuacioncaracterıstica

(1 − λ)2 − 1 = 0

cuyas raıces son λ = 0 y λ = 2. Esto nos da los ultimos autovalores de J2: 0 y 2~2, es decir J = 0 y 1. Losautovectores nos dan

|J = 1,M = 0〉 =1√2

[|+,−〉 + |−,+〉] (16.27)

|J = 0,M = 0〉 =1√2

[|+,−〉 − |−,+〉] (16.28)

como siempre, se puede colocar una fase global si se desea.Vemos entonces que J2 tiene dos autovalores diferentes: 0 y 2~2. El autovalor nulo es no degenerado y tiene como

unico vector asociado a (16.28). Por otro lado, el valor propio 2~2 tiene degeneracion triple, ya que esta asociado alos vectores |+,+〉 , |−−〉 y a la combinacion lineal (16.27).

16.4.3. Autoestados de J2 y J3: singlete y triplete

Hemos obtenido entonces los autovalores de J2 y J3 ası como un conjunto completo de autovectores comunesde J2 y J3 (que automaticamente son autoestados de J2

(1) y J2(2)). Expresaremos los autoestados en la notacion

(16.19-16.21).El numero cuantico J de (16.20) puede tomar dos valores: 0 y 1. El primero esta asociado con un unico vector,

que es tambien autovector de J3 con autovalor cero, el cual denotamos por

|0, 0〉 =1√2

[|+,−〉 − |−,+〉] (16.29)

en tanto que para J = 1 hay tres vectores asociados con tres valores distintos de M

|1, 1〉 = |+,+〉 ; |1, 0〉 =1√2

[|+,−〉 + |−,+〉] ; |1,−1〉 = |−−〉 (16.30)

se puede chequear facilmente que los cuatro vectores dados en (16.29, 16.30) son ortonormales. La especificacion deJ y M determina a un vector de esta base unıvocamente, de modo que J2 y J3 forman un C.S.C.O.. Aunque no esnecesario, a este C.S.C.O se le pueden agregar los operadores J2

(1) y J2(2).

Por tanto cuando adicionamos dos momentos angulares con j1 = j2 = 1/2 (por ejemplo dos espınes), el numero Jque caracteriza al autovalor J (J + 1) ~2 del operador J2 puede ser igual a cero o igual a uno. Con cada uno de estosvalores se asocia una familia de (2J + 1) vectores ortogonales (tres para J = 1, uno para J = 0) que correspondena los 2J + 1 valores de M para J fijo.

Page 353: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

16.5. METODO GENERAL DE ADICION DE DOS MOMENTOS ANGULARES ARBITRARIOS 353

A la familia (16.30) de tres vectores asociados a J = 1 se le denomina un triplete. Al vector |0, 0〉 asociadoa J = 0 se le denomina un singlete. La Ec. (16.30) nos muestra que los estados del triplete son simetricos conrespecto al intercambio de dos momentos angulares (por ejemplo espınes), en tanto que el estado singlete Ec.(16.29) es antisimetrico. Es decir si cada vector |ε1, ε2〉 se reemplaza por |ε2, ε1〉, las expresiones (16.30) permaneceninvariantes en tanto que (16.29) cambia de signo. Esto tendra gran importancia cuando las partıculas cuyos espinesse adicionan sean identicas. Ademas esto nos indica la combinacion lineal de |+,−〉 con |−,+〉 que se requiere paracompletar el triplete (debe ser simetrica). La parte singlete serıa entonces la combinacion lineal antisimetrica de|+,−〉 con |−,+〉 la cual es ortogonal a la parte simetrica y por supuesto a los demas estados del triplete.

16.5. Metodo general de adicion de dos momentos angulares arbitrarios

Consideraremos un sistema fısico descrito por el espacio E , y J un momento angular relativo a este sistema.J puede ser un momento angular parcial o el momento angular total del sistema. Vimos en la seccion 10.4.1, quesiempre es posible construır una base estandar |j,m, k〉 compuesta de autovectores comunes a J2 y J3

J2 |j,m, k〉 = j (j + 1) ~2 |j,m, k〉 ; J3 |j,m, k〉 = m~ |j,m, k〉 (16.31)

de modo que la accion de los operadores escalera sobre esta base estandar esta dada por las Ecs. (10.46)

J± |j,m, k〉 = ~√j (j + 1) −m (m± 1) |j,m± 1, k〉 (16.32)

denotamos como E (j, k) al autosubespacio expandido por vectores de la base estandar con j, k fijos. Este espacioes de dimension 2j + 1 correspondiente a los valores de m para un j dado. La dimension no depende de k. Las Ecs.(16.31, 16.32) nos dicen que los 2j + 1 vectores de la base para E (j, k) se transforman entre sı por medio de losoperadores J2, J3, J+, J−. Es decir, el autosubespacio E (j, k) es globalmente invariante bajo estos cuatro operadoresy mas en general es globalmente invariante bajo la accion de una funcion F (J). El espacio completo E se puedeescribir como una suma directa de subespacios ortogonales E (j, k) como se ve en la Ec. (10.45)

E = E (j1, k = 1) ⊕ E (j1, k = 2) ⊕ . . .⊕ E (j1, k = g (j1)) ⊕E (j2, k = 1) ⊕ E (j2, k = 2) ⊕ . . .⊕ E (j2, k = g (j2)) ⊕E (j3, k = 1) ⊕ E (j3, k = 2) ⊕ . . .⊕ E (j3, k = g (j3)) ⊕ . . . (16.33)

debido a la invariancia de estos subespacios bajo los operadores J2, J3, J+, J−, F (J) estos operadores tendranuna representacion matricial en la base estandar donde los elementos matriciales no nulos estan dentro de cadasubespacio E (j, k). Ademas dentro de cada subespacio E (j, k) los elementos de matriz de una funcion del tipo F (J)son independientes de k.

Recordemos ademas que si a J2 y J3 le agregamos los operadores necesarios para formar un C.S.C.O. podemosdar un significado fısico a k construyendo los vectores propios comunes a todo el C.S.C.O. si por ejemplo solo serequiere un operador A para formar el C.S.C.O. y asumimos que A conmuta con J (escalar), podemos requerir quelos autovectores |j,m, k〉 tambien sean autovectores de A

A |j,m, k〉 = aj,k |j,m, k〉 (16.34)

de modo que la base estandar |j,m, k〉 estara determinada por las Ecs. (16.31, 16.32, 16.34). Cada E (j, k) estambien autosubespacio de A y el ındice k discrimina entre los diferentes autovalores aj,k asociados a cada valorde k. Cuando se requiere mas de un operador para formar el C.S.C.O. el ındice k corresponde realmente a variosındices.

16.5.1. Formacion del sistema a partir de dos subsistemas

Asumamos que nuestro sistema fısico se forma por la union de dos subsistemas (por ejemplo un sistema de dospartıculas o la union del sistema orbital con el de espın para una sola partıcula). Usaremos los ındices (1) y (2) paradenotar cantidades relativas a cada subsistema.

Page 354: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

354 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

Asumiremos que para el espacio de estados E1 del subsistema (1) conocemos una base estandar |j1,m1, k1〉 de

vectores propios comunes a J2(1) y J

(1)3 siendo J(1) el momento angular asociado al subsistema (1) por tanto las Ecs.

(16.31, 16.32) nos dan

J2(1) |j1,m1, k1〉 = j1 (j1 + 1) ~2 |j1,m1, k1〉 ; J

(1)3 |j1,m1, k1〉 = m1~ |j1,m1, k1〉

J(1)± |j1,m1, k1〉 = ~

√j1 (j1 + 1) −m1 (m1 ± 1) |j1,m1 ± 1, k1〉

y similarmente para la base estandar |j2,m2, k2〉 del espacio E2 asociado al subsistema (2)

J2(2) |j2,m2, k2〉 = j2 (j2 + 1) ~2 |j2,m2, k2〉 ; J

(2)3 |j2,m2, k2〉 = m2~ |j2,m2, k2〉

J(2)± |j2,m2, k2〉 = ~

√j2 (j2 + 1) −m2 (m2 ± 1) |j2,m2 ± 1, k2〉

el espacio de estados del sistema completo es el producto tensorial de los espacios E1 y E2

E = E1 ⊗ E2

y sabemos que el producto tensorial de las bases de E1 y E2 formara una base en E . Denotamos esta base como

|j1,m1, k1〉 ⊗ |j2,m2, k2〉 ≡ |j1, j2;m1,m2; k1, k2〉 (16.35)

los espacios E1 y E2 son sumas directas de subespacios del tipo E1 (j1, k1) y E2 (j2, k2) respectivamente. Estas sumasestan descritas por la Ec. (16.33)

E1 = E1

(j(1)1 , k(1) = 1

)⊕ E1

(j(1)1 , k(1) = 2

)⊕ . . .⊕ E1

(j(1)1 , k(1) = g

(j(1)1

))⊕

E1

(j(1)2 , k(1) = 1

)⊕ E1

(j(1)2 , k(1) = 2

)⊕ . . .⊕ E1

(j(1)2 , k(1) = g

(j(1)2

))⊕

E1

(j(1)3 , k(1) = 1

)⊕ E1

(j(1)3 , k(1) = 2

)⊕ . . .⊕ E1

(j(1)3 , k(1) = g

(j(1)3

))⊕ . . . (16.36)

y similarmente para el sistema (2). En este caso la notacion j(m)i representa diversos valores de j para el subsistema

m. No obstante, esta notacion no sera necesaria de aquı en adelante y usaremos jm para denotar el valor de jasociado al subsistema m. Estas sumas las resumimos en la forma

E1 =∑

⊕E1 (j1, k1) ; E2 =

⊕E2 (j2, k2)

por lo tanto E sera la suma directa de subespacios E (j1, j2; k1, k2) obtenido por el producto tensorial de los sube-spacios E1 (j1, k1) y E2 (j2, k2)

E =∑

⊕E (j1, j2; k1, k2) ; E (j1, j2; k1, k2) = E1 (j1, k1) ⊗ E2 (j2, k2) (16.37)

la dimension del subespacio E (j1, j2; k1, k2) es (2j1 + 1) (2j2 + 1). Este subespacio sera globalmente invariante antecualquier funcion de F (J1) y F (J2), donde naturalmente J1 y J2 son las extensiones de los operadores definidosoriginalmente en cada subsistema.

16.5.2. Momento angular total y sus relaciones de conmutacion

Vimos en la seccion 16.3 que la suma de los momentos angulares

J = J(1) + J(2)

es tambien un momento angular siendo J(1) y J(2) las extensiones adecuadas. Por tanto J al igual que J(1) y J(2)

satisface las propiedades algebraicas de un momento angular. No obstante, tambien hay algunas relaciones deconmutacion entre momentos angulares totales y parciales que son de importancia en nuestra discusion (ver seccion

Page 355: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

16.5. METODO GENERAL DE ADICION DE DOS MOMENTOS ANGULARES ARBITRARIOS 355

16.3). Vimos que J(1) y J(2) conmutan con J2(1) y J2

(2) y por tanto tambien con J. En particular J2 y J3 conmutan

con J2(1) y J2

(2). Ademas es inmediato que J(1)3 y J

(2)3 conmutan con J3, por tanto

[J3,J

2(1)

]=[J3,J

2(2)

]=[J2,J2

(1)

]=[J2,J2

(2)

]=[J

(1)3 , J3

]=[J

(2)3 , J3

]= 0 (16.38)

sin embargo, J(1)3 y J

(2)3 no conmutan con J2 lo cual se pudo ver partiendo de las Ecs. (16.7, 16.9)

J2 = J2(1) + J2

(2) + 2J(1) · J(2) (16.39)

J2 = J2(1) + J2

(2) + 2J(1)3 J

(2)3 + J

(1)+ J

(2)− + J

(1)− J

(2)+ (16.40)

con lo cual se llega a la Ec. (16.13)

[J2, J

(1)3

]= −

[J2, J

(2)3

]= 2i~

[J

(1)1 J

(2)2 − J

(1)2 J

(2)1

](16.41)

16.5.3. Cambio de base a realizar

Un vector de la base|j1,m1, k1〉 ⊗ |j2,m2, k2〉 ≡ |j1, j2;m1,m2; k1, k2〉 (16.42)

es autoestado simultaneo de los observables

J2(1), J2

(2), J(1)3 , J

(2)3

con autovalores j1 (j1 + 1) ~2, j2 (j2 + 1) ~2, m1~, m2~. Se observa entonces que la base (16.42) es adecuada parael estudio de los momentos angulares individuales J(1) y J(2) de cada subsistema. Ahora bien, las Ecs. (16.38) nosdicen que el conjunto de observables

J2(1),J

2(2),J

2, J3

tambien conmutan entre sı. Observese que si construımos una base comun a estos observables, serıa mas adecuadapara el estudio del momento angular total del sistema ya que un vector de esta base permitirıa extraer los valorespropios de J2 y J3. Esta base debe ser diferente a la anterior puesto que segun la Ec. (16.41), J2 no conmuta con

J(1)3 ni con J

(2)3 .

Ademas los ındices k1 y k2 tienen un significado fısico que es extension natural del procedimiento para cada

subsistema. SiA1,J

2(1), J

(1)3

forma un C.S.C.O. en E1 donde A1 conmuta con J(1) entonces podemos escoger una

base estandar |j1,m1, k1〉 consistente en los vectores ortonormales completos comunes a estos observables. Si algo

similar ocurre con un conjunto de observablesA2,J

2(2), J

(2)3

en E2 entonces el conjunto

A1, A2;J2(1),J

2(2); J

(1)3 , J

(2)3

forma un C.S.C.O. en E cuyos autovectores estan dados por la Ec. (16.42). Por otro lado, puesto que A1 conmutacon J(1) y con J(2) entonces conmutara con J. Esto a su vez implica que A1 conmuta con J2 y J3. Lo mismo ocurrepara el observable A2, por tanto los observables en el conjunto

A1, A2;J2(1),J

2(2);J

2,J3

conmutan entre ellos. Puede demostrarse que ademas forman un C.S.C.O. y la nueva base que buscaremos es unsistema ortonormal de vectores propios comunes de este C.S.C.O.

Ahora bien, el subespacio E (j1, j2; k1, k2) definido en (16.37) es globalmente invariante bajo la accion de unoperador que sea funcion de J(1) o que sea funcion de J(2). Por tanto, es globalmente invariante ante la accion de unF (J). Esto implica que los observables J2 y J3 que pretendemos diagonalizar, tienen elementos matriciales no nulossolo dentro de cada espacio E (j1, j2; k1, k2). Las matrices de dimension infinita que representan a J2 y J3 en la base(16.42) son diagonales por bloques y se pueden escribir como suma directa de submatrices cada una asociado a unsubespacio de la forma E (j1, j2; k1, k2). Por tanto, el problema se reduce a diagonalizar las submatrices asociadas acada subespacio E (j1, j2; k1, k2) cuya dimension es (2j1 + 1) (2j2 + 1).

Page 356: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

356 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

Por otro lado, los elementos matriciales en la base (16.42) para cualquier funcion F(J(1)

)o F

(J(2)

)son inde-

pendientes de k1 y k2 (solo los elementos matriciales de A1 dependen de k1 y los de A2 dependen de k2). Por tanto,esto tambien vale para J2 y J3. En consecuencia, la diagonalizacion de estos dos operadores dentro de todos lossubespacios E (j1, j2; k1, k2) con el mismo valor de j1 y j2, se realiza de forma identica. Por esta razon hablamos deadicion de los momentos angulares sin hacer referencia a los otros numeros cuanticos. Simplificaremos la notacionomitiendo los ındices k1 y k2 escribiendo entonces

E (j1, j2) ≡ E (j1, j2; k1, k2) ; |j1, j2;m1,m2〉 ≡ |j1, j2;m1,m2; k1, k2〉

puesto que J es un momento angular y E (j1, j2) es invariante ante F (J) entonces E (j1, j2) es una suma directa desubespacios ortogonales E (J, k) cada uno de los cuales es invariante ante la accion de J2, J3, J±

E (j1, j2) =∑

⊕E (J, k) (16.43)

de aquı surgen las siguientes preguntas, dado un par j1 y j2 ¿Cuales son los valores de J que contribuyen en la sumadirecta (16.43)? y ¿Cuantos subespacios E (J, k) estan asociados con un J dado?.

Dado que tenemos una base conocida (16.42) esta sera nuestro punto de partida para llegar a la base asociadaa J2 y J3. Surge entonces el problema de expandir los autovectores de la base buscada asociados a E (j1, j2) enterminos de los autovectores de la base conocida (16.42).

Es importante mencionar que si tenemos mas momentos angulares podemos adicionar los dos primeros y alresultado le adicionamos un tercero y ası sucesivamente. Esto solo es posible puesto que el algoritmo de suma esconmutativo y asociativo como veremos mas adelante.

16.5.4. Autovalores de J2 y J3 : Caso de dos espines j1 = j2 = 1/2.

En este caso cada espacio E1 y E2 contiene solo un subespacio invariante ya que estan asociados cada uno a unvalor fijo de j. El producto tensorial E = E1 ⊗ E2 esta asociado a un solo subespacio E (j1, j2) con j1 = j2 = 1/2.

De acuerdo con la descomposicion (16.43), el espacio E (1/2, 1/2) es la suma directa de subespacios del tipoE (J, k) de dimension 2J + 1. Cada uno de estos subespacios contiene uno y solo un autovector de J3 asociado acada uno de los valores de M tal que |M | ≤ J . Hemos visto en la seccion 16.4.1 que M solo toma los valores 1, 0,−1;donde el primero y el tercero no son degenerados en tanto que M = 0 es doblemente degenerado. De esto se concluyeque:

1. Valores de J > 1 estan excluıdos. Por ejemplo para que J = 2 fuera posible tendrıa que existir al menosun autovector de J3 con M = 2. Esto se debe a que la teorıa del momento angular nos dice que para un jdado los valores permitidos de m consisten en todos los valores enteros o semienteros que cubren el intervalo−j ≤ m ≤ j en saltos unidad.

2. E (J = 1, k) aparece solo una vez (es decir k es unico), puesto que M = ±1 solo aparece una vez, es decirM = ±1 es no degenerado.

3. E (J = 0, k) aparece una sola vez. Esto se debe a que M = 0 es dos veces degenerado pero uno de losautovectores con M = 0 esta en el subespacio con J = 1, de modo que solo un autovector con M = 0esta asociado a un subespacio con J = 0.

Por tanto el espacio 4-dimensional E (1/2, 1/2) se descompone en subespacios del tipo E (J, k) segun la Ec.(16.43) en la forma

E(

1

2,1

2

)= E (J = 1) ⊕ E (J = 0)

que son de dimension 3 y 1 respectivamente. Veremos ahora como extender estas conclusiones al caso general.

Page 357: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

16.5. METODO GENERAL DE ADICION DE DOS MOMENTOS ANGULARES ARBITRARIOS 357

Figura 16.1: (a) Ilustracion de las reglas de adicion para momentos angulares en el caso general. (b) Pares de posiblesvalores de (m,m′) = (m1,m2) para el caso especıfico j = j1 = 2, j′ = j2 = 1. En ambos casos, los puntos asociadoscon un valor dado de M = m + m′ = m1 + m2 estan localizados sobre una lınea recta de pendiente −1 pintadacomo lınea punteada. Hemos supuesto que j = j1 ≥ j′ = j2, con lo cual el ancho del rectangulo es mayor o igual asu altura.

16.5.5. Autovalores de J3 y su degeneracion: Caso general

Consideremos un subespacio de la forma E (j1, j2) de dimension (2j1 + 1) (2j2 + 1). Asumiremos que j1 y j2estan rotulados de modo que

j1 ≥ j2

los vectores base |j1, j2;m1,m2〉 de este subespacio (que se construyen con el producto tensorial de las bases delos espacios factor) ya son autovectores de J3

J3 |j1, j2;m1,m2〉 =(J

(1)3 + J

(2)3

)|j1, j2;m1,m2〉 = (m1 +m2) ~ |j1, j2;m1,m2〉

≡ M~ |j1, j2;m1,m2〉

de modo que el correspondiente autovalor de M~ es tal que

M = m1 +m2 (16.44)

de lo cual, M toma los valores

M = j1 + j2, j1 + j2 − 1, j1 + j2 − 2, . . . ,− (j1 + j2) (16.45)

Denotaremos el grado de degeneracion de cada M en el subespacio E (j1, j2), en la forma gj1,j2 (M). Para encontraresta degeneracion usaremos el siguiente procedimiento geometrico: realizamos un diagrama en dos dimensionesasociando a cada vector |j1, j2;m1,m2〉 un par ordenado donde el eje de abcisas se asocia con m1 y el eje deordenadas con m2

|j1, j2;m1,m2〉 ≡ (m1,m2)

todos los puntos asociados a estos vectores estan ubicados en el borde o interior de un rectangulo cuyos verticesestan en (j1, j2) , (j1,−j2) , (−j1,−j2) y (−j1, j2). La Fig. 16.1 representa los puntos asociados a una configuracionarbitraria (izquierda) y una configuracion con j1 = 2, j2 = 1 (derecha). Si partimos de un punto dado (vector)del tipo P = (m1,m2) es claro que estados “vecinos” del tipo P± ≡ (m1 ± 1,m2 ∓ 1) poseen el mismo valor deM = m1 +m2 siempre y cuando existan los valores incrementados y decrementados de m1 y m2. Cuando alguno delos valores incrementados o decrementados no exista, es por que el estado (m1,m2) se encuentra en alguno de losbordes del rectangulo (o en una esquina). Para estados P en el interior del rectangulo, existe tanto P+ como P−.Dos puntos vecinos definidos con esta relacion estan unidos por una recta de pendiente −1

pendiente =(m2 ∓ 1) −m2

(m1 ± 1) −m1= −1

Page 358: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

358 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

En conclusion, los puntos situados a lo largo de las lıneas punteadas de las Figs. 16.1a, y 16.1b, de pendiente −1,corresponden a los vectores con el mismo valor de M = m1 +m2. El numero de puntos (vectores) unidos por unalınea define el grado de degeneracion gj1,j2 (M) del valor de M asociado.

Consideremos ahora los diferentes valores de M en orden descendente Ec. (16.45). Observaremos el patron delas lıneas punteadas a medida que disminuye M . Empezando por el maximo M = j1 + j2 vemos que este valor esno-degenerado, ya que la lınea que lo cruza pasa solo por la esquina superior derecha (es en realidad un punto),cuyas coordenadas son (j1, j2). Vemos entonces que

gj1,j2 (j1 + j2) = 1 (16.46)

para el siguiente M = j1 + j2 − 1 la degeneracion es doble (a menos que j1 y/o j2 sean nulos), ya que la lıneacorrespondiente contiene los puntos (j1, j2 − 1) y (j1 − 1, j2). Entonces

gj1,j2 (j1 + j2 − 1) = 2 (16.47)

La degeneracion aumenta una unidad por cada decremento de M en una unidad, hasta que se alcanza la esquinainferior derecha (j1,−j2) del rectangulo4, que corresponde al valor M = j1 − j2 ≥ 0 ya que suponemos siempre quej1 ≥ j2. El numero de puntos llega entonces a su maximo (que es el numero de puntos que miden “la altura” delrectangulo) y es igual a

gj1,j2 (j1 − j2) = 2j2 + 1 (16.48)

si continuamos decrementando M , el numero de puntos permanece constante en 2j2+1 siempre que la lınea asociadaa M cruce al rectangulo tocando sus lados superior (m2 = j2) e inferior (m2 = −j2). Esto ocurre hasta que la lıneaasociada alcanza la esquina superior izquierda (−j1, j2) del rectangulo, para el cual M = −j1 + j2 ≤ 0. Por tanto,el numero maximo de puntos 2j2 + 1 se mantiene en un intervalo para M dado por

gj1,j2 (M) = 2j2 + 1 para − (j1 − j2) ≤M ≤ j1 − j2 (16.49)

finalmente, para valores de M menores que − (j1 − j2), la lınea asociada a cada M ya no intersecta la lınea superiordel rectangulo (m2 = j2) y gj1,j2 (M) decrece monotonamente en la unidad por cada decremento unidad de M ,alcanzando el valor 1 nuevamente cuando M = − (j1 + j2), correspondiente a la esquina inferior izquierda delrectangulo. Por lo tanto

gj1,j2 (−M) = gj1,j2 (M) (16.50)

estos resultados se resumen en la figura 16.2 para el caso j1 = 2 y j2 = 1, esta figura muestra g2,1 (M) como funcionde M .

16.5.6. Autovalores de J2 : caso general

De la Ec. (16.45) vemos que los valores de M son enteros si j1 y j2 son ambos enteros o ambos semi-enteros.Ası mismo, los valores M son semi-enteros si unos de los ji es entero y el otro semientero. Por otro lado, la teorıageneral del momento angular nos dice que J es entero (semi-entero) si y solo si M es entero (semi-entero). Podemosentonces distinguir dos situaciones (1) j1 y j2 son ambos enteros o semi-enteros, (2) Uno de los ji es entero y el otrosemientero. El primer caso conduce a pares (J,M) enteros y el segundo caso a pares (J,M) semi-enteros.

Puesto que el maximo valor deM es j1+j2, tenemos que J > j1+j2 no aparece en E (j1, j2) y por tanto no apareceen la suma directa (16.43). Esto se debe a que para este valor J > j1 +j2 tendrıa que existir el correspondiente valorde M = J segun la teorıa general del momento angular. Para J = j1 + j2 hay un subespacio invariante asociadoE (J = j1 + j2), puesto que M = j1 + j2 existe, pero este subespacio es unico ya que M = j1 + j2 es no-degenerado.En este subespacio hay uno y solo un vector asociado a M = j1 + j2 − 1, y dado que M = j1 + j2 − 1 es doblementedegenerado en E (j1, j2), tenemos que J = j1 + j2 − 1 tambien esta presente y a el corresponde un unico subespacioinvariante E (J = j1 + j2 − 1).

4Como estamos asumiendo que j1 ≥ j2, siempre se alcanza la esquina inferior derecha (j1,−j2) antes que la esquina superior izquierda(−j1, j2) en esta secuencia. A lo mas ocurre que las dos esquinas se alcanzan al mismo tiempo cuando j1 = j2, en cuyo caso tenemos uncuadrado.

Page 359: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

16.5. METODO GENERAL DE ADICION DE DOS MOMENTOS ANGULARES ARBITRARIOS 359

Figura 16.2: Grafica del grado de degeneracion gj1,j2 (M) versus M , para el caso j1 = 1, j2 = 2 ilustrado en la Fig.16.1b. El grado de degeneracion se obtiene por simple conteo del numero de puntos que toca cada lınea punteadaen la Fig. 16.1b. Adicionalmente, esta figura muestra la simetrıa expresada por la Ec. (16.50).

En un contexto general denotaremos como pj1,j2 (J) el numero de subespacios E (J, k) de E (j1, j2) asociados aun J dado. En otras palabras, este es el numero de diferentes valores de k para el valor dado de J (siendo j1 y j2fijos desde el principio).

Veremos que pj1,j2 (J) y gj1,j2 (M) estan asociados de manera sencilla. Consideremos un valor particular de M ,a este valor de M esta asociado uno y solo un vector en cada subespacio E (J, k) siempre que J ≥ |M |. Su grado dedegeneracion esta dado entonces por

gj1,j2 (M) = pj1,j2 (J = |M |) + pj1,j2 (J = |M | + 1) + pj1,j2 (J = |M | + 2) + . . .

Invirtiendo esta relacion, se obtiene a pj1,j2 (J) en terminos de gj1,j2 (M)

pj1,j2 (J) = gj1,j2 (M = J) − gj1,j2 (M = J + 1)

= gj1,j2 (M = −J) − gj1,j2 (M = −J − 1) (16.51)

es de resaltar que en la Ec. (16.51), J es fijo y los valores de M no estan asociados al valor fijo de J , sino a todoslos valores permitidos de M en E (j1, j2). Por esta razon, los valores de gj1,j2 (M = J + 1) y gj1,j2 (M = −J − 1)pueden ser no nulos.

Teniendo en cuenta la degeneracion de los valores de M estudiada en la seccion 16.5.5, podemos determinar losvalores del numero cuantico J que ocurren en E (j1, j2) y el numero de subespacios invariantes E (J, k) asociadoscon cada uno de ellos. En primer lugar tenemos que

pj1,j2 (J) = 0 para J > j1 + j2

ya que gj1,j2 (M) = 0 para |M | > j1 + j2. Si ahora aplicamos las Ecs. (16.46, 16.47) tenemos que

pj1,j2 (J = j1 + j2) = gj1,j2 (M = j1 + j2) − gj1,j2 (M = j1 + j2 + 1)

pj1,j2 (J = j1 + j2) = gj1,j2 (M = j1 + j2) = 1

pj1,j2 (J = j1 + j2 − 1) = gj1,j2 (M = j1 + j2 − 1) − gj1,j2 (M = j1 + j2) = 2 − 1

pj1,j2 (J = j1 + j2 − 1) = 1

por tanto todos los valores de pj1,j2 (J) se pueden encontrar por iteracion

pj1,j2 (J = j1 + j2 − 2) = 1, . . . , pj1,j2 (J = j1 − j2) = 1

Page 360: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

360 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

finalmente, aplicando la Ec. (16.49) tenemos

pj1,j2 (J) = 0 para J < j1 − j2 = |j1 − j2|

la ultima igualdad se obtiene recordando que hemos mantenido la suposicion j1 ≥ j2 en todo el tratamiento. Parael caso j2 ≥ j1 solo hay que invertir los ındices 1 y 2.

En conclusion, para valores fijos de j1 y j2, es decir dentro de un subespacio E (j1, j2) de dimension (2j1 + 1) (2j2 + 1),los autovalores de J2 son tales que

J = j1 + j2, j1 + j2 − 1, j1 + j2 − 2, . . . , |j1 − j2|

y cada valor de J esta asociado a un unico subespacio invariante E (J, k) en la suma directa dada por la Ec. (16.43),la cual se reduce a

E (j1, j2) =

j1+j2∑

⊕J=|j1−j2|E (J) (16.52)

de modo que el ındice k es realmente innecesario. Esto implica en particular que si tomamos un valor fijo de J yun valor fijo de M compatible con J (|M | ≤ J), existe un unico vector |J,M〉 en E (j1, j2) asociado a estos numeroscuanticos. La especificacion de J es suficiente para determinar el subespacio invariante, y la especificacion de M melleva a un unico vector en dicho subespacio. En consecuencia J2 y J3 forman un C.S.C.O. en E (j1, j2).

A manera de consistencia, podemos mostrar que el numero N de pares (J,M) encontrados para E (j1, j2) coincidecon la dimension (2j1 + 1) (2j2 + 1) de E (j1, j2), puesto que el conjunto |J,M〉 constituye una base para E (j1, j2).Asumiremos por simplicidad que j1 ≥ j2. Puesto que cada subespacio E (J) es de dimension 2J + 1 (es decir tiene2J + 1 valores diferentes de M), la suma directa (16.52) nos dice que

N =

j1+j2∑

J=j1−j2(2J + 1) (16.53)

si reemplazamos

J = j1 − j2 + i

podemos calcular (16.53)

N =

j1+j2∑

J=j1−j2(2J + 1) =

2j2∑

i=0

[2 (j1 − j2 + i) + 1] = [2 (j1 − j2) + 1]

2j2∑

i=0

1 + 2

2j2∑

i=0

i

= [2 (j1 − j2) + 1] (2j2 + 1) + 22j2 (2j2 + 1)

2= (2j1 − 2j2 + 1) (2j2 + 1) + 2j2 (2j2 + 1)

= [(2j1 − 2j2 + 1) + 2j2] (2j2 + 1) = (2j1 + 1) (2j2 + 1)

16.6. Autovectores comunes de J2 y J3

La base “natural” de E (j1, j2) es la base de los productos tensoriales entre las bases de E (j1) y E (j2) denotada

por |j1, j2,m1,m2〉. Esta es la base de vectores propios comunes a J2(1), J

(1)3 ,J2

(2), J(2)3 . Ahora bien, los vectores

propios comunes a J2, J3,J2(1),J

2(2) seran denotados por |JM〉. Estrictamente la notacion deberıa incluir los valores

j1 y j2 de donde proviene el producto tensorial. Sin embargo, esta notacion se omitira ya que j1 y j2 son fijos entodo el proceso. Por la misma razon, se simplificara la notacion de la base natural escribiendola simplemente como|m1,m2〉. Cuando sea necesario se distinguiran ambas bases por un subındice en la forma |JM〉J y |m1,m2〉j. Latransformacion de la base |m1,m2〉 a la base |JM〉, se debe realizar con una transformacion unitaria, puestoque ambas bases son ortonormales. Como los |JM〉 son autovectores comunes de J2, J3,J

2(1),J

2(2) tenemos que

J2 |JM〉 = J (J + 1) ~2 |JM〉 ; J3 |JM〉 = M~ |JM〉J2

(1) |JM〉 = j1 (j1 + 1) ~2 |JM〉 ; J2(2) |JM〉 = j2 (j2 + 1) ~2 |JM〉

Page 361: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

16.6. AUTOVECTORES COMUNES DE J2 Y J3 361

16.6.1. Caso especial j1 = j2 = 1/2

En la seccion 16.4, hemos encontrado los vectores propios |J,M〉 en E (1/2, 1/2) a traves de la diagonalizacionde las representaciones matriciales. En este caso recurriremos a la generacion de los diferentes vectores por medio deoperadores escalera J±. La ventaja de este metodo es que es mas facil de generalizar y de manejar cuando tenemosvalores altos de los momentos angulares.

En primer lugar el ket |1/2, 1/2〉 ≡ |++〉 es el unico vector propio de J3 en E (1/2, 1/2) que corresponde a M = 1.Puesto que J2 y J3 conmutan, y el valor M = 1 es no degenerado, el teorema 1.66 pagina 50 nos dice que |++〉tambien tiene que ser autovector de J2. Siguiendo los razonamientos de la seccion 16.5.4 el valor propio para J2

tiene que ser J = 1. Por tanto, podemos escoger la fase del vector |J = 1,M = 1〉 para que coincida con |++〉

|1, 1〉 = |++〉 (16.54)

los otros estados del triplete J = 1 se obtienen por aplicacion sucesiva del operador J− tal como se describio en laseccion 10.4.1. Usando la Ec. (10.46), tenemos entonces

J− |1, 1〉 = ~√

1 (1 + 1) − 1 (1 − 1) |1, 0〉 = ~√

2 |1, 0〉

con lo cual se tiene

|1, 0〉 =1

~√

2J− |1, 1〉 =

1

~√

2J− |++〉

para calcular |1, 0〉 en terminos de la base original |m1,m2〉 basta recordar que

J− = J(1)− + J

(2)−

con lo cual

|1, 0〉 =1

~√

2

(J

(1)− + J

(2)−)|++〉 =

1

~√

2(~ |−+〉 + ~ |+−〉)

|1, 0〉 =1√2

(|−+〉 + |+−〉) (16.55)

ahora aplicamos J− a |1, 0〉 para obtener el ultimo elemento |1,−1〉 del triplete.

J− |1, 0〉 = ~√

2 |1,−1〉 (16.56)

combinando las Ecs. (16.55, 16.56) tenemos

|1,−1〉 =1

~√

2J− |1, 0〉 =

1

~√

2

(J

(1)− + J

(2)−) [ 1√

2(|−+〉 + |+−〉)

]

=1

2~

[(J

(1)− + J

(2)−)|−+〉 +

(J

(1)− + J

(2)−)|+−〉

]=

1

2~

[J

(2)− |−+〉 + J

(1)− |+−〉

]

=1

2~[~ |−−〉 + ~ |−−〉]

|1,−1〉 = |−−〉

notese que el estado |−−〉 se pudo haber extraıdo con un argumento similar al usado para encontrar |++〉, ya queel estado con M = −1 al igual que el asociado a M = 1 es no degenerado. El procedimiento anterior tiene sinembargo la ventaja de mostrar el algoritmo general y ademas nos permite ajustar las convenciones de fases quepodrıan aparecer en |1, 0〉 y |1,−1〉. Existen dos lugares en el procedimiento en donde se fijan las fases, en la Ec.(16.54) se puede colocar una fase arbitraria, y en las Ecs. (10.46) para J± se pueden colocar fases que dependan dem.

Finalmente, encontraremos el estado singlete |J = 0,M = 0〉 , que es el unico vector del subespacio unidimen-sional E (J = 0). Este se puede encontrar dentro de fases constantes, con la condicion de ser ortonormal al triplete.

Al ser ortonormal a |1, 1〉 = |++〉 y a |1,−1〉 = |−−〉, se tiene que |0, 0〉 debe ser una combinacion lineal de |+−〉y |−+〉

|0, 0〉 = α |+−〉 + β |−+〉 (16.57)

〈0, 0 |0, 0〉 = |α|2 + |β|2 = 1 (16.58)

Page 362: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

362 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

en donde hemos agregado la condicion de normalizacion. Teniendo en cuenta que |0, 0〉 tambien debe ser ortogonala |1, 0〉, las Ecs. (16.55, 16.57) nos dan

〈1, 0 |0, 0〉 =1√2

[〈−+| + 〈+−|] [α |+−〉 + β |−+〉] = 0

⇒ α 〈−+| + −〉 + β 〈−+| − +〉 + α 〈+−| + −〉 + β 〈+−| − +〉 = 0

β + α = 0 (16.59)

combinando las Ecs. (16.58, 16.59) tenemos

α = −β ⇒ |α|2 = |β|2 ⇒ 2 |α|2 = 1 ⇒ |α| =1√2

con lo cual

α = −β =1√2eiχ

siendo χ cualquier numero real. Eligiendo χ = 0, tenemos

|0, 0〉 =1√2

[|+−〉 − |−+〉]

es importante observar que con este metodo no fue necesario recurrir a las representaciones matriciales de losoperadores, en particular de J2 (que fue la que se tuvo que diagonalizar).

16.7. Autovectores de J2 y J3 : Caso general

Hemos visto en la seccion 16.5.6, Ec. (16.52) que la descomposicion de E (j1, j2) como suma directa de subespaciosinvariantes E (J) esta dada por

E (j1, j2) = E (j1 + j2) ⊕ E (j1 + j2 − 1) ⊕ . . .⊕ E (|j1 − j2|) (16.60)

determinaremos los vectores |J,M〉 para cada uno de estos subespacios

16.7.1. Determinacion de los vectores |JM〉 del subespacio E (j1 + j2)

El ket |m1 = j1,m2 = j2〉 es el unico autovector de J3 en E (j1, j2) con M = j1 +j2. Puesto que J2 y J3 conmutany M = j1 + j2 es no-degenerado, el teorema 1.66 pagina 50 nos dice que |m1 = j1,m2 = j2〉 tambien tiene que serautovector de J2. De acuerdo con (16.60) el valor asociado de J solo puede ser J = j1 + j2. Podemos escoger elfactor de fase de manera que

|J = j1 + j2, M = j1 + j2〉 = |m1 = j1,m2 = j2〉

que tambien denotaremos por

|j1 + j2, j1 + j2〉J = |j1, j2〉j (16.61)

la aplicacion reiterada de J− permitira encontrar todos los vectores del tipo |J,M〉 asociados a J = j1+j2. Aplicandolas Ecs. (10.46), tenemos

J− |j1 + j2, j1 + j2〉J = ~√

2 (j1 + j2) |j1 + j2, j1 + j2 − 1〉J|j1 + j2, j1 + j2 − 1〉J =

1

~√

2 (j1 + j2)J− |j1 + j2, j1 + j2〉J (16.62)

para escribir el vector |j1 + j2, j1 + j2 − 1〉J en terminos de la base original |m1,m2〉j, debemos escribir el termino

de la derecha en la Ec. (16.62) en la base original, para lo cual tenemos en cuenta que J− = J(1)− + J

(2)− y que

|j1 + j2, j1 + j2〉J = |j1, j2〉j; con lo cual la Ec. (16.62) queda

Page 363: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

16.7. AUTOVECTORES DE J2 Y J3 : CASO GENERAL 363

|j1 + j2, j1 + j2 − 1〉J =

(J

(1)− + J

(2)−)|j1, j2〉j

~√

2 (j1 + j2)=

~√

2j1 |j1 − 1, j2〉j + ~√

2j2 |j1, j2 − 1〉j~√

2 (j1 + j2)

obteniendo finalmente

|j1 + j2, j1 + j2 − 1〉J =

√j1

j1 + j2|j1 − 1, j2〉j +

√j2

j1 + j2|j1, j2 − 1〉j (16.63)

notese ademas que la combinacion lineal de vectores originales que me forma a |j1 + j2, j1 + j2 − 1〉J esta au-tomaticamente normalizada.

Para obtener |j1 + j2, j1 + j2 − 2〉J , aplicamos J− a ambos lados de la Ec. (16.63) escribiendo tal operador como

J− = J(1)− + J

(2)− a la derecha de dicha ecuacion. Podemos repetir este procedimiento sistematicamente, hasta llegar

al estado |j1 + j2, − (j1 + j2)〉J , el cual se puede ver que es igual a |−j1,−j2〉j por un argumento similar al que nosllevo a la Ec. (16.61), puesto que M = −j1 − j2 tambien es no-degenerado.

Al finalizar este proceso hemos encontrado todos los 2 (j1 + j2) + 1 vectores de la forma |J = j1 + j2, M〉, loscuales expanden el subespacio E (J = j1 + j2) de E (j1, j2).

16.7.2. Determinacion de los vectores |JM〉 en los otros subespacios

Definiremos ahora a G (j1 + j2) como el suplemento o complemento ortogonal de E (j1 + j2) en E (j1, j2). Deacuerdo con la Ec. (16.60), tal complemento ortogonal estara dado por

G (j1 + j2) = E (j1 + j2 − 1) ⊕ E (j1 + j2 − 2) ⊕ . . .⊕ E (|j1 − j2|)

y aplicamos a G (j1 + j2) un analisis analogo al realizado en la seccion 16.7.1 para E (j1 + j2).

En G (j1 + j2) el grado de degeneracion g′j1,j2 (M) de un valor dado de M es menor en la unidad que la degen-eracion en el espacio completo E (j1, j2)

g′j1,j2 (M) = gj1,j2 (M) − 1 (16.64)

esto se debe a que E (j1 + j2) posee uno, y solo un vector asociado a cada valor accesible de M en E (j1, j2). Esdecir, para cada M en el intervalo − (j1 + j2) ≤M ≤ j1 + j2 hay uno y solo un vector en E (j1 + j2). En particular,M = j1 + j2 ya no existe en G (j1 + j2), y por tanto el valor maximo de M en G (j1 + j2) es M = j1 + j2 − 1,como este era doblemente degenerado en E (j1, j2), sera no-degenerado en G (j1 + j2). Por argumentos similaresa los de la seccion 16.7.1, el vector asociado a M = j1 + j2 − 1 en este subespacio, debe ser proporcional a|J = j1 + j2 − 1,M = j1 + j2 − 1〉. Queremos ahora encontrar su expansion en terminos de la base |m1,m2〉. Envirtud del valor de M = j1 + j2 − 1, la expansion debe ser de la forma

|j1 + j2 − 1, j1 + j2 − 1〉J = α |j1, j2 − 1〉j + β |j1 − 1, j2〉j ; |α|2 + |β|2 = 1 (16.65)

donde ademas requerimos la normalizacion. Adicionalmente, este estado debe ser ortogonal a |j1 + j2, j1 + j2 − 1〉J ∈E (j1 + j2), i.e. al estado del complemento ortogonal de G (j1 + j2) con el mismo valor de M = j1 + j2 − 1. Usandolas expresiones (16.63, 16.65) para este vector, dicha ortogonalidad se escribe como

J〈j1 + j2, j1 + j2 − 1 |j1 + j2 − 1, j1 + j2 − 1〉J = 0[√

j1j1 + j2

j 〈j1 − 1, j2| +√

j2j1 + j2

j 〈j1, j2 − 1|] [α |j1, j2 − 1〉j + β |j1 − 1, j2〉j

]= 0

β

√j1

j1 + j2j 〈j1 − 1, j2| j1 − 1, j2〉j + α

√j2

j1 + j2j 〈j1, j2 − 1| j1, j2 − 1〉j = 0

β

√j1

j1 + j2+ α

√j2

j1 + j2= 0 (16.66)

Page 364: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

364 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

la condicion de normalizacion (16.65) junto con la Ec. (16.66) nos permiten encontrar α y β dentro de un factor defase. Escogiendo α real y positivo, la Ec. (16.66) nos dice que β es real y toma el valor

β = −α√j2j1

⇒ α2 + β2 = α2

[1 +

j2j1

]= 1 ⇒ α2

[j1 + j2j1

]= 1

α =

√j1

j1 + j2; β = −α

√j2j1

= −√

j2j1 + j2

Con lo cual la Ec. (16.65) queda

|j1 + j2 − 1, j1 + j2 − 1〉J =

√j1

j1 + j2|j1, j2 − 1〉j −

√j2

j1 + j2|j1 − 1, j2〉j (16.67)

este es el primer vector de una nueva familia caracterizada por J = j1 + j2 − 1, de forma similar al vector asociadoa J = j1 + j2 en la seccion 16.7.1. Los otros vectores de esta nueva familia se pueden generar por aplicacion sucesivadel operador J−. De esta forma, obtenemos [2 (j1 + j2 − 1) + 1] vectores del tipo |J = j1 + j2 − 1,M〉 donde J y Mtoman los valores

J = j1 + j2 − 1 ; M = j1 + j2 − 1, j1 + j2 − 2, . . . ,− (j1 + j2 − 1)

estos vectores nos permiten expandir al subespacio E (j1 + j2 − 1).

Ahora bien, si j1+j2−2 ≥ |j1 − j2| podemos formar el suplemento de la suma directa E (j1 + j2)⊕E (j1 + j2 − 1)en el espacio E (j1, j2)

G (j1 + j2, j1 + j2 − 1) = E (j1 + j2 − 2) ⊕ E (j1 + j2 − 3) ⊕ . . .⊕ E (|j1 − j2|)

en el suplemento G (j1 + j2, j1 + j2 − 1), la degeneracion de cada valor de M decrece en una unidad con respecto ala degeneracion en el suplemento anterior G (j1 + j2). En particular, el maximo valor de M es ahora M = j1 + j2−2y es no-degenerado. El vector asociado en G (j1 + j2, j1 + j2 − 1) sera |J = j1 + j2 − 2, M = j1 + j2 − 2〉.

Para calcular al vector |j1 + j2 − 2, j1 + j2 − 2〉J en terminos de la base |m1,m2〉, basta notar que este debe seruna combinacion lineal de tres vectores

|j1 + j2 − 2, j1 + j2 − 2〉J = α1 |j1, j2 − 2〉j + α2 |j1 − 1, j2 − 1〉j + α3 |j1 − 2, j2〉j (16.68)

los tres coeficientes se fijan dentro de un factor de fase por la condicion de normalizacion y de ortogonalidad conlos vectores (ya conocidos) dados por: |j1 + j2, j1 + j2 − 2〉 , |j1 + j2 − 1, j1 + j2 − 2〉. Es decir, los vectores en elcomplemento ortogonal de G (j1 + j2, j1 + j2 − 1), con el mismo valor de M = j1 + j2 − 2. Una vez determinadoslos coeficientes en (16.68), podemos encontrar los demas vectores de esta tercera familia, por aplicacion sucesiva deJ−. Estos vectores nos permiten expandir a E (j1 + j2 − 2).

El procedimiento se puede repetir hasta abarcar todos los valores de M mayores o iguales a |j1 − j2|, y en virtudde la Ec. (16.50) tambien todos los valores correspondientes a M menores o iguales a − |j1 − j2|. De esta formadeterminamos todos los vectores |J,M〉 en terminos de la base original |m1,m2〉.

16.8. Transformacion de la base desacoplada a la base acoplada y coeficientesde Clebsch-Gordan

En el espacio E (j1, j2), los autovectores comunes a J2(1), J

(1)3 ,J2

(2), J(2)3 , y que denotamos (en notacion completa)

por |j1, j2;m1,m2〉 forman una base ortonormal conocida como la base “desacoplada” en el sentido de que esta basenos da informacion directa de los numeros cuanticos individuales de cada partıcula. Por otra parte, los autovectorescomunes a J2, J3,J

2(1),J

2(2), y que denotamos (en notacion completa) por |j1, j2; J,M〉 forman una base ortonormal

conocida como la base “acoplada” ya que esta base nos da informacion directa de los numeros cuanticos asociadosal sistema como un todo.

Page 365: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

16.8. TRANSFORMACION DE LA BASE DESACOPLADA A LA BASE ACOPLADA Y COEFICIENTES DE CLEBSCH-GORDAN365

La transformacion que nos lleva desde la base desacoplada hasta la base acoplada es unitaria puesto que es unatransformacion de una base ortonormal a otra base tambien ortonormal. Esta transformacion unitaria se escribefacilmente usando la completez de la base desacoplada

|j1, j2; J,M〉 =

j1∑

m1=−j1

j2∑

m=−j2|j1, j2;m1,m2〉 〈j1, j2;m1,m2| J,M〉 (16.69)

cambiaremos ligeramente la notacion para los coeficientes de esta expansion en la forma

〈j1, j2;m1,m2| J,M〉 ≡ 〈m1,m2 (j1, j2) J,M〉 (16.70)

con lo cual la expansion (16.69) se escribe como

|j1, j2; J,M〉 =

j1∑

m1=−j1

j2∑

m=−j2|j1, j2;m1,m2〉 〈m1,m2 (j1, j2) J,M〉 (16.71)

los coeficientes 〈m1,m2 (j1, j2) J,M〉 de la expansion, que son elementos de la matriz unitaria de transformacion,se conocen como coeficientes de Clebsch-Gordan. Los numeros cuanticos de la izquierda indican un ket de la basedesacoplada, los de la derecha indica un ket de la base acoplada y los numeros cuanticos (j1, j2) del centro, in-dican los momentos angulares j1 y j2 que se estan acoplando. Un aspecto importante es que la notacion original|j1, j2;m1,m2; k1, k2〉 , |j1, j2; J,M ; k1, k2〉 para las bases no es necesaria dado que los productos internos son in-dependientes de k1 y k2, y dentro del espacio E (j1, j2) los k′s toman un solo valor, de modo que dentro de estesubespacio este numero cuantico no discrimina diferentes estados.

No es posible dar expresiones generales para los coeficientes de Clebsch-Gordan. Estos coeficientes se puedengenerar con el algoritmo explicado en las secciones anteriores. Adicionalmente, existen tablas numericas de estoscoeficientes. Por ejemplo, las Ecs. (16.61, 16.63, 16.67) nos permiten encontrar algunos coeficientes de Clebsch-Gordan

〈j1, j2 (j1, j2) j1 + j2, j1 + j2〉 = 1

〈j1 − 1, j2 (j1, j2) j1 + j2, j1 + j2 − 1〉 =

√j1

j1 + j2

〈j1, j2 − 1 (j1, j2) j1 + j2, j1 + j2 − 1〉 =

√j2

j1 + j2

〈j1, j2 − 1 (j1, j2) j1 + j2 − 1, j1 + j2 − 1〉 =

√j1

j1 + j2

〈j1 − 1, j2 (j1, j2) j1 + j2 − 1, j1 + j2 − 1〉 = −√

j2j1 + j2

Es importante mencionar que para determinar estos coeficientes en forma unica, deben escogerse ciertas con-venciones de fases. Lo usual es definir estos coeficientes como reales. Sin embargo, la escogencia de ciertas fasesdictamina el signo de algunos coeficientes. Por supuesto, los signos relativos de los coeficientes que aparecen en laexpansion del mismo vector |J,M〉 estan fijos, solo se puede escoger en forma arbitraria el signo global.

Adicionalmente, la reglas de adicion que hemos obtenido muestran que estos coeficientes tienen unas reglas deseleccion: el coeficiente 〈j1, j2;m1,m2| J,M〉 es diferente de cero solo si

M = m1 +m2 ; |j1 − j2| ≤ J ≤ j1 + j2 (16.72)

donde J debe ser del mismo tipo (entero o semi-entero) que los valores j1 + j2 y |j1 − j2|. La segunda condicion en(16.72) se conoce usualmente como “regla del triangulo” ya que expresa el hecho de que si la condicion se satisface,debe poderse formar un triangulo con tres segmentos de longitud j1, j2 y J . En otras palabras, la segunda ecuacion(16.72) expresa el conocido teorema que nos dice que un lado J de un triangulo es menor que la suma de los otrosdos lados y mayor que su diferencia.

Page 366: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

366 CAPITULO 16. ADICION DE MOMENTOS ANGULARES

Naturalmente la relacion inversa de la expresada en (16.71) se puede obtener usando la completez de la baseacoplada

|j1, j2;m1,m2〉 =

j1+j2∑

J=j1−j2

J∑

M=−J|J,M〉 〈J,M |j1, j2;m1,m2〉 (16.73)

dado que los coeficientes de C-G son elementos de una matriz unitaria y se eligen como reales, la matriz sera ortogonalreal, por tanto se cumple la condicion

〈J,M |j1, j2;m1,m2〉 = 〈j1, j2;m1,m2| J,M〉 (16.74)

En sıntesis, los coeficientes de Clebsch-Gordan determinan la transformacion de la base desacoplada a la baseacoplada y viceversa.

Page 367: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

Capıtulo 17

Propiedades generales de los sistemas de dosestados

Si por ejemplo consideramos los estados propios del operador de espın S para una partıcula de espın s = 1/2,tenemos que hay solo dos autoestados de S que usualmente denotamos |±〉. Si estamos interesados en informacionconcerniente solo a variables de espın, por ejemplo la probabilidad de que el momento magnetico de espın sea+1/2 en una medida de espın (sin importar los valores que tomen las variables espaciales), entonces podemos porsimplicidad considerar un espacio vectorial (espinorial) de solo dos dimensiones para realizar los calculos, tal quelos dos estados |±〉 formaran una base para dicho espacio.

Existen otros escenarios en los cuales los sistemas de dos estados resultan relevantes en mecanica cuantica.Consideremos un sistema para el cual existen dos estados con energıas muy cercanas entre sı, y que son muydiferentes a las energıas de los otros autoestados de energıa del sistema. Asumamos que queremos evaluar el efectode una perturbacion externa o de una perturbacion interna previamente ignorada. Si la intensidad de la perturbaciones suficientemente pequena, se puede demostrar que su efecto sobre los dos estados “cercanos”, se puede calcular enprimera aproximacion ignorando los otros niveles de energıa. De modo que todos los calculos involucran un espaciode dos dimensiones.

17.1. Formulacion del problema

Consideremos un sistema fısico cuyo espacio de estados es de dos dimensiones. Como ya se menciono esto esusualmente solo una aproximacion, en la cual asumimos que hay un subespacio dos dimensional del espacio completode estados que esta casi desacoplado de su complemento ortogonal. Es decir, la probabilidad de obtener valores deenergıa diferentes a las de los dos estados en una medicion es mucho menor que la probabilidad de obtener alguna delas dos energıas de los dos estados en cuestion. De acuerdo con el quinto postulado, esto implica que la probabilidadde que el sistema este en una combinacion lineal que involucra solo a los dos estados es casi uno.

Definamos un Hamiltoniano H0 que denominaremos Hamiltoniano no perturbado, y usaremos la base de susvectores propios |ϕ1〉 , |ϕ2〉 para realizar los calculos. Sus niveles de energıa seran E1 y E2 de modo que

H0 |ϕ1〉 = E1 |ϕ1〉 ; H0 |ϕ2〉 = E2 |ϕ2〉 , 〈ϕi |ϕj〉 = δij , i, j = 1, 2 (17.1)

ahora queremos tener en cuenta una perturbacion externa o interaccion interna previamente ignorada. Tal pertur-bacion (tambien llamado acople) sera simbolizada como W , y el Hamiltoniano perturbado H viene dado por

H = H0 +W (17.2)

denotaremos a los autoestados y autovalores de H como |ψ±〉 y E± respectivamente

H |ψ+〉 = E+ |ψ+〉 ; H |ψ−〉 = E− |ψ−〉 (17.3)

asumiremos que W es independiente del tiempo. Expresaremos matricialmente a la perturbacion W usando la baseno perturbada |ϕ1〉 , |ϕ2〉 (i.e. la base de vectores propios del Hamiltoniano no perturbado H0)

W =

(〈ϕ1|W |ϕ1〉 〈ϕ1|W |ϕ2〉〈ϕ2|W |ϕ1〉 〈ϕ2|W |ϕ2〉

)=

(W11 W12

W21 W22

), Wij = W ∗

ji (17.4)

367

Page 368: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

368 CAPITULO 17. PROPIEDADES GENERALES DE LOS SISTEMAS DE DOS ESTADOS

de modo que W11 y W22 son reales y W12 = W ∗21. En ausencia del acople o perturbacion W , las energıas accesibles

del sistema son E1 y E2, siendo |ϕ1〉 , |ϕ2〉 los estados estacionarios del sistema, de modo que si en t = 0 el sistemaesta en uno de estos dos estados, permanecera en el indefinidamente. Veremos entonces como se modifican lasenergıas y estados estacionarios cuando se introduce el acople W .

17.2. Consecuencias de la introduccion del acople sobre los niveles de energıay los estados estacionarios

Al introducir el acople, el Hamiltoniano del sistema sera el descrito en la Ec. (17.2). Por tanto, de acuerdocon los postulados, los niveles de energıa y estados estacionarios seran ahora los descritos en la Ec. (17.3). Unamedida de la energıa solo podra dar alguno de los valores E+ o E− y los estados estacionarios seran sus autoestadosasociados |ψ+〉 y |ψ−〉. Esto implica en particular que E1 y E2 ya no son energıas permitidas en el sistema y losestados |ϕ1〉 y |ϕ2〉 ya no seran estados estacionarios (pues estos no son en general autovalores ni autoestados delHamiltoniano perturbado H). Esto implica que si el sistema esta inicialmente en el estado |ϕ1〉 la introduccion dela perturbacion genera una evolucion temporal y por tanto hay cierta probabilidad P12 (t) de encontrar al sistemaen el estado |ϕ2〉 en el tiempo t. Decimos entonces que W induce transiciones entre los estados no perturbados. Poresta razon decimos que W actua como un acople entre |ϕ1〉 y |ϕ2〉.

17.2.1. Efecto del acople sobre los estados estacionarios del sistema

La representacion matricial del Hamiltoniano perturbado en la base |ϕ1〉, |ϕ2〉 sera

H =

(E1 +W11 W ∗

21

W21 E2 +W22

)

los valores y vectores propios de esta matriz se realizaron en detalle en la seccion 1.45.3. Las Ecs. (1.220, 1.221,1.222) nos muestran tales autovalores y autovectores

E± =1

2(E1 +W11 +E2 +W22) ±

1

2

√(E1 +W11 −E2 −W22)

2 + 4 |W12|2 (17.5)

|ψ+〉 = cosθ

2e−iϕ/2 |ϕ1〉 + sin

θ

2eiϕ/2 |ϕ2〉 (17.6)

|ψ−〉 = − sinθ

2e−iϕ/2 |ϕ1〉 + cos

θ

2eiϕ/2 |ϕ2〉 (17.7)

donde los angulos θ y ϕ estan dados por la Ecs. (1.223)

tan θ =2 |W21|

E1 +W11 −E2 −W22, W21 = |W21| eiϕ ; 0 ≤ θ < π , 0 ≤ ϕ < 2π (17.8)

Es facil ver que si W12 = 0, los autoestados de H son los autoestados de H0 y los nuevos niveles de energıason simplemente E1 + W11 y E2 +W22. Por tanto, los efectos interesantes surgen cuando W posee elementos no-diagonales W12 = W ∗

21. Para simplificar la discusion asumimos que la matriz de W en la base |ϕ1〉 , |ϕ2〉 espuramente no-diagonal1. Haciendo W11 = W22 = 0 en las Ecs. (17.5, 17.8) obtenemos

E± =1

2(E1 +E2) ±

1

2

√(E1 −E2)

2 + 4 |W12|2 (17.9)

tan θ =2 |W21|E1 −E2

, 0 ≤ θ < π ; W21 = |W21| eiϕ (17.10)

es conveniente definir las siguientes variables

Em ≡ 1

2(E1 +E2) ; ∆ ≡ 1

2(E1 −E2) (17.11)

1Si W11 y W22 son no nulos, podemos definir E1 = E1 +W11 y E2 = E2 +W22. Todos los resultados que se obtendran en esta seccionseran validos en este caso, haciendo los reemplazos E1 → E1 y E2 → E2.

Page 369: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

17.2. CONSECUENCIAS DE LA INTRODUCCION DEL ACOPLE SOBRE LOS NIVELES DE ENERGIA Y LOS ESTADOS ESTACIONARIOS369

que corresponden al promedio y el desdoblamiento de los niveles no perturbados. Sustituyendo (17.11) en las Ecs.(17.9, 17.10) tenemos que

E+ = Em +

√∆2 + |W21|2 ; E− = Em −

√∆2 + |W21|2 ; tan θ =

|W21|∆

(17.12)

Las Ecs. (17.12) muestran que cuando Em cambia, la variacion de E± es equivalente a correr el origen a lo largo del

Figura 17.1: Variacion de las energıas E± con respecto al desdoblamiento ∆ ≡ (E1 −E2) /2. Hemos definido el cerodel eje de energıa en Em. En ausencia de acoplamiento los niveles se cruzan en el origen como lo muestran las lıneasrectas punteadas. Al introducir el acople W no-diagonal, los dos niveles perturbados se “repelen uno a otro” y seobtienen curvas de E+ y E− que no se cruzan. Tales curvas son ramas hiperbolicas (lıneas solidas en la figura) cuyasasıntotas son los niveles no perturbados.

eje de energıa. Adicionalmente, las Ecs. (17.6, 17.7, 17.10, 17.12) muestran que los autovectores |ψ±〉 no dependende Em sino solo del desdoblamiento ∆. Es interesante mostrar el comportamiento de las energıas E1,2 y E± en undiagrama de ∆ versus energıa. La Fig. 17.1 muestra que tal diagrama para las energıas E± corresponde a ramashiperbolicas simetricas con respecto a los ejes coordenados (en donde el zero del eje vertical se ubico en Em), ycuyas asıntotas son las lıneas rectas punteadas que describen el comportamiento de las energıas E1 y E2. La Fig.17.1 tambien muestra que la separacion mınima entre las ramas hiperbolicas es 2 |W21|. Puede verse entonces queen ausencia de acople, los niveles de energıa E1 y E2 se cruzan en ∆ = 0 (como se ve tambien en las Ecs. 17.11).Con la introduccion del acople, los niveles de energıa “se repelen” es decir tienden a alejarse. Por esta razon se suelehablar de diagramas anti-cruzantes, para curvas del tipo mostrado por E±. Se observa ademas que cuando W → 0tenemos que E± → E1,2 si E1 > E2 en tanto que E± → E2,1 si E2 > E1. De las Ecs. (17.11, 17.12) vemos que

|E+ −E−| = 2

√∆2 + |W21|2 > 2∆ ; |E1 −E2| ≡ 2∆ ⇒ (17.13)

|E+ −E−| > |E1 −E2| (17.14)

donde el aumento en el desdoblamiento es mayor a medida que crece el acople. Vemos entonces que el acople separala frecuencias normales, situacion que aparece en muchos escenarios fısicos.

Es necesario poder discriminar cuando podemos hablar de un acople “fuerte” o “debil”. Para ello vemos que lasEcs. (17.12) se pueden reescribir como

E± = Em ± ∆√

1 +K2 ; K ≡∣∣∣∣W21

∣∣∣∣ , ∆ 6= 0 (17.15)

Page 370: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

370 CAPITULO 17. PROPIEDADES GENERALES DE LOS SISTEMAS DE DOS ESTADOS

de modo que la intensidad del acople se puede medir en terminos de K

K ≡∣∣∣∣W21

∣∣∣∣ << 1 ⇒ acople debil

K ≡∣∣∣∣W21

∣∣∣∣ >> 1 ⇒ acople fuerte

17.2.2. Efecto de un acople debil sobre los niveles de energıa y estados estacionarios

El acople debil esta caracterizado por |∆| >> |W21|. La Fig. 17.1 nos muestra que en este lımite todas las energıasse comportan aproximadamente como las asıntotas. Puesto que K << 1, las Ecs. (17.15) se pueden expandir enseries de potencias de K

E± = Em ± ∆

(1 +

1

2

∣∣∣∣W21

∣∣∣∣2

+ . . .

)(17.16)

adicionalmente, la Ec. (17.12) nos dice que θ ' 0 en este lımite. Por tanto tan θ ' θ ' sin θ, de modo que a primerorden obtenemos

cosθ

2' 1 ; sin

θ

2' θ

2' tan θ

2=

|W21|2∆

reemplazando estas aproximaciones en las Ecs. (17.6, 17.7), los autoestados en el lımite de acople debil quedan

|ψ+〉 ' e−iϕ/2 |ϕ1〉 +|W21|2∆

eiϕ/2 |ϕ2〉 ; |ψ−〉 ' −|W21|2∆

e−iϕ/2 |ϕ1〉 + eiϕ/2 |ϕ2〉 (17.17)

|ψ+〉 ' e−iϕ/2[|ϕ1〉 +

|W21|2∆

eiϕ |ϕ2〉]

; |ψ−〉 '[−|W21|

2∆e−iϕ |ϕ1〉 + |ϕ2〉

]eiϕ/2 (17.18)

puesto que las fase globales son irrelevantes, vemos que un acople debil genera estados perturbados muy similaresa los estados no perturbados como era de esperarse. Por ejemplo, el estado |ψ+〉 se puede ver como el estado |ϕ1〉ligeramente “contaminado” por una pequena contribucion del estado |ϕ2〉. Similarmente, |ψ−〉 es casi el estado |ϕ2〉con una pequena contribucion de |ϕ1〉.

17.2.3. Efecto de un acople fuerte sobre los niveles de energıa y estados estacionarios

El acople fuerte se caracteriza por |∆| << |W21|. La Fig. 17.1 nos muestra que este lımite corresponde alcomportamiento de las energıas alrededor de ∆ = 0. En particular, si tomamos ∆ = 0 el acople se considera fuertepara cualquier valor no nulo de W21. En el lımite E1 = E2 i.e. ∆ = 0, las Ecs. (17.12) quedan en la forma

E± = Em ± |W21| (17.19)

y vemos entonces que el efecto del acople es mas mucho mas importante cuando los dos niveles no perturbadostienen la misma energıa (por ejemplo por degeneracion). Las Ecs. (17.19) muestran que este efecto es de primerorden, en tanto que en el lımite de acople debil el efecto es de segundo orden como se aprecia en la Ec. (17.16).Cuando ∆ = 0 vemos de (17.12) que θ = π/2 y los autoestados (17.6, 17.7) quedan

|ψ+〉 = cosπ

4e−iϕ/2 |ϕ1〉 + sin

π

4eiϕ/2 |ϕ2〉 ; |ψ−〉 = − sin

π

4e−iϕ/2 |ϕ1〉 + cos

π

4eiϕ/2 |ϕ2〉 (17.20)

|ψ+〉 =1√2

[e−iϕ/2 |ϕ1〉 + eiϕ/2 |ϕ2〉

]; |ψ−〉 =

1√2

[−e−iϕ/2 |ϕ1〉 + eiϕ/2 |ϕ2〉

](17.21)

de modo que en el lımite de acople fuerte, los estados |ψ±〉 difieren radicalmente de |ϕ1,2〉 como se esperaba. Vemosque |ψ±〉 son superposiciones de |ϕ1〉 y |ϕ2〉 con coeficientes del mismo modulo. Podemos decir que |ψ±〉 son estadosde “maxima mezcla” de los estados |ϕ1〉 y |ϕ2〉.

Page 371: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

17.3. EVOLUCION TEMPORAL DEL VECTOR DE ESTADO: OSCILACION DEL SISTEMA ENTRE DOS ESTADOS SIN PERTURBAR371

17.3. Evolucion temporal del vector de estado: oscilacion del sistema entre

dos estados sin perturbar

La evolucion del estado |ψ (t)〉 del sistema de dos estados esta governada por la ecuacion de Schrodinger

i~d

dt|ψ (t)〉 = (H0 +W ) |ψ (t)〉 (17.22)

y dado que |ψ (t)〉 es una superposicion de los estados |ϕ1〉 y |ϕ2〉 para todo tiempo tenemos que

|ψ (t)〉 = a1 (t) |ϕ1〉 + a2 (t) |ϕ2〉 (17.23)

insertando la expansion (17.23) en la ecuacion de Schrodinger (17.22), aplicando el bra 〈ϕ1| y usando la Ec. (17.4)con W11 = W22 = 0, resulta

i~ 〈ϕ1|d

dt[a1 (t) |ϕ1〉 + a2 (t) |ϕ2〉] = 〈ϕ1| (H0 +W ) [a1 (t) |ϕ1〉 + a2 (t) |ϕ2〉]

i~d

dt[a1 (t) 〈ϕ1 |ϕ1〉 + a2 (t) 〈ϕ1 |ϕ2〉] = a1 (t) 〈ϕ1| (H0 +W ) |ϕ1〉 + a2 (t) 〈ϕ1| (H0 +W ) |ϕ2〉

i~d

dta1 (t) = a1 (t) (E1 +W11) + a2 (t) [E2〈ϕ1 |ϕ2〉 +W12]

i~d

dta1 (t) = E1a1 (t) +W12a2 (t)

donde hemos asumido que H0 es conservativo y por tanto |ϕ1〉 es independiente del tiempo. Un procedimientosimilar aplicando el bra 〈ϕ2| nos lleva a las ecuaciones

i~d

dta1 (t) = E1 a1 (t) +W12 a2 (t) (17.24)

i~d

dta2 (t) = W21 a1 (t) +E2 a2 (t) (17.25)

si W12 6= 0, tenemos una sistema de dos ecuaciones diferenciales homogeneas acopladas.

La evolucion temporal de |ψ (t)〉 se puede obtener utilizando el metodo descrito en la seccion 5.8. Esto es, seescribe la expansion de |ψ (0)〉 en terminos de los autoestados |ψ±〉 del Hamiltoniano H

|ψ (0)〉 = λ |ψ+〉 + µ |ψ−〉 (17.26)

de modo que la evolucion temporal vendra dada por

|ψ (t)〉 = λe−iE+t/~ |ψ+〉 + µe−iE−t/~ |ψ−〉 (17.27)

lo cual nos permite obtener a1 (t) y a2 (t) aplicando los bras 〈ϕ1| y 〈ϕ2| a ambos lados de la Ec. (17.27).

Dado que los estados |ϕ1〉 y |ϕ2〉 ya no son estacionarios, es de esperarse que incluso si el estado inicial es porejemplo |ϕ1〉 el sistema evolucione temporalmente. Veremos de hecho que si el estado del sistema esta descrito porla Ec. (17.27), el sistema oscila entre los estados no perturbados |ϕ1〉 y |ϕ2〉. Para verlo asumiremos que en t = 0 elsistema esta en el estado |ϕ1〉

|ψ (0)〉 = |ϕ1〉

ahora debemos expandir este estado inicial en terminos de |ψ±〉 como en la Ec. (17.26). Para ello invertimos las Ecs.(17.6, 17.7). Esto se realiza multiplicando la Ec. (17.6) por cos (θ/2) y la Ec. (17.7) por − sin (θ/2) y sumando

cosθ

2|ψ+〉 − sin

θ

2|ψ−〉 = cos2 θ

2e−iϕ/2 |ϕ1〉 + sin2 θ

2e−iϕ/2 |ϕ1〉 = e−iϕ/2 |ϕ1〉

|ϕ1〉 = |ψ (0)〉 = eiϕ/2[cos

θ

2|ψ+〉 − sin

θ

2|ψ−〉

](17.28)

Page 372: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

372 CAPITULO 17. PROPIEDADES GENERALES DE LOS SISTEMAS DE DOS ESTADOS

comparando la Ec. (17.28) con la Ec. (17.26) vemos que λ = eiϕ/2 cos (θ/2) y µ = −eiϕ/2 sin (θ/2), con lo cual la Ec.(17.27) queda

|ψ (t)〉 = eiϕ/2[cos

θ

2e−iE+t/~ |ψ+〉 − sin

θ

2e−iE−t/~ |ψ−〉

](17.29)

si el sistema evoluciona bajo el Hamiltoniano perturbado hasta el tiempo t, el sistema estara en este tiempo en elestado |ψ (t)〉 descrito por la Ec. (17.29). Asumamos ahora que la perturbacion W se “desconecta” en el tiempo t.Si justo despues de desconectar la perturbacion medimos la energıa, obtendremos E1 o E2 (ya que estos vuelven aser los valores de energıa accesibles del sistema), y la probabilidad de obtener cada uno de estos valores viene dadapor

PEi = |〈ϕi |ψ (t)〉|2 ; i = 1, 2

pero esto es equivalente a decir que esta es la probabilidad de que el sistema quede preparado en el estado |ϕ i〉.Por esta razon, suele decirse que |〈ϕi |ψ (t)〉|2 es la probabilidad de encontrar al sistema en el tiempo t en |ϕi〉.No obstante, vale la pena mencionar que esta afirmacion solo es valida si: (a) Se desconecta la perturbacion en eltiempo t y (b) Justo despues de desconectar la perturbacion, se hace la medida del observable H (si se mide otroobservable, el sistema queda preparado en un autoestado de ese otro observable). Notese que si la perturbacion nose desconecta en t, una medicion del observable H solo puede dar E+ o E− lo cual a su vez implica que el sistemaquedara preparado en el estado |ψ+〉 o en el estado |ψ−〉 y no hay posibilidad de que quede en el estado |ϕi〉. Deotra parte, si no se realiza ninguna medicion, el sistema evoluciona de acuerdo con la ecuacion de Schrodinger y nopodemos hablar de la probabilidad de obtener un estado (ya que la ecuacion de Schrodinger es determinista).

La anterior discusion nos muestra que si no se realiza ninguna medida en el tiempo t, la cantidad 〈ϕ i |ψ (t)〉 ≡ aies simplemente el coeficiente de Fourier de la expansion de |ψ (t)〉 en terminos de |ϕ1〉 y |ϕ2〉. En otras palabras, elcoeficiente ai nos dice el “peso” con el cual contribuye cada estado |ϕi〉 al estado |ψ (t)〉 con la restriccion de que|a1|2 + |a2|2 = 1.

Con estas aclaraciones interpretaremos de aquı en adelante a |〈ϕ2 |ψ (t)〉|2 como la probabilidad de encontrar alsistema en el tiempo t en |ϕ2〉. La amplitud de probabilidad asociada esta dada por

〈ϕ2 |ψ (t)〉 = eiϕ/2[cos

θ

2e−iE+t/~〈ϕ2 |ψ+〉 − sin

θ

2e−iE−t/~〈ϕ2 |ψ−〉

](17.30)

de las Ecs. (17.6, 17.7) tenemos que

〈ϕ2 |ψ+〉 = cosθ

2e−iϕ/2〈ϕ2 |ϕ1〉 + sin

θ

2eiϕ/2〈ϕ2 |ϕ2〉 ; 〈ϕ2 |ψ−〉 = − sin

θ

2e−iϕ/2〈ϕ2 |ϕ1〉 + cos

θ

2eiϕ/2〈ϕ2 |ϕ2〉

〈ϕ2 |ψ+〉 = sinθ

2eiϕ/2 ; 〈ϕ2 |ψ−〉 = cos

θ

2eiϕ/2 (17.31)

reemplazando (17.31) en (17.30), la probabilidad de encontrar al sistema en el tiempo t en |ϕ2〉 queda

P12 (t) = |〈ϕ2 |ψ (t)〉|2 =

∣∣∣∣eiϕ/2

[cos

θ

2e−iE+t/~ sin

θ

2eiϕ/2 − sin

θ

2e−iE−t/~ cos

θ

2eiϕ/2

]∣∣∣∣2

=

∣∣∣∣eiϕ

2

[sin θ e−iE+t/~ − sin θ e−iE−t/~

]∣∣∣∣2

=1

4sin2 θ

∣∣∣e−iE+t/~ − e−iE−t/~∣∣∣2

P12 (t) =1

4sin2 θ

(e−iE+t/~ − e−iE−t/~

)(eiE+t/~ − eiE−t/~

)=

1

4sin2 θ

[1 − e−i(E+−E−)t/~ − ei(E+−E−)t/~ + 1

]

=1

4sin2 θ

2 −

[e−i(E+−E−)t/~ + ei(E+−E−)t/~

]=

1

4sin2 θ

2 − 2 cos

((E+ −E−) t

~

)

teniendo en cuenta que 1 − cos θ = 2 sin2 (θ/2), tenemos finalmente

P12 (t) =1

2sin2 θ

1 − cos

((E+ −E−) t

~

)

P12 (t) = sin2 θ sin2

[(E+ −E−) t

2~

](17.32)

Page 373: Notas de Mecánica Cuántica - Rodolfo A. Díaz S

17.3. EVOLUCION TEMPORAL DEL VECTOR DE ESTADO: OSCILACION DEL SISTEMA ENTRE DOS ESTADOS SIN PERTURBAR373

usando la Ec. (1.214), Pag. 95, tenemos que

sin2 θ = 1 − cos2 θ = 1 − (H11 −H22)2

(H11 −H22)2 + 4 |H21|2

= 1 − (E1 −E2)2

(E1 −E2)2 + 4 |W21|2

sin2 θ =4 |W21|2

(E1 −E2)2 + 4 |W21|2

(17.33)

reemplazando las Ecs. (17.33, 17.9) en la Ec. (17.32) podemos escribir P12 en terminos de los elementos matricialesWij y de las energıas no perturbadas E1 y E2

P12 (t) =4 |W21|2

(E1 −E2)2 + 4 |W21|2

sin2

√4 |W12|2 + (E1 −E2)

2

2~t

(17.34)

la Ec. (17.34) es conocida como Formula de Rabi.La Ec. (17.32) nos muestra que P12 (t) oscila en el tiempo con una frecuencia (E+ −E−) /h, que corresponde

a la unica frecuencia de Bohr del sistema. P12 (t) varıa desde cero hasta sin2 θ, este valor maximo se alcanza paratiempos

tk =(2k + 1) π~

E+ −E−, k = 0, 1, 2, . . .

la frecuencia de oscilacion y el maximo sin2 θ de la probabilidad dependen de |W21| y de ∆ ≡ E1 − E2. Usando(17.12), con ∆ = 0 tenemos que

∆ = 0 ⇒ E+ −E−h

=2 |W21|h

, sin2 θ = 1

de modo que en un tiempo tk = (2k+1)π~

2|W21| el sistema (cuyo estado inicial es |ϕ1〉) estara en el estado |ϕ2〉 . Enconsecuencia, todo acople entre dos estados de igual energıa hace que el sistema oscile completamente de un estadoa otro con una frecuencia proporcional al acople.

Notese que este fenomeno es analogo al que ocurre con dos pendulos acoplados de la misma frecuencia natural.Si el pendulo 1 se desplaza dejando fijo al pendulo 2, el primero comienza a oscilar pero su oscilacion disminuye entanto que va aumentando la del pendulo 2 hasta que se llega a la condicion opuesta para un cierto tiempo, en el cualel pendulo 2 oscila y el pendulo 1 esta instantaneamente en reposo. Luego comienza la transferencia de energıa alpendulo 1 de nuevo y ası sucesivamente. Similarmente, cuando aumenta el acople (constante del resorte que acoplaa los pendulos), disminuye el tiempo de transferencia.

Por otro lado, cuando ∆ ≡ E1−E2 aumenta, la frecuencia (E+ −E−) /h tambien aumenta (ver Ecs. 17.13, 17.14)en tanto que sin2 θ disminuye como se aprecia en la Ec. (17.33). Para un acople debil |∆| = |E1 −E2| >> |W21|, seobserva de las Ecs. (17.13, 17.14) que el desdoblamiento E+−E− de los niveles perturbados solo difiere ligeramentedel desdoblamiento ∆ de los estados no perturbados. Se puede ver tambien de la Ec. (17.33) que la cantidad sin2 θes muy pequena en tal lımite. Esto es de esperarse ya que en el lımite de acople debil |ψ+〉 es muy similar a |ϕ1〉,con lo cual el sistema estarıa en t = 0 en un estado cuasi-estacionario, de modo que su tiempo caracterıstico deevolucion es muy grande.