metodos· matematicos· de la f· sica...

102
etodos Matem´ aticos de la F´ ısica I: Teor´ ıa. Curso 2006/07. Departamento de ´ Algebra. http://www.us.es/da etodos Matem ´ aticos de la F´ ısica I Notas de Teor´ ıa del primer parcial Departamento de ´ Algebra, Universidad de Sevilla Curso 2006/07

Upload: others

Post on 16-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Metodos Matematicosde la Fısica I

Notas de Teorıa del primer parcial

Departamento de Algebra, Universidad de Sevilla

Curso 2006/07

Page 2: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

El contenido de estas notas ha sido disenado y redactado por el profesorado de laasignatura. Se permite su reproduccion, unica y exclusivamente para estudio personal.No se permite la copia indiscriminada, ni con fines lucrativos o diferentes del citado, dela totalidad o de parte de las presentes notas. c© 2006.

Page 3: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Tema 1: Estructuras basicas

1.1. Conjuntos: Definiciones y notaciones. Operaciones.

Definicion.– Llamaremos conjunto a una coleccion de objetos que comparten unapropiedad. Para que un conjunto este bien definido debe ser posible discernir si un objetoarbitrario esta o no en el.

Los conjuntos pueden definirse de manera explıcita, citando todos sus elementos entrellaves, por ejemplo

A = {1, 2, 3, 4, 5},o de manera implıcita, dando una (o varias) caracterıstica(s) que determine(n) si un objetodado esta o no en el conjunto, por ejemplo

A = {x | x es un numero natural par},

que se leera: A es el conjunto formado por los x tales que x es un numero natural par.Esta ultima opcion es obviamente imprescindible cuando el conjunto en cuestion tieneuna cantidad infinita de elementos.

Notacion.– Los conjuntos se notaran con letras mayusculas: A, B,... y los elementos conminusculas, en general. Si el elemento a pertenece al conjunto A escribiremos a ∈ A. Encaso contrario escribiremos a /∈ A.

Observacion.– En ocasiones hay que considerar varios conjuntos en pie de igualdad. Enestos casos es frecuente denotar los distintos conjuntos con la misma letra y un subındiceque los diferencia. Los subındices pueden ser finitos y concretos, por ejemplo,

X1, X2, X3, X4, X5;

finitos pero en cantidad desconocida,

X1, X2, ..., Xn, n ∈ N,

o arbitrarios; un ejemplo de esto serıa considerar

{Ai}i∈I ,

que se leerıa: la familia de conjuntos Ai donde i pertence a I . Aquı I es el conjunto desubındices que puede o no ser finito (por ejemplo I podrıa ser todo N).

Definicion.– Un conjunto que carece de elementos se denomina el conjunto vacıo y sedenota por ∅. Un conjunto con un unico elemento se denomina unitario.

Page 4: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Notemos que, si X = {x} es un conjunto unitario, debemos distinguir entre el con-junto X y el elemento x.

Definicion.– Dados dos conjuntos A y B, si todo elemento de A es a su vez elemento deB diremos que A es un subconjunto de B y lo notaremos A ⊂ B. En caso contrario senotara A 6⊂ B.

Proposicion.– Sean A, B y C tres conjuntos cualesquiera. Se tienen las siguientespropiedades:

(a) A ⊂ A, ∅ ⊂ A.

(b) Si A ⊂ B y B ⊂ A, entonces A = B.

(c) Si A ⊂ B y B ⊂ C, entonces A ⊂ C.

Demostracion.– La primera propiedad se sigue directamente de la definicion.

Para probar (b), fijemonos en que dos conjuntos son iguales si tienen exactamente losmismos elementos. Pero esto es tanto como decir que todos los elementos de A estan enB, y viceversa; eso es que A ⊂ B y B ⊂ A.

Esta propiedad se utiliza muy frecuentemente para demostrar igualdades de conjuntospor el procedimiento denominado doble inclusion. Este consiste en, dados los dos con-juntos, probar primero que todo elemento del primero esta en el segundo, y luego quetodo elemento del segundo esta en el primero. Aplicando entonces el apartado (b), quedademostrado que ambos conjuntos son iguales.

La demostracion de (c) se sigue de la definicion de subconjunto: todo elemento de Aesta en B, por ser A ⊂ B y, dado que es elemento de B, esta en C por ser B ⊂ C. Asıtodo elemento de A esta en C y hemos finalizado.

Definicion.– Dado dos conjuntos A ⊂ X se define el complementario de A en X (osimplemente el complementario de A, si el conjunto X no se presta a confusion) como

X \ A = {x | x ∈ X, x /∈ A},

esto es, el conjunto de elementos de X que no estan en A. Otras notaciones que se puedeencontrar para X \ A (donde X se obvia) son A o cA.

Observacion.– Dados A ⊂ X , se dan las siguientes igualdades obvias:

∅ = X, X = ∅, A = A.

Nos detendremos solamente en la tercera de las anteriores propiedades. En efecto, pordefinicion

A = {x | x ∈ X, x /∈ A},pero para un x ∈ X , x /∈ A si y solo si x ∈ A, por tanto los elementos de A sonprecisamente los de A.

Notacion.– Cuando A es un conjunto finito, el numero de elementos de A se denominacardinal de A y se notara ](A).

Page 5: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Definicion.– Dados dos conjuntos A y B se define la union de A y B, notado A ∪ Bcomo el conjunto formado por aquellos elementos que pertencen al menos a uno de losdos conjuntos, A o B.

Se definen de forma equivalente la union de una cantidad finita de conjuntosA1, ..., An, que denotaremos

A1 ∪ ... ∪ An =n⋃

i=1

Ai,

y la union de una familia arbitrariamente grande de conjuntos {Ai}i∈I , que denotaremos⋃

i∈I

Ai.

Proposicion.– La union de conjuntos verifica las siguientes propiedades, para cua-lesquiera conjuntos A, B y C:

(a) Conmutativa: A ∪ B = B ∪ A.

(b) Asociativa: (A ∪ B) ∪ C = A ∪ (B ∪ C).

(c) ∅ ∪ A = A.

(d) A ⊂ B ⇐⇒ A ∪ B = B.

(e) Si A ⊂ B, entonces A ∪ (B \ A) = B.

Demostracion.– Todas las pruebas son sencillas, y son un buen ejercicio para queel alumno comience a tratar de plasmar demostraciones rigurosas. Como ilustracion decomo se ataca una doble implicacion, probaremos (d).

Comenzaremos suponiendo que A ⊂ B. Entonces todos los elementos de A estanen B, por tanto A ∪ B = B de manera inmediata. Recıprocamente, supongamos queA ∪ B = B. Entonces todo elemento que este en A o en B esta forzosamente en B, conlo que se tiene A ⊂ B.

Definicion.– Dados dos conjuntos A y B se define la interseccion de A y B, notadoA∩B, como el conjunto formado por aquellos elementos que pertencen al mismo tiempoa ambos conjuntos, A y B.

Se definen de forma equivalente la interseccion de una cantidad finita de conjuntosA1, ..., An, y la interseccion de una familia arbitrariamente grande de conjuntos {Ai}i∈I ,que denotaremos, respectivamente,

A1 ∩ ... ∩ An =n⋂

i=1

Ai, y⋂

i∈I

Ai.

Si A y B son dos conjuntos tales que A ∩ B = ∅ se dice que A y B son disjuntos.

Proposicion.– La interseccion de conjuntos verifica las siguientes propiedades, para cua-lesquiera conjuntos A, B y C:

(a) Conmutativa: A ∩ B = B ∩ A.

Page 6: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(b) Asociativa: (A ∩ B) ∩ C = A ∩ (B ∩ C).

(c) ∅ ∩ A = ∅.

(d) A ⊂ B ⇐⇒ A ∩ B = A.

(e) Si A ⊂ B, entonces A ∩ (B \ A) = ∅.

Demostracion.– Las demostraciones se dejan como ejercicios.

Proposicion.– Dados tres conjuntos A, B y C se verifican las siguientes igualdades:

(a) Leyes distributivas:

A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C), A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)

(b) Leyes de De Morgan (supongamos A,B ⊂ C):

C \ (A ∪ B) = (C \ A) ∩ (C \ B), C \ (A ∩ B) = (C \ A) ∪ (C \ B)

Demostracion.– Probaremos una de las leyes distributivas y una de las leyes de DeMorgan; las restantes quedan como ejercicio por ser simetricas a las probadas. Ambosresultados se probaran por doble inclusion.

Veamos que A∩(B∪C) ⊂ (A∩B)∪(A∩C). Para ello tomemos un elemento arbitrariox ∈ A ∩ (B ∪ C). Esto quiere decir que x esta en A y ademas en B o en C. Esto implicaque, bien esta en A ∩ B, bien esta en A ∩ C. En cualquier caso x ∈ (A ∩ B) ∪ (A ∩ C).

Demostremos ahora que (A ∩ B) ∪ (A ∩ C) ⊂ A ∩ (B ∪ C). Si consideramos unelemento cualquiera y ∈ (A ∩ B) ∪ (A ∩ C), y ha de pertencer a A ∩ B o a A ∩ C. Portanto, bien esta en A y en B o en A y en C. En cualquier circunstancia ha de estar en A yal menos en uno de los otros dos conjuntos B o C. De aquı y ∈ A y ademas y ∈ B ∪ C.

Pasemos a probar la segunda ley de De Morgan. Veamos primero C \ (A ∩ B) ⊂(C \ A) ∪ (C \ B). Un elemento x de C \ (A ∩ B) ha de estar en C, pero no en A ∩ B,por lo que no puede estar en al menos uno de los dos conjuntos A o B. Ası, x ha depertenecer, bien a C \ A, bien a C \ B. En cualquier caso x ∈ (C \ A) ∪ (C \ B).

Si tomamos ahora un elemento z ∈ (C \A)∪ (C \B), observemos que z ha de estar,bien en C \ A, bien en C \ B, por lo que debe estar en C y no estar en A o en B. Ası,z ∈ C, pero nunca puede estar en A ∩ B, por lo que z ∈ C \ (A ∩ B).

1.2. Producto cartesiano. Aplicaciones.

Definicion.– Dados dos conjuntos A y B, se define el producto cartesiano de A y B comoel conjunto de pares ordenados formados (por este orden) por un elemento de A y uno deB y se denota

A × B = {(a, b) | a ∈ A, b ∈ B}.

Page 7: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Dado (a, b) ∈ A×B, el elemento a ∈ A (respectivamente b ∈ B) se suele denominarprimera (segunda) componente del par.

Tambien se puede definir el producto cartesiano de una cantidad finita de conjuntos(para cantidades infinitas hay dos posibles generalizaciones y no las veremos aquı) de laforma natural

A1 × ... × An =n∏

i=1

Ai = {(a1, ..., an) | ai ∈ Ai, para i = 1, ..., n} .

Una correspondencia G de A en B es un subconjunto del producto A×B. Equivalen-temente se puede definir como una regla que asocia algunos elementos de A con algunoselementos de B. Concretamente, G asocia a ∈ A con b ∈ B si (a, b) ∈ G.

Una aplicacion f de A en B es una correspondencia donde todo elemento de A tieneasociado un unico elemento de B. Esto es, en notacion matematica, una correspondenciaG es una aplicacion si y solo si se verifica que

∀a ∈ A ∃!b ∈ B tal que (a, b) ∈ G.

Notacion.– Es habitual denotar una aplicacion entre conjuntos A y B de la forma f :A −→ B. En estas condiciones, dado a ∈ A el unico b verificando (a, b) ∈ f se denotaf(a) y se denomina imagen de a (por f ).

De esta notacion surge la terminologıa, comunmente usada, de llamar a A conjuntooriginal (o dominio) y a B conjunto imagen.

En segun que contextos (por ejemplo, en Analisis Matematico, o cuando el conjuntode llegada es Rn) es habitual llamar a las aplicaciones funciones, pero durante este cursoutilizaremos la denominacion aplicaciones.

Definicion.– Dada una aplicacion f : X −→ Y y subconjuntos A ⊂ X y B ⊂ Y ,definimos:

(a) La imagen de A, notada f(A), como

f(A) = {y ∈ Y | ∃x ∈ A con f(x) = y} ⊂ Y,

esto es, el conjunto de elementos del conjunto imagen que son imagen de un ele-mento de A.

(b) La anti–imagen (o contraimagen, o imagen recıproca) de B, notada f−1(B), como

f−1(B) = {x ∈ X | f(x) ∈ B} ⊂ X,

esto es, el conjunto de elementos del conjunto original cuya imagen esta en B.

Proposicion.– Sea f : X −→ Y una aplicacion, A1, A2 ⊂ X y B1, B2 ⊂ Y . Se verifica:

(a) f(A1 ∪ A2) = f(A1) ∪ f(A2), f(A1 ∩ A2) ⊂ f(A1) ∩ f(A2).

(b) f−1(B1 ∪ B2) = f−1(B1) ∪ f−1(B2), f−1(B1 ∩ B2) = f−1(B1) ∩ f−1(B2).

Page 8: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(c) f(f−1(B1)) ⊂ B1, A1 ⊂ f−1(f(A1)).

Demostracion.– Vamos a probar, por ejemplo, la segunda afirmacion de (a) y laprimera de (c). Las demas son similares. Consideremos y ∈ f(A1 ∩ A2). Entoncesexiste x ∈ A1 ∩ A2 tal que y = f(x). Por tanto, y ∈ f(A1) e y ∈ f(A2), por lo que setiene el resultado.

Es importante entender que, para afirmar que la otra inclusion no es cierta, basta condar un contraejemplo; esto es, un caso particular donde no sea cierto el enunciado. Paraello consideremos f : N −→ N definida por

f(x) =

{

x/2 + 1 si x es parx + 2 si x es impar

Tomamos A1 = {1, 3, 5}, A2 = {2, 4, 6}. Claramente f(A1 ∩ A2) = f(∅) = ∅, perof(A1) ∩ f(A2) = {3}.

Probemos ahora que f(f−1(B1)) ⊂ B1. Si y ∈ f(f−1(B1)), es porque existe x ∈f−1(B1) tal que y = f(x). Pero, al ser x ∈ f−1(B1), por definicion tenemos que y =f(x) ∈ B1.

Para demostrar que la inclusion contraria no es cierta en general podemos tomar lamisma aplicacion que en el caso anterior y considerar B1 = {1, 3, 5} nuevamente. En-tonces f−1(B1) = {1, 3, 4, 8} (por convenio, no incluimos el 0 en N). Pero f(f−1(B1)) ={3, 5}, por lo que hemos acabado.

Definicion.– Sea una aplicacion f : X −→ Y .

(a) f se dice inyectiva si dos elementos distintos de X siempre tienen imagenes distin-tas. Dicho de otro modo, f es inyectiva si, de f(x) = f(x′), para x, x′ ∈ X , sededuce que x = x′.

(b) f se dice sobreyectiva (o sobre) si todo elemento de Y es imagen de algun elementode X . O sea, f es sobre si f(X) = Y .

(c) f se dice biyectiva si es inyectiva y sobreyectiva.

Observacion.– Ası, podemos decir que:

(a) f es inyectiva si y solo si para todo y ∈ Y f−1({y}) consta, a lo mas, de unelemento.

(b) f es sobre si y solo si para todo y ∈ Y f−1({y}) consta, a lo menos, de un elemento.

(c) f es biyectiva si y solo si para todo y ∈ Y f−1({y}) consta, exactamente, de unelemento.

De esta forma, si f es biyectiva, existe una aplicacion, denominada aplicacion inversay notada f−1 : Y −→ X , definida por f−1(y) = x si y solo si f(x) = y.

Las aplicaciones inyectivas, sobres o biyectivas verifican algunas propiedades masconcretas de las que enunciamos con anterioridad.

Page 9: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Definicion.– Dadas dos aplicaciones f : X −→ Y y g : Y −→ Z se define la com-posicion de f y g, notada g ◦ f , de X en Z como

(g ◦ f)(x) = g(f(x)), para todo x ∈ X.

Obviamente g ◦ f es una aplicacion.

1.3. Relaciones de orden y de equivalencia.

Definicion.– Sea A un conjunto. Una relacion R definida en A es una correspondencia deA en sı mismo.

Si el par (x, y) ∈ A × A esta en R, diremos que x esta R–relacionado con y, orelacionado con y por R. Esto se notara frecuentemente xRy (notese que el orden esimportante).

Definicion.– Sea R una relacion en A. Entonces diremos que R es:

(a) Reflexiva cuando para todo x ∈ A se tiene que xRx.

(b) Simetrica cuando xRy implica yRx.

(c) Antisimetrica cuando xRy e yRx implican x = y necesariamente.

(d) Transitiva cuando xRy e yRz implican xRz.

Las relaciones reflexivas, simetricas y transitivas se denominan relaciones de equiva-lencia. Las relaciones reflexivas, antisimetricas y transitivas se denominan relaciones deorden.

Ejemplos.– En el conjunto Z definimos las relaciones siguientes, notadas R, S y T :

xRy ⇐⇒ x ≤ y, xSy ⇐⇒ x − y es par, xTy ⇐⇒ x divide a y.

Entonces R es una relacion de orden (de hecho, las relaciones de orden se denominanası por ser este el ejemplo fundamental), T tambien lo es y S es una relacion de equiva-lencia. De hecho, notemos que S es de equivalencia si sustituimos la condicion “x− y espar” por la condicion “x − y es multiplo de p”, para cualquier numero p que fijemos conantelacion.

Definicion.– Si R es una relacion de equivalencia en A, denominamos clase de equiva-lencia de un elemento x ∈ A al conjunto de todos los elementos de A relacionados con x,esto es,

x = R(x) = {y ∈ A | xRy},donde la primera notacion se usa si R se sobreentiende, y la segunda si no es ası.

Proposicion.– Sea A un conjunto, R una relacion de equivalencia en A. Entonces severifican las siguientes propiedades:

Page 10: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(a) Todo elemento pertenece a una clase de equivalencia.

(b) Dos clases de equivalencia son disjuntas o iguales.

Esto es, la relacion R divide completamente al conjunto A en subconjuntos disjuntos(las clases de equivalencia).

Demostracion.– La afirmacion (a) es trivial, ya que R es reflexiva. Para probar (b)supongamos que tenemos dos clases de equivalencia R(x) y R(y) de tal forma que existez ∈ R(x) ∩ R(y). Tenemos que demostrar entonces que R(x) = R(y), y lo haremos pordoble inclusion. De hecho, solo probaremos que R(x) ⊂ R(y), porque la otra inclusiones absolutamente simetrica.

Tomamos entonces a ∈ R(x). Como z ∈ R(x), tenemos que aRx y xRz, por lo queaRz. De la misma forma, como z ∈ R(y), se verifica que zRy. Ası tenemos aRy, luegoa ∈ R(y). Observemos que hemos usado tanto la propiedad simetrica como la transitivapara demostrar (b).

Definicion.– Dada una relacion de equivalencia R definida sobre un conjunto A, el con-junto cuyos elementos son las clases de equivalencia de A por R se denomina conjuntocociente de A por R. La notacion ususal es

A/R = {R(x) | x ∈ A}.

Ejemplo.– Volviendo al ejemplo anterior, tomamos un entero p, fijado para lo que sigue,y consideramos

xSy ⇐⇒ x − y es multiplo de p.

Entonces se tiene que, para todo x ∈ Z

S(x) = {y ∈ Z | x e y dan el mismo resto al dividirlos entre p},

por lo queZ/S = {S(0), S(1), ..., S(p − 1)}.

Notacion.– Sea A un conjunto. Una relacion de orden sobre A se suele denotar por ≤ (sino hay ambiguedad), por extension del ejemplo visto con anterioridad.

En estas condiciones al par (A,≤) se le denomina conjunto ordenado.

Definicion.– Sea (A,≤) un conjunto ordenado. Se dice que:

(a) (A,≤) esta totalmente ordenado si, para cualesquiera x, y ∈ A se verifica x ≤ y oy ≤ x. En otro caso, se dice que (A,≤) esta parcialmente ordenado.

(b) Un elemento maximal de A es un elemento a ∈ A que verifica que x ≤ a para todox ∈ A. Un elemento minimal de A es un elemento a ∈ A tal que a ≤ x para todox ∈ A.

(c) (A,≤) se dice que esta bien ordenado si esta totalmente ordenado y tiene un ele-mento minimal (necesariamente unico).

Page 11: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Ejemplo.– En el ejemplo del comienzo, (Z, R) es un conjunto totalmente ordenado perosin elementos minimales ni maximales, mientras que (Z, T ) es un conjunto parcialmenteordenado, donde tanto 1 como −1 son elementos minimales y 0 es un elemento maximal.

Un ejemplo de conjunto bien ordenado puede ser (N,≤) donde ≤ denota al ordenusual. En estas condiciones 1 es (el unico) elemento minimal.

1.4. Grupos. Permutaciones.

Definicion.– Dado un conjunto G, una operacion interna binaria, •, en G es una aplicacion

• : G × G −→ G

(a, b) 7−→ •(a, b)

Habitualmente se utiliza la notacion •(a, b) = a • b. Una operacion externa (binaria)es exactamente lo mismo, salvo por el hecho de que el conjunto de partida es X ×G, paraun cierto conjunto X distinto de G.

Un grupo es un par (G, •), compuesto por un conjunto G y una operacion interna • enG, que verifica las siguientes propiedades:

(G.1) Asociativa: a • (b • c) = (a • b) • c, para cualesquiera a, b, c ∈ G.

(G.2) Elemento neutro: Existe un e ∈ G tal que a • e = e • a = a, para todo a ∈ G.

(G.3) Elemento opuesto: Dado a ∈ G existe b ∈ G tal que a • b = b • a = e, el elementoneutro antes mencionado.

Si (G, •) posee ademas la propiedad conmutativa (esto es a•b = b•a para cualesquieraa, b ∈ G), se dice que el grupo es abeliano o conmutativo.

Proposicion.– Dado un grupo (G, •), el elemento neutro es unico. Ademas, fijado a ∈ G,el elemento opuesto de a tambien es unico.

Demostracion.– Supongamos que e′ es otro elemento neutro. Entonces

e = e • e′ = e′ • e = e′.

Sean ahora entonces b y c dos elementos opuestos de un a ∈ G arbitrario, pero fijadoen lo que sigue. Entonces

e = a • b =⇒ c = c • e = c • a • b = e • b = b.

Notacion.– Existen dos notaciones usuales para la operacion en un grupo: la notacionaditiva y la notacion multiplicativa, que heredan las notaciones para los grupos conocidos(k, +) y (k \ {0}, ·), donde k puede ser Q o R.

Page 12: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Si escribimos un grupo en notacion aditiva, (G, +), denotaremos 0 al elemento neutroy −a al opuesto de a. Por el contrario, si usamos la notacion multiplicativa, (G, ·) deno-taremos por 1 al elemento neutro y por a−1 o por 1/a al opuesto de a (que se denominaraentonces inverso de a). Muchas veces la operacion · se denota por simple yuxtaposicion,esto es, ab en lugar de a · b.

Observacion.– Dado un grupo (pongamos en notacion multiplicativa) G y un elementog ∈ G se puede probar (ejercicio facil de doble inclusion) que el conjunto g · G ={gx | x ∈ G} es de nuevo G.

Ejemplos.– Un primer ejemplo que puede resultar nuevo (aunque no tanto, como vere-mos), es Cn, el grupo cıclico de n elementos generado por una variable a. Si usamos lanotacion multiplicativa

Cn ={

a0 = 1, a1 = a, a2, ..., an−1}

,

y la operacion entre dos elementos del grupo es

am · ap = ar,

donde r es el resto de dividir m + p entre n (por tanto un numero entre 0 y n − 1).

En notacion aditiva tendremos

Cn = {0, a, 2a, ..., (n − 1)a}

con la operacion ma + pa = ra, donde r es el resto de dividir m + p entre n de nuevo.En cualquiera de ambas notaciones es obvio que Cn es abeliano.

Entre las muchas encarnaciones de Cn en la vida diaria, tal vez sea C12 (o C24, tantoda) en el sistema horario la mas evidente. Con algo mas de lenguaje, podemos considerarotros ejemplos como C7 en los dıas de la semana.

Tomemos ahora el conjunto A = {1, 2, ..., n} y sea

Sn = {f : A −→ A | f biyectiva }.

De la caracterizacion estudiada en 1.2. para las aplicaciones biyectivas se sigue quela composicion de dos aplicaciones biyectivas es de nuevo biyectiva. Por tanto en Sn

podemos definir una operacion interna, que no es mas que la composicion de aplicaciones.

El par (Sn, ◦) es entonces un grupo, como es sencillo de probar, con la aplicacion,denominada identidad,

Id : A −→ A

i 7−→ i

como elemento neutro y, dada f ∈ Sn, con f−1 como elemento inverso.

Es posible entender cada aplicacion de Sn como una reordenacion del conjunto{1, ..., n}. Es por esto que (Sn, ◦) se denomina el grupo de permutaciones de n ele-mentos. Cuidado: Sn no tiene n elementos, un calculo combinatorio trivial nos dice queSn es un grupo con n! elementos. De aquı es usual denotar los elementos de Sn como una

Page 13: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

tabla con dos filas: en la primera aparecen los numeros del 1 al n (para saber cual es elconjunto original) y en la segunda aparecen, bajo cada original, su imagen. Por ejemplo:

σ =

[

1 2 3 4 54 3 2 1 5

]

es la aplicacion de {1, 2, 3, 4, 5} en sı mismo que envıa 1 en 4, 2 en 3, 3 en 2, 4 en 1 y 5en sı mismo.

Casi cualquier ejemplo no trivial sirve para ver que (Sn, ◦) no es abeliano para n ≥ 3.

Una cierta forma de medir cuanto altera una permutacion σ ∈ Sn el orden natural en{1, 2, ..., n} es ver el numero de trasposiciones que σ efectua: para cada i ∈ {1, 2, ..., n}se cuenta una trasposicion por cada j > i tal que σ(i) > σ(j). En nuestro ejemploanterior tenemos que contar:

• Tres trasposiciones porque σ(1) > σ(2), σ(3), σ(4).

• Dos trasposiciones porque σ(2) > σ(3), σ(4).

• Una trasposicion porque σ(3) > σ(4).

Luego el numero de trasposiciones de σ es 6. Este concepto sera util con posterioridad,para la definicion de determinante.

1.5. Cuerpos. Los numeros complejos.

Definicion.– Un cuerpo k es un conjunto con dos operaciones binarias internas, denomi-nadas usualmente suma o adicion (+) y producto o multiplicacion (·), de tal forma que

(a) (k, +) es un grupo abeliano.

(b) (k \ {0}, ·) es un grupo abeliano.

(c) Se da la propiedad distributiva de la suma respecto del producto:

a(b + c) = ab + ac, para cualesquiera a, b, c,∈ k.

Ejemplos.– Los ejemplos usuales de cuerpos son Q y R, pero veremos un ejemplo masen esta leccion: los numeros complejos.

El cuerpo de los numeros complejos se puede definir como sigue: sea C el conjunto

C = {a + bı | a, b ∈ R},

donde ı es, por ahora una variable, esto es, un sımbolo carente de significado propio.

Dotamos a C de una estructura de cuerpo con las siguientes operaciones:

(a + bı) + (c + dı) = (a + c) + (b + d)ı,

Page 14: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(a + bı)(c + dı) = (ac − bd) + (ad + bc)ı,

regla esta ultima que puede ser facilmente recordada si decimos que ı representa√−1.

En cualquier caso ı se denomina la unidad imaginaria.

Comprobar que C con estas dos operaciones es un cuerpo es algo tedioso. Simple-mente notaremos que el elemento neutro de la suma es 0 = 0+0ı y el neutro del productoes 1 = 1 + 0ı. Ası mismo, dado a + bı el inverso aditivo es −a + (−b)ı y, si es distinto de0, el inverso multiplicativo es precisamente a/(a2 + b2) − (b/(a2 + b2))ı.

Observacion.– Algunas propiedades interesantes de los numero complejos son las si-guientes:

(a) Si consideramos los numeros complejos de la forma a + 0ı veremos que podemossuponer R ⊂ C, identificando a ∈ R con a + 0ı ∈ C.

(b) Dado un complejo z = a + bı, el complejo z = a − bı se denomina su conjugado.El producto zz = a2 + b2 es un real positivo, y su raız cuadrada se llama el modulode z, denotado |z|.

(c) Todo numero complejo z se puede escribir de forma

z = |z|(a + bı),

donde a2 + b2 = 1 y, en consecuencia, existe un unico angulo α ∈ [0, 2π), llamadoargumento de z, tal que z = |z|(cos α + senαı).

De esta ultima escritura y de las formulas trigonometricas del angulo doble podemosdeducir facilmente que, dado z ∈ C siempre existe w ∈ C tal que w2 = z. En concreto,podemos tomar w como el complejo con modulo

|z| y argumento α/2, donde α es elargumento de z. Esto nos indica que, a diferencia de los racionales y los reales, todaslas ecuaciones de segundo grado con coeficientes complejos tienen dos soluciones (even-tualmente repetidas, si el discriminante de la ecuacion es cero) complejas. En realidad elresultado que se puede demostrar (pero que no probaremos) es mucho mas preciso.

Teorema fundamental del algebra.– Toda ecuacion de grado n en C[X] tiene, al menos,una solucion en C.

Corolario.– Toda ecuacion de grado n en C[X] tiene, exactamente, n soluciones (even-tualmente repetidas) en C.

1.6. Anillos. Polinomios.

Definicion.– Un anillo es un conjunto A dotado con dos operaciones binarias internas,usualmente denominadas suma o adicion (+) y producto o multiplicacion (·), de tal formaque:

(a) (A, +) es un grupo abeliano.

Page 15: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(b) La operacion (·) es asociativa, conmutativa y posee elemento neutro (notado 1)1.

(c) Se verifica la propiedad distributiva de la suma respecto del producto:

a · (b + c) = a · b + a · c, para cualesquiera a, b, c ∈ A.

Observacion.– En un anillo A, 0 · a = 0 para todo a ∈ A, ya que

a + 0 · a = a · (1 + 0) = a · 1 = a.

De similar forma se puede probar, por ejemplo, que (−1) · a = −a para todo a ∈ A.

Ejemplo.– El ejemplo fundamental de anillo son los enteros, Z, con la suma y el pro-ducto usuales. Un ejemplo enormemente similar (luego veremos por que) es el de lospolinomios con coeficientes en Q o en R.

Recordemos que un polinomio en la variable X con coeficientes en, pongamos, R (Qes analogo), es una expresion del tipo

p(X) = a0 + a1X + ... + arXr,

donde los ai estan en R. Cuando ar 6= 0, decimos que el grado de p(X) es r (por ahorasupondremos que 0 no tiene grado alguno), notado gr(p(X)). La suma se hace sumandolos coeficientes que acompanan a iguales potencias de X y el producto de dos polinomiosse lleva a cabo multiplicando todos los sumandos del primero por todos los del segundocon la regla

aXr · bX t = (ab)Xr+t

y sumando todos los resultados. Dado que el producto de dos numeros reales o racionalesdistintos de 0 es siempre distinto de 0, tenemos que

gr(p(X)q(X)) = gr(p(X)) + gr(q(X)).

El anillo de los polinomios con coeficientes en R (respectivamente Q) se denota R[X](Q[X]).

Un parecido que tendra bastante importancia en un futuro entre R[X] y Z es la existen-cia de una division. En efecto, dados dos enteros a y b, existen unicos q y r (denominadoscociente y resto, respectivamente) verificando

a = qb + r, r = 0 o 1 ≤ r ≤ b − 1.

De la misma forma, dados dos polinomios con coeficientes, pongamos, reales, a(X)y b(X), existen polinomios unicos q(X) y r(X) (tambien denominados cociente y resto)en R[X] verificando

a(X) = q(X)b(X) + r(X), r = 0 o 0 ≤ gr(r(X)) ≤ gr(b(X)) − 1.

No todos los anillos poseen una division similar. Un primer ejemplo es el de lospolinomios con coeficientes enteros, logicamente notado Z[X]. Observemos que la suma

1No creemos necesario establecer la definicion mas general posible de anillo, que admite la posibilidadde que el producto no sea abeliano ni posea elemento neutro.

Page 16: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

y el producto de polinomios con coeficientes enteros resulta de nuevo un polinomio concoeficientes enteros y todas las propiedades son triviales de verificar; por tanto Z[X] esun anillo. Ademas, sigue siendo cierta la propiedad de que el grado de un producto es lasuma de los grados de los factores.

Sin embargo, dados a(X) y b(X) no siempre es posible hallar q(X) y r(X) enZ[X] verificando las propiedades anteriormente mencionadas. Por ejemplo, considere-mos a(X) = X2 + X + 1 y b(X) = 2X + 1. Si existieran q(X) y r(X) verificando laspropiedades requeridas, tendrıa que darse:

gr(q(X)) = 1, r(X) = 0 o gr(r(X)) = 0,

esto es, q(X) = αX + β, r(X) = γ, con α, β, γ ∈ Z. Pero ademas debe cumplirse2α = 1, lo cual es imposible.

Un caso similar es el de los polinomios en mas de una variable. Consideremos elconjunto R[X,Y ], formado por sumas finitas de terminos de la forma

aX iY j, a ∈ R, i, j ∈ N ∪ {0},

denominados monomios.

En R[X,Y ] podemos definir, de manera analoga al caso R[X], una suma (sumandocoeficientes que acompanen a los mismos X iY j) y un producto que lo dotan de estructurade anillo. Una vez mas, tampoco es posible definir una division analoga a la que se da enR[X]. Veamos ahora, para el caso de polinomios en una variable, otro concepto central:el de raız.

Definicion.– Si P (X) es un polinomio, las soluciones de la ecuacion P (X) = 0 se de-nominan raıces de P (X).

Dado dos polinomios P (X), Q(X) ∈ k[X], diremos que Q(X) divide a P (X) si elresto de la division de P (X) entre Q(X) es 0.

Sea P (X) ∈ k[X], α ∈ k. Se denomina multiplicidad de α en P (X) al unico enteroν ∈ N que verifica que (X − α)ν divide a P (X), pero (X − α)ν+1 no divide a P (X) (launicidad es inmediata de las propiedades de la division.

La relacion entre multiplicidad y raıces la da el siguiente resultado.

Lema.– El escalar α es raız de P (X) = 0 si y solo si X − α divide a P (X).

Demostracion.– La implicacion inversa es muy simple, ası que solo haremos la di-recta. Supongamos que α es raız de P (X) y dividamos P (X) entre X − α para obtener

P (X) = q(X)(X − α) + r(X), con r = 0, o gr(r) < gr(X − α) = 1.

Entonces r = β ∈ k y, al hacer X = α obtenemos

0 = P (α) = q(α)(α − α) + β = β.

Proposicion.– Si P (X) es un polinomio de grado m, con raıces (distintas) α1, ..., αr demultiplicidades ν1, ..., νr, entonces

νi ≤ m.

Demostracion.– Resulta un poco artificial, por no recurrir a la conocida (y segura-mente aceptada por el alumno sin mayor discusion) factorizacion unica de los anillos

Page 17: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

de polinomios. Tal vez el docente opte por dar por supuesto este hecho y simplificar laprueba; en caso contrario aquı tiene una alternativa interesante desde el punto de vistaformativo: lo haremos por induccion en el numero de raıces de P (X).

El caso de una raız es sencillo, ya que si P (X) tiene una sola raız α1 de multiplicidadν1, es

P (X) = (X − α1)ν1Q(X),

y gr(P ) = ν1 + gr(Q), lo que prueba el resultado.

Escribimos, en el caso general,

P (X) = (X − α1)ν1Q(X), P (X) = (X − αi)

νiRi(X), i = 2, ..., r

y veamos que αi es raız de Q(X) con multiplicidad, al menos, νi.

Comenzamos sustituyendo X = αi y vemos que

0 = P (αi) = Q(αi)(αi − α1)ν1 ,

de donde αi es raız de Q(X) y entonces

Q(X) = (X − αi)Q(i)1 (X) =⇒ (X − αi)

νi−1Ri(X) = (X − α1)ν1Q

(i)1 (X).

Si hacemos de nuevo X = αi, comprobamos que Q(i)1 (αi) = 0, y ası

Q(i)1 (X) = (X − αi)Q

(i)2 (X) =⇒ Q(X) = (X − αi)

2Q(i)2 (X),

y podemos seguir el proceso en νi ocasiones. Al final obtenemos una expresion de laforma

Q(X) = Q(i)νi

(X)(X − αi)νi ,

por lo que αi es raız de Q con multiplicidad, al menos, νi.

Obviamente Q(X) no tiene mas raıces que α2, ..., αr, porque α1 no lo es (dado que sumultiplicidad en P (X) es ν1) y P (X) no tiene otras raıces. Ası podemos aplicar a Q(X)la hipotesis de induccion, para deducir gr(Q) ≤ ν2 + ... + νr. Como gr(P ) = ν1 + gr(Q),el resultado esta probado.

Observacion.– Para finalizar esta leccion, destacamos los resultados mas utiles a la horade calcular raıces de polinomios, que el docente puede entrar a demostrar o no, segun sucriterio. Los casos que tendran mas trascendencia en el futuro seran, obviamente k =R,C y por ello se deberıa dedicar algun tiempo a estos, al menos.

En cualquier caso, lo mas importante es que el alumno entienda que cual es el cuerpobase es esencial para el calculo de las raıces de un polinomio, como se puede ver, porejemplo con P (X) = X5 − 2X que tiene una raız racional, tres raıces reales y cincocomplejas.

Caso k = C. Dado un polinomio P (X) ∈ C[X] de grado m, el teorema fundamentaldel algebra, aplicado m veces nos indica que P (X) tiene exactamente m raıces, si conta-mos cada una tantas veces como indica su multiplicidad (esto se expresa abreviadamentediciendo “m raıces contadas con multiplicidad”).

Page 18: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Ademas, si P (X) ∈ R[X] y z ∈ C es una raız, es inmediato que z tambien: para veresto solo hay que fijarse en que, dados z1, z2 ∈ C y α ∈ R,

z1 z2 = z1 z2, z1 + z2 = z1 + z2, αz1 = αz1,

de donde P (z) = P (z) = 0. Usando esto, es simple ver, tras dividir por (X − z)(X − z),que z y z han de tener la misma multiplicidad.

Caso k = R. Si k = R, todo polinomio se puede escribir como producto de poli-nomios de grado 1 (de la forma X −α) por polinomios de grado 2 con sus dos solucionescomplejas (y conjugadas, como hemos visto).

Esto es ası porque un polinomio de grado m tiene m raıces complejas. Si son reales,pongamos α, dan factores en R[X] de grado 1, (X − α). Si son complejas α = a + bı,entonces a − bı tambien es raız y, en la descomposicion en C[X] aparecen los factores(X−α) y (X−α), que al multiplicarse dan el polinomio de segundo grado (X 2−2aX +a2 + b2) ∈ R[X].

Caso k = Q. Si k = Q, como el coeficiente de Xm es 1, todas las raıces racionalesde P (X) han de ser numeros enteros que dividan al termino independiente (Regla deRuffini).

En efecto, pongamos

P (X) = Xm + a1Xm−1 + ... + am−1X + am, con ai ∈ Q,

y α = p/q ∈ Q una raız escrita en forma irreducible. Entonces sustituyendo X = α ymultiplicando por qm tenemos

pm + a1pm−1q + ... + am−1pq

m−1 + amqm = 0,

de donde amqm es multiplo de p y pm es multiplo de q. Como p y q no tienen factorescomunes tiene que ser q = ±1 y α ∈ Z.

Page 19: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Tema 2: Matrices. Sistemas deecuaciones lineales.

2.1. Definiciones. Matrices especiales.

Sea k un cuerpo cualquiera (puede ser C, R o Q)2.

Definicion.– Una matriz m× n definida sobre el cuerpo k, donde m,n ∈ N, es una tablade mn elementos de k dispuestos en m filas y n columnas. A la expresion (sin operar)m × n se la denomina orden de la matriz.

Una tal matriz A se denotara de alguna de las siguientes maneras:

A =

a11 a12 ... a1n

a21 a22 ... a2n

......

...am1 am2 ... amn

= (aij)1≤i≤m, 1≤j≤n= (aij) ,

usandose esta ultima notacion solo cuando m y n se conozcan sin ambiguedad. Ası pues,un elemento generico de la matriz A se denotara por aij , queriendo esto decir que esteelemento ocupa la posicion (i, j): fila i, columna j.

El conjunto de todas las matrices de orden m × n definidas sobre k se denota porMm×n(k) o bien por M(m × n; k).

Definicion.– Dadas dos matrices A y B, definidas sobre k, se dira que A = B cuandoambas tengan el mismo orden, pongamos m × n, y ademas,

aij = bij, para cualesquiera 1 ≤ i ≤ m, 1 ≤ j ≤ n.

Definicion.– Sea A ∈ M(m × n; k) una matriz.

(a) La diagonal de A son los elementos de la forma aii, para 1 ≤ i ≤ min{m,n}.

(b) A se dice cuadrada cuando m = n. El conjunto de las matrices cuadradas de ordenn × n, definidas sobre k, se denota habitualmente por M(n; k).

(c) Una matriz cuadrada se dice diagonal si aij = 0 cuando i 6= j, esto es, todos loselementos distintos de 0 (si es que hay) se encuentran en la diagonal.

2La teorıa de matrices definidas sobre anillos, si bien es muy interesante y posee grandes campos deaplicacion, queda fuera de los objetivos de los primeros cursos y, en consecuencia, no la trataremos aquı.

Page 20: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(d) Una matriz se dice triangular superior (respectivamente inferior) cuando aij = 0cuando i > j (respectivamente i < j), esto es, cuando todos los elementos situadospor debajo de la diagonal principal son nulos.

Ejemplo.– De todas las matrices diagonales de orden n, la mas importante es sin dudala denominada matriz identidad, usualmente denotada In y definida como la matriz dia-gonal donde todos los elementos de la diagonal son 1 (equivalentemente, como la matrizIn = (eij) definida por eij = δij , la delta de Kronecker (o de Dirac), que vale 1 cuandocoinciden sus subındices y 0 en otro caso).

La matriz cuadrada de orden n que tiene 0 en todos sus elementos se denomina matriznula y se denotara por 0n. Ası mismo, notaremos 0m×n a la matriz m × n con todos suselementos nulos.

Definicion.– Dada una matriz A ∈ M(m × n; k), se define la matriz traspuesta de A,notada At, como la matriz de M(n × m; k) cuyo elemento (i, j) es el elemento (j, i) deA. Esto es, At es el resultado de cambiar, en A, filas por columnas y columnas por filas,respetando el orden. De esto, es obvio que (At)t = A.

Una matriz A se dice simetrica cuando A = At, esto es cuando aij = aji para cua-lesquiera i, j. Por otro lado, A se dice antisimetrica cuando aij = −aji para todo (i, j)(en particular, aii = 0 para todo i).

Observacion.– Obviamente una matriz simetrica o antisimetrica ha de ser cuadrada.Analogamente, una matriz antisimetrica y diagonal ha de ser forzosamente 0n.

Para finalizar, definiremos algunos conceptos que tambien aparecen en algebra matri-cial y que seran utiles en adelante.

Definicion.– Sea A ∈ M(m × n; k).

(a) Cuando m = 1 (respectivamente n = 1) A se dira una matriz–fila (matriz–columna).

(b) Una submatriz de A es una matriz formada por la interseccion de un subconjuntode filas y un subconjunto de columnas de A, respetando el orden.

(c) Cuando una submatriz este formada por filas consecutivas y columnas consecutivas,se denominara un bloque de A.

Observacion.– Los bloques de A correspondientes a las filas y columnas de A (mas pre-cisamente las submatrices–fila y submatrices–columna de A) seran usados con frecuencia.Ası, cuando escribamos, por ejemplo

A = ( C(A)1 |C(A)2 | ... |C(A)n ),

estaremos indicando que C(A)i es la submatriz–columna de A formada por todas las filasy la columna i–esima de A. La notacion correspondiente por filas sera

A =

F (A)1

F (A)2

...F (A)m

.

Page 21: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

2.2. Operaciones: Suma, producto, producto por es-calares.

Definicion.– Dadas dos matrices A,B ∈ M(m × n; k) definimos la matriz suma de A yB como C = (cij) = A + B ∈ M(m × n; k) dada por

cij = aij + bij.

Proposicion.– La suma de matrices dota a M(m×n; k) de estructura de grupo abeliano.

Demostracion.– Las cuatro propiedades son elementales de probar: el elemento neu-tro es 0m×n y el opuesto de A, notada −A, es aquella en la que el elemento (i, j) esprecisamente −aij .

Definicion.– Dada una matriz A ∈ M(m × n; k) y un elemento α ∈ k se define elproducto de α por A como B = (bij) = αA ∈ M(m × n; k) dada por

bij = αaij.

Los elementos de un cuerpo k, cuando operan con elementos de otro conjunto, sedenominan a menudo escalares. Por ello el anterior producto se suele denominar productopor escalares, para diferenciarlo del producto de matrices que despues veremos.

Proposicion.– El producto por escalares verifica las siguientes propiedades, dadas A,B ∈M(m × n; k) y α, β ∈ k):

(a) (α + β)A = αA + βA (distributividad del producto respecto de la suma de es-calares).

(b) α(A + B) = αA + αB (distributividad del producto respecto de la suma de matri-ces).

(c) (αβ)A = α(βA).

(d) 1A = A y 0A = 0m×n.

Definimos ahora el producto de matrices, que es, con diferencia, la operacion mascomplicada, tanto por sus propiedades como por la definicion en sı. Incorporaremostambien la notacion de sumatorios, que ya debe resultar familiar.

Definicion.– Dadas dos matrices A ∈ M(m × n; k) y B ∈ M(n × p; k) se define elproducto de A por B como C = (cij) = AB dada por

cij = ai1b1j + ai2b2j + ... + ainbnj =n∑

l=1

ailblj.

Notemos que, si escribimos A en submatrices–fila y B en submatrices–columna,

A =

F (A)1

F (A)2

...F (A)m

, B = ( C(B)1 |C(B)2 | ... |C(B)p ),

Page 22: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

entonces el elemento (i, j) de AB es precisamente F (A)iC(B)j .

Proposicion.– Se verifican las siguientes propiedades:

(a) Dadas A ∈ M(m × n; k), B ∈ M(n × p; k) y C ∈ M(p × q; k), se tiene queA(BC) = (AB)C.

(b) Dadas A ∈ M(m × n; k), B,C ∈ M(n × p; k) y D ∈ M(p × q; k), se tiene que

A(B + C) = AB + AC, (B + C)D = BD + CD.

(c) Dada A ∈ M(m × n; k), AIn = ImA = A.

(d) Dadas A ∈ M(m × n; k), B ∈ M(n × p; k) y α ∈ k, se tiene que (αA)B =α(AB) = A(αB).

Demostracion.– Casi todas las propiedades son similares y no demasiado complejas,salvo por el hecho de que la notacion puede ser enrevesada. De esta forma, haremos laprueba de (a) y dejaremos las demas (sobre todo (b) y (d)) como un interesante ejercicio.Denominemos

D = A(BC), E = (AB)C,

ambas de orden m × q.

El elemento dij viene dado por

dij =n∑

h=1

aih [ elemento (h, j) de BC ] =n∑

h=1

aih

(

p∑

l=1

bhlclj

)

=n; p∑

h=1; l=1

aihbhlclj,

mientras que el elemento eij viene dado por

eij =p∑

l=1

[ elemento (i, l) de AB ] clj =p∑

l=1

(

n∑

h=1

aihbhl

)

clj =p; n∑

l=1; h=1

aihbhlclj,

con lo que probamos el resultado.

Observacion.– El producto de matrices no es conmutativo: de hecho, es posible que nitan siquiera se puedan considerar los dos productos posibles. En concreto, AB y BAsolo tiene sentido si A ∈ M(m × n; k) y B ∈ M(n × m; k), pero no tiene por que serAB = BA, como se puede comprobar con casi cualquier ejemplo.

En particular, si A,B ∈ M(n; k), en cuyo caso tienen sentido AB y BA, tampoco severifica AB = BA, en general.

Observacion.– De la definicion de producto se sigue facilmente que el producto y lasuma de matrices diagonales (respectivamente triangulares superiores/inferiores) es denuevo diagonal (triangular superior/inferior).

Proposicion.– Dadas matrices A y B, y un escalar α ∈ k, se verifica:

(a) Si A,B ∈ M(m × n; k), (A + B)t = At + Bt.

(b) Si A ∈ M(m × n; k) y B ∈ M(n × p; k), (AB)t = BtAt.

Page 23: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(c) (αA)t = αAt.

Demostracion.– Solo apuntaremos la prueba de (b), que es la mas difıcil: denotamosC = (AB)t y D = BtAt. Entonces el elemento cij es el elemento (j, i) de AB, esto es,el producto de F (A)j por C(B)i. Por otro lado, dij es el producto F (Bt)iC(At)j , esto es,

n∑

l=1

bliajl = F (A)jC(B)i,

lo que prueba el resultado.

2.3. Determinantes (I).

El concepto de determinante es uno de los mas complejos del algebra matricial: optamosaquı por la definicion mas tradicional basada en el desarrollo indicado por permutaciones,que ya se han introducido.

Definicion.– Sea A ∈ M(n; k). Denominamos determinante de A, notado |A| o det(A)al escalar dado por la formula

|A| =∑

σ∈Sn

(−1)nt(σ)a1σ(1)a2σ(2)...anσ(n),

donde nt(σ) indica el numero de trasposiciones de la permutacion σ.

Observacion.– Como el sumatorio esta indicado por los elementos de Sn, habra n!sumandos en el desarrollo completo de |A|.

Cada uno de estos sumandos, salvo signo, es el producto de n elementos de la matriz,tomados de forma que no hay dos en la misma fila, ni dos en la misma columna.

Ejemplo.– Consideremos una matriz generica A ∈ M(2; k),

A =

(

a11 a12

a21 a22

)

.

En S2 tenemos dos permutaciones posibles que llamaremos σ y τ , concretamente

σ =

[

1 21 2

]

, τ =

[

1 22 1

]

,

y que verifican nt(σ) = 0, nt(τ) = 1. Ası pues, el desarrollo de |A| queda

|A| = (−1)0a11a22 + (−1)1a12a21 = a11a22 − a12a21.

Ejemplo.– Veamos ahora el caso de matrices 3 × 3; tomamos

A =

a11 a12 a13

a21 a22 a23

a31 a32 a33

.

Page 24: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

En S3 hay seis permutaciones, en concreto

σ1 =

[

1 2 31 2 3

]

, σ2 =

[

1 2 32 3 1

]

, σ3 =

[

1 2 33 1 2

]

,

τ1 =

[

1 2 33 2 1

]

, τ2 =

[

1 2 32 1 3

]

, τ3 =

[

1 2 31 3 2

]

,

donde las σi tienen nt(σi) par y las τi tiene nt(τi) impar.

El desarrollo es entonces el siguiente:

|A| = a11a22a33 + a12a23a31 + a13a21a32 − a13a22a21 − a12a21a33 − a11a23a32,

que coincide con la formula conocida de los determinantes 3 × 3.

De las muchas propiedades de los determinantes, vamos a estudiar solamente algunasen esta leccion, las que lo caracterizan en cierto modo.

Proposicion.– Sea A ∈ M(n; k). Entonces |A| = |At|.Demostracion.– Escribimos, como es costumbre A = (aij) y un sumando, de los n!

de que consta el desarrollo del determinante de A es

Mσ = (−1)nt(σ)a1r1a2r2

...anrn,

donde σ viene dada por

σ =

[

1 2 ... nr1 r2 ... rn

]

.

Como σ es una permutacion de {1, 2, ..., n}, podemos reordenar los factores de Mσ

usando el segundo subındice de cada factor,

Mσ = (−1)nt(σ)ak11ak22...aknn.

Donde ki es precisamente el elemento de {1, 2, ..., n} que verifica σ(ki) = i. Esto es,la permutacion

[

1 2 ... nk1 k2 ... kn

]

es, precisamente, σ−1 que tambien es un elemento de Sn.

En el desarrollo del determinante de At = (bij) nos encontramos con el sumandocorrespondiente a la permutacion σ−1, que es

Nσ−1 = (−1)nt(σ−1)b1k1b2k2

...bnkn= (−1)nt(σ−1)ak11ak22...aknn,

con lo que cada sumando Mσ de |A| es, salvo signo, igual que un sumando Nσ−1 de |At|.Por tanto para probar el resultado solo resta demostrar que

(−1)nt(σ) = (−1)nt(σ−1).

Antes de entrar a probar el resultado, tomemos un ejemplo de S6

σ =

[

1 2 3 4 5 64 3 2 6 1 5

]

,

Page 25: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

cuyo numero de trasposiciones es nt(σ) = 7. El inverso de σ viene dado por

σ−1 =

[

1 2 3 4 5 65 2 3 1 6 4

]

,

que verifica nt(σ−1) = 7. Esto no es, como veremos, casual y, de hecho, este ejemploesta previsto para que podamos seguir sobre el (u otro similar) el razonamiento.

En efecto, cada trasposicion de σ corresponde a un par (i, j) de {1, ..., n}× {1, ..., n}tal que i < j y σ(i) = ri > σ(j) = rj . Pero esto tambien corresponde a un par (rj, ri) ∈{1, ..., n} × {1, ..., n} tal que rj < ri y σ−1(rj) = j > σ−1(ri) = i. Por tanto, cadatrasposicion de σ lleva aparejada una trasposicion de σ−1, con lo que nt(σ) ≤ nt(σ−1).Como esto es cierto para cualquier σ, aplicando el mismo resultado a σ−1 se tiene lo quequeremos.

Observacion.– A partir de este enunciado, todos los resultados relativos a evaluacionde determinantes (esto es del tipo, “el determinante no varıa”, “el determinante vale0”,...) y relativos a propiedades u operaciones por columnas son igualmente validos parapropiedades u operaciones por filas, y viceversa.

Vamos a estudiar ahora otras de las propiedades mas sobresalientes de los determi-nantes; dando, en casi todos los casos, las demostraciones precisas. Aun ası, es obvio elhecho de que el alumno debe limitarse a entender bien (que no es poco) las pruebas y aaplicar los enunciados a la evaluacion de determinantes de diversa complejidad.

Definicion.– Dada una matriz–fila (respectivamente columna) A, pongamos

A = (a1 a2 ... an ) ,

diremos que es combinacion lineal de las matrices–fila (columna) B y C, dadas por

B = (b1 b2 ... bn ) , C = (c1 c2 ... cn ) ,

cuando existan α, β ∈ k tales que A = αB + βC, esto es,

ai = αbi + βci, para todo i = 1, ..., n.

Analogamente diremos que A es combinacion lineal de matrices–fila B1, ..., Br

cuando existan escalares α1, ..., αr ∈ k tales que

A = α1B1 + ... + αrBr.

Proposicion.– Sea A ∈ M(n; k) verificando que F (A)i es combinacion lineal de matri-ces fila B1, ..., Br;

F (A)i = α1B1 + ... + αrBr.

En estas condiciones el determinante de A es

|A| = α1|A1| + ... + αr|Ar|,

donde cada Aj es la matriz resultante de cambiar, en A la fila F (A)i por la matriz–fila Bj .

Demostracion.– Solo haremos la demostracion para r = 2, porque el caso general seobtiene aplicando reiteradamente este caso. Este razonamiento se usara varias veces en el

Page 26: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

futuro y tal vez merezca la pena detenerse un instante en el. En efecto, supongamos quesolo hemos probado el caso r = 2. Entonces

|A| =

C(A)1...

C(A)i

...C(A)n

=

C(A)1...

α1B1 + α2B2 + ... + αrBr

...C(A)n

,

y, aplicando el caso de dos sumandos,

|A| = α1

C(A)1...

B1...

C(A)n

+

C(A)1...

α2B2 + ... + αrBr

...C(A)n

.

Aplicando de nuevo el caso probado al ultimo determinante,

|A| = α1

C(A)1...

B1...

C(A)n

+ α2

C(A)1...

B2...

C(A)n

+

C(A)1...

α3B3 + ... + αrBr

...C(A)n

,

y, en r aplicaciones sucesivas,

|A| = α1|A1| + ... + αr|Ar|.

Probemos entonces el caso r = 2. Para ello simplificaremos la notacion y supon-dremos

F (A)i = αB + βC,

conB = ( bi1 ... bin ) , C = ( ci1 ... cin ) ,

donde usamos una notacion algo extrana, para facilitar la situacion de B y C como filasi–esimas de A1 y A2.

Desarrollamos el determinante de A, usando la notacion habitual,

|A| =∑

σ∈Sn

(−1)nt(σ)a1r1...airi

...anrn

=∑

σ∈Sn

(−1)nt(σ)a1r1... (αbiri

+ βciri) ...anrn

=∑

σ∈Sn

(−1)nt(σ)a1r1... (αbiri

) ...anrn+∑

σ∈Sn

(−1)nt(σ)a1r1... (βciri

) ...anrn

= α|A1| + β|A2|,

Page 27: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

donde A1 (resp. A2) es la matriz resultante de A al cambiar F (A)i por B (resp. C).

Corolario.– Si multiplicamos todos los elementos de una fila de A por un elemento α ∈ k,el determinante de la matriz resultante es α|A|.

Demostracion.– Es el resultado anterior para r = 1 (la demostracion se adapta triv-ialmente).

Proposicion.– Sea A ∈ M(n; k), y denominemos B la matriz resultante de intercambiardos filas de A. Entonces |B| = −|A|.

Demostracion.– Supongamos que las filas que se permutan son F (A)i y F (A)j (coni < j) y denotemos, como es usual, A = (aij), B = (bij). Entonces:

|B| =∑

σ∈Sn

(−1)nt(σ)b1r1...biri

...bjrj...bnrn

=∑

σ∈Sn

(−1)nt(σ)a1r1...ajri

...airj...anrn

=∑

σ∈Sn

(−1)nt(σ)a1r1...airj

...ajri...anrn

Fijemonos ahora en la permutacion indicada en los subındices de los sumandos: no esσ, sino otra permutacion, llamemosla τ , que concide con σ en todo, salvo porque

τ(i) = σ(j) = rj, τ(j) = σ(i) = ri.

Tratemos de relacionar las trasposiciones de σ con las de τ . Obviamente, para 1, ..., i−1, j+1, ..., n las trasposiciones que tienen lugar por ambas permutaciones son exactamen-te las mismas. Si tomamos i < k < j, entonces las trasposiciones que contamos en k porσ y τ son distintas en dos casos:

(a) Si ri < rk < rj , en τ aparece una trasposicion (porque τ(k) = rk > τ(j) = ri) queno aparecıa en σ. Pero, de hecho, tambien aparece otra (τ(i) = rj > τ(k) = rk).

(b) Si ri < rk < rj , se da el caso simetrico.

Ası las cosas, la diferencia entre las trasposiciones que contemos en σ y las de τ vansiempre de dos en dos, a excepcion de un solo caso: si ri > rj en σ hay una trasposicion(i < j, σ(i) > σ(j)) que no aparece en τ . Por contra, si ri < rj , en τ aparece unatrasposicion que no aparece en σ. En cualquier circunstancia

(−1)nt(σ) = (−1) · (−1)nt(τ),

de donde|B| =

τ∈Sn

−(−1)nt(τ)a1r1...airj

...ajri...anrn

= −|A|,porque, cuando σ recorre todas las biyecciones de Sn, τ tambien lo hace. Esto se puedeprobar directamente o bien observando que τ = υσ, donde υ es la pemutacion que in-tercambia i con j, dejando todos los demas elementos de {1, ..., n} iguales. Entonces,cuando σ varıa por todas las biyecciones de Sn, τ lo hace por las de υ ·Sn = Sn (ver 1.4.).

Page 28: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Proposicion.– El determinante de In vale 1.

Demostracion.– Es inmediata, dado que la unica permutacion que no arroja unsumando nulo en el desarrollo es σ(i) = i, para todo i = 1, ..., n, que no tiene trasposi-ciones. Entonces

|In| = (−1)01 · 1 · ... · 1 = 1.

Observacion.– Puede probarse (aunque no lo haremos aquı), que las tres propiedadesestudiadas en esta leccion (denominadas habitualmente, por este orden, multilinealidad,alternancia y normalidad) caracterizan el determinante como aplicacion de M(n; k) en k.

2.4. Determinantes (II).

Continuamos con las propiedades basicas del determinante, incluyendo una prueba, queraras veces se expone en clase con total rigor, de que el producto de dos determinanteses el determinante del producto. Aunque es obligatorio que los alumnos conozcan esteresultado, se pudede optar por sustituir la prueba por algunos ejemplos n–dimensionales,determinantes de Vandermonde o algunos otros ejemplos que puedan resultar utiles en elfuturo.

Proposicion.– El determinante de una matriz con dos filas iguales es 0.

Demostracion.– En efecto, si A ∈ M(n; k) tiene dos filas iguales, al permutarlasobtenemos la misma matriz A. Pero, por alternancia, eso implica |A| = −|A|, de donde|A| = 0.

Proposicion.– Si una matriz tiene una fila proporcional a otra, su determinante es 0.

Demostracion.– Sea A ∈ M(n; k) tal que F (A)i = αF (A)j para cierto α ∈ k.Entonces

|A| =

F (A)1...

F (A)i

...F (A)j

...F (A)n

=

F (A)1...

αF (A)j

...F (A)j

...F (A)n

= α

F (A)1...

F (A)j

...F (A)j

...F (A)n

= 0,

por la alternancia del determinante.

Corolario.– Si una matriz tiene una fila de ceros, su determinante es 0.

Demostracion.– Inmediata.

Proposicion.– Si en una matriz una fila es combinacion lineal de otras, el determinantees 0.

Demostracion.– Supongamos que, en la matriz A ∈ M(n; k), tenemos

F (A)i = α1F (A)j1 + α2F (A)j2 + ... + αrF (A)jr.

Page 29: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Entonces el determinante de A se puede descomponer, por multilinealidad, comosuma de r determinantes, cada uno de ellos con dos filas proporcionales y, en conse-cuencia, nulos. Ası |A| = 0.

Proposicion.– Dada una matriz A ∈ M(n; k), si sumamos a una fila de A una combi-nacion lineal de otras filas de A, obtenemos una matriz B que verifica |A| = |B|.

Demostracion.– Supongamos que B se obtiene de A haciendo

F (B)i = F (A)i + α1F (A)j1 + α2F (A)j2 + ... + αrF (A)jr,

y todas las demas filas de B coinciden con las de A. Entonces

|B| =

F (A)1...

F (A)i + α1F (A)j1 + ... + αrF (A)jr

...F (A)n

=

F (A)1...

F (A)i

...F (A)n

+

F (A)1...

α1F (A)j1 + ... + αrF (A)jr

...F (A)n

= |A| + 0 = |A|.

Proposicion.– Sean A,B ∈ M(n; k). Entonces |AB| = |A| · |B|.Demostracion.– Esta prueba es bastante compleja, y es muy probable que el docente

opte por no hacerla en clase; de todos modos la haremos por si no es este el caso.

Sea D = AB. Entonces, por definicion del producto,

dij =n∑

l=1

ailblj,

por lo que

F (D)i =n∑

l=1

ailF (B)l, para i = 1, ..., n.

Ası pues tenemos que

|D| =

F (D)1...

F (D)n

=

n∑

l1=1

a1l1F (B)l1

...n∑

ln=1

anlnF (B)ln

=n∑

l1=1

...n∑

ln=1

a1l1 ...anln

F (B)l1...

F (B)ln

,

Page 30: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

usando (reiteradamente) la multilinealidad del determinante. Ahora bien, por alternancia,sabemos que si los {l1, ..., ln} no son todos distintos dos a dos, el sumando correspondi-ente es 0, al tener el determinante del sumando dos filas iguales.

Nos quedamos, pues, con los sumandos no nulos. Para uno de estos sumandos, defin-imos σ ∈ Sn por σ(j) = lj para j = 1, ..., n. Notemos que σ es un permutacion biendefinida, para todos los sumandos no nulos de |D| y, recıprocamente, toda permutacionde Sn va a aparecer de esta forma en algun sumando de la expresion anterior.

En uno de nuestros sumandos, observemos que∣

F (B)l1...

F (B)ln

= (−1)nt(σ)|B|.

Esto puede probarse de manera similar a la prueba de que nt(σ) = nt(σ−1). Entonces

|D| =n∑

l1=1

...n∑

ln=1

a1l1 ...anln

F (B)l1...

F (B)ln

=∑

σ∈Sn

a1σ(1)...anσ(n)(−1)nt(σ)|B|

= |B|∑

σ∈Sn

a1σ(1)...anσ(n)(−1)nt(σ) = |A| · |B|.

Observacion.– Algunas otras propiedades que se deducen de las ya estudiadas o que seprueban de forma analoga, y que pueden aparecer como corolarios o como ejercicios (o noaparecer en absoluto e ir probandolas segun surjan) son las siguientes: dada A ∈ M(n; k),

(a) |αA| = αnA, para todo α ∈ k.

(b) |Ar| = |A|r, para todo r ∈ N.

(c) Si A es triangular superior (inferior), |A| es el producto de sus elementos diago-nales.

Estudiamos ahora un metodo de calculo de determinantes a mano: el desarrollo de undeterminante por adjuntos de una fila (columna).

Definicion.– Sea A ∈ M(n; k), aij un elemento de A. La submatriz de A resultante deeliminar F (A)i y C(A)j , se denomina submatriz complementaria de aij y se denota Mij .Su determinante se llama menor complementario de aij , que notaremos αij . El escalar

Aij = (−1)i+jαij

se denomina adjunto de aij .

Observacion.– Los adjuntos se puede usar para calcular explıcitamente los determi-nantes, en especial si se usan junto con las propiedades estudiadas anteriormente. Probe-mos primero el resultado esencial de esta leccion.

Proposicion.– Sea A ∈ M(n; k) y escojamos una fila (columna) cualquiera F (A)i. En-tonces

ai1Ai1 + ai2Ai2 + ... + ainAin = |A|,

Page 31: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

esto es, el determinante de |A| se puede hallar calculando el desarrollo de una fila(columna) por sus adjuntos.

Demostracion.– El desarrollo de |A| era

|A| =∑

σ∈Sn

(−1)nt(σ)a1σ(1)...aiσ(i)...anσ(n),

por lo que los sumandos que contienen a un aij escogido de antemano se agrupan en

aij

σ(i)=j

(−1)nt(σ)a1σ(1)...ai−1σ(i−1)ai+1σ(i+1)...anσ(n) = aijBij.

Obviamente el objetivo es probar que Bij = Aij = (−1)i+jαij .

Dado que en cada sumando de |A| hay exactamente un elemento de cada fila y de cadacolumna, en cada sumando de Bij hay precisamente un elemento de cada fila de A (ex-cepto de F (A)i) y de cada columna (excepto de C(A)j). Por tanto, salvo eventualmenteel signo en cada sumando, Bij es el determinante de Mij .

Veamos, para un sumando concreto de Bij la relacion entre el signo con que aparecearriba (esto es, (−1)nt(σ)) y el signo con el que aparece en el desarrollo del determinantede Mij .

Dado σ ∈ Sn con σ(i) = j,

σ =

[

1 2 ... i − 1 i i + 1 ... nr1 r2 ... ri−1 j ri+1 ... rn

]

,

denominaremos σ′ la biyeccion entre {1, ..., i− 1, i+1, ..., n} y {1, ..., j − 1, j +1, ..., n}definida por σ′(l) = σ(l). En estas condiciones si indicamos las filas de Mij por1, 2, ..., i − 1, i + 1, ..., n y las columnas por 1, 2, ..., j − 1, j + 1, ..., n, tenemos que(−1)nt(σ′) es el coeficiente con que aparece a1σ(1)...ai−1σ(i−1)ai+1σ(i+1)...anσ(n) en |Mij|.

N.B.: Para hacerlo usando permutaciones de Sn−1, deberıamos denotar por σ′ a lapermutacion de Sn−1 definida por

σ′(l) =

σ(l) si 1 ≤ l ≤ i − 1, 1 ≤ σ(l) ≤ j − 1σ(l) − 1 si 1 ≤ l ≤ i − 1, j + 1 ≤ σ(l) ≤ nσ(l − 1) si i + 1 ≤ l ≤ n, 1 ≤ σ(l) ≤ j − 1σ(l − 1) − 1 si i + 1 ≤ l ≤ n, j + 1 ≤ σ(l) ≤ n

o sea, σ′ consiste simplemente en borrar i del conjunto original y j del conjunto imagen.Cuando σ recorre Sn, σ′ recorre Sn−1.

Ahora bien, al eliminar σ(i) = j, el numero de trasposiciones de σ′ se ve alteradocomo sigue:

nt(σ′) = nt(σ) − ]{rl > j | l = 1, ..., i − 1} + ]{rl < j | l = i + 1, ..., n}.

Si llamamos s al segundo sumando en la expresion anterior, entonces el tercersumando es claramente (j − 1) − (i − 1 − s) = j − i + s, por lo que

nt(σ′) = nt(σ) − (s + j − i + s),

de donde(−1)nt(σ′) = (−1)nt(σ)−2s−j+i = (−1)nt(σ)+i+j .

Page 32: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

De esta forma hemos probado que el coeficiente de aij en |A| es∑

σ′

(−1)nt(σ′)+i+ja1σ(1)...ai−1σ(i−1)ai+1σ(i+1)...anσ(n) = (−1)i+jAij.

Observacion.– Este resultado, junto con las propiedades del determinante (especialmenteel hecho de que sea invariante al sumar a una fila una combinacion lineal de otras) seusa frecuentemente para el calculo explıcito, aplicando este desarrollo una vez que sehan hecho en una fila todos los elementos cero, salvo uno. Esto permite convertir undeterminante de orden n en uno de orden n − 1.

Lema.– Dada A ∈ M(n; k), escojamos dos filas distintas F (A)i y F (A)j . Entonces

ai1Aj1 + ai2Aj2 + ... + ainAjn = 0,

esto es, el desarrollo de una fila por los adjuntos de otra es siempre 0.

Demostracion.– Tenemos que evaluar la suma anterior (supongamos i < j), dondeun sumando arbitrario es

ailAjl = (−1)j+lail

a11 ... a1l−1 a1l+1 ... a1n

......

......

ai1 ... ai,l−1 ai,l+1 ... ain

......

......

aj−1,1 ... aj−1,l−1 aj−1,l+1 ... aj−1,n

aj+1,1 ... aj+1,l−1 aj+1,l+1 ... aj+1,n

......

......

an1 ... an,l−1 an,l+1 ... ann

y usando el desarrollo visto anteriormente, pero a la inversa, podemos escribir

ailAjl = ail

a11 ... a1l−1 a1l a1l+1 ... a1n

......

......

...ai1 ... ai,l−1 ail ai,l+1 ... ain

......

......

...aj−1,1 ... aj−1,l−1 aj−1,l aj−1,l+1 ... aj−1,n

0 ... 0 1 0 ... 0aj+1,1 ... aj+1,l−1 aj+1,l aj+1,l+1 ... aj+1,n

......

......

...an1 ... an,l−1 anl an,l+1 ... ann

=

a11 ... a1l−1 a1l a1l+1 ... a1n

......

......

...ai1 ... ai,l−1 ail ai,l+1 ... ain

......

......

...aj−1,1 ... aj−1,l−1 aj−1,l aj−1,l+1 ... aj−1,n

0 ... 0 ail 0 ... 0aj+1,1 ... aj+1,l−1 aj+1,l aj+1,l+1 ... aj+1,n

......

......

...an1 ... an,l−1 anl an,l+1 ... ann

Page 33: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

De esta forma cuando realizamos la suma, usando la multilinealidad del determinante,obtenemos el determinante de A, sustituyendo la fila j–esima por la i–esima. Al tener dosfilas repetidas, el determinante (esto es, la suma que queremos evaluar) vale 0.

2.5. Matriz inversa.

Definicion.– Sea A ∈ M(n; k). Diremos que A es regular si existe B ∈ M(n; k) verifi-cando

AB = BA = In.

En este caso, B se denomina la matriz inversa de A y se denota A−1. Las matrices noregulares se denominan singulares.

Observacion.– Notemos en primer lugar que la matriz inversa de A, de existir, es unica(lo cual justifica que se la denote A−1). En efecto, si B y C son matrices inversas de A,tendremos

AB = In =⇒ InB = (CA)B = C(AB) = CIn =⇒ B = InB = CIn = C.

Observacion.– Pasamos ahora a la vertiente practica, esto es: como reconocer si unamatriz es regular y, en caso afirmativo, como hallar A−1.

Definicion.– Sea A ∈ M(n; k). Se denomina matriz adjunta de A a la matriz adj A cuyoelemento (i, j) es Aij , el adjunto del elemento (i, j) de A.

Proposicion.– Sea A ∈ M(n; k). Entonces

A(adj A)t = (adj A)tA = |A|In.

Demostracion.– Si notamos como de costumbre

A = (aij) , adj A = (Aij) ,

entonces

A(adj A)t =

n∑

i=1

a1iA1i

n∑

i=1

a1iA2i ...n∑

i=1

a1iAni

n∑

i=1

a2iA1i

n∑

i=1

a2iA2i ...n∑

i=1

a2iAni

...... . . . ...

n∑

i=1

aniA1i

n∑

i=1

aniA2i ...n∑

i=1

aniAni

,

esto es,

A(adj A)t =

|A| 0 ... 00 |A| ... 0...

... . . . ...0 0 ... |A|

,

usando las propiedades de los adjuntos. La otra igualdad es analoga.

Page 34: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Con este resultado ya podemos probar el enunciado que resuelve los dos problemasantes citados.

Teorema de la matriz inversa.– Sea A ∈ M(n; k). Entonces A es regular si y solosi |A| 6= 0. En este caso,

A−1 =1

|A|(adj A)t.

Demostracion.– Es nuestra primera prueba de una condicion necesaria y suficiente,ası que la haremos paso a paso para acentuar el procedimeinto estandar.

Primero supondremos que A es regular, y tendremos que probar que |A| 6= 0. Peroesto es trivial porque, como existe A−1,

A · A−1 = In,

de donde |A| · |A−1| = 1, por lo que |A| 6= 0. Ademas hemos probado que |A|−1 = |A−1|.Ahora supondremos que |A| 6= 0. Entonces, por la proposicion anterior

(adj A)t · A = A · (adj A)t = |A| · In,

de donde, usando las propiedades del producto por escalares,(

1

|A|(adj A)t

)

· A = A ·(

1

|A|(adj A)t

)

= In.

Corolario.– Los conjuntos

GL(n; k) = {A ∈ M(n; k) | |A| 6= 0}SL(n; k) = {A ∈ M(n; k) | |A| = ±1}

denominados, respectivamente, grupo lineal de orden n y grupo especial (lineal) de ordenn son, en efecto, grupos con la operacion producto.

Demostracion.– La propiedad asociativa se verifica en todo M(n; k) y el elementoneutro del producto, In, esta en ambos conjuntos, por lo que solo hay que probar queexiste elemento inverso. Pero esto es sencillo usando el teorema anterior.

Observese que estos grupos no son, en general, abelianos.

2.6. Rango.

Definicion.– Sea A ∈ M(m × n; k). Un menor de orden r de A es el determinante deuna submatriz cuadrada de A de orden r.

El rango de A, notado indistintamente rg(A) o rango(A), es el mayor r ∈ N tal queexiste un menor de orden r de A distinto de 0. Dicho de otro modo, es el orden del mayormenor no nulo de A.

Observacion.– De las propiedades estudiadas en 2.4. se deduce inmediatamente que, sitodos los menores de orden r+1 son nulos, tambien lo son los de orden r+2 y, por tanto,los de cualquier orden mayor que r; de donde rg(A) ≤ r.

Proposicion.– Sea A ∈ M(m × n; k). Se verifica:

Page 35: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(a) Si intercambiamos dos filas (columnas) de A, obtenemos una matriz con el mismorango.

(b) Si eliminamos de A una fila (columna) de ceros, obtenemos una matriz con elmismo rango.

(c) Si sumamos a una fila (columna) de A una combinacion lineal de otras filas (colum-nas), obtenemos una matriz del mismo rango.

(d) Si eliminamos de A una fila (columna) que es combinacion lineal de otras filas(columnas), obtenemos una matriz con el mismo rango.

Demostracion.– Las propiedades (a) y (b) son elementales ya que, si denominamos Ba la matriz resultante de intercambiar dos filas o de eliminar una fila de ceros, todo menorno nulo de A puede formarse en B, y viceversa, por lo que el resultado es inmediato.

Probemos la propiedad (c). Para ello, comenzaremos reduciendo el problema al casobasico en el que la operacion efectuada sea sumar, a una fila, otra multiplicada por unescalar. En efecto, probado esto, sumar una combinacion lineal arbitraria se traduce enaplicar el caso basico cuantas veces sean necesarias.

Una vez constatado esto, podemos tambien reducir el problema al caso

F (B)1 = F (A)1 + αF (A)2, F (B)i = F (A)i, para i = 2, ..., n;

ya que, de no ser ası, podemos permutar las filas afectadas (lo cual no varıa el rango,por (a)). Ahora probaremos que rg(A) ≥ rg(B) y con esto habremos finalizado, pues Atambien se puede obtener de B usando una combinacion lineal de filas y, en consecuencia,la misma demostracion que vamos a realizar prueba que rg(B) ≥ rg(A).

Supongamos entonces que rg(A) = r y, por tanto, todos los menores de orden r + 1son cero. Tomemos entonces un menor M cualquiera de orden r+1 de B y probemos quees 0. Para ello, notemos en primer lugar que si M no involucra a F (B)1 se puede hallarexactamente el mismo menor en A, por lo que M = 0. Ası mismo si involucra tantoa F (B)1 como a F (B)2, tambien se puede hallar el mismo menor en A, convirtiendoF (B)1 en F (A)1 usando F (B)2 = F (A)2. Ası pues, el unico caso a tratar es cuando Minvolucra a F (B)1, pero no a F (B)2.

Podemos permutar las filas y columnas involucradas de manera que las filas seanF (B)1, F (B)3, ..., F (B)r+2 y las columnas C(B)1, ..., C(B)r+1, solo por simplificar no-tacion. Pero entonces

M =

a11 + αa21 a12 + αa22 ... a1r+1 + αa2r+1

a31 a32 ... a3r+1...

... . . . ...ar+2,1 ar+2,2 ... ar+2,r+1

=

a11 a12 ... a1r+1

a31 a32 ... a3r+1...

... . . . ...ar+2,1 ar+2,2 ... ar+2,r+1

+ α

a21 a22 ... a2r+1

a31 a32 ... a3r+1...

... . . . ...ar+2,1 ar+2,2 ... ar+2,r+1

,

por lo que M es combinacion de dos menores de orden r + 1 de A, de donde M = 0.

Page 36: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

El apartado (d) es combinacion directa de los apartados (c) y (b).

Proposicion.– Sea A ∈ M(m × n; k), P ∈ GL(m; k), Q ∈ GL(n; k). Entoncesrg(PA) = rg(AQ) = rg(A).

Demostracion.– Haremos solo el caso rg(PA) ≤ rg(A), porque la otra desigualdadse tiene multiplicando a izquierda por P−1 y el caso rg(A) = rg(QA) es similar.

Procediendo como el apartado (c) de la proposicion anterior, podemos suponerrg(A) = r − 1 (para facilitar la notacion) y tomar, sin perdida de generalidad, M , elmenor formado por las r primeras filas y columnas de PA. Si probaramos M = 0,tendrıamos el resultado. Pero, si notamos,

A = (aij)i=1,...,m; j=1,...,n, P = (pij)i,j=1,...,m

,

tenemos que

M =

∑ml=1 p1lal1 ...

∑ml=1 p1lalr

... . . . ...∑m

l=1 prlal1 ...∑m

l=1 prlalr

y este menor, por la multilinealidad del determinante, puede escribirse como combinacionlineal de menores de orden r de A, separando primero en sumas de determinantes (usandola multilinealidad por filas, no por columnas) y extrayendo despues r coeficientes pij decada determinante (tambien por filas).

Dado que el proceso completo es sumamente engorroso, no entraremos en los detalles,pero haremos un ejemplo suponiendo r = m = 2 para ilustrar la complejidad de darexplıcitamente M como suma de menores de A. Ası, en ese caso

M =

p11a11 + p12a21 p11a12 + p12a22

p21a11 + p22a21 p21a12 + p22a22

=

p11a11 p11a12

p21a11 + p22a21 p21a12 + p22a22

+

+

p12a21 p12a22

p21a11 + p22a21 p21a12 + p22a22

=

p11a11 p11a12

p21a11 p21a12

+

p11a11 p11a12

p22a21 p22a22

+

p12a21 p12a22

p21a11 p21a12

+

+

p12a21 p12a22

p22a21 p22a22

= p11p22M1 + p12p21M2,

donde M1 y M2 son menores de orden 2 de A.

Observacion.– No hemos dado aun un metodo para calcular el rango, mas alla de losdos evidentes que se desprende de la definicion: bien ir hallando todos los menores deun orden dado hasta que aparezca uno no nulo y, en ese momento, comenzar con losdel orden siguiente; bien comenzar con los menores de orden maximo e ir bajando hastaencontrar uno no nulo.

Page 37: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Como muestra de la inefectividad de estos procedimientos, baste poner un ejemplo,ni tan siquiera numerico: consideremos una matriz cuadrada de orden 5 y rango 3.

Si comenzamos haciendo menores de orden bajo y vamos ascendiendo, aun en el casode que tengamos suerte y hallemos pronto un menor de orden 3 no nulo, nadie nos quita detener que calcular todos los menores de orden 4 hasta cerciorarnos de que todos son nulos.Eso implica 25 determinantes de orden 4. Si optamos por hacer primero el determinantede la matriz y luego ir buscando menores de menor rango aparte de los 25 determinantesde orden 4 debemos anadir a nuestra lista de tareas un determinante de orden 5.

A continuacion desarrollaremos un metodo mas efectivo para el calculo a mano delrango de una matriz, conocido como el metodo de orlado. En el ejemplo anterior, bastancuatro determinantes de orden 4 para garantizar que el rango de la matriz es 3.

El metodo del orlado se basa en el resultado siguiente:

Proposicion.– Sea A ∈ M(m × n; k), verificando que:

(a) Existe una submatriz cuadrada S de orden r con |S| 6= 0.

(b) Toda submatriz cuadrada de orden r + 1 que contenga a S tiene determinante 0.

En estas condiciones rg(A) = r.

Demostracion.– Podemos suponer como en la leccion anterior que S esta formadapor las r primeras filas y columnas. Escribimos entonces A por bloques de la forma

A =

(

S M1

M2 M3

)

,

y consideramos la matriz cuadrada de orden m dada por bloques

P =

(

Ir 0r×(m−r)

−M2S−1 Im−r

)

,

cuya inversa es (ejercicio sencillo)

P−1 =

(

Ir 0r×(m−r)

M2S−1 Im−r

)

= (qij) ,

aplicando la definicion.

Entonces la matriz B = PA tiene el mismo rango que A, pero B tiene la siguienteforma, sin mas que aplicar la definicion de producto

B =

(

S M1

0(m−r)×r M ′3

)

,

con M ′3 = −M2S

−1M1 + M3.

Ahora bien, supongamos que hay una submatriz de orden r + 1 en B que contienea S y con determinante distinto de 0. Permutando, supondremos que es la formada porlas r + 1 primeras filas y columnas. Esto implica, en particular que br+1,r+1 6= 0, ya quebr+1,i = 0 para i = 1, ..., r.

Page 38: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Entonces, hacemos P−1B = A y es elemental (aunque algo largo de probar condetalle: lo dejamos al juicio del docente) ver que la submatriz formada por las r + 1primeras filas y columnas de A es precisamente

S =

b1r+1

S...

brr+1

ar+1,1 ... ar+1,r ar+1,r+1

,

donde se verifica

ar+1,j =m∑

l=1

qr+1,lblj, j = 1, ..., r + 1

pero, al ser qr+1,l = 0 para l > r + 1, y qr+1,r+1 = 1, en realidad

ar+1,j =r∑

l=1

qr+1,lblj + br+1,j , j = 1, ..., r + 1

y, para l, j ≤ r se tiene que blj = alj y br+1,j = 0, por lo que

ar+1,j =r∑

l=1

qr+1,lalj j = 1, ..., r

ar+1,r+1 =r∑

l=1

qr+1,lal,r+1 + br+1,r+1

Si ahora realizamos la operacion

F (S)r+1 −r∑

l=1

qr+1,lF (S)l,

obtenemos una matriz de determinante |S| y forma

b1r+1

S...

brr+1

0 ... 0 br+1,r+1

.

De todo esto deducimos que, si br+1,r+1 6= 0, podemos hallar tambien en A unasubmatriz de orden r + 1 que contiene a S y de determinante distinto de 0. Por reduccional absurdo se deduce que rg(B) = r y, por tanto, tambien rg(A) = r.

Observacion.– El metodo del orlado para el calculo del rango de una matriz A se basaen el resultado anterior de la manera obvia: dada A comenzamos buscando un menor deorden 1 distinto de 0. Si lo hay, rg(A) ≥ 1, si no, rg(A) = 0 y hemos terminado.

En caso de no haber terminado, buscamos un menor de orden 2 cuya submatriz con-tenga la del menor de orden 1 no nulo hallado anteriormente. Si encontramos tal menor,rg(A) ≥ 2, si no, por la proposicion, rg(A) = 1 y hemos terminado.

Ası, cuando tengamos rg(A) ≥ i porque hemos hallado una submatriz de orden i ymenor no nulo, buscamos una submatriz de orden i+1 que contenga a la anterior (lo cualrecorta mucho la busqueda) y de determinante no nulo. Si la hallamos rg(A) ≥ i + 1 yseguimos, si no, rg(A) = i y hemos finalizado.

Page 39: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

2.7. Sistemas de ecuaciones lineales: Sistemas de Cramer.

Definicion.– Un sistema de m ecuaciones lineales en n incognitas, pongamos x1, ..., xn

definido sobre un cuerpo k es un conjunto de expresiones

a11x1 + a12x2 + ... + a1nxn = b1

a21x1 + a22x2 + ... + a2nxn = b2...

......

...am1x1 + am2x2 + ... + amnxn = bm

donde aij, bi ∈ k para todo i = 1, ..., n, j = 1, ...,m.

En notacion matricial el sistema anterior se expresa

a11 a12 ... a1n

a21 a22 ... a2n

......

...am1 am2 ... amn

x1

x2...

xn

=

b1

b2...

bm

,

o, abreviadamente,AX t = Bt.

La matriz A ∈ M(m × n; k) se denomina matriz de coeficientes del sistema y lamatriz

A =(

C(A)1 | ... |C(A)n |Bt)

se denomina matriz ampliada del sistema (notese que hemos usado Bt en lugar de(C(Bt)1), abusando un poco de la notacion).

Una solucion del sistema es una asignacion de valores

x1 = α1, x2 = α2, ..., xn = αn,

con αi ∈ k para todo i = 1, ..., n; de tal forma que se verifica

A

α1

α2...

αn

= Bt.

Abreviadamente tambien se dira que (α1, ..., αn) es una solucion del sistema.

Dos sistemas se dicen equivalentes cuando tienen exactamente las mismas soluciones;esto es, toda solucion de uno lo es de otro, y viceversa.

Observacion.– El caso mas simple (y, en cierto sentido, el unico) de sistemas equivalenteses aquel en el que anadimos o sustraemos a un sistema ecuaciones formadas a partir delas del sistema mediante combinaciones lineales.

Observacion.– Notemos que la existencia de una solucion (α1, ..., αn) es equivalente aque

α1C(A)1 + α2C(A)2 + ... + αnC(A)n = Bt.

Definicion.– Atendiendo a la existencia y a la cantidad de soluciones, los sistemas deecuaciones lineales pueden clasificarse como:

Page 40: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(a) Sistemas incompatibles: Aquellos que no tienen soluciones.

(b) Sistemas compatibles: Aquellos que admiten soluciones. Estos, a su vez, se dividenen:

(b.1) Sistemas compatibles determinados: Aquellos que admiten una unicasolucion.

(b.2) Sistemas compatibles indeterminados: Aquellos que admiten mas de unasolucion.

Definicion.– Un sistema de ecuaciones lineales se dice homogeneo cuando la matriz Btiene todos sus elementos nulos.

Observacion.– Los sistemas homogeneos han sido de gran importancia historicamente ytambien lo seran en esta asignatura. Como es obvio, todo sistema homogeneo es compa-tible.

Definicion.– Un sistema de ecuaciones lineales se dice de Cramer si tiene el mismonumero de ecuaciones que de incognitas y verifica que |A| 6= 0.

Teorema.– Un sistema de Cramer es siempre compatible determinado.

Demostracion.– Si escribimos el sistema en notacion matricial AX t = Bt, dado que|A| 6= 0, podemos escribir

A−1AX t = A−1Bt =⇒ InXt = X t = A−1Bt,

lo cual demuestra el resultado, por la unicidad de A−1.

Corolario.– Un sistema de Cramer homogeneo tiene como unica solucion

x1 = x2 = ... = xn = 0.

Observacion.– Para resolver un sistema de ecuaciones hay muchos metodos distintos,y, si bien un estudio detallado de la complejidad de cada uno esta fuera por completode los objetivos de la asignatura, sı podemos recalcar que el metodo que a continuacionprobaremos para los sistemas de Cramer, si bien es claramente inmanejable para sistemasde mas de 4 incognitas, puede resultar de ayuda para sistemas con pocas ecuaciones dondeno queramos pararnos a buscar combinaciones que eliminen variables.

Regla de Cramer.– Sea un sistema de ecuaciones de Cramer, notado matricialmente,

AX t = Bt.

Entonces la solucion unica del sistema viene dada por

xi =1

|A| det(

C(A)1 | ... |C(A)i−1 |Bt |C(A)i+1 | ... |C(A)n

)

,

para i = 1, ..., n. Esto es, el valor de cada xi es el cociente de dos determinantes, eldeterminante de A como denominador y, como numerador, el determinante de la matriz

Page 41: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

obtenida al sustituir, en A, la columna de los coeficientes de xi por la de terminos inde-pendientes.

Demostracion.– Si recobramos de la prueba anterior la solucion del sistema deCramer,

X t = A−1Bt,

podemos escribir lo siguiente

X t =1

|A|(adj A)tBt

=1

|A|

A11 A21 ... An1

A12 A22 ... An2...

... . . . ...A1n A2n ... Ann

b1

b2...bn

=1

|A|

A11b1 + A21b2 + ... + An1bn

A12b1 + A22b2 + ... + An2bn

...A1nb1 + A2nb2 + ... + Annbn

,

de lo cualxi =

A1ib1 + A2ib2 + ... + Anibn

|A| ,

donde, para finalizar la demostracion solo resta observar que el numerador es el desarrollopor los adjuntos de la columna i–esima del determinante de la matriz

a11 a12 ... a1i−1 b1 a1i+1 ... a1n

a21 a22 ... a2i−1 b2 a2i+1 ... a2n

......

......

......

an1 an2 ... ani−1 bn ani+1 ... ann

.

Observacion.– Gracias a los sistemas de Cramer podemos probar el recıproco de unapropiedad del rango de una matriz.

Proposicion.– Sea A una matriz con rg(A) = r. Si al eliminar una fila (columna) deA el rango continua siendo r, la fila (columna) eliminada era combinacion lineal de lasrestantes.

Demostracion.– Podemos suponer, como ya hemos explicado varias veces, que unmenor de orden maximal lo dan las r primeras filas y columnas. Probaremos entoncesque la columna C(A)r+1 es combinacion lineal de C(A)1, ..., C(A)r y todos los demascasos se siguen de este.

Si denominamos S a la submatriz anteriormente descrita, tenemos que

SX t =

a1r+1...

arr+1

Page 42: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

es un sistema de Cramer de orden r, por lo que existen α1, ..., αr ∈ k tales que, paral = 1, ..., r

α1al1 + ... + αralr = alr+1.

Ahora bien, si al hacer α1C(A)1+...+αrC(A)r−C(A)r+1 no obtenemos exactamenteuna columna de ceros es porque hay un elemento no nulo por debajo de la fila r–esima.Pero entonces al orlar la submatriz S con esa fila y la columna (j + 1)–esima, obtenemosuna submatriz de determinante no nulo y orden r +1, contradiciendo la hipotesis. Ası, hade ser

C(A)r+1 = α1C(A)1 + ... + αrC(A)r.

2.8. Teorema de Rouche–Frobenius.

El teorema de Rouche–Frobenius es el resultado mas importante visto hasta ahora, ya queclasifica perfectamente los sistemas en funcion de los rangos de la matriz de coeficientesy de la matriz ampliada.

Teorema de Rouche–Frobenius.– La condicion necesaria y suficiente para que un sis-tema de ecuaciones lineales tenga solucion es que el rango de la matriz de los coeficientescoincida con el rango de la matriz ampliada.

En estas condiciones, si dicho rango coincide con el numero de variables el sistemaes determinado. Si el rango es menor, el sistema es indeterminado.

Demostracion.– Notamos, como en las anteriores lecciones, A ∈ M(m × n; k) lamatriz de coeficientes, A la matriz ampliada y el sistema por

AX t = Bt.

Probemos primero la condicion necesaria, esto es: si un sistema es compatible hade darse que los rangos coincidan. Esto es consecuencia directa de la observacion quehicimos en la leccion 2.7.: la existencia de una solucion (α1, ..., αn) implica que

α1C(A)1 + ... + αnC(A)n = Bt,

por lo que la ultima columna de A es combinacion lineal de las anteriores y, en conse-cuencia, rg(A) = rg(A).

Demostremos ahora que si los rangos de A y A coinciden, entonces existe solucionpara el sistema. Para ello, supongamos que rg(A) = h y, permutando ecuaciones yvariables si es necesario, que las h primeras filas y columnas de A forman un menor nonulo (de A y de A, claro).

Por tanto, las m − h filas restantes de A son, como vimos en la leccion pasada, com-binacion lineal de las anteriores. Esto es, las m − h ecuaciones ultimas son combinacionlineal de las h primeras, por lo que podemos eliminarlas del sistema y el sistema que nosqueda es equivalente.

Page 43: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Ası mismo, como las h primeras columnas participan en el menor no nulo, reescribire-mos el sistema original de la siguiente forma:

a11x1 + a12x2 + ... + a1hxh = b1 − a1h+1xh+1 − ... − a1nxn

a21x1 + a22x2 + ... + a2hxh = b2 − a2h+1xh+1 − ... − a2nxn

......

ah1x1 + ah2x2 + ... + ahhxh = bh − ahh+1xh+1 − ... − ahnxn

que, como sistema de h ecuaciones en las variables x1, ..., xh es de Cramer y, por tanto,tiene solucion unica. En concreto, por los resultados de la leccion anterior, si denotamosel sistema anterior

A′

x1...

xh

= B′

obtenemosxi =

A′1ib

′1 + A′

2ib′2 + ... + Ahib

′h

|A′| ,

para i = 1, ..., h donde

b′j = bj − ajh+1xh+1 − ... − ajnxn.

Esto es, para cada valor que demos a las variables xh+1, ..., xn obtenemos unasolucion del sistema de Cramer. En nomenclatura habitual, las variables xh+1, ..., xn sonparametros del espacio de soluciones.

A partir de aquı todas las afirmaciones del teorema se siguen de manera obvia: existesolucion; y es unica si y solo si no existen parametros, esto es, cuando h = n; ya quesi existe un solo parametro, dandole valores 0 y 1 se han de obtener necesariamente almenos dos soluciones distintas.

Observacion.– Sea el sistema de m ecuaciones en n incognitas dado por AX t = Bt, yconsideremos el sistema AX t = 0m×1, denominado usualmente el sistema homogeneoasociado. Sea

L ={

(α1, ..., αn) soluciones de AX t = 0m×1

}

,

y sean (β1, ..., βn) y (γ1, ..., γn) dos soluciones particulares del sistema original AX t =Bt. Entonces

(β1 − γ1, ..., βn − γn) ∈ L,

como se deduce trivialmente, ya que

A

β1 − γ1...

βn − γn

= A

β1...

βn

− A

γ1...

γn

= Bt − Bt = 0m×1.

De la misma forma se prueba que (β1 + α1, ..., βn + αn) es solucion del sistema ori-ginal para cualquier (α1, ..., αn) ∈ L. Ambas afirmaciones prueban entonces que el con-junto de soluciones del sistema original se puede hallar sumando una solucion particularcualquiera con todas las soluciones del sistema homogeneo asociado.

Page 44: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Page 45: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Tema 3: Espacios vectoriales

3.1. Espacios vectoriales: Definicion y ejemplos.

Seguiremos, en lo sucesivo, denotando por k un cuerpo arbitrario, que para nosotros puedesuponerse que es Q, R, C.

Definicion.– Sea k un cuerpo, 0 y 1 los elementos neutros de la suma y el producto,respectivamente. Un espacio vectorial sobre k, tambien denominado k–espacio vectorial,es un conjunto V con dos operaciones: una interna, denominada suma y notada +, y otraexterna, de k × V en V , denominada producto por escalares y denotada · (o por simpleyuxtaposicion), verificando:

(a) (V, +) es un grupo abeliano.

(b) El producto por escalares verifica, para cualesquiera u, v ∈ V , α, β ∈ k,

(b.1) α(u + v) = αu + αv.

(b.2) (α + β)u = αu + βu.

(b.3) (αβ)u = α(βu).

(b.4) 1u = u.

Los elementos de V se denominan vectores y los de k, como de costumbre, escalares.

Notacion.– Usaremos las notaciones siguientes, dado un k–espacio vectorial V :

(a) Los elementos V se denotaran con letras subrayadas: v ∈ V .

(b) Dado v ∈ V el inverso aditivo es unico y ha de ser igual necesariamente a (−1)v.Se notara −v. Ası mismo, tambien notaremos u + (−v) = u − v.

(c) El elemento neutro de la suma en V se denotara 0.

Proposicion.– Sea V un k–espacio vectorial, u, v ∈ V , α, β ∈ k. Se verifican las siguien-tes propiedades:

(a) α0 = 0, 0u = 0.

(b) α(u − v) = αu − αv, (α − β)u = αu − βu.

(c) (−α)u = −(αu), α(−u) = −(αu).

Page 46: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(d) αu = 0 implica que α = 0 o u = 0.

Demostracion.– Todas las demostraciones son elementales y solo requieren el uso delas propiedades axiomaticas de k y V . Hagamos por ejemplo el primer apartado de (a).Para ello tomemos un x ∈ V cualquiera, y un α ∈ k no nulo (el caso α = 0 es el segundoapartado). Entonces

x + α0 = α1

αx + α0 = α

(

1

αx + 0

)

= α(

1

αx)

= x,

por lo que α0 = 0.

Para finalizar haremos el segundo caso de (c). Para ello dados α ∈ k y u ∈ V ,consideramos

αu + α(−u) = α(u + (−u)) = α(u − u) = α0 = 0,

lo cual prueba que α(−u) es el inverso aditivo de αu, esto es, −(αu).

Las restantes pruebas son buenos ejercicios para que los alumnos se habituen a usarlas propiedades de forma rigurosa, sin apoyarse en los vectores a los que estan acostum-brados.

Ejemplos.– Notemos que, para dar un espacio vectorial, es necesario no solamente darun conjunto, sino las dos operaciones. Veremos a continuacion algunos ejemplos proce-dentes de diversos campos de las matematicas, aunque no daremos las demostraciones,por apartarse del temario de esta asignatura.

(a) El ejemplo fundamental sera el espacio numerico n–dimensional definido comosigue: el conjunto base es

kn = {(a1, ..., an) | ai ∈ k} ,

y las dos operaciones son:

(a1, ..., an) + (b1, ..., bn) = (a1 + b1, ..., an + bn),

α(a1, ..., an) = (αa1, ..., αan).

Con estas operaciones comprobar las propiedades de espacio vectorial es elemen-tal. Este ejemplo incluye los casos mas conocidos (¿unicos?) hasta ahora por losalumnos, R2 y R3.

(b) Supongamos que tenemos dos cuerpos k ⊂ K, de tal forma que, dados dos ele-mentos cualesquiera en k, su suma y su producto son iguales si se consideran comoelementos de k y si se consideran como elementos de K. Entonces K es un k–espacio vectorial con las operaciones:

• Dados α, β ∈ K, α + β es la suma en K.

• Dados α ∈ k ⊂ K y β ∈ K, el producto por escalares αβ es el producto enK.

(c) El conjunto M(m× n; k) es un k–espacio vectorial con las operaciones usuales desuma y producto por escalares, como vimos en la leccion 2.2.

Page 47: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(d) Sea AX t = 0n×1 un sistema de ecuaciones lineales homogeneo en m variables.Consideremos el conjunto de soluciones L ⊂ km, dotadas con las mismas opera-ciones de suma y producto por escalares que definimos en km. Entonces L es a suvez un k–espacio vectorial.

(e) El conjunto k[X], con la suma de polinomios y el producto por escalares usual,es un k–espacio vectorial. De hecho, como solo se consideran los productos deescalares por polinomios, el conjunto

k[X]r = {p(X) ∈ k[X] | grado(p) ≤ r} ∪ {0}

tambien es un k–espacio vectorial.

(f) El conjunto de funciones continuas (diferenciables, Riemann–integrables,...) en unabierto (a, b) ⊂ R es un R–espacio vectorial.

(g) Una ecuacion diferencial lineal homogenea es una expresion de la forma

a0(x)yn)′ + a1(x)yn−1)′ + ... + an−1(x)y′ + an(x)y = 0,

donde a0(x), a1(x), ..., an(x) son funciones continuas en R, y es una funcion de R

en R a determinar e y′, y′′, ..., yn−1)′ , yn)′ son sus derivadas sucesivas. Usando laspropiedades de la derivada es facil ver que el conjunto de soluciones de la ecuaciondiferencial es un R–espacio vectorial.

(h) El conjunto V = {0} es un k–espacio vectorial para cualquier k. Es el menor queexiste, ya que por ser (V, +) grupo debe existir elemento neutro de la suma.

(i) De manera similar al ejemplo (e), consideremos n variables x1, ..., xn y el conjunto

W = {f(x1, ..., xn) = a1x1 + ... + anxn | ai ∈ k}

Este conjunto es un espacio vectorial con la suma y el producto por escalares habit-uales. Por motivos que luego veremos, se denomina el espacio dual de kn.

3.2. Dependencia e independencia lineal.

Definicion.– Sea V un k–espacio vectorial. Diremos que v ∈ V es combinacion lineal dev1, ..., vm ∈ V si existen escalares α1, ..., αm ∈ k verificando

v = α1v1 + ... + αmvm.

Ejemplos.– Algunos ejemplos elementales son:

(a) El vector 0 es combinacion lineal de cualquier conjunto de vectores. De formasimilar, un vector v ∈ V siempre es combinacion lineal de cualquier conjunto devectores que contenga a v.

Page 48: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(b) Cuando V = kn, consideramos el conjunto {e1, ..., en} donde ei es el vector quetiene todas sus componentes 0 excepto la i–esima, que es un 1. Entonces, dado(a1, ..., an) ∈ V ,

(a1, ..., an) = a1e1 + ... + anen,

por lo que todo elemento de V es combinacion lineal de e1, ..., en.

(c) Sea V = M(m× n; k) y sea Eij la matriz que tiene todos sus elementos 0 exceptoel (i, j), que es 1. Entonces, analogamente, para cualquier A = (aij) ∈ V ,

A =m∑

i=1

n∑

j=1

aijEij.

Definicion.– Sea S = {v1, ..., vm} ⊂ V . Diremos que S es un conjunto linealmente de-pendiente (o que los vectores v1, ..., vm son linealmente dependientes) si existen escalaresα1, ..., αm ∈ k no todos nulos tales que

α1v1 + ... + αmvm = 0.

Esto es, S es linealmente dependiente si 0 es combinacion lineal no trivial de loselementos de S.

En caso contrario, S se dice linealmente independiente. Esto es, v1, ..., vm son lineal-mente independientes cuando

α1v1 + ... + αmvm = 0 =⇒ α1 = ... = αm = 0.

Ejemplos.– Veamos ejemplos de dependencia e independencia lineal.

(a) Si 0 ∈ S, S ha de ser linealmente dependiente.

(b) Si S es un conjunto linealmente dependiente, cualquier conjunto (finito) T que locontenga tambien es linealmente dependiente. Del mismo modo, cualquier subcon-junto de un conjunto linealmente independiente es linealmente independiente.

(c) En particular, el conjunto vacıo es linealmente independiente.

(d) Dado un vector v 6= 0, el conjunto {v} es linealmente independiente.

Proposicion.– Sea S = {v1, ..., vm} ⊂ V . Entonces:

(a) S es linealmente dependiente si y solo si existe un i tal que vi depende linealmentede v1, ..., vi−1, vi+1, ..., vm.

(b) S es linealmente independiente si y solo si ningun vi depende linealmente de losrestantes vectores de S.

Page 49: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Demostracion.– Es claro que probar (a) prueba (b) y viceversa, pues uno es la ne-gacion del otro: demostraremos entonces (a). En primer lugar supondremos que S eslinealmente dependiente: por tanto existen α1, ..., αm ∈ k no todos nulos tales que

α1v1 + ... + αmvm = 0.

Si suponemos que αi 6= 0, entonces la igualdad anterior se puede traducir en

vi =−1

αi

(α1v1 + ... + αi−1vi−1 + αi+1vi+1 + ... + αmvm) ,

por lo que vi es combinacion lineal de los restantes.

Ahora supondremos que algun vj es combinacion lineal de los restantes vectores deS,

vj = β1v1 + ... + βj−1vj−1 + βj+1vj+1 + ... + βmvm.

La expresion anterior se traduce en

0 = β1v1 + ... + βj−1vj−1 − vj + βj+1vj+1 + ... + βmvm,

por lo que 0 es combinacion lineal no trivial de los vectores de S, ya que el coeficiente devj es no nulo.

Observacion.– Consideremos el ejemplo V = kn, y sean v, v1, ..., vm dados por

v = (α1, ..., αn) , vi = (β1i, ..., βni) .

Entonces, por las propiedades del rango estudiadas en las lecciones 2.6. y 2.8., sabe-mos que v es combinacion lineal de v1, ..., vm si y solo si

rg

β11 ... β1m

......

βn1 ... βnm

= rg

β11 ... β1m α1...

......

βn1 ... βnm αn

.

Aplicando esta misma propiedad m veces deducimos entonces que {v1, ..., vm} eslinealmente independiente si y solo si

rg

β11 ... β1n

......

β1m ... βnm

= m,

lo que prueba, en particular, que un conjunto de mas de n vectores no puede ser lineal-mente independiente en kn.

3.3. Sistemas generadores. Bases.

Definicion.– Sea V un k–espacio vectorial, S ⊂ V un subconjunto no necesariamentefinito. Diremos que S es un sistema generador de V si todo v ∈ V es combinacion linealde un subconjunto finito de S.

Page 50: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Si existe un sistema generador finito, V se dice de dimension finita. En ese caso, ladefinicion de sistema generador se puede simplificar para decir que S, finito, es sistemagenerador si y solo si todo vector de V es combinacion lineal de los vectores de S.

Ejemplos.– Veamos algunos de los ejemplos que hemos estudiado hasta ahora que sonde dimension finita.

(a) El espacio V = kn es de dimension finita, ya que todo vector es combinacion linealde {e1, ..., en}.

(b) El espacio V = M(m × n; k) tambien es de dimension finita, ya que toda matrizes combinacion de las matrices Eij , que son mn en total.

(c) El cuerpo C como R–espacio vectorial es de dimension finita, ya que todo complejoes de la forma α + βı, con α, β ∈ R, por lo que el conjunto {1, ı} es un sistemagenerador de C.

(d) El k–espacio vectorial k[X]r es de dimension finita, ya que todo polinomiode grado menor o igual que r se puede escribir como combinacion lineal de{1, X,X2, ..., Xr}.

(e) El k–espacio V = {0} admite como sistema generador a S = ∅, y a {0}.

(f) El espacio dual de kn admite como sistema de generadores a {x1, ..., xn}.

Observacion.– Si S1, S2 son dos subconjuntos finitos de V tales que S2 es sistema gene-rador y todo vector de S2 es combinacion lineal de vectores de S1, S1 tambien es sistemagenerador: basta escribir un vector cualquier como combinacion lineal de elementos deS2 y sustituir estos por las correspondientes combinaciones lineales de elementos de S1.

Definicion.– Un conjunto B ⊂ V se dice una base si es un sistema de generadores lineal-mente independiente.

Ejemplos.– Todos los ejemplos anteriores son bases de sus respectivos espacios vectoria-les, salvo {0} en (e). Para dar otro ejemplo de sistema generador que no sea base bastaampliar alguno de los conjuntos anteriores con mas vectores. Demos un ejemplo menoselemental.

Una base de k[X] es el conjunto (infinito) {1, X,X2, ...}, porque todo polinomio escombinacion lineal (finita) de estos vectores y son linealmente independientes por queuna combinacion lineal finita de ellos igualada a 0 debe tener todos sus coeficientes 0forzosamente.

Daremos a continuacion un resultado esencial, que combina los dos conceptos masimportantes estudiados hasta ahora: independencia lineal y sistema generador. Antesprobaremos algunos resultados auxiliares.

Lema I.– Sean v1, ..., vn linealmente independientes, v ∈ V . Si v no es combinacionlineal de v1, ..., vn, entonces v, v1, ..., vn son linealmente independientes.

Demostracion.– Por reduccion al absurdo, si v, v1, ..., vn fueran linealmente depen-dientes hallarıamos β, α1, ..., αn ∈ k no todos nulos tales que

βv + α1v1 + ... + αnvn = 0.

Page 51: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Ahora bien, si β 6= 0 tendrıamos que v es combinacion lineal de los vi, contradiciendolas hipotesis. Por tanto ha de ser β = 0, pero eso implica que existe una combinacionlineal de los vi igualada a 0, con no todos los coeficientes nulos. Ası v1, ..., vn son lineal-mente dependientes y llegamos tambien a contradiccion. Esto prueba el resultado.

Lema II.– Sean T ⊂ S ⊂ V conjuntos finitos de tal forma que T es linealmente inde-pendiente y S es sistema generador. Entonces existe B, base de V tal que T ⊂ B ⊂ S.

Demostracion.– Consiste en aplicar reiteradamente el lema I, de la siguiente forma:llamemos

T = {u1, ..., ur} ⊂ {u1, ..., ur, v1, ..., vs} = S.

Empecemos tomando B0 = {u1, ..., ur} e iremos anadiendo vectores de S \ T o no,siguiendo el siguiente proceso.

Miremos primero si v1 es combinacion lineal de los elementos de B0 (por ahora,B0 = T ). Si no es combinacion lineal lo anadimos a B0 y, si lo es, no lo anadimos.En cualquier caso, repetimos el proceso con v2, v3, ..., vs. Cuando hayamos realizado lass comprobaciones y anadido los vectores que sean, definimos B = B0.

El resultado es obviamente un conjunto B que verifica T ⊂ B ⊂ S, por construccion.Ademas, por el lema I, B es linealmente independiente, ya que B0 se mantiene linealmenteindependiente en todos los pasos del proceso. Resta ver que B es sistema generador de V .Para ello notemos que todos los elementos de S son combinacion lineal de los elementosde B, bien porque estan en B bien porque, si no estan en B, es porque son combinacionlineal de vectores de B. Como hemos indicado, esto implica que B es sistema generador.

Proposicion.– Sea V un k–espacio vectorial de dimension finita. Entonces V admite unabase finita (esto es, con una cantidad finita de elementos). Mas aun:

(a) Todo sistema generador finito contiene una base.

(b) Todo conjunto finito linealmente independiente se puede ampliar a una base finita.

Demostracion.– Claramente (a) o (b) implican la existencia de una base ası que noslimitaremos a probar ambas afirmaciones.

Para probar (a): dado un sistema generador finito S, basta entonces aplicar el lema IIa la situacion ∅ ⊂ S para obtener una base finita contenida en S.

Para probar (b): dado un conjunto linealmente independiente T , consideramos unsistema generador finito cualquiera (debe existir por ser V de dimension finita) S y apli-camos el lema II a la situacion T ⊂ T ∪ S, que es sistema generador por contener aS.

3.4. Teorema de la base.

Esta leccion se dedica fundamentalmente a probar el teorema de la base, resultado fun-damental para todo lo que sigue, que tambien requiere resultados auxiliares. De ahoraen adelante, salvo expresa mencion en sentido contrario, V representara un k–espaciovectorial de dimension finita.

Page 52: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Lema I (Lema del intercambio).– Sea a ∈ V un vector distinto de 0 que es com-binacion lineal de v1, ..., vn. Entonces existe un i tal que vi es combinacion lineal dev1, ..., vi−1, a, vi+1, ..., vn.

Demostracion.– Como a 6= 0, en la expresion

a = α1v1 + ... + αnvn,

debe existir, forzosamente, un αi 6= 0. Entonces

vi =−1

αi

(α1v1 + ... + αi−1vi−1 − a + αi+1vi+1 + ... + αnvn) ,

lo que prueba el resultado.

Lema II.– Sean B = {u1, ..., um} una base de V y A = {v1, ..., vr} un conjunto lineal-mente independiente. Entonces r ≤ m.

Demostracion.– Por el lema del intercambio, como v1 es combinacion lineal de loselementos de B, podemos intercambiarlo con uno de los elementos de B, pongamos conu1. Obtenemos entonces un nuevo conjunto B1 = {v1, u2, ..., um}, que es de nuevosistema generador como lo era B, porque todo elemento de B es combinacion lineal delos elementos de B1.

Por tanto, como v2 es combinacion lineal de los elementos de B1, podemos intercam-biarlo por un elemento de B1. Aun mas, podemos tomar para intercambiar un vector deB1 que no sea v1.

En efecto, si nos fijamos en la demostracion del lema del intercambio, veremos quepodemos tomar cualquier vector de B1 que tenga coeficiente no nulo en la expresion dev2 como combinacion lineal. Si el unico vector disponible fuera v1, tendrıamos

v2 = α1v1,

con lo que A serıa linealmente dependiente, contradiciendo las hipotesis. Por tanto pode-mos tomar uno de los vi, i = 2, ..., n. Por comodidad de notacion, supondremos quetomamos v2 y definimos

B2 = {v1, v2, u3..., um} ,

que sigue siendo sistema generador, por analogas razones que B1.

Pasamos entonces al caso generico, suponiendo que tenemos un sistema generador

Bi = {v1, ..., vi, ui+1, ..., um} .

Por el lema del intercambio, como vi+1 es combinacion lineal de los vectores de Bi,podemos intercambiarlo con uno de esos vectores. Pero, si no pudiera ser intercambiadopor uno de los uj , j = i + 1, ...,m, serıa porque

vi+1 = α1v1 + ... + αivi,

por lo que A serıa linealmente dependiente, en contra de las hipotesis. Ası pues podemosintercambiar vi+1 con uno de los uj y supondremos que es ui+1. Ası definimos

Bi+1 = {v1, ..., vi+1, ui+2, ..., um} ,

Page 53: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

que sigue siendo sistema generador.

Podremos seguir de esta forma hasta llegar al mınimo entre m y r. Supongamos quer > m y lleguemos a un absurdo para probar el resultado. En efecto, si r > m podemosconstruir un sistema generador

Bm = {v1, ..., vm} ,

y aun existiran vectores en A que, forzosamente, dependeran de los que estan en Bm. Ası,A es linealmente dependiente, contradiciendo las hipotesis.

Corolario.– Sea V un k–espacio vectorial, no necesariamente de dimension finita. Siexiste un conjunto infinito linealmente independiente, o conjuntos linealmente indepen-dientes finitos pero arbitrariamente grandes, V no es de dimension finita.

Demostracion.– En efecto, la proposicion de la leccion anterior, junto con el lemaque acabamos de probar, implica que en un k–espacio vectorial de dimension finita, losconjuntos linealmente independientes tienen un cardinal acotado por el cardinal de unabase finita arbitraria.

Observacion.– El k–espacio vectorial k[X] no es de dimension finita. Por tanto, tampocolo es el espacio de funciones continuas (derivables, integrables,...).

Teorema de la base.– Sea V un k–espacio vectorial de dimension finita. Entonces todaslas bases de V tienen el mismo numero de elementos.

Demostracion.– Sean B1 y B2 dos bases distintas de V , con cardinales respectivos n1

y n2. Entonces, por ser B1 linealmente independiente, n1 ≤ n2 y por ser B2 linealmenteindependiente n2 ≤ n1. Ası n1 = n2.

3.5. Dimension. Coordenadas.

Esta leccion esta dedicada por entero a explotar consecuencias del teorema de la base:entre ellas los conceptos fundamentales de dimension y coordenadas.

Definicion.– Sea V un k–espacio vectorial (de dimension finita). El numero de elementosde una base cualquiera de V se denomina dimension de V , denotado dim(V ).

Ejemplos.– En los ejemplos usuales, tenemos las siguientes dimensiones:

(a) dim(kn) = n.

(b) dim({0}) = 0.

(c) dim(k[X]r) = r + 1.

(d) dim(M(m × n; k)) = mn.

(e) La dimension del espacio dual de kn es n.

Proposicion.– Sea V un k–espacio vectorial, dim(V ) = n.

Page 54: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(a) Todo conjunto de n vectores linealmente independiente es una base.

(b) Todo conjunto de mas de n vectores es linealmente dependiente.

(c) Todo sistema de generadores con n vectores es una base.

(d) Todo sistema de generadores tiene, al menos, n vectores.

(e) Si W es otro k–espacio vectorial, W ⊂ V , W es de dimension finita y dim(W ) ≤dim(V ).

(f) Si W ⊂ V son dos k–espacios vectoriales con la misma dimension, V = W .

Demostracion.– Es obvio que (a) y (b) son equivalentes, ası como (c) y (d). Haremospor ejemplo (a), ya que (c) es analogo. En efecto, si A es un conjunto de n vectoreslinealmente independiente, se puede extender a una base. Como toda base ha de tener nelementos, A es necesariamente una base.

Veamos ahora (e). Si W ⊂ V , tomamos una base B de W . Aunque no podemosdecir nada acerca de si genera o no todo V , sı podemos asegurar que B es un conjuntolinealmente independiente de V , ya que esto solo depende del conjunto y de k, no delespacio vectorial en el que esta inmerso el conjunto. Ası, B puede extenderse a una baseB′ de V . Por tanto, como B′ ha de ser finita, W es de dimension finita y

dim(W ) = ](B) ≤ ](B′) = dim(V ).

Veamos por ultimo (f). En efecto, si W ⊂ V , tomamos como antes una base B de Wy la extendemos a una base B′ de V . Dado que dim(W ) = dim(V ), ha de ser B = B′ y,por tanto, B genera V , de donde W = V .

Observacion.– El concepto de coordenadas respecto de una base es uno de los mas impor-tantes: es particularmente esencial que el alumno distinga entre vectores y coordenadas; sies necesario poniendo enfasis en los ejemplos distintos de kn para acentuar la diferencia.

Proposicion.– Sea B = {u1, ..., un} una base de V , v ∈ V . Entonces existen unosescalares unicos α1, ..., αn ∈ k tales que

v = α1u1 + ... + αnun.

Demostracion.– La existencia de α1, ..., αn esta garantizada por el hecho de que B essistema generador de V . Para probar la unicidad supondremos que v se puede expresarde dos formas distintas como combinacion lineal de los elementos de B:

v = α1u1 + ... + αnun = β1u1 + ... + βnun.

Entonces ha de ser

0 = (α1 − β1) u1 + ... + (αn − βn) un,

de donde, al ser B linealmente independiente,

α1 − β1 = ... = αn − βn = 0,

Page 55: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

esto es, αi = βi para i = 1, ..., n.

Definicion.– En la situacion de la proposicion, la n–upla (α1, ..., αn) ∈ kn se denominancoordenadas de v con respecto a B, y se denota (v)B.

En (numerosas) ocasiones abusaremos de la notacion y consideraremos las coorde-nadas indistintamente como n–upla (α1, ..., αn) y como matriz de orden 1×n, (α1 ... αn).

Proposicion.– Sea V un k–espacio vectorial, B = {u1, ..., un} una base de V ; v, v1, ..., vm

vectores de V . Son equivalentes:

(a) v es combinacion lineal de v1, ..., vm.

(b) (v)B es combinacion lineal de (v1)B, ..., (vm)B.

Demostracion.– Denominemos

(v)B = (α1, ..., αn) , (vi)B = (βi1, ..., βin) , i = 1, ...,m.

Entonces si tenemos

v =m∑

i=1

γivi =m∑

i=1

γi

n∑

j=1

βijuj

=∑

i,j

(γiβij)uj,

por lo que, por la unicidad de las coordenadas,

(α1, ..., αn) =

(

m∑

i=1

γiβi1, ...,m∑

i=1

γiβin

)

=m∑

i=1

γi (βi1, ..., βin) ,

y la otra implicacion es analoga.

Corolario.– Dados vectores v, v1, ..., vp ∈ V y escalares α1, ..., αp ∈ k,

v =p∑

i=1

αivi ⇐⇒ (v)B =p∑

i=1

αi(vi)B

Observacion.– A partir de este corolario es directo ver que la dependencia e independen-cia lineal de un conjunto de vectores o el hecho de ser o no sistema generador se puedenver a partir de las coordenadas respecto de una base cualquiera.

3.6. Cambios de base.

En esta seccion trabajaremos con kn como espacio de coordenadas de un k–espacio vecto-rial arbitrario V de dimension n. Como ilustracion primordial de la diferencia conceptualentre vectores y coordenadas, estudiaremos a fondo la relacion entre coordenadas respectode distintas bases.

Observacion.– En el caso V = kn, un conjunto de n vectores S = {v1, ..., vn} dados por

vi = (a1i, ..., ani)

Page 56: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

es una base si y solo sia11 ... a1n

... . . . ...an1 ... ann

6= 0.

Veamos por que.

Para empezar S es sistema generador porque todo vector de V es combinacion linealde sus elementos, como se puede ver rapidamente por el criterio dado en 3.2.: ningunvector que anadamos a la matriz (aij) puede hacer crecer el rango.

Ademas son linealmente independientes, porque el rango de la matriz que forman esn y, si retiramos una fila, el rango disminuye obviamente. Ası, ninguno de los vectoresdepende linealmente de los restantes y el conjunto ha de ser linealmente independiente.

Esta observacion, llevada al caso general, arroja el siguiente resultado.

Proposicion.– Sea V un k–espacio vectorial de dimension n, B una base cualquiera de Vy u1, ..., un un conjunto de vectores tales que

(uj)B = (a1j, ..., anj) .

Entonces {u1, ..., un} son base de V si y solo si det(aij) 6= 0.

Demostracion.– El resultado se sigue de combinar la observacion anterior con laultima de la leccion 3.5.

Vamos a tratar ahora un tema distinto: sea V un k–espacio vectorial de dimension n,B = {u1, ..., un} y B′ = {v1, ..., vn} dos bases de V . Estudiaremos la relacion que existeentre las coordenadas de un mismo vector respecto de B y de B′.

Proposicion.– En las condiciones anteriores, sea v ∈ V con

(v)B = (α1, ..., αn) , (v)B′ = (β1, ..., βn) ,

y sean(ui)B′ = (c1i, ..., cni) ,

las coordenadas de los vectores de B respecto de B′. Entonces

c11 ... c1n

... . . . ...cn1 ... cnn

α1...

αn

=

β1...

βn

.

Demostracion.– Basta aplicar la definicion de coordenadas respecto de B y B′ y launicidad de estas ultimas. En concreto, tenemos que

v =n∑

i=1

αiui =n∑

i=1

αi

n∑

j=1

cjivj

=n∑

j=1

(

n∑

i=1

αicji

)

vj,

por lo que la coordenada j–esima de v respecto de B′ es precisamente

α1cj1 + ... + αncjn = βj,

Page 57: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

de donde se tiene el enunciado.

Definicion.– En las condiciones del enunciado, la matriz (cij) se denomina matriz decambio de base de B a B′ y se denotara por M(B,B′), esto es

M(B,B′)(v)tB = (v)t

B′ .

Observacion.– La matriz M(B,B′) es unica verificando la condicion de la proposicion.En efecto, para que esta se cumpla sobre los vectores de B es inmediato comprobar quelas columnas de la matriz han de ser las coordenadas de los elementos de B respecto deB′.

Observacion.– Notemos que, como en M(B,B′) aparecen, por columnas, las coorde-nadas de una base respecto de otra, la matriz ha de ser invertible. En particular, por elresultado anterior y la unicidad que acabamos de enunciar, se tiene que

M(B,B′)−1 = M(B′,B).

3.7. Subespacios (I): Definicion y ejemplos.

Definicion.– Sea V un k–espacio vectorial, no necesariamente de dimension finita. Unsubconjunto L ⊂ V se denomina un subespacio vectorial si es, a su vez, un k–espaciovectorial con las mismas operaciones definidas en V .

Ejemplo.– Si consideramos Q ⊂ R, vemos que Q es un subespacio de R como Q–espacio vectorial, pero no como R–espacio vectorial pues con la suma y el producto porescalares reales Q no es espacio vectorial.

Proposicion.– Sea L ⊂ V . Son equivalentes:

(a) L es un subespacio vectorial de V .

(b) Dados u, v ∈ L y α, β ∈ k cualesquiera, se tiene que αu + βv ∈ L.

Demostracion.– Haremos por separado las dos implicaciones, ya que son esencial-mente distintas en su estrategia.

(a) =⇒ (b) Esta implicacion es sencilla: como L es k–espacio vectorial, el productode un escalar por un vector de L ha de estar en L, ası como la suma de vectores de L, porlo que se tiene (b).

(b) =⇒ (a) Entre elementos de L tenemos definida una suma, por ser a su vez ele-mentos de V . La hipotesis (b), para α = β = 1, asegura que esta suma es una operacioninterna. Ası mismo, el producto de un vector de L por un escalar arbitrario es de nuevo unvector de L, tomando en (b) el caso β = 0. Por tanto, tenemos definidos en L una suma yun producto por escalares.

Casi todas las propiedades que debe verificar L para ser k–espacio vectorial se veri-fican inmediatamente porque se verifican en todo V . Solo hay que verificar que 0 ∈ L y

Page 58: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

que, dado u ∈ L, −u ∈ L. Pero la primera afirmacion se tiene por el caso α = β = 0 yla segunda por el caso α = −1, β = 0.

Corolario.– Si L es subespacio vectorial, cualquier combinacion lineal de elementos deL debe estar en L.

Ejemplos.– Veamos algunos ejemplos en los casos conocidos.

(a) Dado cualquier k–espacio vectorial V , el propio V y {0} son siempre subespaciosvectoriales de V (denominados impropios o triviales).

(b) Sea AX t = 0m×1 un sistema homogeneo de m ecuaciones lineales en n incognitas,L el conjunto de sus soluciones. Entonces L es un subespacio vectorial de kn. Enefecto, si tomamos dos soluciones, u y v, y dos escalares α, β ∈ k,

A (αu + βv)t = αAut + βAvt = 0m×1.

(c) Las matrices diagonales, las triangulares superiores y las triangulares inferiores deorden m × n, son subespacios vectoriales de M(m × n; k).

(d) Las funciones derivables en R son un subespacio de las funciones continuas en R.

Observacion.– Un ejemplo esencial es el siguiente: dado un k–espacio vectorial V y unsubconjunto de vectores A definimos el subespacio generado por A como

{x ∈ V | x es combinacion lineal de un subconjunto finito de A} ,

denotado L(A) o 〈A〉. Si A = {v1, ..., vm}, tambien se notara L(v1, ..., vm) o 〈v1, ..., vm〉.

Proposicion.– Sea V un k–espacio vectorial de dimension finita, A ⊂ V . Entonces L(A)es el menor subespacio vectorial de A que contiene a A.

Demostracion.– Veamos primero que L(A) es subespacio vectorial: para ellotomemos u, v ∈ L(A) y α, β ∈ k. Por definicion existen vectores u1, ..., ur, v1, ..., vs ∈ Ay escalares γ1, ..., γr, δ1, ..., δs ∈ k tales que

u =r∑

i=1

γiui, v =s∑

i=1

δivi.

Pero entonces

αu + βv =r∑

i=1

αγiui +s∑

i=1

βδivi,

esto es, es combinacion lineal de una cantidad finita de vectores de A, por lo que αu+βv ∈L(A).

Ahora hemos de probar que L(A) es el menor subespacio que contiene a A, para loque tomaremos un subespacio L tal que A ⊂ L y veremos que L(A) ⊂ L. Esto essencillo, ya que, si v ∈ L(A), existen a1, ..., ar ∈ A y α1, ..., αr ∈ k tales que

v = α1a1 + ... + αrar.

Pero, como ai ∈ A ⊂ L, v es combinacion lineal de elementos de L y, por tanto, estaen L.

Corolario.– En las condiciones anteriores:

Page 59: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(a) A siempre es sistema generador de L(A). En particular, L(A) = V si y solo si Aes sistema generador de V .

(b) Si A ⊂ B, entonces L(A) ⊂ L(B).

(c) L(∅) = {0}.

(d) Si A es un subespacio vectorial, L(A) = A.

Demostracion.– Todas las pruebas son triviales a partir de la proposicion.

3.8. Subespacios (II): Sistemas de ecuaciones.

Hemos visto que el conjunto de soluciones de un sistema de ecuaciones es un subespaciode kn y que, de algun modo, lo mismo da trabajar con un k–espacio vectorial de dimensionn que con kn como espacio de coordenadas respecto de una base fijada. Ahora veremosel otro lado de la cuestion probando que, fijada una base para tomar coordenadas, todosubespacio se puede expresar como el conjunto de soluciones de un sistema de ecuacioneslineales.

Proposicion.– Sea AX t = 0m×1 un sistema de m ecuaciones con n incognitas, ho-mogeneo, definido sobre k; L el subespacio vectorial de kn formado por las soluciones.Entonces

dim(L) = n − rg(A).

Demostracion.– Tomemos un menor de orden maximal, pongamos h, en A y supon-gamos que esta formado por las h primeras filas y columnas. Entonces, como en laprueba del teorema de Rouche–Frobenius, consideramos el sistema equivalente de Cramerformado por las h primeras ecuaciones en x1, ..., xh, considerando xh+1, ..., xn comoparametros. Ası, todo vector de L es de la forma

v =

n∑

i=h+1

di1xi,n∑

i=h+1

di2xi, ...,n∑

i=h+1

dihxi, xh+1, ..., xn

=n∑

i=h+1

xi (di1, ..., dih, 0, ..., 0, 1, 0, ..., 0) ,

con el 1 en la posicion i–esima. Denotemos

zi = (di1, ..., dih, 0, ..., 0, 1, 0, ..., 0) ,

para i = h + 1, ..., n.

Page 60: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Lo anterior implica que L = L(zh+1, ..., zn). Pero ademas como

rg

dh+1,1 dh+2,1 ... dn1

dh+1,2 dh+2,2 ... dn2...

......

dh+1,h dh+2,2 ... dnh

1 0 . . . 00 1 . . . 0...

... . . . ...0 0 . . . 1

= n − h,

los zi son linealmente independientes y, por tanto, base de L. De aquı, dim(L) = n −rg(A).

Observacion.– Como es habitual, lo anterior se puede trasladar a cualquier k–espaciovectorial de dimension n, una vez que hemos fijado una base B para tomar coordenadascon respecto a ella. Ahora veremos que, de hecho, esta forma de definir subespacios sepuede utilizar en cualquier caso.

Proposicion.– Sea V un k–espacio vectorial de dimension n, L ⊂ V un subespaciovectorial, B una base de V . Entonces existe un sistema de ecuaciones homogeneo AX t =0m×1 tal que

v ∈ L ⇐⇒ (v)B es solucion de AX t = 0m×1.

Demostracion.– Al ser L un k–espacio vectorial de dimension finita, podemos tomaruna base u1, ..., us de L, con coordenadas respecto de B dadas por

(ui)B = (c1i, ..., cni).

Entonces un vector de coordenadas genericas (v)B = (x1, ..., xn) esta en L si y solosi es combinacion lineal de los ui, lo cual se traduce en que

rg

c11 ... c1s

......

cn1 ... cns

= rg

c11 ... c1s x1...

......

cn1 ... cns xn

,

lo cual, a su vez, se traduce, usando por ejemplo el metodo del orlado, en que una seriede determinantes, con una fila de indeterminadas, sean todos 0. Esto es, en definitiva, unsistema de ecuaciones lineales homogeneo.

Observemos que, si tomamos una base de L, s = dim(L) , la matriz de orden s ×n (cij) tiene un menor no nulo de orden s y, por tanto, aparecen exactamente n − secuaciones, correspondientes a las n− s formas posibles de orlar un menor de orden s enuna matriz (s + 1) × n, con s + 1 ≤ n.

Definicion.– En la situacion de la proposicion, el sistema AX t = 0m×1 se denomina unsistema de ecuaciones implıcitas de L. Cuando rg(A) = m el sistema se dira (linealmente)independiente.

Proposicion.– Sea L ⊂ V un subespacio vectorial, n = dim(V ), s = dim(L) y AX t =0m×1 un sistema de ecuaciones implıcitas de L respecto de una base fijada B. Entonces

n = s + rg(A).

Page 61: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Demostracion.– Todos los ingredientes de la prueba ya se han visto: un vector esta enL si y solo si sus coordenadas verifican el sistema y esto sucede si y solo si dichas coor-denadas son combinacion lineal de n − rg(A) vectores de kn linealmente independientesy que son soluciones del sistema. Los vectores de V que tienen estas soluciones comocoordenadas son, entonces, una base de L.

Notemos que es un buen ejercicio para el alumno ver si es capaz de distinguir, en estaprueba, cuando hablamos de coordenadas y cuando de vectores.

Observacion.– Es crucial observar que, al basarse en las coordenadas, un sistema deecuaciones implıcitas de L depende de la eleccion previa de una base y un cambio debase trae consigo obviamente un cambio del sistema de ecuaciones.

Proposicion.– Sea V un k–espacio vectorial de dimension n, B y B′ dos bases de V , L unsubespacio definido, respecto de B por un sistema de ecuaciones implıcitas AX t = 0m×1.Entonces un sistema de ecuaciones implıcitas de L respecto de B′ viene dado por

AM(B′,B)X t = 0m×1.

Demostracion.– El sistema anterior sera un sistema de ecuaciones implıcitas de Lrespecto de B′ si verifica que v ∈ L si y solo si (v)B′ es solucion del sistema. Pero estoultimo sucede si y solo si

0m×1 = AM(B′,B)(v)tB′ = A(v)t

B,

lo cual sucede si y solo si v ∈ L. Esto prueba el resultado.

3.9. Operaciones (I): Teorema de la dimension.

En toda esta leccion consideraremos un k–espacio vectorial V de dimension n.

Proposicion.– Sea {Li}i∈I una familia de subespacios vectoriales de V . Entonces elconjunto

L =⋂

i∈I

Li

es un subespacio vectorial.

Demostracion.– Aplicando la caracterizacion de subespacios es muy facil: tomamosu, v pertenencientes a L (en consecuencia a todos los Li) y α, β ∈ k. Por ser todos los Li

subespacios, tenemos que αu + βv esta en todos los Li y, por tanto, en L.

Observacion.– Como interseccion de conjuntos que es, la interseccion de subespaciosverifica las propiedades asociativa y conmutativa.

Observacion.– Notemos, sin embargo que no siempre la union de subespacios es unsubespacio. Si tomamos, por ejemplo, los subespacios de R3 definidos por

L1 : z = 0, L2 : x = 0,

observaremos que (1, 0, 0), (0, 0, 1) ∈ L1∪L2, pero su suma no esta en ninguno de ambos,por lo que no esta en la union. Esto, como es costumbre en matematicas, definiendo unanueva operacion que resulte lo mas parecida posible a la suma.

Page 62: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Definicion.– Sean {Li}i∈I una familia de subespacios de V . Entonces se define el subes-pacio suma de la familia Li como

i∈I

Li =

i∈I

Li

.

Equivalentemente, si I = {1, ..., n}, notaremos∑

i∈I Li = L1 + ... + Ln.

Observacion.– Obviamente∑

i∈I Li es un subespacio, porque lo hemos definido comotal. Ademas es trivial que, por ser el menor subespacio que contiene a la union de losLi, ha de ser el menor subespacio que contiene a todos los Li. Ası, la suma es, en ciertomodo, la operacion mas proxima posible a la union.

Observacion.– Por la forma de definirla, es obvio que la suma de subespacios verifica laspropiedades asociativa y conmutativa.

Proposicion.– En las condiciones anteriores, dados subespacios L1, L2, L3, se verifica:

(a) L1 + L2 = {u1 + u2 | ui ∈ Li} (por supuesto, el enunciado analogo es valido paran sumandos).

(b) (Leyes de simplificacion) L1 = L1 + (L1 ∩ L2) = L1 ∩ (L1 + L2).

(c) (Ley modular) Si L1 ⊂ L3, L1 + (L2 ∩ L3) = (L1 + L2) ∩ L3.

Demostracion.– Probemos (a) y, para ello, denotemos momentaneamente

M = {u1 + u2 | ui ∈ Li}.

Si tomamos un vector cualquiera de M , pongamos v han de existir u1 ∈ L1, u2 ∈ L2

verificando v = u1 + u2. Pero, por ser L1, L2 ⊂ L1 + L2 y ser L1 + L2 subespacio, setiene que v ∈ L1 + L2.

Para ver la otra inclusion tomaremos un vector cualquier de L1 + L2 = 〈L1 ∪ L2〉,pongamos w. Como vimos entonces en 3.7., w ha de ser combinacion lineal de unacantidad finita de vectores de L1 ∪ L2, esto es

w = α1a1 + ... + αrar + β1b1 + ... + βsbs,

donde ai ∈ L1, bj ∈ L2, para i = 1, ..., r y j = 1, ..., s. Entonces llamando u1 =∑

αiai ∈L1 y u2 =

βjbj ∈ L2, tenemos el resultado.

Dejaremos (b), que es el enunciado mas simple, como ejercicio, y probaremos unade las inclusiones de (c), pues las dos son parecidas. Si, por ejemplo, tomamos u ∈L3 ∩ (L1 + L2), eso quiere decir que

u ∈ L3 y, ademas, ∃a1 ∈ L1, a2 ∈ L2 tales que u = a1 + a2.

Entonces a2 = u − a1 ∈ L3 (recordemos que a1 ∈ L1 ⊂ L3), por lo que u se puedeescribir como suma de dos vectores: a1 ∈ L1 y a2 ∈ L2 ∩ L3. Esto finaliza la inclusion.

Sin duda alguna el resultado esencial que relaciona suma e interseccion de subespacioses el teorema de la dimension, que tendra ası mismo sus variantes geometricas.

Page 63: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Teorema de la dimension.– Sean L1, L2 subespacios de V . Entonces

dim(L1 + L2) = dim(L1) + dim(L2) − dim(L1 ∩ L2).

Demostracion.– Sea B = {a1, ..., ap} una base de L1 ∩ L2. Como conjunto lineal-mente independiente en L1 y L2 puede ampliarse a sendas bases respectivas

B1 = {a1, ..., ap, b1, ..., bq}, B2 = {a1, ..., ap, c1, ..., cr}.

Por definicion de dimension basta entonces probar que

S = B1 ∪ B2 = {a1, ..., ap, b1, ..., bq, c1, ..., cr}

es base de L1 + L2. Es claro que es sistema generador, pues todo vector de L1 + L2 escombinacion lineal de vectores de L1 (que son a su vez combinacion lineal de vectores deB1) y de vectores de L2 (analogo). Veamos entonces que S es linealmente independiente.Para ello consideremos

p∑

i=1

αiai +q∑

j=1

βjbj +r∑

l=1

γlcl = 0,

y denotemos para abreviar los tres sumatorios de la izquierda como u, v, w, pertenecientesrespectivamente a L1 ∩ L2, L1 y L2.

Entonces, como u + v = −w, este vector esta en L1 ∩ L2 y, por tanto, podemosescribirlo como

p∑

i=1

αiai +q∑

j=1

βjbj =p∑

i=1

δiai,

de donde∑

(αi − δi)ai +∑

βjbj = 0 y, al ser B1 base, esto implica que αi − δi = βj = 0para todo i = 1, ..., p y j = 1, ..., q. Ası, u + w = 0 y, por ser B2 base, obtenemosfinalmente αi = γl = 0 para i = 1, ..., p y l = 1, ..., r.

Corolario.– Dados subespacios L1, ..., Lt de V , se tiene que

dim(L1 + ... + Lt) ≤ dim(L1) + ... + dim(Lt).

Demostracion.– Ejercicio sencillo por induccion en t.

3.10. Operaciones (II): Calculos. Suma directa.

Observacion.– Sean L1 y L2 subespacios de un k–espacio vectorial V de dimensionfinita. A la hora de efectuar calculos explıcitos de suma e interseccion hemos de partir dedatos diferentes: como hemos visto en la demostracion del teorema de la dimension, sitenemos

L1 = L (u1, ..., us) , L2 = L (v1, ..., vt) ,

es sencillo verificar que

L1 + L2 = L (u1, ..., us, v1, ..., vt) .

Page 64: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

El caso de n sumandos es analogo. No obstante, hemos de ser cuidadosos en el sentidode que, aun en el caso de que los sistemas generadores escogidos sean bases, el sistemagenerador hallado al unirlo no tiene por que serlo. Un ejemplo elemental puede ser tomarL1 = V y L2 6= {0} con sistemas generadores cualesquiera.

En caso de que queramos calcular la interseccion, los sistemas generadores de L1 y L2

no son de mucha utilidad ya que estos representan la faceta constructiva del problema (seusan para crear vectores por combinacion lineal) mientras que la interseccion representauna operacion restrictiva. Por ello, es mucho mas util usar dos sistemas de ecuaciones quedefinan respectivamente a L1 y a L2. En efecto, ya que un vector estara en L1 si y solo siverifica el primer sistema, y analogamente para L2, es inmediato ver que un vector esta enL1 ∩L2 si y solo si verifica ambos sistemas de ecuaciones. Ası, un sistema de ecuacionesde L1 ∩ L2 se obtiene reuniendo ambos sistemas.

De la misma forma que en el caso de la suma, el escoger sistemas de ecuacionesindependientes no garantiza que el sistema obtenido para la interseccion sea de ecuacionesindependientes. El mismo ejemplo que pusimos anteriormente sirve para este caso.

Veamos ahora una situacion particular que tiene numerosas aplicaciones.

Definicion.– Sean L,L1, L2, ..., Ln subespacios vectoriales de V . Decimos que L es sumadirecta de L1, ..., Ln, (o que L1, ..., Ln estan en suma directa) notado

L =n⊕

i=1

Li = L1 ⊕ ... ⊕ Ln,

si se verifican las dos condiciones siguientes:

(a) L = L1 + ... + Ln.

(b) Li ∩(

j 6=i Lj

)

= {0} para cualquier i.

En particular, L = L1 ⊕ L2 si L = L1 + L2 y L1 ∩ L2 = {0}. Este caso es el queaparecera con mas frecuencia.

Observacion.– De la definicion y del teorema de la dimension se sigue que:

(a) Si L1, ..., Ln estan en suma directa, tambien lo estan cualquier subconjunto de ellos.

(b) dim(L1 ⊕ ... ⊕ Ln) = dim(L1) + ... + dim(Ln). (Induccion en n trivial)

Proposicion.– Sea L = L1 + ... + Ln. Las condiciones siguientes son equivalentes:

(a) L = L1 ⊕ ... ⊕ Ln.

(b) Para todo v ∈ L existen unicos u1 ∈ L1, ..., un ∈ Ln tales que v = u1 + ... + un.

(c) Para cualesquiera B1, ...,Bn, bases respectivas de L1, ..., Ln, B1 ∪ ... ∪ Bn es basede L.

Page 65: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Demostracion.– Como hemos de probar que cualquiera de los enunciados implica losotros dos, haremos la prueba siguiendo el esquema (a) =⇒ (b) =⇒ (c) =⇒ (a).

(a) =⇒ (b) La existencia esta garantizada por el hecho de que L = L1 + ... + Ln.Para ver la unicidad, si tenemos v = u1 + ... + un = u′

1 + ... + u′n, con ui, u

′i ∈ Li,

tendrıamos

u1 − u′1 = (u2 + ... + un) − (u′

2 + ... + u′n) ∈ L1 ∩

j>1

Lj

= {0},

por lo que u1 = u′1. Para un i cualquiera se procede analogamente.

(b) =⇒ (c) El hecho de que B1∪ ...Bn es sistema generador esta garantizado porqueL = L1 + ... + Ln. Hemos de probar que es linealmente independiente y, para ello,tomamos una combinacion lineal

0 =r1∑

i=1

α1ia1i + ... +rn∑

i=1

αn1ani, con aji ∈ Bj ={

aj1, ..., ajrj

}

, αji ∈ k.

Pero en la expresion anterior escribimos 0 ∈ L como suma de un vector de cada Li.Sin embargo, otra forma equivalente de expresarlo es 0 = 0 + ... + 0. Por la unicidad deesta forma de expresion (que es la hipotesis (b)) hemos de tener necesariamente

0 =r1∑

i=1

α1ia1i = ... =rn∑

i=1

αniani,

y, al ser las Bj bases, tenemos que, para cualesquiera j = 1, ..., n; i = 1, ..., rj; αji = 0como querıamos probar.

(c) =⇒ (a) Sean B1, ...,Bn bases respectivas de L1, ..., Ln, verificandose dim(Li) =ri. Si es necesario, multiplicaremos algunos vectores de cada Bi por escalares no nulospara garantizar que Bi ∩ Bj = ∅ en cualquier caso. Entonces

dim

Li ∩∑

j 6=i

Lj

= dim(Li) + dim

j 6=i

Lj

− dim(L).

Pero, por (c), B1 ∪ ...Bn esbase de L y, obviamente, B1 ∪ Bi−1 ∪ ... ∪ Bi+1 ∪ ... ∪ Bn

lo es de∑

j 6=i Lj , por ser linealmente independiente. Ası,

dim

Li ∩∑

j 6=i

Lj

= ri +∑

j 6=i

rj −n∑

j=1

rj = 0,

lo que prueba (a).

Definicion.– Dados subespacios L ⊂ L0, diremos que L′ es un subespacio complemen-tario de L en L0 cuando L0 = L ⊕ L′.

Observacion.– Por los resultados anteriores, una forma de calcular un subespacio com-plementario de L en L0 consiste en tomar una base, BL, de L y ampliarla a una base B deL0. Entonces los vectores de B \ BL forman una base de un subespacio complementario.En particular, salvo que L sea un subespacio trivial de L0, no existe un unico subespaciocomplementario.

Page 66: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Page 67: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Tema 4: Homomorfismos de espaciosvectoriales

4.1. Homomorfismos de espacios vectoriales.

Definicion.– Un homomorfismo entre dos k–espacios vectoriales V y V ′ es una aplicacionf : V −→ V ′ que verifica la siguiente propiedad: para cualesquiera u, v ∈ V y α, β ∈ kse tiene que

f(αu + βv) = αf(u) + βf(v).

Observacion.– La condicion anterior es equivalente a la siguiente: para cualesquierau, v ∈ V y α ∈ k se verifica:

f(u + v) = f(u) + f(v), f(αu) = αf(u).

Definicion.– El conjunto de los homomorfismos de V en V ′ se denota Hom(V, V ′).

Un homomorfismo de V en sı mismo se denomina un endomorfismo (de V ). El con-junto de los endomorfismos se denota End(V ).

Observacion.– Dado f ∈ Hom(V, V ′) se tienen, inmediatamente, las siguientes igual-dades

f(0) = 0, f(−u) = −f(u).

Probaremos la primera y dejaremos la segunda como ejercicio. En efecto, para unα ∈ k cualquiera

f(0) = f(α0) = αf(0),

de donde (α−1)f(0) = 0. Ası ha de ser α−1 = 0 para todo α ∈ k, lo cual es obviamenteimposible, o bien f(0) = 0, como querıamos probar.

Un comentario a esta sencilla prueba: hay que destacar el hecho de que el mismosımbolo, 0, designa dos vectores distintos: el elemento neutro de V , sobre el que actua f ,y su imagen, que es el elemento neutro de V ′.

Observacion.– Sea f ∈ Hom(V, V ′), v, v1, ..., vp ∈ V . Entonces si v depende lineal-mente de v1, ..., vp, f(v) depende linealmente de f(v1), ..., f(vp). Para verlo solo hay queescribir

v =p∑

i=1

αivi =⇒ f(v) =p∑

i=1

αif(vi).

Page 68: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Por tanto si S ⊂ V es linealmente dependiente, f(S) = {f(w) |w ∈ S} tambienlo es. Sin embargo si S es linealmente independiente, f(S) no tiene por que serlo (verejemplo (b) mas abajo).

El resto de esta seccion lo dedicaremos a poner numerosos ejemplos (no necesaria-mente entre espacios de dimension finita).

Ejemplos.– Algunos homomorfismos de espacios vectoriales son los siguientes:

(a) Dados un k–espacio vectorial V y un subespacio L ⊂ V , la aplicacion

i : L −→ V

v 7−→ v

denominada la inmersion de L en V , es un homomorfismo de espacios vectoriales.Notemos que i es inyectiva. En el caso particular L = V la aplicacion se denotaIdV ∈ End(V ) y se denomina identidad de V .

(b) Dado un k–espacio vectorial V , la aplicacion

f : V −→ {0}v 7−→ 0

denominada la aplicacion nula, es un homomorfismo de espacios vectoriales.

(c) Dada una matriz A ∈ M(n; k) se denomina la traza de A a la suma de sus elementosdiagonales, Tr(A) =

aii. La aplicacion

Tr : M(n; k) −→ k

A 7−→ Tr(A)

es un homomorfismo de espacios vectoriales.

(d) Sean V = km, V ′ = kn, A ∈ M(m × n; k). Consideramos la aplicacion dada por

f : V −→ V ′

(a1, ..., an) 7−→ A

a1...

an

Entonces f es un homomorfismo de V en V ′. De forma similar podemos probarque, dados V y V ′ espacios de dimensiones m y n, con bases respectivas B y B′, laaplicacion

f : V −→ V ′

v 7−→ f(v) tal que [f(v)]tB′ = A(v)tB

es un homomorfismo por las propiedades vistas en 3.5.

(e) Dado p(X) ∈ k[X], un ejemplo de endomorfismo de k[X] es

µp(X) : k[X] −→ k[X]

q(X) 7−→ p(X)q(X)

Page 69: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(f) Sea V = C∞(a, b) el conjunto de funciones infinitamente diferenciables en el in-tervalo (a, b) ⊂ R. Entonces la aplicacion

D : V −→ V

f(x) 7−→ D(f(x)) = f ′(x)

es un endomorfismo de V .

(g) Siendo V = C[a, b] el conjunto de funciones continuas en [a, b] las aplicaciones

I : V −→ R Lc : V −→ R

f(x) 7−→ I(f) =∫ ba f(x)dx f(x) 7−→ Lc(f) = lim

x→cf(x)

son homomorfismos de R–espacios vectoriales (para el segundo fijamos cualquierc ∈ (a, b)).

(h) Si V es un k–espacio vectorial de dimension n y B es una base de V , la aplicacion

f : V −→ kn

v 7−→ (v)B

es un homomorfismo de espacios vectoriales (ver, de nuevo, 3.5.).

4.2. Matriz de un homomorfismo.

Hemos visto que, tomando coordenadas respecto de dos bases, multiplicar por una matrizes un homomorfismo. En esta leccion probaremos el recıproco; esto es, que, esencial-mente, todos los homomorfismos entre espacios de dimension finita (no consideraremosotros en adelante) se reducen a multiplicar por una matriz.

Proposicion.– Dados V y V ′ k–espacios vectoriales de dimensiones respectivas m y n,B y B′ bases de V y V ′, y f ∈ Hom(V, V ′); existe una unica matriz A ∈ M(n × m; k)verificando que, para todo v ∈ V ,

A(v)tB = [f(v)]tB′ .

Demostracion.– Escribimos B = {w1, ..., wm},B′ = {z1, ..., zn}, y notaremos

f (wi) =n∑

j=1

ajizj ⇐⇒ [f(wi)]t

B′ =

a1i

...ani

.

Entonces si ponemos, para un v ∈ V arbitrario,

(v)B = (α1, ..., αm) ⇐⇒ v =m∑

i=1

αiwi,

Page 70: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

tenemos que

f(v) =m∑

i=1

αif (wi) =m∑

i=1

αi

n∑

j=1

ajizj

,

esto es,

[f(v)]tB′ =

(

m∑

i=1

αia1i, ...,m∑

i=1

αiani

)

de donde llamando A = (aij) ∈ M(n × m; k), resulta

A(v)tB = [f(v)]tB′ .

Notemos que la matriz A tiene por filas las coordenadas, respecto de B ′, de lasimagenes de los vectores de B. Dicho de otro modo,

C(A)i = (f(wi))t

B′ , i = 1, ...,m.

Pero, si queremos que A verifique el enunciado, esta condicion debe cumplirse. Estodemuestra la unicidad de A.

Definicion.– La matriz A del enunciado anterior se denomina matriz de f respecto de lasbases B y B′, y se denota MB,B′(f). Cuando f ∈ End(V ) y escogemos B = B′, A sedenota MB(f).

Ejemplos.– Con algunos de los casos que estudiamos en 4.1., veamos algunas matricesde homomorfismos. Notemos que, para dar una matriz, previamente hay que fijar basesen el espacio original y en el espacio de llegada.

(a) Si L ⊂ V es un subespacio, con dim(L) = l, dim(V ) = m, tomamos BL una basede L y la extendemos a una base BV de V . Entonces

MBL,BV(i) =

1 0 ... 00 1 ... 0...

... . . . ...0 0 ... 10 0 ... 0...

......

0 0 ... 0

∈ M(m × l; k).

En particular, cuando L = V , MB(IdV ) = Im, pero MB,B′(IdV ) 6= Im, si B 6= B′.

(b) La matriz de la aplicacion nula de V (dim(V ) = n) en {0} es, obviamente, 01×n.

(c) Si consideramos V = M(n; k) y consideramos la base

B = {E11, E12, ..., E1n, E21, ..., E2n, ..., En1, ..., Enn} ,

y la base {1} de k entonces MB,{1}(Tr) es una matriz fila de n2 columnas con 1en las columnas 1, n + 2, 2n + 3,...,1 + i(n + 1),...,1 + (n − 1)(n + 1) = n2,(correspondientes a las Eij con i = j) y 0 en las restantes.

Page 71: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Estudiemos ahora como hallar, conocida la matriz de un homomorfismo respecto dedos bases, la matriz del mismo homomorfismo pero respecto de bases distintas.

Proposicion.– Sean V, V ′ dos k–espacios vectoriales de dimensiones m y n, B y C basesde V ; B′ y C ′ bases de V ′. Entonces, dado f ∈ Hom(V, V ′) se verifica

M(B′, C ′)MB,B′(f)M(C,B) = MC,C′(f).

Demostracion.– Dado que la matriz de f , fijadas dos bases, es unica, solo hay queprobar que el termino de la izquierda verifica la propiedad que determina la matriz de laderecha. Pero, para cualquier v ∈ V ,

M(B′, C ′)MB,B′(f)M(C,B)(v)tC = M(B′, C ′)MB,B′(f)(v)B

= M(B′, C ′) (f(v))t

B′

= (f(v))t

C′ ,

lo que demuestra el resultado, ya que la matriz MC,C′(f) es la unica que verifica estaigualdad para cualquier v ∈ V .

Corolario.– Dadas dos bases B y B′ de un k–espacio vectorial V ,

MB,B′(IdV ) = M(B,B′).

Ası, podemos entender los cambios de base como un caso particular de homomor-fismo.

Proposicion.– Sean f ∈ Hom(V, V ′), g ∈ Hom(V ′, V ′′), B,B′,B′′ bases de V , V ′ y V ′′

respectivamente. Entonces g ◦ f ∈ Hom(V, V ′′) y, de hecho,

MB,B′′(g ◦ f) = MB′,B′′(g)MB,B′(f).

Demostracion.– Por el mismo razonamiento que en la proposicion anterior, bastademostrar que, para cualquier v ∈ V ,

MB′,B′′(g)MB,B′(f)(v)tB = [(g ◦ f)(v)]tB′′ ,

peroMB′,B′′(g)MB,B′(f)(v)t

B = MB′,B′′(g) (f(v))t

B′ = [g(f(v))]tB′′ ,

lo que finaliza la demostracion.

4.3. Nucleo e imagen de un homomorfismo. Isomorfismos.

Observacion.– Recordemos de los rudimentos de teorıa de conjuntos explicados en 1.2.que, dada una aplicacion f : X −→ Y y subconjuntos A ⊂ X y B ⊂ Y , definıamos

f(A) = {f(x) | x ∈ A} ⊂ Yf−1(B) = {x ∈ X | f(x) ∈ B} ⊂ X

Page 72: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Proposicion.– Sea f ∈ Hom(V, V ′), L ⊂ V y L′ ⊂ V ′ dos subespacios vectoriales.Entonces f(L) ⊂ V ′ y f−1(L′) ⊂ V son a su vez subespacios vectoriales. Mas aun, siL =

u1, ..., up

, entonces

f(L) =⟨

f (u1) , ..., f(up)⟩

.

Por otra parte, si B y B′ son bases de V y V ′, y AX t = 0l×1 es un sistema de ecua-ciones implıcitas de L′ con respecto a B′, entonces

AMB,B′(f)X t = 0l×1

es un sistema de ecuaciones implıcitas de f−1(L′) con respecto a B.

Demostracion.– La primera afirmacion es trivial por doble inclusion. Ya vimos en4.1. que la imagen de cualquier vector de L es combinacion lineal de las imagenes de losui. Pero, obviamente, si un vector de V ′ es de la forma

w = α1f (u1) + ... + αpf(up),

entonces w = f(∑

αiui) ∈ f(L).

Para demostrar que un sistema de ecuaciones implıcitas define un conjunto concreto,hay demostrar que un elemento esta en dicho conjunto si y solo si verifica las ecuaciones.Por tanto, notemos que u ∈ f−1(L′) si y solo si f(u) ∈ L′.

Ahora bien, al ser AX t = 0l×1 un sistema de ecuaciones de L′, con respecto a B′,f(u) ∈ L′ si y solo si

0l×1 = A [f(u)B′ ]t = AMB,B′(f) [(u)B]t ,

lo que prueba que el sistema de ecuaciones propuesto es, de hecho, un sistema de ecua-ciones de f−1(L′). Al estar definido a partir de un sistema de ecuaciones, f−1(L′) es unsubespacio de V .

Veamos ahora los dos casos particulares mas interesantes de imagen y anti–imagen.

Definicion.– Sea f ∈ Hom(V, V ′). Se definen:

(a) El nucleo de f , denotado3 ker(f), es la imagen recıproca del subespacio {0}; estoes,

f−1({0}) = {v ∈ V | f(v) = 0}.

(b) La imagen de f , denotada Img(f) es el conjunto f(V ), esto es,

Img(f) = {f(v) | v ∈ V }.

Observacion.– Los procedimientos anteriores para hallar imagenes e imagenesrecıprocas, cuando se aplican al nucleo y la imagen de un homomorfismo resultan es-pecialmente simples; sobre todo si conocemos una matriz de f respecto de dos bases.

3Del aleman kernel. Una de las pocas notaciones de origen aleman que quedan junto con Z de zahlen.

Page 73: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

En efecto, si f ∈ Hom(V, V ′) y conocemos M = MB,B′(f) ∈ M(n×m; k), entonces,el nucleo de f es precisamente el conjunto de vectores cuya imagen es 0, por lo que unasecuaciones implıcitas son, de forma inmediata,

M

x1

x2...

xm

= 0n×1,

o, escritas en la forma usual, MX t = 0n×1.

Por otro lado, si B = {v1, ..., vm} es base de V , como B es sistema generador de V ,un sistema generador de Img(f) es {f(v1), ..., f(vm)} cuyas coordenadas respecto de B′

son, precisamente, las columnas de M .

Recordemos que, dado que un conjunto linealmente independiente puede perder estacondicion al aplicarsele un homomorfismo, el sistema generador obtenido anteriormente,no tiene por que ser base de Img(f), como se puede comprobar en algunos de los ejemplosvistos en 4.1. y 4.2.

De estas dos observaciones se deduce que

dim(ker(f)) = m − rg(M), dim(Img(f)) = rg(M),

y ası hemos probado el siguiente resultado.

Proposicion.– Sea f ∈ Hom(V, V ′). Entonces

dim(ker(f)) + dim(Img(f)) = dim(V ).

Veamos ahora un ejemplo de la utilidad del nucleo y la imagen, a la hora de estudiarun homomorfismo.

Proposicion.– Sea f ∈ Hom(V, V ′). Entonces

(a) f es inyectiva si y solo si ker(f) = {0}.

(b) f es sobreyectiva si y solo si Img(f) = V ′.

Demostracion.– El enunciado (b) es trivial, por definicion de sobreyectividad y deImg(f). Por tanto, probaremos (a). Es tambien obvio que, como f(0) = 0, si f esinyectiva el nucleo ha de reducirse necesariamente a {0}.

Para ver la otra implicacion supongamos que ker(f) no contiene otro vector que elnulo y que f no es inyectiva. Ası, han de existir u, v ∈ V distintos tales que f(u) = f(v).Pero entonces f(u − v) = f(u) − f(v) = 0, con lo que hemos hallado un vector (enconcreto u − v) no nulo en el nucleo, contradiciendo la hipotesis. Por consiguiente, fdebe ser inyectiva.

Observacion.– Una aplicacion inyectiva sı preserva la independencia lineal. En efecto, sif es inyectiva y u1, ..., ur son linealmente independientes, tenemos que

0 =r∑

i=1

αif(ui) =r∑

i=1

f (αiui) =⇒ 0 =r∑

i=1

αiui =⇒ α1 = ... = αr = 0.

Corolario.– Si f ∈ Hom(V, V ′) y dim(V ) = dim(V ′), son equivalentes:

Page 74: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(a) f es biyectiva.

(b) f es inyectiva.

(c) f es sobreyectiva.

Demostracion.– Haremos (a) ⇐⇒ (b), ya que (a) ⇐⇒ (c) es muy similar. Obvi-amente (a) =⇒ (b), ası que nos podemos reducir a la otra implicacion. Pero, si f esinyectivo,

dim(V ′) = dim(V ) = dim(ker(f)) + dim(Img(f)) = dim(Img(f)),

de donde Img(f) = V ′ y f es sobre.

Definicion.– Un homomorfismo f ∈ Hom(V, V ′) biyectivo se denomina un isomorfismo.Si existe un isomorfismo entre V y V ′ los espacios se diran isomorfos, y se notara V ' V ′.

Si V = V ′, f se denomina un automorfismo. El conjunto de automorfismos de unk–espacio vectorial V se denota Aut(V ) ⊂ End(V ).

Teorema.– Dos espacios vectoriales V y V ′ son isomorfos si y solo si dim(V ) =dim(V ′).

Demostracion.– Supongamos que V y V ′ son isomorfos: entonces existe f ∈Hom(V, V ′) biyectivo. Fijadas entonces bases B y B′ de V y V ′, respectivamente, ten-emos que

dim(V ′) = dim(Img(f)) = rg (MB,B′(f)) ,0 = dim(ker(f)) = dim(V ) − rg (MB,B′(f)) ,

por ser f , por este orden, sobreyectiva e inyectiva. De ambas igualdades obtenemosdim(V ) = dim(V ′).

Ahora tenemos dos espacios V y V ′ con la misma dimension. Tomamos entonces dosbases B = {u1, ..., un} y B′ = {v1, ..., vn} y consideramos el homomorfismo dado por

MB,B′(f) = In,

esto es, el dado por ui 7−→ vi. Como rg(In) = n, f es inyectiva, porque dim(ker(f)) = 0y es sobre porque dim(Img(f)) = n = dim(V ′).

Corolario.– Si f es un isomorfismo de V en V ′, para cualesquiera bases B y B′, se tieneque MB,B′(f) es invertible.

Demostracion.– Directa: la matriz es cuadrada por el teorema y, aplicando lasformulas dadas para las dimensiones del nucleo y la imagen se deduce que ha de tenerrango maximo.

Observacion.– Si f es un isomorfismo de V en V ′, f−1 (que esta bien definida por ser fbiyectiva) tambien es un isomorfismo, en este caso de V ′ en V . En efecto, fijadas B y B′

bases de V y V ′

MB,B′(f)(v)tB = (f(v))t

B′ ,

por lo que[MB,B′(f)]−1 (f(v))t

B′ = (v)tB =

[

f−1f(v)]t

B,

Page 75: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

lo que prueba que f−1 es un homomorfismo (biyectivo ya era por serlo f ) y, ademas, paracualesquiera bases B y B′,

[MB,B′(f)]−1 = MB′,B

(

f−1)

.

De esto se puede deducir, sin problemas, que Aut(V ) es un grupo con la operaciondefinida por la composicion de aplicaciones.

4.4. Autovalores y autovectores.

Observacion.– De ahora en adelante trataremos con endomorfismos de un k–espaciovectorial de dimension m, que denotaremos V . Sabemos que un mismo endomorfismopuede adoptar diversas formas matriciales, al cambiar de base. Es por ello interesanteestudiar, dado f ∈ End(V ) el conjunto de matrices que pueden ser matriz de f y, si esposible, hallar una base tal que su correspondiente matriz sea lo mas simple posible. Estecurso daremos respuesta parcial a este complicado problema.

Como sabemos de 4.2., si A = MB(f), B = MC(f) y P = M(B, C), entoncesA = P−1BP . Esto motiva la siguiente definicion.

Definicion.– Dos matrices A,B ∈ M(m; k) se dicen semejantes si existe una matrizP ∈ GL(m; k) tal que A = P−1BP .

Observacion.– La relacion

A ∼s B ⇐⇒ A es semejante a B

es de equivalencia. Veamos por ejemplo la transitividad: tenemos A,B,C ∈ M(m; k)tales que existen P,Q ∈ GL(m; k) verificando

A = P−1BP, B = Q−1CQ.

Entonces es claro que A = P−1Q−1CQP = (QP )−1C(QP ), de donde A ∼s C.

Por tanto, el conjunto M(m; k) queda dividido en clases de equivalencia disjuntas ytodas las matrices de una misma clase corresponden a un mismo homomorfismo, vistodesde diferentes bases. Se trata de buscar elementos comunes a todas estas matrices, y eslo que vamos a hacer en las proximas lecciones.

Definicion.– Sea f ∈ End(V ). Un escalar λ ∈ k se dice un autovalor de f cuando existaun vector v 6= 0 que verifique f(v) = λv.

En la situacion anterior, v se denomina un autovector asociado al autovalor λ. Porconvenio (y por extension natural de la definicion), consideraremos 0 como autovectorasociado a cualquier autovalor.

Observacion.– Es logico imponer v 6= 0 en la definicion de autovalor porque, de noimponerlo, todo escalar serıa autovalor.

Observacion.– Si f(v) = λv, entonces (λId − f)(v) = 0, por lo que v es un autovectorasociado a λ si y solo si v ∈ ker(λId − f).

Page 76: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Ademas, eso permite deducir que λ es autovalor de f si y solo si ker(λId− f) 6= {0},esto es si y solo si λId − f no es inyectiva.

Lema.– Sea g ∈ End(V ), B una base cualquiera de V . Entonces g es biyectivo si y solosi |MB(g)| 6= 0.

Demostracion.– Trivial, a partir de 4.3.

Corolario.– Sea B una base cualquiera de V . Entonces λ ∈ k es un autovalor de f ∈End(V ) si y solo si |λIm − MB(f)| = 0.

Demostracion.– Como inyectividad y biyectividad son equivalentes para un endo-morfismo (4.3.), basta aplicar el lema al endomorfismo λId − f , cuya matriz respecto deB es λIm − MB(f).

Observacion.– El corolario anterior establece un procedimiento para hallar los autovalo-res de f , conocida la matriz de f respecto de una base B cualquiera: primero hallamosMB(f), que denotaremos en lo sucesivo A = (aij) ∈ M(m; k). A continuacion conside-ramos una variable λ y calculamos el determinante

|λIm − A| =

λ − a11 −a12 ... −a1m

−a21 λ − a22 ... −a2m...

... . . . ...−am1 −am2 ... λ − amm

,

cuyo resultado es un polinomio de k[λ], que denotaremos P (λ). Entonces α es autovalorde f si y solo si P (α) = 0.

Estudiemos un poco mas este polinomio que hemos usado para el calculo de los auto-valores.

Lema.– El polinomio |λIm − MB(f)| no depende de la base B escogida para calcularlo.

Demostracion.– En efecto, supongamos que A = MB(f), B = MC(f) y P =M(B, C). Como sabemos, A = P−1BP y, ası

|λIm − A| = |P−1(λIm)P − P−1AP | = |P−1(λIm − B)P |= |P−1||λIm − B||P | = |λIm − B|.

Definicion.– El polinomio P (λ) hallado anteriormente se denomina polinomio carac-terıstico del endomorfismo f . Si A = MB(f), tambien se dira que P (λ) es el polinomiocaracterıstico de A.

Observacion.– El polinomio caracterıstico es, pues, un primer objeto comun a todas lasmatrices de una misma clase de equivalencia para ∼s.

Observacion.– El polinomio caracterıstico de un endomorfismo de V siempre es un poli-nomio de grado m = dim(V ). Esto se observa del desarrollo del determinante, puestoque hay un solo sumando que tiene λ en sus m factores, y es precisamente

(λ − a11)(λ − a22)...(λ − amm),

de forma que aparece un termino λm que no se puede anular con los demas factores.Ademas hemos probado que el coeficiente de λm es 1.

Page 77: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

En particular, los resultados de 1.6. nos indican que un endomorfismo de un k–espaciovectorial de dimension m no puede tener mas de m autovalores (contados con multiplici-dad).

4.5. Espacios invariantes.

Definicion.– Sea f ∈ End(V ), α ∈ k un autovalor de f . El conjunto

Vα = { Autovectores asociados a α }

se denomina (primer) subespacio invariante asociado a α.

Observacion.– Vα es, en efecto un subespacio, ya que Vα = ker(αId − f). De hecho,fijada una base B de V , unas ecuaciones de Vα son, precisamente

[αIm − MB(f)] X t = 0m×1.

Observacion.– Ademas Vα es invariante por f , esto es f(Vα) ⊂ Vα. En efecto, sitomamos v ∈ Vα, f(v) = αv ∈ Vα, ya que es subespacio. Ası, f(Vα) ⊂ Vα.

Proposicion.– En las condiciones anteriores, si ν es la multiplicidad de α como raız delpolinomio caracterıstico de f , dim(Vα) ≤ ν.

Demostracion.– Escojamos una base de Vα, pongamos Bα = {v1, ..., vr}. Queremosprobar que r ≤ ν. Para ello comenzamos ampliando Bα a una base de V , B.

Si queremos calcular A = MB(f), recordemos de 4.2. que la columna i–esima sonlas coordenadas, respecto de B de la imagen del elemento i–esimo de B. En particular,para los r primeros elementos tenemos

f(vi) = αvi,

de donde, para i = 1, ..., r,

[f(vi)]B = (0, 0, ..., 0, α, 0, ..., 0),

con α en la posicion i–esima. Ası,

A =

α ... 0 a1,r+1 ... a1,m

... . . . ......

...0 ... α ar,r+1 ... arm

0 ... 0 ar+1,r+1 ... ar+1,m

......

... . . . ...0 ... 0 am,r+1 ... amm

.

Ahora, al calcular el polinomio caracterıstico usando A, vemos que tiene la forma

P (λ) = (λ − α)rQ(λ),

de donde la multiplicidad de α es, al menos, r.

Page 78: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Ejemplos.– Conviene poner ejemplos en los cuales se da y no se da la igualdad entre lamultiplicidad de un autovalor y la dimension de su subespacio asociado. Por ejemplo,valdrıa estudiar los distintos casos asociados a la matriz

M =

1 a 00 1 00 0 2

, a ∈ k.

Observacion.– Un caso es particularmente frecuente y simple; por ello lo estudiaremosaparte: sea α un autovalor simple (esto es, de multiplicidad 1). Entonces dim(Vα) = 1.

El resultado es elemental y se sigue de lo siguiente: dim(Vα) ≤ 1 por la proposicionque hemos probado. Pero, por ser α autovalor, existe al menos un autovector no nulo, dedonde dim(Vα) ≥ 1. Esto finaliza la prueba.

Finalizamos la leccion estudiando la relacion existente (o, mejor dicho, inexistente)entre autovectores procedentes de autovalores distintos.

Proposicion.– Sea f ∈ End(V ), α1, ..., αr ∈ k autovalores de f , y sean

Bi ={

ui,1, ..., ui,ti

}

bases de los espacios Vαi. Entonces el conjunto B1 ∪ B2 ∪ ... ∪ Br es linealmente inde-

pendiente.

Demostracion.– La prueba es algo difıcil de seguir, por la notacion, ası que iremosdespacio. Lo haremos por induccion en el numero de autovalores que consideramos. Elcaso r = 1 no requiere prueba, porque B1 es linealmente independiente.

Vamos al caso general, suponiendo cierto el caso de considerar r − 1 autovalores.Tomamos una combinacion lineal igualada a 0,

0 =

t1∑

j=1

β1ju1j

+ ... +

tr−1∑

j=1

βr−1,jur−1,j

+

tr∑

j=1

βrjurj

,

y aplicamos f a ambos miembros de la igualdad:

0 =

t1∑

j=1

β1jα1u1j

+ ... +

tr−1∑

j=1

βr−1,jαr−1ur−1,j

+

tr∑

j=1

βrjαrurj

.

Ahora multiplicamos la primera igualdad por αr y la restamos a la segunda. Asıobtenemos

0 =

t1∑

j=1

β1j(α1 − αr)u1j

+ ... +

tr−1∑

j=1

βr−1,j(αr−1 − αr)ur−1,j

,

que es una combinacion lineal de autovectores de B1 ∪ ... ∪ Br−1. Por hipotesis de in-duccion, este conjunto es linealmente independiente, por lo que βij(αi − αr) = 0, parai = 1, ..., r − 1, j = 1, ..., ti; esto es, βij = 0 ya que αi 6= αr para i = 1, ..., r − 1. Portanto, de la primera igualdad nos resta

0 =tr∑

j=1

βrjurj,

donde βrj = 0 para todo j = 1, ..., tr porque Br es base de Vαr.

Page 79: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

4.6. Endomorfismos diagonalizables.

Esta leccion cerrara nuestro trabajo sobre endomorfismos. En concreto responderemos ala siguiente pregunta: dada una matriz A, ¿cuando existe una matriz semejante diagonal?

Definicion.– Un endomorfismo de un k–espacio vectorial V se dice diagonalizable siexiste B, base de V tal que MB(f) es diagonal.

Proposicion.– Un endomorfismo f ∈ End(V ) es diagonalizable si y solo si existe unabase de V formada por autovectores.

Demostracion.– Ambas implicaciones son sencillas. Si f es diagonalizable existeuna base B = {v1, ..., vm} tal que

MB(f) =

a1 0 ... 00 a2 ... 0...

... . . . ...0 0 ... am

,

y entonces, para todo vi ∈ B f(vi) = aivi, por lo que B esta formada por autovectores.

En el otro sentido, tomamos una base B = {v1, ..., vm} donde vi es un autovectorasociado al autovalor αi. Entonces, como vimos en 1.10.,

[f(vi)]B = (0, 0, ..., 0, αi, 0, ..., 0),

con αi en la coordenada i–esima. Por tanto MB(f) es diagonal.

Corolario.– Si f posee m autovalores distintos (en k) es diagonalizable.

Demostracion.– Supongamos que f tiene autovalores α1, ..., αm todos ellos necesari-amente de multiplicidad 1. Como vimos en la leccion anterior, dim(Vαi

) = 1 y, uniendom autovectores no nulos, uno por cada Vαi

, obtenemos un conjunto linealmente indepen-diente, por tanto una base de autovectores.

Observacion.– Notemos que, en realidad, la proposicion prueba que MB(f) es diagonalsi y solo si B esta formada por autovectores. Esto, en particular, implica lo siguiente:si los autovalores de f son α1, ..., αr con multiplicidades respectivas ν1, ..., νr; entoncespara que f sea diagonalizable es necesario que

νi = m = dim(V ).

En efecto, para que f sea diagonalizable, es necesario hallar una base formada porautovectores, pero el maximo numero de autovectores linealmente independientes quepodemos hallar es

dim (Vα1) + ... + dim (Vαr

) ≤ ν1 + ... + νr ≤ m,

de forma que, para que la suma de las dimensiones sea m, ha de ser ν1 + ... + νr = m.

Ahora podemos enunciar el resultado que caracteriza cuando un endomorfismo esdiagonalizable.

Teorema.– Sea f ∈ End(V ) de autovalores α1, ..., αr, con multiplicidades ν1, ..., νr.Supongamos que se verifica

νi = m. Entonces las condiciones siguientes son equiva-lentes:

Page 80: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(a) f es diagonalizable.

(b) dim (Vαi) = νi para todo i = 1, ..., r.

Demostracion.– Comencemos por (a) =⇒ (b). Si f es diagonalizable, entonces tieneuna base formada por autovectores. Por tanto un conjunto que contenga a todos los au-tovectores de f ha de generar V . Ahora bien, todos los autovectores no nulos de f estanen los espacios Vα1

, ..., Vαr. Por tanto

V = Vα1+ ... + Vαr

.

Ahora, aplicando los resultados de la leccion anterior y una consecuencia de teoremade la dimension obtenemos

m = dim (Vα1+ ... + Vαr

) ≤ dim (Vα1) + ... + dim (Vαr

)≤ ν1 + ... + νr (sumando a sumando)≤ m,

de donde, para que se de la igualdad que estamos suponiendo cierta, ha de ser dim(Vαi) =

νi, para i = 1, ..., r.

Para ver (b) =⇒ (a) solo hay que tener en cuenta que la union de bases de los Vαies un

conjunto linealmente independiente. En las condiciones de (b) este conjunto linealmenteindependiente es de hecho base de V porque tiene m elementos. Al estar formada estabase por autovectores, f es diagonalizable.

Corolario.– Sea f ∈ End(V ) de autovalores α1, ..., αr, con multiplicidades ν1, ..., νr.Supongamos que se verifica

νi = m. Entonces las condiciones siguientes son equiva-lentes:

(a) f es diagonalizable.

(b) V = Vα1⊕ ... ⊕ Vαr

.

Demostracion.– Como vimos en 3.10. V es suma directa de subespacios si y solo siel conjunto resultante de unir una base de cada subespacio es base de V . A partir de aquıse tiene la equivalencia.

Observacion.– A partir de aquı disponemos de un procedimiento para decidir cuandoun endomorfismo de diagonalizable y, caso de serlo, hallar una base tal que la matrizcorrespondiente sea diagonal. En efecto, basta calcular los autovalores αi, sus respectivasmultiplicidades νi y sus subespacios invariantes asociados Vαi

.

Entonces comprobamos si se verifican las condiciones del teorema y, de ser ası, for-mamos una base B de V uniendo las bases halladas de los Vαi

. La matriz MB(f) esentonces diagonal y, por construccion, la unica forma de hallar otra matriz diagonal de fes reordenando los vectores de la base (y los elementos de la diagonal, claro). Todos estosrazonamientos nos llevan al siguiente resultado.

Teorema.– Sean A y B matrices de endomorfismos diagonalizables. Entonces A y B sonsemejantes si y solo si tienen los mismos autovalores, con las mismas multiplicidades.

Page 81: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Tema 5: Aplicaciones bilineales

5.1. Aplicaciones multilineales.

Definicion.– Sea V un k–espacio vectorial, r ∈ N. Una aplicacion r–multilineal deV r = V × ... × V (r veces) es una aplicacion

θ : V r −→ k

(u1, ..., ur) 7−→ θ (u1, ..., ur)

verificando la siguiente propiedad: si u, v ∈ V , α, β ∈ k,

θ (u1, ..., ui−1, αu + βv, ui+1, ..., ur) = αθ (u1, ..., ui−1, u, ui+1, ..., ur) ++βθ (u1, ..., ui−1, v, ui+1, ..., ur) ,

para cualquier ındice i = 1, ..., r.

Cuando r = 2 las aplicaciones suelen denominarse bilineales. Estas (o, mejor dicho,un subconjunto de estas) seran nuestro objeto principal de estudio.

Observacion.– Una aplicacion multilineal de V r no es sino una aplicacion de V r en kque se comporta como un homomorfismo en cada componente de V r.

Ejemplos.– Veamos algunos ejemplos de aplicaciones multilineales:

(a) El ejemplo fundamental lo da, para V = kn, r = n, la aplicacion

det : V n −→ k

(u1, ..., un) 7−→ det(A)

donde A ∈ M(n; k) es la matriz cuya fila i–esima es (abuso de notacion tacito) ui.Observemos que la imagen de una n–upla que tenga dos vectores iguales es 0.

(b) En el caso V = k2, la aplicacion

det : k2 × k2 −→ k

((α1, α2), (β1, β2)) 7−→ α1 α2

β1 β2

verifica det(u, v) = − det(v, u).

(c) Consideramos V = C[0, 1], y la aplicacion

θ : C[0, 1] × C[0, 1] −→ R

(f, g) 7−→∫ 1

0f(x)g(x)dx

Page 82: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

En este caso una propiedad notable de esta aplicacion es que θ(f, g) = θ(g, f) paracualesquiera f, g ∈ C[0, 1].

(d) El producto escalar (usual) en kn, definido por

(a1, ..., an) · (b1, ..., bn) = a1b1 + ... + anbn,

es, ası mismo, una aplicacion bilineal.

(e) Sea A ∈ M(n; k) cualquiera. Consideremos la aplicacion

θ : kn × kn −→ k

(u, v) 7−→ uAvt

Entonces θ es una aplicacion bilineal, por las propiedades conocidas del productode matrices. El ejemplo anterior es el caso particular A = In.

(f) Para cualquier V , la aplicacion

Θ : V × V −→ k

(u, v) 7−→ 0

es una aplicacion bilineal, denominada aplicacion bilineal nula. Cuando no esteclaro cual es el espacio V , la denotaremos ΘV .

De estos ejemplos generalizaremos algunas propiedades.

Definicion.– Una aplicacion r–multilineal θ : V r −→ k se dice alternada si verifica

θ(u1, ..., ui−1, v, ui+1, ..., uj−1, v, uj+1, ..., ur) = 0,

para cualquier par de subındices distintos (i, j).

Una aplicacion bilineal θ : V × V −→ k se dice simetrica si verifica

θ(u, v) = θ(v, u),

para cualesquiera u, v ∈ V . Si verifica

θ(u, v) = −θ(v, u),

θ se dice (evidentemente) antisimetrica.

Observacion.– En uno de los ejemplos anteriores, la aplicacion bilineal

θ : kn × kn −→ k

(u, v) 7−→ uAvt

es (anti)simetrica si y solo si lo es A. En efecto, como θ(u, v) ∈ k, tenemos que

θ(u, v) = [θ(u, v)]t =⇒ uAvt = vAtut,

que es θ(v, u) (para todo u, v ∈ V × V ) si y solo si A = At.

Page 83: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Observacion.– Si θ : V × V −→ k es una aplicacion bilineal y L ⊂ V es un subespacio,es obvio que podemos considerar la aplicacion bilineal definida en L × L

θ|L : L × L −→ k

(u, v) 7−→ θ(u, v)

denominada restriccion de θ a L (en realidad se restringe a L × L).

Obviamente, si θ es (anti)simetrica, θ|L tambien lo es, para todo L; pero tambien puedeocurrir que una aplicacion bilineal sea simetrica cuando esta restringida a un subespacio,pero no en todo el espacio. Por dar un caso trivial, en el ejemplo (b) anterior, θ es simetrica(de hecho, nula) restringida a 〈(1, 1)〉.

5.2. Matriz de una aplicacion bilineal. Ortogonalidad.

Supongamos que V es de dimension finita, pongamos dim(V ) = m, y fijemos una baseB = {u1, ..., um}. Entonces, para dos vectores cualesquiera x, y ∈ V , tenemos

x =m∑

i=1

xiui, y =m∑

j=1

yjuj.

De esta forma, dada una aplicacion bilineal θ : V × V −→ k,

θ(x, y) = θ

m∑

i=1

xiui,m∑

j=1

yjuj

=m∑

i=1

m∑

j=1

xiyjθ(

ui, uj

)

Por tanto, si llamamos aij = θ(ui, uj), tenemos que

θ(x, y) = (x1 ... xm)

a11 ... a1m

... . . . ...am1 ... amm

y1...

ym

.

Definicion.– En las condiciones anteriores, la matriz (aij) se denomina matriz de θ res-pecto de la base B, y se denota MB(θ).

La matriz MB(θ) es obviamente unica por construccion.

Observacion.– Ası pues, para hallar la imagen de (x, y) por θ solo necesitamos las coor-denadas de ambos vectores respecto de B y saber como actua θ sobre todos los posiblespares de vectores de B.

Esto es el enunciado analogo al que sabemos para los homomorfismos: para hallar laimagen de x por un homomorfismo basta conocer sus coordenadas respecto de una basey como actua el homomorfismo sobre los elementos de dicha base.

Sin embargo no debemos pasar por alto las notables diferencias entre ambos casos:son aplicaciones con conjuntos originales y conjuntos imagen distintos y, sobre todo, queverifican propiedades distintas. Un primer reflejo de estas diferencias lo encontramos enlos cambios de base.

Page 84: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Proposicion.– Sea V un k–espacio vectorial de dimension m, θ : V × V −→ k unaaplicacion bilineal y sean B y B′ dos bases de V . Entonces

MB′(θ) = M(B′,B)tMB(θ)M(B′,B).

Demostracion.– Sean x, y ∈ V cualesquiera. Entonces

(x)B′M(B′,B)t · MB(θ) · M(B′,B)[

(y)B′

]t= (x)BMB(θ)

[

(y)B]t

= θ(x, y),

lo que prueba el resultado, por la unicidad de la matriz de θ respecto de la base B ′.

El problema analogo al de las matrices semejantes es en esta ocasion el de las matricescongruentes.

Definicion.– Dos matrices A,B ∈ M(m; k) se dicen congruentes si existe P ∈ GL(m; k)tal que A = P tBP .

Esto es, dos matrices son congruentes si y solo si son matrices de una misma apli-cacion bilineal, pero considerada en diferentes bases.

Observacion.– La relacion en M(m; k) dada por

A ∼c B ⇐⇒ A es congruente con B

es de equivalencia (esto es muy sencillo de probar). Ası pues, al igual que en el caso de lasemejanza, podemos preguntarnos como distinguir si dos matrices son o no semejantes.

A diferencia del problema anterior, en este podremos dar una solucion completa parala situacion que nos interesa: el de las matrices simetricas. Por ello, aunque algunosconceptos y resultados se puedan generalizar, solo nos dedicaremos en adelante a estecaso.

Al igual que en el primer tema, buscaremos, dada A ∈ M(m; k), A = MB(θ), unamatriz congruente y, si es posible, diagonal. En este caso, el hecho de que sea diagonalimplica que la base B = {u1, ..., um} verifique

θ(ui, uj) = 0, cuando i 6= j,

y esto motiva la siguiente definicion.

Definicion.– Sea V k–espacio vectorial y θ como antes. Dos vectores u, v ∈ V se dicenortogonales (o θ–ortogonales, si puede haber confusion) si θ(u, v) = 0.

Sea H ⊂ V . Definimos el ortogonal de H como

H⊥ = {u ∈ V | θ(u, v) = 0, ∀v ∈ H}.

Proposicion.– En las condiciones anteriores:

(a) H⊥ = 〈H〉⊥.

(b) Si H = 〈u1, ..., us〉, entonces H⊥ = {v ∈ V | θ(ui, v) = 0, i = 1, ..., s}.

(c) H⊥ es un subespacio de V que verifica dim(H⊥) ≥ m − dim(H).

Page 85: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Demostracion.– A estas alturas, todas las afirmaciones deben ser ejercicios sencillospara el alumno. Por ejemplo, para probar (a) es obvio que 〈H〉⊥ ⊂ H⊥, ya que H ⊂ 〈H〉.Para ver la otra inclusion tomamos u ∈ H⊥. Entonces, para todo v ∈ 〈H〉 existenv1, ..., vt ∈ H y α1, ..., αt ∈ k tales que

v =t∑

i=1

αivi =⇒ θ(u, v) =t∑

i=1

αiθ(u, vi) = 0,

por lo que u ∈ 〈H〉⊥.

El mismo argumento prueba que, si H = L(u1, ..., us), entonces

H⊥ = {v ∈ V | θ(ui, v) = 0, i = 1, ..., s}.

Pero, fijada una base B de V , esto equivale a decir que

x ∈ H⊥ ⇐⇒ (x)BMB(θ) (ui)t

B = 0, i = 1, ..., s;

lo que nos determina un sistema de s ecuaciones implıcitas homogeneas que definen aH⊥. Por tanto, es un subespacio de V de dimension, al menos, m − s.

5.3. Diagonalizacion de aplicaciones bilineales simetricas.

Esta leccion tiene por objetivo, dada un aplicacion bilineal simetrica θ : V × V −→ k,hallar B tal que MB(θ) sea diagonal.

Lema.– Sean L = 〈u1, ..., ur〉 ⊂ V , verificando

θ(

ui, uj

)

=

{

0 si i 6= jbi 6= 0 si i = j

Entonces V = L ⊕ L⊥.

Demostracion.– Hemos de probar L + L⊥ = V , L ∩ L⊥ = {0}. Para lo primero,dado x ∈ V , escribimos

x =

(

r∑

i=1

θ(ui, x)

θ(ui, ui)ui

)

+

(

x −r∑

i=1

θ(ui, x)

θ(ui, ui)ui

)

= x1 + x2,

y veamos que x1 ∈ L, x2 ∈ L⊥.

Lo primero es elemental, pues x1 es combinacion de u1, ..., ur. En cuanto a lo se-gundo, hagamos

θ(

uj, x2

)

= θ

(

uj, x −r∑

i=1

θ(ui, x)

θ(ui, ui)ui

)

= θ(

uj, x)

−r∑

i=1

θ(ui, x)

θ(ui, ui)θ(

uj, ui

)

= θ(

uj, x)

− θ(ui, x)

θ(uj, uj)θ(

uj, uj

)

= 0,

de donde x2 ∈ L⊥.

Page 86: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Probemos ahora que L∩L⊥ = {0}. Para ello observemos que, si u ∈ L∩L⊥, por unlado u = α1u1 + ... + αrur, y por otro, para todo i = 1, ..., r

0 = θ (u, ui) =r∑

j=1

αjθ(

uj, ui

)

= αibi,

y, al ser bi 6= 0 para todo i, ha de ser αi = 0 para todo i, y u = 0.

Lema.– Sea θ una aplicacion bilineal simetrica no nula. Entonces existe u ∈ V tal queθ(u, u) 6= 0.

Demostracion.– Notemos que, para dos vectores u, v ∈ V cualesquiera,

θ (u + v, u + v) = θ(u, u) + θ(v, v) + 2θ(u, v),

de donde2θ(u, v) = θ (u + v, u + v) − θ(u, u) − θ(v, v).

Entonces, si θ(w,w) fuese 0 para cualquier w ∈ V ; para cualquier par (u, v),tendrıamos

2θ(u, v) = θ (u + v, u + v) − θ(u, u) − θ(v, v) = 0,

contradiciendo que θ 6= ΘV .

Teorema de diagonalizacion de las aplicaciones bilineales simetricas.– Sea V un k–espacio vectorial, θ una aplicacion bilineal simetrica. Entonces existe B, base de V talque MB(θ) es diagonal.

Demostracion.– Lo haremos por induccion en dim(V ) = m. El caso m = 1 estrivial, dado que MB(θ) es una matriz de orden 1.

Supongamos entonces probado el caso de dimension m − 1. Desde luego, si θ =ΘV no hay nada que probar, porque MB(ΘV ) = 0m en cualquier base B. Ası pues,supondremos que θ 6= ΘV y, por tanto, que existe u1 ∈ V con θ(u1, u1) 6= 0.

Entonces, si denotamos L1 = 〈u1〉, tenemos que V = L1 ⊕ L⊥1 . Como dim(L1) = 1,

ha de ser dim(L⊥1 ) = m − 1. En consecuencia, como θ|L⊥

1es una aplicacion bilineal

simetrica definida sobre un espacio de dimension m − 1, existe B′ = {u2, ..., um}, basede L⊥

1 (la notacion es claramente tendenciosa) tal que MB′(θ|L⊥

1) es diagonal.

Consideremos ahora B = {u1, u2, ..., ur} que es base de V porque es union de unabase de L1 y otra de L⊥

1 . Pero observemos que

MB(θ) =

θ(u1, u1) θ(u1, u2) ... θ(u1, um)θ(u2, u1) θ(u2, u2) ... θ(u2, um)

...... . . . ...

θ(um, u1) θ(um, u2) ... θ(um, um)

y, aplicando que θ(u1, ui) = 0 para i = 2, ...,m,

MB(θ) =

θ(u1, u1) 0 ... 00... MB′

(

θ|L⊥

1

)

0

,

Page 87: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

que es diagonal por serlo MB′

(

θ|L⊥

1

)

.

Observacion.– El procedimiento inductivo que se sigue de la prueba del teorema no esquiza el mas adecuado en la practica. Una alternativa es el que presentamos ahora, cuyavalidez puede ser facilmente demostrada con los resultados anteriores.

Comenzamos haciendo V = L1 y buscamos u1 ∈ L1 tal que θ(u1, u1) = a1 6= 0. Sino lo hallamos, θ|L1

= ΘL1y hemos terminado. Si lo hallamos, definimos

H1 = 〈u1〉, L2 = H⊥1 ,

que verifica dim(L2) = m − dim(H1) = m − 1.

Ahora buscamos u2 ∈ L2 tal que θ(u2, u2) = a2 6= 0. Si no lo hallamos, θ|L2= ΘL2

y hemos terminado: haciendo

B = {u1} ∪ { base de L2 } =⇒ MB(θ) =

a1

0. . .

0

Si, por contra, lo hallamos, definimos

H2 = 〈u1, u2〉, L3 = H⊥2 ,

que verifica dim(L3) = m − dim(H2) = m − 2.

Supongamos que, mediante este proceso, hemos definido

H1 ⊂ ... ⊂ Hj = 〈u1, ..., uj〉, Lj+1 = H⊥j .

Buscamos uj+1 ∈ Lj+1 tal que θ(uj+1, uj+1) = aj+1 6= 0. Si no lo hallamos, θ|Lj+1=

ΘLj+1y de nuevo hemos terminado, ya que

B = {u1, ..., uj} ∪ { base de Lj+1 } =⇒ MB(θ) =

a1

. . .aj

0. . .

0

Pero si lo hallamos, definimos

Hj+1 = 〈u1, ..., uj+1〉, Lj+2 = H⊥j+1,

que verifica dim(Lj+2) = m − dim(Hj+1) = m − (j + 1).

El proceso termina, bien si hallamos un Lj con θ|Lj= ΘLj

, bien si llegamos aHm = V . Tomando entonces B = {u1, ..., um} tenemos por construccion que MB(θ)es diagonal.

Page 88: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

5.4. Teorema de Sylvester.

Observacion.– A diferencia del caso de los endomorfismos, el hecho de hallar una matrizdiagonal no resuelve el problema de decidir cuando dos matrices son congruentes, ya que,por el proceso dado en la leccion anterior, es obvio que una misma aplicacion bilinealpuede diagonalizarse de infinitas maneras, en general.

Lo que es claro es que, dadas dos matrices A y B, si son congruentes A = P tBP paraP ∈ GL(m; k), por lo que rg(A) = rg(B).

Teorema de Sylvester (k = C).– Dadas A,B ∈ M(m;C) son congruentes si y solo sirg(A) = rg(B).

Demostracion.– Solo hay que probar que si rg(A) = rg(B) = l las matrices soncongruentes. Pero para ello fijamos una base B de Cm cualquiera y definimos aplicacionesbilineales θ y η tales que A = MB(θ), B = MB(η). Entonces podemos hallar dos nuevasbases, C = {u1, ..., um} y D = {v1, ..., vm} tales que

MC(θ) =

a1

. . .al

0. . .

0

, MD(η) =

b1

. . .bl

0. . .

0

,

congruentes con A y B, respectivamente. Pero entonces, haciendo

C ′ =

u1√

θ(u1, u1), ...,

ul√

θ(ul, ul), ul+1, ..., um

,

D′ =

v1√

η(v1, v1), ...,

vl√

η(vl, vl), vl+1, ..., vm

,

es casi inmediato (y queda como ejercicio) que

MC′(θ) = MD′(η) =

1. . .

10

. . .0

,

que es congruente con A y B. Por tanto, al ser la congruencia relacion de equivalencia, Aes congruente con B.

Observacion.– Hemos usado de forma esencial k = C ya que hemos tomado raıcescuadradas de elementos no nulos de k, lo cual no esta garantizado en los casos k = Q,R.En concreto, la misma demostracion que hemos hecho, en el caso k = R, nos permite

Page 89: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

deducir que toda matriz simetrica es congruente con una de la forma

1. . .

1−1

. . .−1

0. . .

0

.

Veamos entonces como hemos de afinar el resultado para el caso k = R.

Definicion.– Sea A ∈ M(m;R) una matriz diagonal. Definimos la signatura de A,notada sg(A), como el numero de elementos positivos de la diagonal principal de A.

Lema.– Sean A,B ∈ M(m;R) matrices diagonales. Entonces si A y B son congruentessg(A) = sg(B).

Demostracion.– Escribamos A y B de la forma

A =

a1

. . .ar

−ar+1

. . .−at

0. . .

0

,

B =

b1

. . .bs

−bs+1

. . .−bt

0. . .

0

,

con r = sg(A), s = sg(B), t = rg(A) = rg(B) y ai, bi > 0 para i = 1, ..., t. FijamosB = {u1, ..., um}, base de V = Rm y definimos la aplicacion bilineal θ como

θ(u, v) = (u)BA(v)tB.

Dado que A y B son congruentes, existe C = {v1, ..., vm} tal que MC(θ) = B.Definimos entonces

L = 〈u1, ..., ur〉, M = 〈vs+1, ..., vm〉,

Page 90: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

y vamos a probar que L ∩ M = {0}. Para ello sea x ∈ L ∩ M ,

x =r∑

i=1

αiui =m∑

j=s+1

βjvj.

Entonces, segun usemos la base B o la base C, obtenemos

θ(x, x) = (x)BA(x)tB =

r∑

i=1

α2i ai > 0

= (x)CB(x)tC = −

m∑

j=s+1

β2j bj < 0

de donde θ(x, x) = 0. Pero entonces

r∑

i=1

α2i ai = 0, ai > 0 para i = 1, ..., r =⇒ αi = 0, i = 1, ..., r,

esto es, x = 0.

De aquı deducimos que

m = dim(V ) ≥ dim(L + M) = dim(L) + dim(M) = r + m − s,

esto es, s ≥ r. Analogamente se prueba que r ≥ s.

Teorema de Sylvester (k = R).– Dos matrices diagonales A,B ∈ M(m;R) son con-gruentes si y solo si rg(A) = rg(B) y sg(A) = sg(B).

Demostracion.– Ya hemos visto que las dos igualdades son necesarias para la con-gruencia. El hecho de que son suficientes es analogo al caso k = C.

Observacion.– Dadas entonces dos matrices A y B, simetricas y definidas sobre R, cal-culamos dos matrices A′ y B′ congruentes con ellas que sean diagonales y, por el teoremaanterior, A y B seran congruentes si y solo si A′ y B′ tienen la misma cantidad de elemen-tos diagonales no nulos (rg(A′) = rg(B′)) y la misma cantidad de elementos positivos nonulos (sg(A′) = sg(B′)).

Definicion.– Si θ es una aplicacion bilineal simetrica, denominaremos rango de θ, notadorg(θ), al rango de la matriz de θ respecto de una base cualquiera de V . De igual modo,si k = R, denominaremos signatura de θ, notada sg(θ), a la signatura de la matriz de θsobre cualquier base de V que la diagonalice.

5.5. Aplicaciones de la diagonalizacion.

Veremos dos aplicaciones de la diagonalizacion: la expresion de formas cuadraticascomo suma de cuadrados y un resultado tecnico que nos resultara util en el estudio dehipercuadricas. Como antes, consideramos un cuerpo k = Q,R,C.

Page 91: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Definicion.– Sea Z0 el conjunto de los enteros positivos junto con el 0. Un polinomiof(x1, ..., xm) ∈ k[x1, ..., xm] es una expresion de la forma

f(x1, ..., xm) =∑

(i1,...,im)∈Zm0

ai1,...,imxi11 ...xim

m ,

donde ai1,...,im ∈ k y son nulos, salvo para una cantidad finita de subındices.

Cuando existe r ∈ Z0 tal que i1+...+im = r para todo ai1,...,imxi11 ...xim

m con coeficienteno nulo, el polinomio f(x1, ..., xm) se dice homogeneo de grado r, o bien una forma degrado r.

Cuando r = 1, f(x1, ..., xm) (o f , para abreviar, si no hay lugar a confusion) se diceuna forma lineal, y cuando r = 2, f(x1, ..., xm) se dice una forma cuadratica.

El objetivo de esta leccion es el probar el siguiente resultado:

Teorema.– Sea f(x1, ..., xm) ∈ k[x1, ..., xm] una forma cuadratica. Entonces existenformas lineales g1, ..., gr y escalares α1, ..., αr ∈ k, con r ≤ m, tales que

f = α1g21 + ... + αrg

2r .

Demostracion.– Escribimos f de la siguiente forma

f(x1, ..., xm) =m∑

i≤j; i,j=1

aijxixj.

Entonces otra forma de escribir f es la siguiente

f = (x1 x2 ... xm)

a11 a12/2 ... a1m/2a12/2 a22 ... a2m/2

...... . . . ...

a1m/2 a2m/2 ... amm

x1

x2...

xm

= X · A(f) · X t,

como se puede comprobar facilmente (no confundir con rapidamente).

Ahora bien, A(f) es una matriz cuadrada y simetrica de orden m. Por tanto existe unamatriz P ∈ GL(m; k) tal que

A(f) = P t

a1

. . .as

0. . .

0

P.

Por otro lado, notemos que

XP t = (x1 ... xm) P t = (g1 ... gm) ,

con g1, ..., gm formas lineales. Concretamente, si P = (pij),

gi = pi1x1 + ... + pimxm.

Page 92: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

En suma tenemos que

f = XA(f)X t = XP t

a1

. . .as

0. . .

0

PX t = a1g21 + ... + asg

2s .

Corolario.– Cuando k = C, f se puede expresar como suma, a lo mas, m de formaslineales al cuadrado.

Corolario.– Cuando k = R, f se puede expresar como suma y/o diferencia de, a lo mas,m formas lineales al cuadrado.

Observacion.– La segunda aplicacion que vamos a obtener de la diagonalizacion es masbien una anotacion al margen de la prueba. Supongamos que θ es una aplicacion bilinealsimetrica y que tenemos nuestro espacio vectorial V descompuesto en

V = L1 ⊕ L2,

de tal forma que todo vector de L1 sea ortogonal a L2. Entonces, si tomamos bases B1 yB2 respectivas, y consideramos B = B1 ∪ B2, tendremos que

MB(θ) =

0 ... 0

MB1(θ|L1

)... . . . ...0 ... 0

0 ... 0... . . . ... MB2

(θ|L2)

0 ... 0

,

por lo que podremos aplicar el procedimiento de diagonalizacion a θ|L1y θ|L2

, hallarbases apropiadas B′

1 y B′2, y entonces B′ = B′

1 ∪B′2 sera una base que diagonalice a θ. En

particular tenemos que

rg(θ) = rg(

θ|L1

)

+ rg(

θ|L2

)

sg(θ) = sg(

θ|L1

)

+ sg(

θ|L2

)

Ejemplo.– Dada la aplicacion bilineal simetrica θ definida, respecto de la base B por lamatriz

A =

0 1 0 01 0 0 00 0 0 10 0 1 0

,

si consideramos

L1 = 〈(1, 0, 0, 0), (0, 1, 0, 0)〉, L2 = 〈(0, 0, 1, 0), (0, 0, 0, 1)〉,

Page 93: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

vemos que es obvio que L1 y L2 verifican las condiciones requeridas. Ahora bien, apli-cando el procedimiento de diagonalizacion obtenemos

(

0 11 0

)

∼c

(

1−1

)

,

de donde

A ∼c

1−1

1−1

.

5.6. Producto escalar. Modulo.

Consideramos un R–espacio vectorial V , en principio no necesariamente de dimensionfinita.

Definicion.– Un producto escalar definido sobre V es una forma bilineal simetrica θ :V × V −→ R que verifica

θ(u, u) > 0 ⇐⇒ u 6= 0.

El par (V, θ) se denomina un espacio vectorial euclıdeo. Habitualmente sustituimos θpor un operador de notacion multiplicativa. En concreto, usaremos en general la notacionθ(u, v) = u · v y el espacio vectorial euclıdeo quedara entonces notado (V, ·). La matrizde θ respecto de una base B quedara notada por MB(·).

En este contexto cuando dos vectores u y v son ortogonales (esto es; u · v = 0, 5.2.),esto se suele denotar u ⊥ v.

Definicion.– El numero real no negativo√

u · u se denomina modulo del vector u, y sedenota por ||u||.

Proposicion.– Dados u, v ∈ V , se verifica:

(a) ||αu|| = |α| ||u||.

(b) ||u|| = 0 ⇐⇒ u = 0.

(c) |u · v| ≤ ||u|| ||v||, con igualdad si y solo si u y v son linealmente dependientes(desigualdad de Cauchy–Schwartz).

(d) ||u + v|| ≤ ||u|| + ||v|| (desigualdad triangular).

(e) ||u + v||2 = ||u||2 + ||v||2 si y solo si u ⊥ v (teorema de Pitagoras).

Demostracion.– Las propiedades (a) y (b) se reducen a aplicar la definicion de formadirecta.

Para ver (c) notemos que, si u = αv, se tiene la igualdad ||u + v|| = ||u|| + ||v|| sinmas que sustituir.

Page 94: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Por otro lado, u y v son linealmente independientes si y solo si no existe α ∈ R talque u + αv = 0, lo que a su vez equivale a que no exista α ∈ R tal que ||u + αv|| = 0,y esto ocurre si y solo si no existe α ∈ R tal que ||u + αv||2 = 0. Pero esto es lo mismoque decir que no existe solucion para la ecuacion (en α)

0 = ||u + αv||2 = ||u||2 + 2αu · v + α2||v||2,que, como sabemos, no tiene solucion si y solo si el discriminante es negativo, esto es, siy solo si

4(u · v)2 − 4||u||2||v||2 < 0 ⇐⇒ |u · v| ≤ ||u|| ||v||

El apartado (d) es consecuencia directa del siguiente desarrollo:

||u + v||2 = (u + v)(u + v) = ||u||2 + 2u · v + ||v||2≤ ||u||2 + 2|u · v| + ||v||2 ≤ ||u||2 + 2||u|| ||v|| + ||v||2= (||u|| + ||v||)2,

donde hemos aplicado (en la segunda desigualdad) el apartado (c). Ademas, la primeralınea prueba el apartado (e).

Observacion.– La desigualdad triangular es igualdad si y solo si u y v son linealmentedependientes y, ademas, u · v ≥ 0.

Observacion.– Un R–espacio vectorial V (no necesariamente de dimension finita) juntocon una aplicacion de V en los reales no negativos

|| · || : X −→ R+

x 7−→ ||x||que verifique las propiedades (a), (b) y (d) anteriores se denomina un espacio vectorialesnormado. Estos espacios aparecen con mucha frecuencia en otras ramas de la Matematica,como la Topologıa y el Analisis, donde el termino norma sustituye habitualmente al demodulo.

Las propiedades (c) y (e) son tambien comunes a todos los espacios vectoriales nor-mados.

Ejemplos.– Veamos algun ejemplo conocido (y algun no otro tanto) de espacio vectorialeuclıdeo:

(a) Para V = Rn un primer ejemplo obligado es el del producto escalar clasico,definido por

u = (a1, ..., an)v = (b1, ..., bn)

}

=⇒ u · v = a1b1 + ... + anbn

(b) Consideremos C([a, b]) el espacio de funciones continuas en el intervalo [a, b]. En-tonces

f(x) · g(x) =∫ b

a(fg) (x)dx

es un producto escalar. La norma asociada se suele denotar

||f ||2 =

∫ b

af(x)2dx.

Notemos que, por ejemplo, si sustituimos el espacio por el de las funcionesRiemann–integrables, la misma operacion no define un producto escalar.

Page 95: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Observacion.– Dado un producto escalar en un espacio n–dimensional, si B es una basetal que MB(·) es diagonal, los elementos de la diagonal son los productos de los elementosde la base por sı mismos, luego han de ser todos positivos. En particular, la matriz delproducto, respecto de cualquier base, siempre tiene rango n.

5.7. Ortonormalidad. Bases ortonormales.

Consideraremos a partir de ahora (V, ·) un espacio vectorial euclıdeo de dimension n.

Definicion.– Recordemos que, dada una aplicacion bilineal simetrica θ, un conjunto devectores S = {u1, ..., ur} se dice ortogonal cuando los vectores de S lo son dos a dos;esto es, cuando θ(ui, uj) = 0 para todo i 6= j. Si, ademas, θ es un producto escalar y en Sse verifica que para todo i = 1, ..., r, ||ui|| = 1, S se denomina un conjunto ortonormal.

Ejemplo.– La base canonica es una base ortonormal para el producto escalarclasico. Una base ortogonal de R3 para el mismo producto escalar es, por ejemplo,{(1, 1, 1), (1,−1, 0), (1, 1,−2)}.

Proposicion.– Dado un subespacio vectorial L, L⊥ es tambien un subespacio vectorialque verifica L ⊕ L⊥ = V .

Demostracion.– Si tomamos una base de L, BL = {u1, ..., ur}, entonces v ∈ L⊥ si ysolo si v ⊥ ui. Si notamos A ∈ M(r×n;R) la matriz que verifica F (A)i = ui, entoncesun vector (x1, ..., xn) ∈ L⊥ si y solo si

AM(·)

x1...

xn

= 0r×1.

Esto prueba que L⊥ es un subespacio vectorial de dimension n−rg(A) = n−dim(L).Ademas, es elemental que u ⊥ u si y solo si u = 0, por lo que L ∩ L⊥ = {0}. Por tanto,usando el teorema de la dimension,

dim(L + L⊥) = dim(L) + dim(L⊥) − dim(L ∩ L⊥) = n,

lo que prueba el resultado.

Proposicion.– Dados subespacios L1 y L2 de V se verifica:

(a) V ⊥ = {0}, {0}⊥ = V .

(b) (L1 + L2)⊥ = L⊥

1 ∩ L⊥2 .

(c) (L1 ∩ L2)⊥ = L⊥

1 + L⊥2 .

(d) (L⊥)⊥ = L.

Demostracion.– La primera propiedad es directa. En cuanto a (b) y (c), dado que sonsimilares, probaremos una, por ejemplo (b), y dejaremos (c) como ejercicio.

Page 96: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

En primer lugar, si v ∈ (L1 + L2)⊥, entonces v ha de ser ortogonal, en particular, a

todos los vectores de L1 y L2 y, en consecuencia, v ∈ L⊥1 ∩L⊥

2 . Para ver la otra inclusionbasta recordar que todo vector u ∈ L1 + L2 se puede expresar como u = u1 + u2, conui ∈ Li (Algebra Lineal, 5.9.). Entonces si v ∈ L⊥

1 ∩ L⊥2 ,

v · u = v · (u1 + u2) = v · u1 + v · v2 = 0,

lo que prueba el resultado.

Por su parte, el apartado (d) es directo de observar que L ⊂ (L⊥)⊥ (por definicion desubespacio ortogonal) y

dim[

(L⊥)⊥]

= n − dim(L⊥) = dim(L).

Para finalizar damos una caracterizacion de los productos escalares en funcion de laexistencia de bases ortonormales.

Proposicion.– Sea θ una forma bilineal simetrica. Entonces son equivalentes:

(a) θ es un producto escalar.

(b) Existe una base ortonormal de V .

(c) rg(θ) = sg(θ) = dim(V ).

Demostracion.– Veamos (b) ⇐⇒ (c). Si existe una base ortonormal B, es inmediatode la definicion que MB(θ) = In, por lo que, del teorema de Sylvester deducimos que severifica (c). En el otro sentido, las condiciones sobre el rango y la signatura implican laexistencia de una base B tal que MB(θ) = In. Entonces B es ortonormal.

Para finalizar haremos (a) ⇐⇒ (c). Por un lado, si θ es un producto escalar, podemoshallar una base B que diagonaliza a θ y que verifique que los elementos de la diagonal deMB(θ) son 1, −1 o 0. Pero, para verificar que θ es producto escalar sobre los vectores deB, han de ser todos 1. En el otro sentido, podemos escoger una base ortonormal B de Vy, entonces,

(u)B = (a1, ..., an)(v)B = (b1, ..., bn)

}

=⇒ u · v = (a1 ... an)

b1...bn

= a1b1 + ... + anbn,

que verifica facilmente la condicion de producto escalar.

Observacion.– Una lectura del resultado anterior es que, salvo cambio de base, todoproducto escalar definido en un R–espacio vectorial de dimension finita es el productoescalar clasico.

Observacion.– Sea L ⊂ V un subespacio vectorial. La union de bases ortonormales deL y L⊥ es una base ortonormal de V (ver 3.10.).

Page 97: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

5.8. Algoritmo de Gram–Schmidt. Matrices ortogonales.

Nos dedicaremos en esta leccion a disenar un procedimiento para obtener una baseortonormal. Como vimos en la pasado leccion, una vez que sepamos hallar esta base,podremos considerar en lo sucesivo que todo espacio vectorial euclıdeo es, salvo isomor-fismo y cambio de base, Rn con el producto escalar habitual.

Fijamos por tanto un R–espacio vectorial euclıdeo (V, ·) de dimension n. Vamos adar una prueba constructiva del siguiente resultado que ya probamos en la pasada leccion.

Proposicion.– Dado un subespacio L, existe una base ortonormal de L.

Demostracion.– Partimos de una base de L, BL = {u1, ..., ur}. Consideremos en-tonces los siguientes vectores:

v1 = u1

v2 = u2 −v1 · u2

v1 · v1

v1

......

vr = ur −v1 · ur

v1 · v1

v1 − ... − vr−1 · ur

vr−1 · vr−1

vr−1

y comprobemos que forman una base ortogonal.

Para ello, probaremos por induccion que, dado un vector vi, este es ortogonal a todoslos vj , con j < i. Esto, junto con el hecho de que el producto escalar es conmutativo,prueba que el conjunto {v1, ..., vr} es ortogonal. Para probar el caso i = 2, solo hay quecomprobar que

v1 · v2 = v1 ·(

u2 −v1 · u2

v1 · v1

v1

)

= v1 · u2 −v1 · u2

v1 · v1

v1 · v1 = 0.

Para el caso general, supondremos cierto el resultado para los vectores v1, ..., vi−1 ylo probaremos para vi. Entonces, si j < i,

vi · vj =

(

ui −v1 · ui

v1 · v1

v1 − ... − vi−1 · ui

vi−1 · vi−1

vi−1

)

· vj

= ui · vj −v1 · ui

v1 · v1

v1 · vj − ... − vi−1 · ui

vi−1 · vi−1

vi−1 · vj

y, por hipotesis de induccion, todos los sumandos anteriores son 0, salvo el correspondi-ente a vj . Ası,

vi · vj = ui · vj −vj · uj

vj · vj

vj · vj = 0.

Solo resta comprobar que {v1, ..., vr} son base de L. Pero para ello basta comprobarque, en efecto, son vectores de L y que cada vi se puede escribir como

vi = ui + α1u1 + ... + αi−1ui−1,

para ciertos α1, ..., αi−1 ∈ R que dependen de vi, pero que carentes de importancia aestos efectos (esto es un ejercicio sencillo de induccion). Ası, la matriz B definida por

Page 98: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

C(B)i = (vi)tBL

verifica

|B| =

1 ∗ ... ∗0 1 ... ∗...

... . . . ...0 0 ... 1

= 1,

y, por tanto (ver 3.2.) el conjunto {v1, ..., vr} es linealmente independiente, luego sonbase de L al ser dim(L) = r.

Una vez hecho esto, la base ortonormal buscada es simplemente

B =

{

1

||u1||u1, ...,

1

||ur||ur

}

.

Observacion.– El procedimiento anterior se denomina algoritmo de ortonormalizacionde Gram–Schmidt.

Proposicion.– Sea B una base ortonormal de V . Entonces otra base, B′, es ortonormal siy solo si se verifica

M(B′,B)tM(B′,B) = In.

Demostracion.– Basta recordar que

MB′(·) = M(B′,B)tMB(·)M(B′,B) = M(B′,B)tM(B′,B),

ası como el hecho de que una base es ortonormal si y solo si la matriz que determina parael producto escalar es la identidad.

Definicion.– Sea A ∈ M(n;R). Si A verifica At · A = In (o, lo que es igual, queAt = A−1), A se denomina matriz ortogonal (no ortonormal). El conjunto de las matricesortogonales se denota por O(V ) y es de manera elemental un grupo para el producto dematrices.

Proposicion.– Sea f ∈ End(V ). Son equivalentes:

(a) La matriz de f respecto de una base ortonormal es ortogonal.

(b) Para cualesquiera u, v ∈ V , f(u) · f(v) = u · v (f preserva productos escalares).

(c) Para cualquier u ∈ V , ||f(u)|| = ||u|| (f preserva modulos).

Demostracion.– Haremos primero (a) =⇒ (b). Para ello fijemos B una base ortonor-mal, A = MB(f), y entonces

f(u) · f(v) = [f(u)]B[f(v)]tB = (u)BAtA(v)tB = (u)B(v)t

B = u · v

En el otro sentido, partiendo de (b) es facil llegar a (a) porque, como f preservaproductos escalares, las imagenes de una base ortonormal, B, por f (esto es, las columnasde A = MB(f)) han de formar, ası mismo, una base ortonormal B′ = {v1, ..., vn}. Dadoque el elemento (i, j) de AtA es, precisamente,

F (At)iC(A)j = (vi)B(vj)tB = δij,

Page 99: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

por lo que AtA = In.

Por ultimo (b) =⇒ (c) es elemental; y no lo es menos la implicacion inversa, con soloescribir, para cualesquiera u, v ∈ V ,

u · v =1

2

(

||u + v||2 − ||u||2 − ||v||2)

.

Definicion.– Un endomorfismo f que verifica alguna (y, por tanto, todas) de laspropiedades anteriores se denomina un endomorfismo ortogonal (o, en segun que con-textos, isometrıa).

5.9. Complementos a los productos escalares.

Observacion.– Finalizamos este tema dando, sin demostrar, un teorema que nos permite,en ciertos casos, pedir a una base que diagonaliza un endomorfismo la condicion extra deortonormalidad (esto no es, en general, posible) y una caracterizacion muy simple y util(la demostracion no lo es tanto) de los productos escalares.

Teorema.– Sea B una base ortonormal de (V, ·), f ∈ End(V ) y A = MB(f).

(a) Si A es ortogonal, f es C–diagonalizable y existe C, base ortonormal de tal queMC(f) es diagonal por bloques, a lo mas 2 × 2. Es mas, todos sus autovalores sonnumeros complejos de modulo 1.

(b) Si A es simetrica, f es R–diagonalizable y existe C, base ortonormal tal que MC(f)es diagonal.

Observacion.– Veamos como el teorema anterior nos permite, si A es ortogonal, daruna tal base C. En efecto, como A es C–diagonalizable, tendremos que existe una baseB′ = {u1, ..., um} de Cm tal que

ui = (a1i + ıb1i, ..., ami + ıbmi)

y, por ser A una matriz real, por cada autovector no real como el de arriba debe estartambien el autovector conjugado

uj = (a1j − ıb1j, ..., amj − ıbmj) .

Esto es equivalente al hecho de que cada raız compleja de una ecuacion real aparecejunto con su conjugada. Entonces, si suponemos j = i + 1, sustituimos el par (ui , ui+1)por (vi, vi+1), con

vi = (a1i, ..., ami) , vi+1 = (b1i, ..., bmi) .

La base obtenida C = {v1, ..., vm}, verifica que MC(f) es de la forma buscada. Dehecho, si ui esta asociado a α = a + ıb y ui+1 a a − ıb, la submatriz de MC(f) formadapor las filas y columnas i–esima e (i + 1)–esima es, precisamente,

(

a b−b a

)

.

Page 100: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

El motivo de esto es porque

A (vi + ıvi+1)t = (a + ıb) (vi + ıvi+1)

t ,

y, separando en parte real e imaginaria, obtnemos

Avti = avt

i − bvti+1, Avt

i+1 = bvi + avi+1.

Observacion.– En cuanto a como conseguir, si A es simetrica, una base C tal y comoplantea el enunciado, es muy sencillo: basta hallar una base que diagonalice f y aplicarleel algoritmo de Gram–Schmidt. La razon es que, si u y v son autovectores provenientesde autovalores distintos, pongamos α y β, entonces u ⊥ v. En primer lugar notemos que,para cualesquiera z y w, tenemos que

w · f(z) = wAzt = f(w) · z

y, por tanto,u · f(v) = β(u · v) = f(u) · v = α(u · v),

de donde se tiene el resultado. En realidad podemos aplicar Gram–Schmidt a cada sube-spacio invariante por separado. La union de las bases halladas sera una base ortonormalde V que diagonaliza a f .

Teorema.– Sea V un k–espacio vectorial de dimension m, B una base de V y θ unaaplicacion bilineal simetrica con A = MB(θ). Denotemos por ∆i, con i = 1, ...,m; eldeterminante de la submatriz de A formada por las i primeras filas y columnas. Entoncesson equivalentes:

(a) θ es un producto escalar.

(b) ∆i > 0 para i = 1, ...,m.

Demostracion.– Veamos primero (a) =⇒ (b). Suponemos que θ es un producto es-calar y, por tanto, podemos construir una base ortogonal B ′, siguiendo el algoritmo deGram–Schmidt. Como vimos en la pasada leccion

P = M(B′,B) =

1 ∗ ... ∗0 1 ... ∗...

... . . . ...0 0 ... 1

,

esto es, es triangular inferior con todos los elementos diagonales iguales a 1. Veamos queentonces su inversa, P−1 = Q = M(B,B′), verifica ambas propiedades tambien.

Por un lado sabemos que el elemento qij es Pji/|P |, donde Pji es el adjunto del ele-mento (j, i) de P . Si tomamos entonces j < i, para hallar un elemento de Q por debajo dela diagonal, hemos de calcular el adjunto del elemento pji, que se encuentra por encimade la diagonal. Pero es obvio que Pji es un determinante de una matriz triangular superiorcon un cero en la diagonal, ya que, al ser j 6= i, si eliminamos F (P )j y C(P )i estamosquitando dos unos de la diagonal. Por tanto, Pji = 0 y Q es triangular superior.

Page 101: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

Para ver que en la diagonal solo aparecen unos, no hay mas que recobrar el razona-miento anterior: el elemento qii es Pii/|P |, pero, por ser P triangular inferior con unos enla diagonal, es elemental que Pii = |P | = 1.

Por otro lado, al ser B′ ortogonal,

B = MB′(θ) =

α1

α2

. . .αm

,

y, por ser θ producto escalar, ha de ser αi > 0 para i = 1, ...,m. Ademas, como vimos en5.2., A = QtBQ.

Escribamos ahora las matrices anteriores separando en bloques: hacemos uno con lasprimeras i filas y columnas (que notaremos Ai, Qi y Bi, respectivamente) y completamos.Entonces obtenemos

(

Ai S1

S2 S3

)

=

(

Qti 0i×(n−i)

T t1 T t

2

)

(

Bi 0i×(n−i)

0(n−i)×i U

)(

Qi T1

0(n−i)×i T2

)

=

(

QtiBiQi ∗∗ ∗

)

Ası pues ∆i = |Qi| |Bi| |Qi| = α1...αi > 0.

Pasamos a demostrar (b) =⇒ (a). Ahora suponemos que ∆i > 0 para todo i, y vamosa usar este hecho para construir una base ortogonal {v1, ..., vm} tal que θ(vi, vi) > 0 paratodo i. Una vez hecho esto, es ya trivial que para todo v ∈ V ,

v =m∑

i=1

αivi =⇒ θ(v, v) =m∑

i=1

α2i θ (vi, vi) > 0,

con lo que θ es producto escalar.

En concreto, si denotamos de nuevo Ai la submatriz de A formada por las i primerasfilas y columnas, y, como de costumbre (Ai)jl el adjunto del elemento (j, l) de Ai, en-tonces vamos a definir

vi = ((Ai)1i, ..., (Ai)ii, 0, ..., 0) ,

esto es, vi tiene en sus i primeras coordenadas los adjuntos de los elementos de la columnai de Ai. Notemos que (Ai)ii = ∆i−1.

Es sencillo ver que, entonces

viA = (0 0 ... 0 ∆i 0 ... 0) ,

ya que viC(A)i es precisamente el desarrollo de ∆i por los adjuntos de C(Ai)i. Sinembargo, viC(A)j , cuando j 6= i, es el desarrollo de una columna (de una submatriz deorden i de A) por los adjuntos de otra, lo cual siempre da 0.

Esto prueba que:

(a) vi es ortogonal a v1, ..., vi−1. En consecuencia, el conjunto {v1, ..., vm} es ortogo-nal.

Page 102: Metodos· Matematicos· de la F· sica Ieuclides.us.es/da/apuntes/fisica/NotasMMF1cuatrimestre1.pdf · 2014-12-02 · z 2 C, pero nunca puede estar en A\B, por lo que z 2 C n(A\B)

Metodos Matematicos de la Fısica I: Teorıa. Curso 2006/07. Departamento de Algebra. http://www.us.es/da

(b) θ(vi, vi) = ∆i∆i−1 > 0.

Por tanto, solo resta probar que {v1, ..., vm} es base para terminar de probar (b). Peroesto es elemental, pues la matriz cuyas columnas son los vi es triangular superior y, porhipotesis, los elementos de la diagonal son no nulos.