factorización de matrices - · pdf filecapítulo 6 factorización de...

26
CAPÍTULO 6 Factorización de matrices En este capítulo se estudian algunas de las técnicas más utilizadas para factorizar matrices, es decir, técnicas que permiten escribir una matriz como producto de dos o tres matrices con una estructura especial. La factorización de matrices es importante por ejemplo cuando se quiere resolver sistemas de ecuaciones con un número muy grande tanto de variables como de ecuaciones, pero también cuando se quieren resolver sistemas simultáneos de ecuaciones. En la sección 6.1 se tratará la descomposición LU , en la sección 6.2 se abordará la descomposición QR, en la sección 6.3 se tratará la descomposición de Cholesky y en la sección 6.4 se abordará aspectos relativos a la descomposición en valores singulares. 6.1. Descomposición LU En esta sección se estudia, quizás la factorización de matrices más sencilla pero igualmente muy útil. Se trata de la factorización o descomposición LU , la cual está directamente relacionada con las operaciones elementales aplicadas a una matriz, para llevarla a una forma triangular inferior. Como una motivación, suponga que se conoce cómo factorizar una matriz A� m × n en la forma (6.1) A = LU donde L es una matriz triangular inferior (del inglés lower) m × m y U es una matriz escalonada m × n (del inglés upper). Entonces el sistema (6.2) Ax = b puede resolverse de la siguiente forma: Usando (6.1), el sistema (6.2) se puede escribir en la forma (6.3) LU x)= b. En este punto se introduce una nueva variable (por sustitución) y = U x, obteniendo así el nuevo sistema (6.4) Ly = b. Una vez en este punto, se resolve dicho sistema para la variable ymediante sustitución hacia adelante. Como paso final, usamos sustitución hacia atrás para resolver el sistema (6.5) U x = y. Es de anotar, que los sistemas (6.4) y (6.5) son relativamente fáciles de resolver dado que se trata de matrices de coeficientes triangulares inferiores y superiores respectivamente. La factorización o descomposición LU es particularmente útil cuando se requiere resolver de manera simultánea varios sistemas de ecuaciones que difieren únicamente en la parte no homogénea. El siguiente resultado da condiciones suficientes para la existencia de una tal factorización LU para una matriz cuadrada A. Posteriormente se extenderá a matrices rectangulares. �3�

Upload: lamhuong

Post on 12-Feb-2018

227 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

CAPÍTULO 6

Factorización de matrices

En este capítulo se estudian algunas de las técnicas más utilizadas para factorizar matrices, es decir, técnicasque permiten escribir una matriz como producto de dos o tres matrices con una estructura especial. Lafactorización de matrices es importante por ejemplo cuando se quiere resolver sistemas de ecuaciones conun número muy grande tanto de variables como de ecuaciones, pero también cuando se quieren resolversistemas simultáneos de ecuaciones. En la sección 6.1 se tratará la descomposición LU , en la sección 6.2 seabordará la descomposición QR, en la sección 6.3 se tratará la descomposición de Cholesky y en la sección6.4 se abordará aspectos relativos a la descomposición en valores singulares.

6.1. Descomposición LU

En esta sección se estudia, quizás la factorización de matrices más sencilla pero igualmente muy útil. Setrata de la factorización o descomposición LU , la cual está directamente relacionada con las operacioneselementales aplicadas a una matriz, para llevarla a una forma triangular inferior. Como una motivación,suponga que se conoce cómo factorizar una matriz A� m× n en la forma

(6.1) A = LU

donde L es una matriz triangular inferior (del inglés lower) m ×m y U es una matriz escalonada m × n(del inglés upper). Entonces el sistema

(6.2) Ax = b

puede resolverse de la siguiente forma: Usando (6.1), el sistema (6.2) se puede escribir en la forma

(6.3) L�Ux) = b.

En este punto se introduce una nueva variable (por sustitución) y = Ux, obteniendo así el nuevo sistema

(6.4) Ly = b.

Una vez en este punto, se resolve dicho sistema para la variable y� mediante sustitución hacia adelante.Como paso final, usamos sustitución hacia atrás para resolver el sistema

(6.5) Ux = y.

Es de anotar, que los sistemas (6.4) y (6.5) son relativamente fáciles de resolver dado que se trata de matricesde coeficientes triangulares inferiores y superiores respectivamente. La factorización o descomposición LUes particularmente útil cuando se requiere resolver de manera simultánea varios sistemas de ecuaciones quedifieren únicamente en la parte no homogénea.

El siguiente resultado da condiciones suficientes para la existencia de una tal factorización LU para unamatriz cuadrada A. Posteriormente se extenderá a matrices rectangulares.

�3�

Page 2: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

6.1. Descomposición LU Factorización de matrices

6.1. Teorema (Factorización ). Sea A una matriz cuadrada n × n. Supongamos que A se puede reducirpor filas a una matriz triangular superior, U aplicando únicamente operaciones elementales de eliminación(operaciones del tipo αFi +Fj con i < j). Entonces existe una matriz triangular inferior L que es invertibley posee unos en su diagonal principal, tal que

A = LU.

Si A es invertible, entonces esta descomposición es única.

Demostración� Por hipótesis, existen matrices elementales E1� E2� . . . � Ek del tipo (αFi +Fj � i > j)y una matriz U (triangular superior) tales que

EkEk−1 · · ·E2E1A = U.

De aquí se obtiene A = E−11 E−1

2 · · ·E−1k U.

Ahora bien, por construcción, cada matriz elemental E1� E2� . . . � Ek es triangular inferior y tiene unos ensu diagonal principal, por consiguiente sus inversas E−1

1 � E−12 � · · · � E−1

k y la matriz L = E−11 E−1

2 · · ·E−1k

también tienen las mismas características (ver ejercicio 5 de la sección 6.1). Lo que implica que se haobtenido la factorización LU buscada para la matriz A� es decir:

A = LU�

Para demostrar la unicidad de dicha factorización se procede como es usual. Supóngase que se tienen dosfactorizaciones LU para A de la forma

A = L1U1 = L2U2�

con U1� U2 matrices triangulares superiores y L1� L2 matrices triangulares inferiores con unos en su diagonalprincipal. Como A es invertible las matrices U1� U2 también lo son, más aún sus inversas son igualmentetriangulares superiores (ver ejercicio 6 de la sección 6.1). De esta última igualdad se obtiene entonces

L−12 L1 = U2U

−11 .

El lado izquierdo de esta igualdad es producto de matrices triangulares inferiores con unos en la diagonal,por tanto es triangular inferior y tiene unos en la diagonal principal. Igualmente, el lado derecho es unatriangulares superiores, pues es el producto de matrices triangulares superiores (ver ejercicio 6 de la sección6.1). Entonces L−1

2 L1 = I� de esto se sigue que L2 = L1 y por ende,

U1 = U2.

En el ejemplo 6.5 se considerará una matriz no invertible, que posee infinitas descomposiciones LU.

6.2. Ejemplo. Considere la matriz 3× 3� A =

2

41 4 72 5 83 6 12

3

5 . Aplique operaciones elementales, sin inter-

cambio, para llevar a la matriz A a una forma escalonada.2

41 4 72 5 83 6 12

3

5 −2F�+F2−→−3F�+F3

2

41 4 70 −3 −60 −6 −9

3

5

−2F2+F3−→

2

41 4 70 −3 −60 0 3

3

5 = U

132

Page 3: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

Factorización de matrices 6.1. Descomposición LU

Si se denota entonces con E1, E2 y E3 a las matrices elementales provenientes de las operaciones elementales−2F1 + F2� −3F1 + F3 y −2F2 + F3 respectivamente, entonces se obtiene

E3E2E1A = U

A = �E3E2E1)−1U

= E−11 E−1

2 E−13 U

=

2

41 0 02 1 00 0 1

3

5

2

41 0 00 1 03 0 1

3

5

2

41 0 00 1 00 2 1

3

5U

=

2

41 0 02 1 03 2 1

3

5

2

41 4 70 −3 −60 0 3

3

5 = LU .

En este caso esta factorización es única. �

6.3. Observación. Como sólo se han efectuado operaciones del tipo αFi + Fj con i < j, �αFi + Fj)−1 =

�−α)Fi + Fj y L es triangular inferior con unos (1’s) en su diagonal principal. La información sobre L sepuede almacenar en aquellas posiciones donde se obtienen los ceros (0’s) de U� simplemente colocando losopuestos de los multiplicadores α en las operaciones elementales aplicadas del tipo αFi + Fj con i < j.

En el ejemplo anterior

2

41 4 72 5 83 6 12

3

5 −2F�+F2−→−3F�+F3

2

41 4 72 −3 −63 −6 −9

3

5

−2F2+F3−→

2

41 4 72 −3 −63 2 3

3

5

de donde se obtiene que

L =

2

41 0 02 1 03 2 1

3

5 y U =

2

41 4 70 −3 −60 0 3

3

5

son tales que A = LU .

6.4. Ejemplo. Considere la matriz

A =

2

664

2 3 2 44 10 −4 0

−3 −2 −5 −2−2 4 4 −7

3

775 .

Aplíquense las operaciones elementales, sin intercambio, para llevar la matriz A a una forma escalonada

133

Page 4: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

6.1. Descomposición LU Factorización de matrices

2

664

2 3 2 44 10 −4 0

−3 −2 −5 −2−2 4 4 −7

3

775

�−2)F�+F2

�3/2)F�+F3

−→�1)F�+F4

2

664

2 3 2 42 4 −8 −8

−3/2 5/2 −2 4−1 7 6 −3

3

775

�−5/8)F2+F3

�−7/4)F2+F4

−→

2

664

2 3 2 42 4 −8 −8

−3/2 5/8 3 9−1 7/4 20 11

3

775

�−20/3)F3+F4

−→

2

664

2 3 2 42 4 −8 −8

3/2 5/8 3 9-1 7/4 20/3 −49

3

775 �

de donde se obtiene que

L =

2

664

1 0 0 02 1 0 0

−3/2 5/8 3 0−1 7/4 20/3 1

3

775 y U =

2

664

2 3 2 40 4 −8 −80 0 3 90 0 0 −49

3

775 �

son matrices tales que A = LU� siendo esta factorización única. �

6.5. Ejemplo. Considere la matriz A =

2

41 2 3

−1 −2 −32 4 6

3

5 . Se procede entonces a aplicar operaciones

elementales, sin intercambio, para llevar la matriz A a una forma escalonada2

41 2 3

−1 −2 −32 4 6

3

5�1)F1 + F2

−→�−2)F1 + F3

2

41 2 3−1 0 02 0 0

3

5

de donde se obtiene que

U =

2

41 2 30 0 00 0 0

3

5 y L =

2

41 0 0

−1 1 02 x 1

3

5 con x arbitrario.

En este caso A = LU� donde L no es única. �

Considere ahora el caso en que se necesitan intercambio de filas para poder reducir una matriz. Existe en estecaso un procedimiento que permite extender la factorización LU , el cual hace uso de matrices permutación.

Como se recordará, el intercambio de dos filas de una matriz A se puede expresar como PiA, siendo Pi

la matriz permutación correspondiente a las filas de A que deseamos intercambiar. Ahora bien. Si durantela reducción de A a una forma escalón necesitamos realizar P1� . . . � Pk permutaciones de filas, éstas puedehacerse al comienzo de todo el procedimiento y producir así la matriz P = P1 · · ·Pk. El paso siguienteconsiste entonces en aplicar la factorización LU a la matriz PA en lugar de la matriz A. Es decir, nosotrosbuscamos ahora matrices L (triangular inferior) y U (triangular superior) tales que

PA = LU .

6.6. Ejemplo. Halle la descomposición para la matriz

A =

2

40 2 32 −4 71 −2 5

3

5 .

134

Page 5: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

Factorización de matrices 6.1. Descomposición LU

En este caso, para reducir A a una matriz triangular superior U es necesario primero una o varias operacioneselementales del tipo permutación de filas (también es posible usar operaciones del tipo αFi +Fj con i > j).Una de tales operaciones de intercambio puede ser F12. Si se denota con P a la correspondiente matrizpermutación se obtiene entonces

PA =

2

42 −4 70 2 31 −2 5

3

5 .

A esta nueva matriz se le aplican los pasos descritos en los ejemplos anteriores pa obtener2

42 −4 30 2 31 −2 5

3

5 �1/2)F1 + F3

−→

2

42 −4 70 2 3

1/2 0 3/5

3

5

de aquí se sigue que

L =

2

41 0 00 1 0

1/2 0 1

3

5 y U =

2

42 −4 70 2 30 0 3/5

3

5

son matrices tales que

PA = LU . �

6.7. Teorema. Sea A una matriz invertible n× n. Entonces existe una matriz de permutación P tal que

PA = LU

donde L es una matriz triangular inferior y U es una matriz triangular superior. Se tiene además, que paracada matriz P , L y U son únicas.

El siguiente teorema recoge ahora la formulación para la descomposición LU para matrices A rectangularesm× n. El esquema para una factorización LU para una matriz Am×n está dado por la gráfica 6.1, la cualcorresponde respectivamente a los casos m = n� m < n y m > n.

6.8. Teorema. Sea A una matriz rectangular m×n que se puede reducir a una forma escalonada efectuandoúnicamente operaciones elementales de eliminación (operaciones del tipo αFi + Fj con i < j). Entoncesexiste una matriz m ×m triangular inferior L con unos en la diagonal principal y una matriz m × n, Ucon uij = 0� si i > j tales que

A = LU.

6.9. Ejemplo. Encontre la descomposición LU para la matriz

A =

2

41 4 7 22 5 8 −13 6 12 3

3

5

3×4

.

Aplique para ello, operaciones elementales, sin intercambio, para llevar a la matriz A a una forma escalonada2

41 4 7 22 5 8 −13 6 12 3

3

5�−2)F1 + F2

−→�−3)F1 + F3

2

41 4 7 22 −3 −6 −53 −6 −9 −3

3

5

�−2)F1 + F2

−→

2

41 4 7 22 −3 −6 −53 2 3 7

3

5

135

Page 6: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

6.1. Descomposición LU Factorización de matrices

AL

0

0

A

AL

0

U0

U

L

0

0

U

Figura 6�1� Esquema de la factorización LU

de donde se obtiene que

L =

2

41 0 02 1 03 2 1

3

5 y U =

2

41 4 7 20 −3 −6 −50 0 3 7

3

5

son tales que A = LU. �

El siguiente ejemplo, ilustra cómo hacer uso de la descomposición LU en el proceso de resolver resolversistemas lineales de ecuaciones.

6.10. Ejemplo. Considere el sistema de ecuaciones

x1 + 4x2 + 7x3 = 1

2x1 + 5x2 + 8x3 = 2

3x1 + 6x2 + 12x3 = 4

cuya matriz de coeficientes corresponde a la matriz A del ejemplo 6.2 y cuyo término independiente esbT =

ˆ1 2 4

˜. De acuerdo con dicho ejemplo se tiene

A =

2

41 4 72 5 83 6 12

3

5 =

2

41 0 02 1 03 2 1

3

5

2

41 4 70 −3 −60 0 3

3

5 = LU

Ahora bien planteamos el sistema Lz = b, esto es8><

>:

z1 = 1

2z1 + z2 = 2

3z1 + 2z2 + z3 = 4

cuya solución es

z =

2

4101

3

5 .

136

Page 7: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

Factorización de matrices 6.1. Descomposición LU

Con esta solución planeamos el sistema Ux = z, esto es el sistema8><

>:

x1 + 4x2 + 7x3 = 1

−3x2 − 6x3 = 0

3x3 = 1

y cuya solución es

x1 = 4/3; x2 = −2/3 x3 = 1/3. �

6�1 Ejercicios

En los ejercicios 1 al 4 responda falso o verdadero justificando su respuesta

1. Las operaciones elementales en las filas del tipo αFi +Fj con i < j, producen matrices elementalestriangulares inferiores.

2. Las operaciones elementales en las columnas del tipo αCi + Cj con i < j, producen matriceselementales triangulares inferiores.

3. El producto de dos matrices elementales del mismo tamaño, es una matriz elemental.4. La descomposición LU para cualquier matriz A es única.

En los ejercicios 5 al 6 demuestre la afirmación correspondiente

5. Suponga que Li, (i = 1� 2)� son matrices triangulares inferiores:a) Muestre que el producto L1L2 es una matriz triangular inferior.b) Mueste que si L1es invertible, entonces su inversa L−1

1 es también una matriz triangular inferior(Sug.: use inducción matemática)

c) Muestre que si los elementos de la diagonal principal de L1 y L2 son tosdo iguales a 1 (uno),entonces las matrices L1L2, L

−11 y L−1

2 también tienen unos en su diagonal principal. (Sug.:use inducción matemática)

6. Use el ejercicio anterior para demostrar que las afirmaciones son igualmente válidas para matricestriangulares superiores.

7. Use la factorización LU dada para resolver el sistema de ecuaciones lineales

a)

»1 0

−3 1

– »4 10 −1

x =

»−11

32

b)

»1 05 1

– »2 10 −7

x =

»1246

c)

2

41 0 04 1 0

−2 3 1

3

5

2

42 −2 10 3 10 0 −2

3

5 x =

2

427

−3

3

5

d)

2

41 0 04 1 0

−7 3 1

3

5

2

4−1 2 1

0 3 −10 0 −5

3

5 x =

2

4039

3

5

8. Calcule la descomposición LU de la matriz

A =

2

41 3 −1 22 7 1 1

−1 2 17 3

3

5 .

Use dicha descomposición para resolver el sistema Ax = y, yT =ˆ

5 18 14˜.

137

Page 8: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

6.2. Descomposición QR Factorización de matrices

9. Considere la matriz simétrica positiva definida S =

2

44 2 02 9 40 4 5

3

5 y calcule su descomposición LU.

6.2. Descomposición QR

En esta sección se hablará de la descomposición QR de una matriz, donde Q es una matriz con columnasortogonales (ortonormales) y R es una matriz triangular inferior. Dicha descomposición es de gran impor-tancia para resolver problemas de mínimos cuadrados y tiene una estrecha relación con el cálculo de lainversa generalizada de una matriz. En el caso de matrices cuadradas, dicha descomposición es la base deun algoritmo para determinar numéricamente y de forma iterativa, los valores propios de la matriz A (vercapítulo 8 de [10]).

En primer lugar se hace aquí la discusión de la descomposición QR para una matriz A de rango columnacompleto. En este caso, la factorización se basa en el proceso de ortogonalización de Gram-Schmidt descritoen teorema 1.33. El siguiente teorema garantiza la existencia de una tal factorización en dicho caso y sudemostración resume el proceso para encontrarla.

6.11. Teorema (Factorización QR (Parte I)). Sea A ∈ �m×n una matriz de rango columna completo n.Entonces existen matrices Q ∈ �m×n con columnas ortogonales (ortonormales) y R ∈ �n×n triangularsuperior e invertible tales que

A = QR

Demostración� Considere la matriz A particionada por sus columnas, ésto es,

A =ˆA1 A2 · · · An

˜�

la cual por hipótesis es de rango columna completo n. De aquí se tiene que el conjunto � =˘A1� A2� . . . � An

¯

es una base de C�A) (el espacio columna de A). Aplicando el proceso de ortogonalización de Gram-Schmidt(teorema 1.33) a esta base se obtiene

v1 = A1

v2 = A2 −�A2;v1�

�v1;v1�v1

v3 = A3 −�A3;v1�

�v1;v1�v1 −

�A3;v2�

�v2;v2�v2

...

vn = An −

n−1X

i=1

�An;vi�

�vi;vi�vi .

138

Page 9: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

Factorización de matrices 6.2. Descomposición QR

Despejando de aquí cada vector columna Aj obtenemos:

A1 = v1

A2 = v2 +�A2;v1�

�v1;v1�v1

A3 = v3 +�A3;v1�

�v1;v1�v1 +

�A3;v2�

�v2;v2�v2

...

An = vn +

n−1X

i=1

�An;vi�

�vi;vi�vi.

Así que se puede escribir:

A =ˆA1 A2 · · · An

˜

A =ˆ

v1 v2 · · · vn

˜

2

6666666666666666666664

1�A2;v1�

�v1;v1�

�A3;v1�

�v1;v1�· · ·

�An;v1�

�v1;v1�

0 1�A2;v2�

�v2;v2�· · ·

�An;v2�

�v2;v2�

0 0 1 · · ·�An;v3�

�v3;v3�...

...... · · ·

...

0 0 0. . .

�An;vn−1�

�vn−1;vn−1�

0 0 0 · · · 1

3

7777777777777777777775

A = Q0R0 �

que corresponde a la descomposición QR no normalizada de la matriz A.

Usando ahora los módulos de las columnas de la matriz Q0 para definir la matriz diagonal invertibleD = diag��v1�� �v2�� . . . � �vn�). De esta forma, se puede reescribir la igualdad A = Q0R0 como sigue:

A = Q0R0

= Q0D−1DR0

=h

v�

�v��v2

�v2�· · · vn

�vn�

i

2

66666664

�v1� �v1��A2;v1�

�v1;v1�· · · �v1�

�An;v1�

�v1;v1�

0 �v2� · · · �v2��An;v2�

�v2;v2�...

.... . .

...0 0 · · · �vn�

3

77777775

= QR �

que corresponde a la descomposición QR normalizada de la matriz A. �

139

Page 10: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

6.2. Descomposición QR Factorización de matrices

6.12. Ejemplo. Encuentre la descomposición QR para la matriz

A =

2

664

1 2 −11 −1 21 −1 2

−1 1 1

3

775 =

ˆA1 A2 A3

˜.

Aplicando el proceso de ortogonalización de Gram-Schmidt se obtiene

v1 = A1 =

2

664

111

−1

3

775 ;

v2 = A2 −�A2;v1�

�v1;v1�v1 =

2

664

2−1−1

1

3

775 +

1

4

2

664

111

−1

3

775 =

1

4

2

664

9−3−3

3

3

775 ;

v3 = A3 −�A3;v1�

�v1;v1�v1 −

�A3;v2�

�v2;v2�v2

=

2

664

−1221

3

775−

1

2

2

664

111

−1

3

775 +

2

3

2

664

9−3−3

3

3

775 =

2

664

0112

3

775 .

De aquí se tiene que

A1 = v1

A2 = −1

4v1 + v2

A3 =1

2v1 −

2

3v2 + v3.

Siguiendo ahora los delineamientos de la demostración del teorema anterior obtenemos:

A =ˆA1 A2 A3˜

= [v1 v2 v3]

2

41 −1/4 1/20 1 −2/30 0 1

3

5

=

2

664

1 9/4 01 −3/4 11 −3/4 1

−1 3/4 2

3

775

2

41 −1/4 1/20 1 −2/30 0 1

3

5

= Q0R0 �Descomposicón no normalizada).

140

Page 11: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

Factorización de matrices 6.2. Descomposición QR

En este caso, la matriz D está dada por D = diag`2� 3

2

√3�√

6´. Entonces se puede escribir

A =ˆA1 A2 A3˜

= Q0D−1DR0

=

2

666666664

1/2 3/2√

3 0

1/2 −1/2√

3 1/√

6

1/2 −1/2√

3 1/√

6

−1/2 1/2√

3 2/√

6

3

777777775

2

66664

2 −1/2 1

0 3√

3/2 −√

3

0 0√

6

3

77775

= QR (Descomposición normalizada). �

Suponga ahora que la matrizm×n, A no tiene rango columna no completo, esto es, ρ�A) = r con 0 < r < n.En este caso se tiene, que también existe una descomposición QR, pero la matriz Q en la factorización nonormalizada contiene columnas nulas, como lo establece el siguiente teorema.

6.13. Teorema (Factorización QR (Parte II)). Sea la matriz A ∈ �m×n tal que ρ�A) = r con 0 < r < n.Entonces existen una matriz Q0 ∈ �m×n con r columnas ortogonales no nulas y el resto nulas, y una matrizR0 ∈ �n×n triangular superior invertible tales que

A = Q0R0 (Descomposición no normalizada) .

La matriz A también se puede descomponer de manera normalizada en la forma

A = QRr

donde Q ∈ �m×r tiene columnas ortogonales (ortonormales) no nulas y Rr ∈ �r×n es �triangular� superiorde orden r. Las r columnas no nulas de Q0� respectivamente las r columnas de Q� conforman una base paraC�A).

Demostración� Si se siguen los pasos de la demostración del teorema 6.11 se obtiene la descomposiciónQR no normalizada para A. Esto es,

A = Q0R0.

En este caso sin embargo, Q0 tendrá r columnas ortogonales no nulas y n− r columnas nulas. Ahora, paradefinir matriz diagonal D se usan los módulos de la columnas no nulas Q0 respetando sus posiciones y unos(1’s) en el resto de componentes de la diagonal de D. La matriz Q buscada corresponde entonces a la matrizformada por las columnas no nulas de Q0D

−1� igualmente Rr se obtiene eliminado de la matriz DR0� lasfilas con índices iguales a las columnas nulas de Q0. �

El siguiente ejemplo ilustra el proceso para calcular la descomposición QR en el caso de matrices que noson de rango columna completo.

6.14. Ejemplo. Encontrar la descomposición QR para la matriz

A =

2

664

1 2 0 −11 −1 3 21 −1 3 2

−1 1 −3 1

3

775 =

ˆA1 A2 A3 A4

˜.

141

Page 12: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

6.2. Descomposición QR Factorización de matrices

Para ello se aplican los pasos del método de ortogonalización de Gram-Schmidt con las columnas de A� estoes:

v1 = A1 =

2

664

111

−1

3

775 ;

v2 = A2 −�A2;v1�

�v1;v1�v1 = A2 +

1

4v1 =

1

4

2

664

9−3−3

3

3

775 ;

v3 = A3 −�A3;v1�

�v1;v1�v1 −

�A3;v2�

�v2;v2�v2 = A3 −

9

4v1 + v2 =

2

664

0000

3

775 ;

v4 = A4 −1

2v1 +

2

3v2 − 0v3 =

2

664

0112

3

775 .

Despejando los vectores Aj ’s, en términos de los vectores vj ’s, como en el ejemplo 6.12 se obtiene entonces

A =ˆA1 A2 A3 A4

˜

=

2

664

1 9/4 0 01 −3/4 0 11 −3/4 0 1

−1 3/4 0 2

3

775

2

664

1 −1/4 9/4 1/20 1 −1 −2/30 0 1 00 0 0 1

3

775

= Q0R0.

Si se toma ahora la matriz diagonal D, cuyos elementos �D�ii corresponden a los a los módulos de lasi-ésimas columnas no nulas de Q0. Para las columnas nulas de Q0 se considera �D�ii = 1. En el ejemplo se

tiene entonces, D = diagh2� 3

2

√3� 1 �

√6

iy de aquí se sigue que

A =ˆA1 A2 A3 A4

˜= Q0R0 = Q0D

−1DR0

=

2

666666664

1/2 3/2√

3 0 0

1/2 −1/2√

3 0 1/√

6

1/2 −1/2√

3 0 1/√

6

−1/2 1/2√

3 0 2/√

6

3

777777775

2

666666664

2 −1/2 9/2 1

0 3√

3/2 −3√

3/2 −√

3

0 0 1 0

0 0 0√

6

3

777777775

.

Esto es,

142

Page 13: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

Factorización de matrices 6.2. Descomposición QR

A =

2

666666664

1/2√

3/2 0 0

1/2 −√

3/6 0√

6/6

1/2 −√

3/6 0√

6/6

−1/2√

3/6 0√

6/3

3

777777775

2

666666664

2 −1/2 9/2 1

0 3√

3/2 −3√

3/2 −√

3

0 0 1 0

0 0 0√

6

3

777777775

=

2

666666664

1/2√

3/2 0

1/2 −√

3/6√

6/6

1/2 −√

3/6√

6/6

−1/2√

3/6√

6/3

3

777777775

2

66664

2 −1/2 9/2 1

0 3√

3/2 −3√

3/2 −√

3

0 0 0√

6

3

77775

= QR .

La matriz Q se obtiene al eliminar la tercera columna (columna nula) de Q0D−1� mientras que R se obtiene

al eliminar la correspondiente tercera fila de DR0. �

El siguiente resultado presenta la relación existente entre la descomposición QR y la inversa generalizadade una matriz A. En este punto de la discusión, se suguiere al lector a recordar los conceptos dados en elcapítulo 5 sobre inversas condicionales (Ac), inversa generalizada (A+), mejor solución aproximada (M.S.A.)y solución mínima cuadrada (S.M.C.).

6.15. Teorema. Sea A ∈ �m×n una matriz real.

1. Si ρ�A) = n entonces existe una matriz Q, m × n� con columnas ortonormales y una matriz Rtriangular superior e invertible n× n tales que

A = QR�

además se tiene que

A+ = R−1QT .

2. Si ρ�A) = r < n entonces existe una matriz Q, m × n� con las primeras r columnas no nulasortonormales y una matriz R triangular superior n× n, ambas de rango r tales que

A = QR�

además se tiene que

A+ = RT �RRT )−1QT .

Demostración� Suponga que A es una matriz m× n de rango columna completo. Según lo estableceel teorema 6.11, existen matrices Q ∈ �m×n y R ∈ �n×n con las condiciones citadas tales que A = QR.De otra parte, se sabe que A+ = �ATA)−1AT (teorema 5.15(1)). De aquí se sigue que:

A+ = �ATA)−1AT

= �RTQTQR)−1RTQT

= R−1�RT )−1RTQT

= R−1QT .

143

Page 14: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

6.2. Descomposición QR Factorización de matrices

Lo que demuestra el inciso 1.

Suponga ahora, que A no tiene rango columna completo, es decir, suponga, que ρ�A) = r; 0 < r < n.Según el teorema 6.13 existen matrices Q ∈ �r×n y R ∈ �r×n con las condiciones requeridas tales queA = QR. Ahora, aplicando el teorema 5.15 (con B = Q y C = R), así como el literal (iv) del teorema 5.15,se obtiene entonces

A+ = RT �RRT )−1�QTQ)−1QT

= RT �RRT )−1QT � (puesto que �QTQ)−1 = Ir)

6.16. Nota. Con respecto a los resultados anteriores se puede anotar que:

1. Si A ∈ �m×n es una matriz de rango r < n se tiene, usando la notación del teorema anterior, que

A+A = RT“RRT

”−1

R.

2. De acuerdo con el teorema 5.45, todo sistema de ecuaciones Ax = y tiene una única M.S.A. dadapor

x∗ = A+

y.

Puesto que el conjunto de todas la soluciones mínimas cuadradas del sistema Ax = y están dadaspor (ver capítulo 5)

x = A+y + �I −A+A)h; h ∈ R

n.

Del literal anterior se sigue:

x = RT �RRT )−1QTy + �I −RT �RRT )−1R)h; h ∈ R

n�

y de aquí, que el conjunto de todas la soluciones mínimas cuadradas del sistema Ax = y está dadapor las soluciones

Rx = QTy .

6.17. Ejemplo. Considere el sistema de ecuaciones lineales Ax = y� siendo

A =

2

664

1 2 0 −11 −1 3 21 −1 3 2

−1 1 −3 1

3

775 y y =

2

664

1−1

21

3

775 .

De acuerdo con el ejemplo 6.14 ρ�A) = 3 y las matrices

Q =

2

666666664

1/2√

3/2 0

1/2 −√

3/6√

6/6

1/2 −√

3/6√

6/6

−1/2√

3/6√

6/3

3

777777775

y R =

2

66664

2 −1/2 9/2 1

0 3√

3/2 −3√

3/2 −√

3

0 0 0√

6

3

77775

son tales que

A = QR .

144

Page 15: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

Factorización de matrices 6.2. Descomposición QR

Entonces A+ = RT �RRT )−1QT , (ver teorema 6.15), es decir,

A+ =

2

66666666666664

2

9

1

18

1

180

7

18

1

18

1

18

1

6

1

18

1

18

1

18−

1

6

01

6

1

6

1

3

3

77777777777775

y el conjunto de todas las S.M.C. (ver nota 6.16) está dada por las soluciones del sistema

Rx = QTy =

2

41/2√3/2√6/2

3

5 �

es decir por la expresión

x =

2

664

1/62/30

1/2

3

775 + h

2

664

−2110

3

775 � h ∈ R.

En particular, si h = 1/18� se obtiene la M.S.A.

x∗ = A+

y =1

18

2

664

511−1

9

3

775 . �

6�2 Ejercicios

En los ejercicios 1 al 1, responda falso o verdadero justificando su respuesta

1. Si Q es una matriz rectangular cuyas columnas son orgonormales entre sí, entonces QTQ = I.2. Demuestre que si A ∈ �m×n tiene rango n y A = QR� donde Q tiene columnas ortogonales y R

es una matriz triangular superior con unos en su diagonal principal, entonces Q y R son únicas.3. Encuentre la matriz triangular R tal que A = QR en cada uno de los siguientes casos

a) A =

2

66664

1 2

1 1

−1 1

3

77775� Q =

2

6666666664

1√

3

4√

42

1√

3

1√

42

−1√

3

5√

42

3

7777777775

145

Page 16: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

6.3. Descomposición de Cholesky Factorización de matrices

b) A =

2

66664

1 −1 1

0 1 −1

−1 1 1

3

77775� Q =

2

66666664

1√

20

1√

2

0 1 0

−1√

20

1√

2

3

77777775

4. Calcule la descomposición QR de las matrices

(a) A =

2

664

1 0 00 1 11 1 −10 0 1

3

775 (b) B =

2

664

1 1 3−1 1 1

1 2 −21 2 0

3

775

(c) C =

2

664

1 1 21 0 01 1 11 0 −1

3

775 (d) D =

2

664

1 2 41 1 31 −1 11 1 3

3

775

6.3. Descomposición de Cholesky

A diferencia de las factorizaciones vistas hasta ahora, la factorización o descomposición de Cholesky se aplicasólo a matrices simétricas positivas definidas y ésta consiste en expresar una tal matriz como producto deuna matriz triangular superior y por su transpuesta. En forma más precisa tenemos

6.18. Teorema (Factorización de Cholesky). Si A ∈ �n×n es una matriz simétrica positiva definida,entonces existe una única matriz real T = [tij ]n×n triangular superior con tii > 0 �i = 1� . . . � n), tal que

A = TTT .

Además,

|A| = |T |2 = [Πni=1 tii]

2 .

Demostración� La demostración la hará usando inducción sobre el orden de la matriz. Primero sedemuestra que la afirmación es válida para n = 2� en efecto:

Sea A =

»α ββ θ

una matriz 2×2 simétrica positiva definida, entonces se tiene que α > 0 y |A| = αθ−β2 >

0 (teorema 4.27). Se necesita mostrar que existe una única matriz triangular superior T =

»a b0 c

� con

elementos de la diagonal positivos, tal que A = TTT� esto es:»α ββ θ

=

»a 0b c

– »a b0 c

=

»a2 abab b2 + c2

.

De ésto se tiene que

a2 = α de donde, a =√α �a > 0)

ab = β de donde, b =β√α

y

b2 + c2 = θ de donde, c =

pαθ − β2

√α

�c > 0).

146

Page 17: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

Factorización de matrices 6.3. Descomposición de Cholesky

ésto es,

A =

»α ββ θ

=

2

664

√α 0

β√α

pαθ − β2

√α

3

775

2

66664

√α

β√α

0

pαθ − β2

√α

3

77775

= TTT�

además, se tiene que |A| = �t11 · t22)2.

Suponga ahora que la afirmación es cierta para n = k� ésto es, sea B ∈ �k×k una simétrica positivadefinida. Supongamos que existe una única matriz triangular superior U ∈ �k×k tal que A = UTU y que|A| = |U |2 = [Πk

i=1 u2ii] (hipótesis de inducción).

Se demuestra entonces ahora, que la afirmación es cierta para n = k + 1. Considere para ello una ma-triz A ∈ ��k+1)×�k+1) simétrica positiva definida. Se puede escribir la matriz A por bloques en la forma

A =

»A a

at θ

� con A ∈ �k×k� a ∈ �k×1 y θ ∈ R

La matriz A es simétrica positiva definida (teorema 4.27), entonces por hipótesis de inducción, existe una

única matriz triangular superior U ∈ �k×k tal que A = UTU y˛˛A

˛˛ =

˛˛U

˛˛2 = [Πk

i=1 uii]2.

Considere ahora la matriz triangular superior T de tamaño �k + 1)× �k + 1), con elementos de la diagonalprincipal positivos y escrita por bloques en la forma

T =

»U y

� z

donde y ∈ �k×1 y z ∈ R+ deben ser escogidos adecuadamente tales que, A = TTT ; esto es, tales que:

A =

»A a

aT θ

=

»UT �

yT z

– »U y

� z

=

»UTU UT y

yTU yT y + z2

.

Igualando término a término se debe tener que

UTy = a� lo que implica que y = �UT )−1

a

yTy + z2 = θ� lo que implica que z = �θ − y

Ty)1/2.

Además se tiene que

|A| = |T |2 = |U |2z2

=hΠk

i=1 uii

i2

z2 =hΠk+1

i=1 tiii2

.

A continuación se verán dos procesos para calcular la factorización de Cholesky. El primero se basa en ladefinición propia de la factorización de Cholesky, mientras que el segundo usa resultados sobre diagonal-ización de matrices positivas definidas.

Proceso A �cálculo de la factorización de Cholesky):

147

Page 18: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

6.3. Descomposición de Cholesky Factorización de matrices

Sea A una matriz simétrica n × n positiva definida. Puesto que A = TTT con T una matriz triangularsuperior con elementos positivos en su diagonal principal, se debe tener que:

A =

2

666664

a11 a12 a13 · · · a1n

a12 a22 a23 · · · a2n

a13 a23 a33 · · · a3n

......

.... . .

...a1n a2n a3n · · · ann

3

777775

=

2

666664

t11 0 0 · · · 0t12 t22 0 · · · 0t13 t23 t33 · · · 0...

......

. . ....

t1n t2n t3n · · · tnn

3

777775

2

666664

t11 t12 t13 · · · t1n

0 t22 t23 · · · t2n

0 0 t33 · · · t3n

......

.... . .

...0 0 0 · · · tnn

3

777775

.

Cálculos directos muestran entonces que se debe cumplir que:

1. t11 =√a11.

2. t1j =a1j

t11=

a1j√a11

; j = 1� . . . � n.

3. tii = �aii −Pi−1

k=1 t2ki)1/2; i = 2� . . . � n.

4. tij =1

tii[aij −

i−1X

k=1

tkitkj ]; j > i� i = 2� . . . � n− 1.

5. tij = 0; j < i� i = 2� . . . � n.

Observación. Con respecto a este método y al cálculo de los elementos no nulos tij de la matriz triangularT se puede decir que:

1. t2ii es igual al elemento aii menos la suma de los cuadrados de los elementos ya calculados de lai-ésima columna de T . Es decir,

t2ii = aii −

i−1X

k=1

t2ki� i = 1� . . . � n.

2. El producto tii · tij es igual a aij menos la suma del producto de los elementos ya calculados de lasi-ésima y j-ésima columnas de T . Es decir,

tij · tii = aij −

i−1X

k=1

tkitkj ; j > i� i = 2� . . . � n− 1 .

6.19. Ejemplo. Siguiendo el esquema anterior, encuentre la descomposición de Cholesky para la matrizsimétrica positiva definida

A =

2

664

4 −2 0 2−2 2 3 −2

0 3 18 02 −2 0 4

3

775 .

Cálculos directos muestran que:

148

Page 19: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

Factorización de matrices 6.3. Descomposición de Cholesky

1. t11 =√a11 = 2; t12 =

a12

2= −1; t13 =

a13

2= 0; t14 =

a14

2= 1.

2. t22 =pa22 − t212 =

√2− 1 = 1;

t23 =a23 − t12t13

t22=

3− �−1) · 0

1= 3

t24 =a24 − t12t14

t22=−2− �−1) · 1

1= −1.

3. t33 =pa33 − t213 − t223 =

√18− 02 − 32 = 3;

t34 =a33 − t13t14 − t23t24

t33=

0− 0 · 1− 3�−1)

3= 1

4. t44 =pa44 − t214 − t224 − t234 =

p4− 12 − �−1)2 − 12 = 1

Es decir,

T =

2

664

2 −1 0 10 1 3 −10 0 3 10 0 0 1

3

775 �

es la matriz triangular superior tal que A = TTT. �

6.20. Ejemplo. Siguiendo con el esquema anterior, encuentre la descomposición de Cholesky para la matrizsimétrica positiva definida

A =

2

44 2 −42 10 4

−4 4 9

3

5 �

Cálculos directos muestran que:

1. t11 =√a11 = 2; t12 =

a12

t11= 1; t13 =

a13

2= −2.

2. t22 =pa22 − t212 =

√10− 1 = 3;

t23 =a23 − t12t13

t22=

4− �1)�−2)

3= 2.

3. t33 =pa33 − t213 − t223 =

p9− �−2)2 − �2)2 = 1.

Es decir,

T =

2

42 1 −20 3 20 0 1

3

5 �

es la matriz triangular superior tal que A = TTT. �

Proceso B �cálculo de la factorización de Cholesky):

De acuerdo con los resultados presentados en el capítulo 4 se tiene que una matriz simétrica A, es positivadefinida, si existe una matriz triangular superior P� tal que PTAP = I (ver también el teorema 4.31). Deaquí que

A = �PT )−1P−1 = �P−1)TP−1.

Así las cosas, se puede encontrar una tal matriz PT usando los pasos ilustrados en el ejemplo 3.46, esdecir, planteando la matriz

ˆA | I

˜y realizando de manera adecuada y simultáneamente operaciones

elementales en las filas y columnas de A y en las filas de I (sin hacer intercambios de filas).

149

Page 20: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

6.3. Descomposición de Cholesky Factorización de matrices

Nota. Existe una relación entre la factorización LU para matrices positivas definidas y la descomposiciónde Cholesky. En efecto, si A es simétrica positiva definida entonces A se puede expresar mediante A = TTTcon T una matriz triangular superior con elementos positivos en la diagonal principal.

Ahora bien, sea D = diag �t11� t22� . . . � tnn) entonces se tiene que:

A = TTT

= TTD−1DT

= �TTD−1)�DT )

= LU.

6.21. Ejemplo. Considere la matriz simétrica positiva definida

A =

2

44 2 −42 10 4

−4 4 9

3

5 .

Del ejemplo 6.20 se tiene que

A =

2

44 2 −42 10 4

−4 4 9

3

5 =

2

42 0 01 3 0

−2 2 1

3

5

2

42 1 −20 3 20 0 1

3

5 = TTT .

Tomando D =

2

42 0 00 3 00 0 1

3

5 � se tiene que

A =

2

42 0 01 3 0

−2 2 1

3

5

2

42 1 −20 3 20 0 1

3

5

=

2

42 0 01 3 0

−2 2 1

3

5

2

41/2 0 00 1/3 00 0 1

3

5

2

42 0 00 3 00 0 1

3

5

2

42 1 −20 3 20 0 1

3

5

=

2

41 0 0

1/2 1 0−1 2/3 1

3

5

2

44 2 −40 9 60 0 1

3

5 = LU . �

Ahora bien, suponga que se desea hallar las soluciones del sistema de ecuaciones lineales Ax = y� siendo Auna matriz simétrica y positiva definida. Sea T triangular positiva tal que A = TTT , entonces

Ax = y ⇐⇒ TTTx = y ⇐⇒ Tx = �TT )−1y�

es decir, si se conoce la factorización de Cholesky para una matriz A = TTT , la solución del sistema Ax = y

se reduce a encontrar la solución del sistema triangular superior

Tx = z� con z = �TT )−1y.

6.22. Ejemplo. Considere el sistema de ecuaciones lineales

4x1 + 2x2 − 4x3 = 12

2x1 + 10x2 + 4x3 = 6

−4x1 + 4x2 + 9x3 = −3 .

150

Page 21: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

Factorización de matrices 6.4. Descomposición en valores singulares

Puesto que la matriz de coeficientes es justo la matriz del ejemplo 6.20, la matriz aumentada del sistemase puede reducir mediante multiplicación del sistema por la matriz T−T (ver ejemplo 6.20), para obtener:

ˆA | y

˜=

2

44 2 −4 | 122 10 4 | 6

−4 4 9 | −15

3

5

∼=

2

42 1 −2 | 60 3 2 | 00 0 1 | −3

3

5 =ˆT | z

˜.

De esto último se sigue que

x3 = −3�

x2 =−2x3

3=

6

3= 2�

x1 =6 + 2x3 + x2

2=

6− 2− 6

2= −1. �

6�3 Ejercicios

1. Considere la matriz simétrica positiva definida S =

2

44 2 02 9 40 4 5

3

5 y calcule sus descomposición de

Cholesky (compare con el problema 9 de la seccion de ejercicios 6.1)

6.4. Descomposición en valores singulares �SVD)

En esta sección se abordará el estudio de la descomposición de una matriz rectangular A la cual involucralos valores y vectores propios de la matrices simétricas AAT y ATA. Como se recordará dichas matrices sonpositivas semidefinidas y por ello sus valores propios son no negativos.

6.23. Teorema. Para toda matriz A ∈ �m×n se tiene que existen matrices ortogonales U ∈ �m×m yV ∈ �n×n y una matriz “diagonal” Σ ∈ �m×n , con elementos �Σ�ij = 0, si i �= j y �Σ�ii =: σi ≥ 0, y

σ1 ≥ σ2 ≥ · · · ≥ σs, en donde s = mın {m�n} tales que

Am×n = Um×mΣm×nVT

n×n .

Los números σ21 � σ

22 � · · · � σ

2s son los valores propios de ATA (quizás agregando algunos ceros) y los vectores

propios asociados son las columnas de la matriz V = [ v1 v2 · · · vn ]. Además, lo números σ21 � σ

22 �

· · · � σ2s son igualmente los valores propios de AAT (quizás agregando algunos ceros) y los vectores propios

asociados son las columnas de U = [ u1 u2 · · · um ]. Además de tiene las siguientes relaciones entreestos vectores

Avi = σiui

i = 1� 2� . . . � s.

uTi A = σiv

Ti

151

Page 22: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

6.4. Descomposición en valores singulares Factorización de matrices

Demostración� Suponga que A ∈ �m×n tiene rango r con 0 < r < s. La matriz simétrica S =AAT ∈ �m×m es no negativa y por tanto existe una matriz ortogonal U ∈ �m×m tal que

UTAATU = D2 =

2

6664

σ21 0 · · · 00 σ2

2 · · · 0...

.... . .

...0 0 · · · σ2

m

3

7775

donde σ21 ≥ σ2

2 ≥ · · · ≥ σ2m ≥ 0 son los valores propios de S = AAT y las columnas de U = [u1 u2 · · · um]

son vectores propios de S correpondientes a dichos valores propios:

AATui = Sui = σ2

i ui; i = 1� 2� . . . �m.

Como r = ρ�A) = ρ�AAT )� entonces σ21 ≥ σ2

2 ≥ · · · ≥ σ2r > 0. Particione ahora la matriz U como

U = [ U1 U2 ] con U1 ∈ �m×r. Luego

UTAATU =

2

4UT

1

UT2

3

5AAT ˆU1 U2

˜

=

2

4UT

1 AATU1 UT

1 AATU2

UT2 AA

TU1 UT2 AA

TU2

3

5

=

»D2

r �

� �

es decir,

UTAATU =

2

666666666664

σ21 0 · · · 0 0 · · · 00 σ2

2 · · · 0 0 · · · 0...

.... . .

......

. . ....

0 0 · · · σ2m 0 · · · 0

0 0 · · · 0 0 · · · 0...

.... . .

......

. . ....

0 0 · · · 0 0 · · · 0

3

777777777775

Esto implica que

UT2 AA

TU2 = �ATU2)T �ATU2) = ��

de donde UT2 A = � y ATU2 = �. También se tiene que UT

1 AATU1 = D2

r � o sea:

D−1r UT

1 AATU1D

−1r = I = �ATU1D

−1r )T �ATU1D

−1r ).

Esto significa que la matriz

V1 = ATU1D−1r ∈ �n×r

tiene columnas ortonormales �V T1 V1 = I). Sea V2 ∈ �n×�n−r) tal que la matriz

V =ˆV1 V2

˜∈ �n×n

es ortogonal. Se requiere ahora verificar que

UTAV = Σ =

»Dr �

� �

.

152

Page 23: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

Factorización de matrices 6.4. Descomposición en valores singulares

En efecto, de una parte:

UTAV =

2

4UT

1

UT2

3

5AˆV1 V2

˜=

2

4UT

1 AV1 UT1 AV2

UT2 AV1 UT

2 AV2

3

5 �

y de otra parte, UT2 A = �. Así mismo,

V TV = I =

2

4V T

1

V T2

3

5ˆV1 V2

˜=

2

4V T

1 V1 V T1 V2

V T2 V1 V T

2 V2

3

5

=

»I �

� I

lo que implica que V T1 V2 = � = �ATU1D

−1r )TV2 de donde

UT1 AV2 = �.

y finalmente,

UT1 AV1 = UT

1 AATU1D

−1r

= D2rD

−1r = Dr

=

2

6664

σ1 0 · · · 00 σ2 · · · 0...

.... . .

...0 0 · · · σm

3

7775.

En consecuencia,

UTAV = Σ =

»Dr �

� �

.

Nota. Observe que

AV1 = AATU1D−1r ⇒ Avi = σiui i = 1� 2� . . . � r.

igualmente,

ATU1 = V1Dr ⇒ ATui = σivi ⇒ u

Ti A = σiv

Ti i = 1� 2� . . . � r.

El siguiente proceso ilustra cómo calcular la descomposición en valores singulares de una matriz A ∈ �m×n.Se supondrá en este caso, que m ≤ n.

6.24. Algoritmo.

1. Formule S = AAT ∈ �m×m.2. Encuentre los valores propios de S : σ2

1 ≥ σ22 ≥ · · · ≥ σ2

m ≥ 0.3. Encuentre un conjunto ortonormal u1�u2� . . . �um de vectores propios de S y construya la matriz

U = [ u1 u2 · · · um ](ortogonal) y la matriz diagonal D = diag�σ1� σ2� · · · � σm).4. Si r = ρ�A); Dr = diag�σ1� σ2� · · · � σr)5. Haga V1 = ATU1D

−1r � siendo U1 = [ u1 u2 · · · ur ], las primeras r columnas de U. Encuentre

una matriz V2 ∈ �n×�n−r) tal que la matriz V = [ V1 V2 ] ∈ �n×n sea ortogonal.

5*. Otra forma de (5) es trabajar con la matriz ATA.

153

Page 24: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

6.4. Descomposición en valores singulares Factorización de matrices

6.25. Ejemplo. Considere la matriz A =

»2 1 −24 −4 2

; ρ�A) = 2, calcule la descomposición en valores

singulares usando el proceso esbozado anteriormente.

Calculando directamente se obtiene la matriz S = AAT =

»9 00 36

, cuyos valores propios son: σ21 =

36 y σ22 = 9 (σ2

1 ≥ σ22).

Calcule ahora los vectores propios asociados a estos valores propios:

Para σ21 = 36 se tiene el sistema �S − 36 · I)X = �, es decir el sistema

»−25 00 0

– »x1

x2

=

»00

cuyo conjunto solución es de la forma

B =

»0x2

: x2 �= 0

ff

.

Como un representante de los σ21-vectores propios se puede tomar entonces u1 =

»01

. Análogamente se

puede tomar a u2 =

»10

como σ22-vector propio. Ahora considere la matriz ortogonal

U = [ u1 u2 ] =

»0 11 0

y la matriz diagonal

D = diag�σ1� σ2) =

»6 00 3

.

Puesto que r = ρ�A) = 2 se tiene que Dr = diag�σ1� σ2) =

»6 00 3

.

Con las matrices definidas hasta ahora se tiene que

V1 = ATU1D−1r

=

2

42 41 −4

−2 2

3

0 11 0

– »1/6 00 1/3

=

2

42 41 −4

−2 2

3

0 1/31/6 0

=1

3

2

42 2

−2 11 −2

3

5 Columnas ortonormales.

Si se considera ahora la matriz ortogonal

V =1

3

2

42 2 1

−2 1 21 −2 2

3

5 =ˆV1 V2

˜conV2 =

1

3

2

4122

3

5 �

se tiene que:

UTAV =

»6 0 00 3 0

= Σ. �

154

Page 25: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

Factorización de matrices 6.4. Descomposición en valores singulares

6.26. Ejemplo. Considere la matriz A =

2

41 1 00 1 11 0 1

3

5 ; ρ�A) = 3, calcule ahora la descomposición en

valores singulares:

De nuevo se calcula la matriz S = AAT

S = AAT =

2

42 1 11 2 11 1 2

3

5 .

cuyos valores propios los se obtienen de manera usual, es decir, resolviendo la ecuación |S − λI| = 0, estoes,

0 = |S − λI|

=

˛˛˛˛˛˛

2− λ 1 11 2− λ 11 1 2− λ

˛˛˛˛˛˛= −�λ− 4)�λ− 1)2.

Los valores propios de S son entonces σ21 = 4� σ2

2 = 1 y σ23 = 1. Algunos cálculos usuales permiten elegir a

los vectores

u1 =1√

3

2

4111

3

5 ; u2 =1√

6

2

4−2

11

3

5 y u3 =1√

2

2

401

−1

3

5 �

como vectores propios ortonormales asociados a σ21 � σ

22 y σ2

3 respectivamente. Considere ahora la matrizortogonal

U =ˆ

u1 u2 u3

˜=

2

66664

1/√

3 −2/√

6 0

1/√

3 1/√

6 1/√

2

1/√

3 1/√

6 −1/√

2

3

77775.

y las matrices diagonales (ρ�A) = 3)

D = diag�σ1� σ2� σ3) =

2

42 0 00 1 00 0 1

3

5 = Dr.

Se definine ahora la matriz V1 = ATU1D−1r , esto es,

V1 =

2

41 0 11 1 00 1 1

3

5

2

41/√

3 −2/√

6 0

1/√

3 1/√

6 1/√

2

1/√

3 1/√

6 −1/√

2

3

5

2

41/2 0 00 1 00 0 1

3

5

=

2

41 0 11 1 00 1 1

3

5

2

41/2

√3 −2/

√6 0

1/2√

3 1/√

6 1/√

2

1/2√

3 1/√

6 −1/√

2

3

5

=

2

41/√

3 −1/√

6 −1/√

2

1/√

3 −1/√

6 1/√

2

1/√

3 2/√

6 0

3

5 = V

Con estas matrices se tiene que:

UTAV =

2

44 0 00 1 00 0 1

3

5 = Σ. �

155

Page 26: Factorización de matrices - · PDF fileCAPÍTULO 6 Factorización de matrices Enestecapítuloseestudianalgunasdelastécnicasmásutilizadasparafactorizarmatrices,esdecir,técnicas

6.4. Descomposición en valores singulares Factorización de matrices

6�4 Ejercicios

1. Calcule la descomposición en valores singulares de las matrices

(a) A =

»2 1 −2

−1 4 1

(b) B =

»2 2 11 1 −4

(c) C =

2

41 12 22 2

3

5 (d) D =

2

41 −1

−1 12 −2

3

5

156