matices ortogonales

11
Conjuntos de Vectores y Matrices Ortogonales Departamento de Matem´ aticas, CCIR/ITESM 28 de junio de 2011 ´ Indice 21.1. Introducci´on ............................................... 1 21.2. Producto interno ............................................ 1 21.3. Propiedades del producto interno ................................... 5 21.4. Norma de un vector .......................................... 5 21.5. Distancia entre dos vectores ...................................... 5 21.6. Vectores ortogonales .......................................... 6 21.7. Conjunto ortogonal de vectores .................................... 6 21.8. Ortogonalidad e independencia lineal ................................. 7 21.9. Ortogonalidad y bases ......................................... 7 21.10.Ortogonalidad y descomposici´ on de un vector ............................ 7 21.11.Conjunto ortonormal de vectores ................................... 8 21.12.Matriz ortogonal ............................................ 9 21.1. Introducci´on En esta lectura veremos conjuntos y matrices ortogonales. Primero veremos algunas definiciones alternativas a los productos internos. 21.2. Producto interno Un producto interno en un espacio vectorial es una funci´ on : V × V F , donde F es el conjunto de los escalares utilizados (F = R ´ o F = C), y que tiene que cumplir los siguientes axiomas: Para todos los vectores x, y y z de V y para todo escalar c de F 1. (x + y) z = x z + y z es decir, se distribuye a la izquierda. 2. (c · x) y = c (xy) es decir, los factores escalares a la izquierda pueden salir. 3. x y = y x. 4. x x > 0 para todo x = 0. En el axioma 3, la l´ ınea horizontal encima de una expresi´on indica que se debe tomar el conjugado complejo: El conjugado comple de un n´ umero se obtiene cambiando el signo de la parte imaginaria. As´ ı 3+3 i =3 3 i 5= 5+0 i =5 0 i = 5, es decir: el conjugado de un real es ´ el mismo. 3 i = 0 3 i =0+3 i =3 i

Upload: alejandro-castaneda

Post on 25-Jul-2015

370 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Matices ortogonales

Conjuntos de Vectores y Matrices Ortogonales

Departamento de Matematicas, CCIR/ITESM

28 de junio de 2011

Indice

21.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.2. Producto interno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.3. Propiedades del producto interno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 521.4. Norma de un vector . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 521.5. Distancia entre dos vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 521.6. Vectores ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 621.7. Conjunto ortogonal de vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 621.8. Ortogonalidad e independencia lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 721.9. Ortogonalidad y bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 721.10.Ortogonalidad y descomposicion de un vector . . . . . . . . . . . . . . . . . . . . . . . . . . . . 721.11.Conjunto ortonormal de vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 821.12.Matriz ortogonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

21.1. Introduccion

En esta lectura veremos conjuntos y matrices ortogonales. Primero veremos algunas definiciones alternativasa los productos internos.

21.2. Producto interno

Un producto interno en un espacio vectorial es una funcion • : V × V → F , donde F es el conjunto de losescalares utilizados (F = R o F = C), y que tiene que cumplir los siguientes axiomas: Para todos los vectoresx, y y z de V y para todo escalar c de F

1. (x+ y) • z = x • z+ y • z es decir, se distribuye a la izquierda.

2. (c · x) • y = c (xy) es decir, los factores escalares a la izquierda pueden salir.

3. x • y = y • x.

4. x • x > 0 para todo x 6= 0.

En el axioma 3, la lınea horizontal encima de una expresion indica que se debe tomar el conjugado complejo:El conjugado comple de un numero se obtiene cambiando el signo de la parte imaginaria. Ası

3 + 3 i = 3− 3 i

5 = 5 + 0 i = 5− 0 i = 5, es decir: el conjugado de un real es el mismo.

−3 i = 0− 3 i = 0 + 3 i = 3 i

Page 2: Matices ortogonales

Figura 1: El producto interno estandar de Rn en la TI.

Daremos sin comprobacion algunos ejemplos de productos internos en los espacios vectoriales que nos ocupan.

Ejemplo 21.1Si V = Rn y x = (xi) y y = (yi) el producto punto estandar • es:

x • y =n∑

i=1

xi · yi

Si n = 3, x =< 1, 2,−1 > y y =< 1,−1, 3 >, entonces

x • y = (1)(1) + (2)(−1) + (−1)(3) = −4

Observe que el producto interno estandar en Rn concide con una operacion entre matrices:

x • y = xT · y

Aquı los vectores x y y se consideran como una matrices n × 1; ası xT quedara una matriz 1 × n y al hacerel producto matricial con y quedara una matriz 1× 1 que sera un escalar. Este ejemplo puede realizarse en lacalculadora TI utilizando la funcion dotP ya programada como se ilustra en la figura 1.

Ejemplo 21.2Mientras que si V = Cn con escalares C el producto punto estandar • es

x • y =

n∑

i=1

xi · yi

Si n = 3, x =< 1, 2 + 2 i,−i > y y =< 1,−1 + i, 3 i >, entonces

x • y = (1)(1) + (2 + 2 i)(−1 + i) + (−i)(3 i)= (1)(1) + (2 + 2 i)(−1− i) + (−i)(−3 i)= 1− 2− 2 i− 2 i− 2 i2 + 3 i2

= −1− 4 i+ i2

= −1− 4 i+ (−1)= −2− 4 i

Es importante comentar que este producto interno estandar en Cn esta implementado en la calculadora TIy coincide con el producto estandar en Rn. Esto se ilustra en la figura 2. Note la diferencia entre el numeroimaginario i y el sımbolo i en su calculadora; en la voyage 200 i se obtiene con la combinacion 2ND i

mientras que en la TI 89 con la combinacion 2ND catalog . No notar la diferencia le puede traer verdaderosdolores de cabeza.

2

Page 3: Matices ortogonales

Figura 2: El producto interno estandar de Cn en la TI.

Ejemplo 21.3Si V = C [a, b] es el conjunto de las funciones continuas de valor real el producto interno estandar es:

f • g =

∫ b

a

f(t) · g(t) dt

Si [a, b] = [0, 1], f(x) = x+ 1 y g(x) = x2 − 1 entonces

f • g =∫

1

0(x+ 1) · (x2 − 1) dx

=∫

1

0(x3 + x2 − x− 1) dx

= −11/12

Ejemplo 21.4Si Si V = C [0, 2π] es el conjunto de las funciones continuas complejas un producto interno es:

f • g =1

0

f(t) · g(t) dt

Ejemplo 21.5Si Mn×m es el conjunto de las matrices reales con n renglones y m columnas el producto interno estandar es:

A •B = tr(

B′ ·A)

donde B′ representa la transpuesta de la matriz B y tr(X) representa la traza de la matriz cuadrada X quees la suma de los elementos de la diagonal. Por ejemplo, si

A =

[

1 2 3−1 2 −3

]

y B =

[

1 −2 30 2 −3

]

Entonces

BT ·A =

1 0−2 23 −3

[

1 2 3−1 2 −3

]

=

1 2 3−4 0 −126 0 18

y por tanto

A •B = tr

1 2 3−4 0 −126 0 18

= 1 + 0 + 18 = 19

Para realizar esto en la calculadora TI debemos programar la funcion traza puesto que en la configuracioninicial no viene tal funcion. Una implementacion posible para esta funcion viene ilustrada en la figura 3. Unavez programada la funcion traza, la figura 4 ilustra el calculo del producto interno de dos matrices.

3

Page 4: Matices ortogonales

Figura 3: Programando la funcion traza en la TI.

Figura 4: Producto interno estandar de Mn×m(R) en la TI.

Ejemplo 21.6Si Mn×m es el conjunto de las matrices complejas con n renglones y m columnas el producto interno estandares:

A •B = tr (B∗ ·A)

donde B∗ representa la adjunta de la matriz B es decir la transpuesta conjugada o tambien conocida comotranspuesta hermitiana, a veces tambien se utiliza la notacion BH para la matriz conjugada compleja de B.Aquı tr(X) representa la traza de la matriz cuadrada X que es la suma de los elementos de la diagonal.Por ejemplo, si

A =

[

1 + i 2− 3 i i

−1 2− i −3 i

]

y B =

[

1 + 2 i −2 3

0 2 i −3 + i

]

y ası

A∗ =

1− i −1

2 + 3 i 2 + i

−i 3 i

y por tanto

A∗ ·B =

3 + i −2 6− 4 i

−4 + 7 i −6− 2 i −1 + 8 i

2− i −6 + 2 i −3− 12 i

de dondeB •A = (3 + i) + (−6− 2 i) + (−3− 12 i) = −6− 13 i

Es importante comentar que la transpuesta conjugada de una matriz en Maple se obtiene como el comandohtranspose, por el nombre alternativo de transpuesta hermitiana. Por otro lado, en la calculadora TI latranspuesta siempre representa la transpuesta hermitiana de una matriz. Esto se puede ejemplificar repitiendolos calculos del ejemplo como se ilustra en la figura 5.

4

Page 5: Matices ortogonales

Figura 5: Producto interno estandar de Mn×m(C) en la TI.

21.3. Propiedades del producto interno

Propiedades que satisfacen todos los productos internos:Teorema

Sea V es espacio vectorial con producto interno •, x, y y z vectores de V y c un escalar:

1. x • (y + z) = x • y + x • x2. x • (c · y) = c · (x • y)3. x • x = 0 si y solo si x = 0.

4. x • y = 0 si y solo si y • x = 0.

5. Si ∀x ∈ V se cumple x • y = x • x, entonces y = z.

21.4. Norma de un vector

Teniendo definido un producto interno, el siguiente paso es definir una norma o longitud de vectores.

Definicion 21.1Sea V un espacio vectorial con producto interior •, para todo vector x de definimos la norma o longitud de xcomo

‖x‖ =√x • x

Propiedades que se deducen de la norma:Teorema

1. ‖cx‖ = |c| · ‖x‖2. ‖x‖ = 0 si y solo si x = 0. En cualquier caso, x ≥ 0.

3. Desigaldad de Cauchy-Schwarz: |x • y| ≤ ‖x‖ · ‖y‖.4. Desigualdad del triangulo: ‖x+ y‖ ≤ ‖x‖+ ‖y‖.

21.5. Distancia entre dos vectores

Ahora, habiendo definido la magnitud de un vector es posible definir una distancia en un espacio vectorial.

Definicion 21.2Sea V un espacio vectorial con producto interior •, para cualesquier dos vectores x y y definimos la distancia

de x a y comod(x,y) = ‖x− y‖

Propiedades que se deducen de la funcion distancia:Teorema

5

Page 6: Matices ortogonales

1. d(x,y) = d(y,x) es decir, la distancia medida desde x a y es la misma que la distanciamedida desde y a x.

2. d(x,y) = 0 si y solo si x = y es decir, si la distancia entre dos puntos es cero entonces lospuntos son iguales.

3. Desigualdad del triangulo: d(x,y) ≤ d(x, z) + d(z,y)

21.6. Vectores ortogonales

Definicion 21.3Dos vectores x y y en Rn se dicen ortogonales si x • y = 0. Si esto pasa se expresara como x ⊥ y.Ejemplo 21.7Indique si los vectores x =< 1, 0, 2 > y y =< −2, 2, 1 > son ortogonales. Directamente de la definicion:requerimos hacer

x • y = (1)(−2) + (0)(2) + (2)(1) = −2 + 0 + 2 = 0

Por tanto, x ⊥ y.

Ejemplo 21.8Determine el valor del parametro a para que x =< 1, 1, 2 > y y =< −3, a, 1 > sean ortogonales. Directamentede la definicion: requerimos hacer

x • y = (1)(−3) + (1)(a) + (2)(1) = −3 + a+ 2 = a− 1

Por tanto, x ⊥ y si y solo si x • y = 0 si y solo si a = 1.

21.7. Conjunto ortogonal de vectores

Definicion 21.4Un conjunto de vectores {v1,v2, . . . ,vm} se dice conjunto ortogonal o simplemente ortogonal si se cumple

vi • vj = 0 para i 6= j y i, j = 1, . . . ,m (1)

Ejemplo 21.9Indique si el conjunto formado por los siguientes vectores es ortogonal

v1 =

102

, v2 =

−221

, v3 =

−2−5/2

1

SolucionCalculando todos los productos punto entre vectores diferentes tenemos

v1 • v2 = (1)(−2) + (0)(2) + (2)(1) = 0v1 • v3 = (1)(−2) + (0)(−5/2) + (2)(1) = 0v2 • v3 = (−2)(−2) + (2)(−5/2) + (1)(1) = 0

ası concluimos que es conjunto es ortogonal.

6

Page 7: Matices ortogonales

21.8. Ortogonalidad e independencia lineal

Teorema

Cualquier conjunto ortogonal S = {v1, ....,vk} de vectores distintos de cero es linealmente inde-pendiente.

Demostracion: Si suponemos quec1 v1 + c2 v2 + · · ·+ ck vk = 0

Entonces, haciendo producto punto por vi obtenemos que:

c1 v1 • vi + c2 v2 • vi + · · ·+ ck vk • vi = 0 • vi

Observe que siendo el conjunto ortogonal todos los productos punto en el lado izquierdo se hacen cero, exceptouno: el correponiente a vi •vi. Mientras que en el segundo miembro el producto punto al ser uno de los vetorescero queda cero. Ası lo anterior se resume a:

civi • vi = 0

como vi • vi 6= 0 al ser todos los vectores vi diferentes del vector cero, concluimos que ci = 0.

21.9. Ortogonalidad y bases

Teorema

Cualquier conjunto generador ortogonal S = {v1, ....,vk} de vectores distintos de cero es basepara Gen(S).

Demostracion: Por definicion de Gen(S), S genera a Gen(S); y por el teorema anterior S es linealmenteindependiente. Por tanto, S es base para Gen(S).

21.10. Ortogonalidad y descomposicion de un vector

Teorema

Sea S = {v1, ...,vk} un conjunto ortogonal de vectores distintos de cero. Si u esta en Gen(S) y

u = c1 v1 + · · ·+ ck vk

entoncesci =

u • vi

vi • vi

para i = 1, . . . , k

A las expresiones u • vi/vi • vi se les llama los coeficientes de Fourier de u respecto a S.Demostracion: Si

u = c1 v1 + · · ·+ ck vk

haciendo el producto punto con vi y considerando la ortogonalidad obtenemos:

u • vi = ci vi • vi

Al ser los vectores vi 6= 0, se tiene que vi • vi 6= 0 y por tanto se tiene:

ci =u • vi

vi • vi

7

Page 8: Matices ortogonales

Nota:Lo importante del teorema anterior es indica que para bases ortonormales no es necesario resolver sistemasde ecuaciones lineales para determinar los coeficientes de cada vector es suficientes calcular los coeficientes deFourier.

Ejemplo 21.10Utilizando el conjunto ortogonal S del primer ejemplo de esta lectura y el vector u = (1, 2, 3)′, determine loscoeficientes de Fourier u respecto a S y compruebe que se obtienen los mismos valores resolviendo el sistemade ecuaciones lineales correspondientes.Solucion: Calculemos

u • v1 = (1)(1) + (2)(0) + (3)(2) = 7u • v2 = (1)(−2) + (2)(2) + (3)(1) = 5u • v3 = (1)(−2) + (2)(−5/2) + (3)(1) = −4v1 • v1 = (1)(1) + (0)(0) + (2)(2) = 5v2 • v2 = (−2)(−2) + (2)(2) + (1)(1) = 9v3 • v3 = (−2)(−2) + (−5/2)(−5/2) + (1)(1) = 45/4

y al aplicar las formulas obtenermos:

c1 = 7/5, c2 = 5/9, c3 = −16/45

Si por otro lado armamos la matriz aumentada [v1,v2,v3|u] y la reducimos:

1 −2 −2 10 2 −5/2 22 1 1 3

1 0 0 7/50 1 0 5/90 0 1 −16/45

de donde observamos que los valores de las constantes ci coinciden con los valores dados por los coeficientesde Fourier.

21.11. Conjunto ortonormal de vectores

Definicion 21.5Un conjunto de vectores {v1,v2, . . . ,vm} se dice conjunto ortonormal o simplemente ortonormal si se cumple

vi • vj = 0 para i 6= j y vi • vi = 1 para i, j = 1, . . . ,m (2)

Note que en caso de una base ortonormal S para un espacio las formulas de Fourier para un u simplificana ci = u • vi, por ello es que es deseable tener una base ortonormal a un espacio. Si ya se posee una baseortogonal dividiendo cada vector entre su norma se obtiene una ortonormal:

{v1, . . . ,vm} ortogonal →{

1

||v1||v1, . . . ,

1

||vm||vm

}

ortonormal (3)

Ejemplo 21.11Ortonormalize el conjunto ortogonal ejemplo de esta lectura:

v1 =

102

, v2 =

−221

, v3 =

−2−5/2

1

8

Page 9: Matices ortogonales

Solucion: Tenemos ya realizados los siguientes calculos

v1 • v1 = 5 → ||v1|| =√5

v2 • v2 = 9 → ||v1|| = 3

v3 • v3 = 45/4 → ||v1|| =√45/2

Por tanto, el conjunto ortonormalizado queda

1√5

102

,1

3

−221

,2√45

−2−5/2

1

21.12. Matriz ortogonal

Definicion 21.6Una matriz A se dice matriz ortogonal o simplemente ortogonal si es una matriz cuadrada y las columnas deA forman un conjunto ortonormal.

Teorema

A n× n: A es ortogonal ssi AT ·A = I.

Observe que el teorema anterior se deduce de que para dos vectores x y y en Rn, x • y = x′ · y:

x1x2...xn

y1y2...yn

= x1 · y1 + · · ·+ xn · yn =[

x1 x2 · · · xn]

·

y1y2...yn

Con lo anterior se deduce que cuando se hace AT ·v se calcula un vector donde cada componente es el productopunto de la columna correspondiente de A con el vector v. Con lo anterior se deduce que cuando se calculaAT ·A la matriz resultante tiene en la posicion (i, j) justo ai • aj es decir, el producto punto de la columna

i de A con la columna j de A. De esta forma: AT · A = I si y solo si se tiene que las columnas de A sonortogonales y que tienen norma 1.Con la observacion anterior presente podemos hacer el ejemplo 1 mas facilmente.

Ejemplo 21.12Indique si el conjunto formado por los siguientes vectores es ortogonal

v1 =

102

, v2 =

−221

, v3 =

−2−5/2

1

SolucionFormamos la matriz A cuyas columnas son los vectores:

A = [v1 v2 v3] =

1 −2 −20 2 −5/22 1 1

Y calculamos AT ·A:

AT ·A =

5 0 00 9 00 0 45/4

9

Page 10: Matices ortogonales

que sean cero los elementos que estan fuera de la diagonal principal indica que el conjunto es ortogonal.

Ejemplo 21.13Determina los valores de x, y y z para que el conjunto de vectores

v1 =

46z

, v2 =

x64

, v3 =

2y3

sea ortogonal.Formamos la matriz A cuyas columnas son los vectores:

A = [v1 v2 v3] =

4 x 26 6 yz 4 3

Y calculamos AT ·A:

AT ·A =

52 + z2 4x+ 36 + 4 z 8 + 6 y + 3 z

4x+ 36 + 4 z x2 + 52 2x+ 6 y + 12

8 + 6 y + 3 z 2x+ 6 y + 12 13 + y2

Por tanto, para que el conjunto se ortogonal debe cumplirse que:

4x+ 36 + 4 z = 08 + 6 y + 3 z = 02x+ 6 y + 12 = 0

de donde, los unicos valores que hacen ortogonal al conjunto son x = −31/5, y = 1/15 y z = −14/5

Ejemplo 21.14Determine el vector de coordenadas de v =< 2, 2,−4 > respecto a la base ortonormal

B =

u1 =

1/32/32/3

, u2 =

2/3−2/31/3

, u3 =

2/31/3

−2/3

Recordemos que el vector de coordenadas de un vector respecto a una base son los coeficientes de la combinacionlineal de la base que da tal vector. Si la base es ortonormal entonces los coeficientes de la combinacion linealson los coeficientes de Fourier, es decir los productos punto del vector con cada uno de los elementos de labase. Verifiquemos primero que el conjunto es ortonormal. Para ello, formamos la matriz A cuyas columnasson los vectores de B:

A = [u1 u2 u3] =

1/3 2/3 2/32/3 −2/3 1/32/3 1/3 −2/3

y calculamos AT ·A:

AT ·A =

1 0 00 1 00 0 1

Por tanto, dando la matriz diagonal el conjunto es ortogonal; dando la identidad el conjunto es ortonormal.Para calcular los productos punto de los elemento de B con v recurrimos al producto:

ATv =

1/3 2/3 2/32/3 −2/3 1/32/3 1/3 −2/3

·

22

−4

=

−2/3−4/314/3

10

Page 11: Matices ortogonales

Por tanto, c1 = v • u1 = −2/3, c2 = v • u2 = −4/3, y c3 = v • u3 = 14/3 y el vector de coordenadas de vrespecto a la base B es < −2/3,−4/3, 14/3 >.Teorema

Sea A una matriz n× n, y u y v dos vectores en Rn. Entonces

(Au) • v = u •(

ATv)

Demostracion

(Au) • v = (Au)Tv=

(

uTAT)

v= uT

(

ATv)

= u •(

ATv)

Teorema

Sea A una matriz n× n. Son equivalentes las siguientes afirmaciones:

(1) A es ortogonal.

(2) A preserva los productos punto:

(Au) • (Au) = u • v ∀u,v

(3) A preserva norma:||Av|| = ||v|| ∀v

Demostracion(1) implica (2)

Si A es ortogonal, ATA = I. Ası

(Au) • (Av) = (Au)T ·Av = uTAT ·Av = uT · (AT ·A)v = uT · I · v = uT · v = u • v

(2) implica (3)Se tiene

||Av||2 = (Av) • (Av)

= v • v = ||v||2

tomando raız cuadrada se tiene la igualdad de (3).(3) implica (1)

11