geometria y algebra lineal 2 tema espacios con...

46
GEOMETRIA Y ALGEBRA LINEAL 2 TEMA 3 ESPACIOS CON PRODUCTO INTERNO Uno de los aspectos que pueden señalarse del anterior curso de Geometría y Álgebra Lineal 1 es que tiene dos fases. La primera de ellas va de sistemas de ecuaciones, que aprendemos a resolver usando un lenguaje que involucra matrices y operaciones entre ellas. Dentro de todos los tipos de matrices tenemos unas muy particulares que forman el conjunto de las n-uplas R n , que comparten las operaciones de suma y de producto por un escalar que tienen las matrices de orden m × n. Pero además de tener estas operaciones, R n viene equipado con una operación adicional conocida como producto escalar, que envía a cada par de n-uplas en un escalar real y que satisface una serie de propiedades intere- santes que en cierta forma definen la geometría de R n . Luego en la segunda fase del curso de GAL 1 entramos en un lenguaje más general basado en el concepto de espacio vectorial. Resulta ser que los conjuntos de matrices y de n- uplas forman casos particulares de dichos espacios. Una ventaja que tiene presentar este lenguaje general de espacios vectoriales es la de demostrar resultados para vectores en abstracto (y así no haga falta probarlos por separado en cada ejemplo que se tenga de es- pacio vectorial). Sin embargo, hubo algún que otro concepto que quedó fuera de esa primera genera- lización que hicimos hacia los espacios vectoriales, y uno de ellos fue el producto escalar de n-uplas mencionado anteriormente. El propósito de estas notas es generalizar este pro- ducto al lenguaje de espacios vectoriales. El análogo abstracto del producto escalar será una operación conocida como producto interno. Naturalmente, presentaremos varios ejem- plos de productos internos, y las propiedades que demostremos en el lenguaje general de vectores serán por supuesto válidas para cada uno de estos ejemplos. 1

Upload: others

Post on 06-Apr-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

GEOMETRIA Y ALGEBRA LINEAL 2 TEMA 3

ESPACIOS CON PRODUCTO INTERNO

Uno de los aspectos que pueden señalarse del anterior curso de Geometría y ÁlgebraLineal 1 es que tiene dos fases. La primera de ellas va de sistemas de ecuaciones, queaprendemos a resolver usando un lenguaje que involucra matrices y operaciones entreellas. Dentro de todos los tipos de matrices tenemos unas muy particulares que forman elconjunto de las n-uplas Rn, que comparten las operaciones de suma y de producto por unescalar que tienen las matrices de orden m × n. Pero además de tener estas operaciones,Rn viene equipado con una operación adicional conocida como producto escalar, que envíaa cada par de n-uplas en un escalar real y que satisface una serie de propiedades intere-santes que en cierta forma definen la geometría de Rn.

Luego en la segunda fase del curso de GAL 1 entramos en un lenguaje más general basadoen el concepto de espacio vectorial. Resulta ser que los conjuntos de matrices y de n-uplas forman casos particulares de dichos espacios. Una ventaja que tiene presentar estelenguaje general de espacios vectoriales es la de demostrar resultados para vectores enabstracto (y así no haga falta probarlos por separado en cada ejemplo que se tenga de es-pacio vectorial).

Sin embargo, hubo algún que otro concepto que quedó fuera de esa primera genera-lización que hicimos hacia los espacios vectoriales, y uno de ellos fue el producto escalarde n-uplas mencionado anteriormente. El propósito de estas notas es generalizar este pro-ducto al lenguaje de espacios vectoriales. El análogo abstracto del producto escalar seráuna operación conocida como producto interno. Naturalmente, presentaremos varios ejem-plos de productos internos, y las propiedades que demostremos en el lenguaje general devectores serán por supuesto válidas para cada uno de estos ejemplos.

1

Page 2: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

3.1 Producto interno

Como es costumbre en este curso, en lo que sigue K denotará el cuerpo R o C.

Definición 3.1.1. Sea V un K-espacio vectorial. Un producto interno en V es una funciónde dos variables

〈−,−〉 : V × V → K

que satisface las siguientes propiedades:

1. 〈u+ v, w〉 = 〈u,w〉+ 〈v, w〉 para todo u, v, w ∈ V .

2. 〈u, v〉 = 〈v, u〉 para todo u, v ∈ V .(Aquí, 〈v, u〉 denota el conjugado del número complejo 〈v, u〉).

3. 〈αu, v〉 = α 〈u, v〉 para todo u, v ∈ V y para todo α ∈ K.

4. 〈u, u〉 ∈ R y 〈u, u〉 ≥ 0 para todo u ∈ V . Más aún, 〈u, u〉 = 0 si, y sólo si, u = ~0.(Es este caso, se suele decir que 〈−,−〉 es una función definida positiva). ♣

Observación 3.1.2. Se pueden notar algunas propiedades extras de la definición anterior:

1.⟨~0, v⟩

=⟨u,~0⟩

= 0 para todo u, v ∈ V .

Sabemos que ~0 +~0 = ~0. Tenemos entonces⟨~0, v⟩

=⟨~0 +~0, v

⟩⟨~0, v⟩

=⟨~0, v⟩

+⟨~0, v⟩

0 =⟨~0, v⟩.

De manera similar,⟨u,~0⟩

= 0.

2. 〈u, v + w〉 = 〈u, v〉+ 〈u,w〉 para todo u, v, w ∈ V .

En efecto:

〈u, v + w〉 = 〈v + w, u〉 (por la propiedad 2.)

= 〈v, u〉+ 〈w, u〉 = 〈v, u〉+ 〈w, u〉 (por la propiedad 1.)= 〈u, v〉+ 〈u,w〉 (por la propiedad 2. nuevamente).

Tenemos así que 〈−,−〉 es una función aditiva en cada componente.

2

Page 3: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

3. La función 〈−,−〉 es homogénea en la componente izquierda, pero no así en laderecha para el caso K = C. En efecto, para cualesquiera u, v ∈ R y α ∈ K, te-nemos:

〈u, αv〉 = 〈αv, u〉 (por la propiedad 2.)

= α 〈v, u〉 = α〈v, u〉 (por la propiedad 3.)= α 〈u, v〉 (por la propiedad 2. nuevamente).

Tenemos entonces que 〈−, v0〉 : V → K es una transformación lineal. En este caso, es máspreciso decir que 〈−, v0〉 es un funcional lineal (es decir, una transformación lineal de unespacio vectorial V al cuerpo de escalares K). ♠

Fijar la primera componente en el producto interno 〈−,−〉 no siempre genera un funcionallineal. Esto lo caracterizamos a continuación.

Proposición 3.1.3. Sea u0 ∈ V fijo y no nulo. Entonces, 〈u0,−〉 : V → K es un funcionallineal si, y sólo si, K = R. ♥

Demostración: Supongamos primero que 〈u0,−〉 es un funcional lineal. Entonces, ten-emos que

〈u0, αu0〉 = α 〈u0, u0〉

para todo α ∈ K. Por otro lado,

〈u0, αu0〉 = α 〈u0, u0〉

por 3. en la observación anterior. Tenemos entonces

α 〈u0, αu0〉 = α 〈u0, u0〉 .

Como u0 6= ~0, por la propiedad 4. se tiene que 〈u0, u0〉 > 0. Por lo tanto, al dividir por〈u0, u0〉, tenemos que α = α, y esto a su vez implica que α es un número real para todoα ∈ K, es decir, K = R.

Ahora supongamos que K = R. Para todo α ∈ R y v, w ∈ V , tenemos:

〈u0, αv + w〉 = 〈u0, αv〉+ 〈u0, w〉 (por 2. en la observación anterior)= α 〈u0, v〉+ 〈u0, w〉 (por 3. en la observación anterior)= α 〈u0, v〉+ 〈u0, w〉 (porque α ∈ R).

Por lo tanto, 〈u0,−〉 : V → R es una transformación lineal.

3

Page 4: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Ejemplo 3.1.4. Los siguientes son ejemplos de productos internos (a excepción de 4.).

1. V = Rn y K = R. Tenemos que el producto escalar de n-uplas

〈−,−〉 : Rn × Rn → R

〈(x1, . . . , xn), (y1, . . . , yn)〉 :=n∑

k=1

xkyk

es un producto interno en Rn.

2. Producto escalar en complejos: Algo similar al ejemplo anterior ocurre cuando susti-tuimos R por el cuerpo de los números complejos. Consideremos V = Cn y K = C.Definimos la siguiente función de dos variables:

〈−,−〉 : Cn × Cn → C

〈u, v〉 =n∑

k=1

uivi,

donde u = (u1, . . . , un) y v = (v1, . . . , vn). Tenemos que 〈−,−〉 es un producto internoen Cn. En efecto:

(a) Sean u = (u1, . . . , un), v = (v1, . . . , vn), w = (w1, . . . , wn) ∈ Cn:

〈u+ v, w〉 = 〈(u1, . . . , un) + (v1, . . . , vn), (w1, . . . , wn)〉= 〈(u1 + v1, . . . , un + vn), (w1, . . . , wn)〉

=n∑

k=1

(uk + vk)wk =n∑

k=1

(ukwk + vkwk) =n∑

k=1

ukwk +n∑

k=1

vkwk

= 〈u,w〉+ 〈v, w〉 .

(b) Sean u = (u1, . . . , un), v = (v1, . . . , vn) ∈ Cn:

〈u, v〉 = 〈(u1, . . . , un), (v1, . . . , vn)〉 =n∑

k=1

ukvk =n∑

k=1

vkuk =n∑

k=1

vkuk = 〈v, u〉.

(c) Sean u = (u1, . . . , un), v = (v1, . . . , vn) ∈ Cn y α ∈ C:

〈αu, v〉 = 〈α(u1, . . . , un), (v1, . . . , vn)〉 = 〈(αu1, . . . , αun), (v1, . . . , vn)〉

=n∑

k=1

αukvk = α

n∑k=1

ukvk

= α 〈u, v〉 .

4

Page 5: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

(d) Sea u = (u1, . . . , un) ∈ Cn:

〈u, u〉 = 〈(u1, . . . , un), (u1, . . . , un)〉 =n∑

k=1

ukuk =n∑

k=1

|uk|2 ≥ 0.

Ahora bien, si u = ~0, es claro que 〈u, u〉 = 0. Ahora supongamos que 〈u, u〉 = 0.Tenemos entonces que

n∑k=1

|uk|2 = 0, y |uk|2 ≥ 0 para todo 1 ≤ k ≤ n.

Estas dos condiciones implican que |uk|2 = 0 para todo 1 ≤ k ≤ n. Por lo tanto,uk = 0 para todo 1 ≤ k ≤ n.

3. Un producto interno de funciones continuas: Consideremos el R-espacio vectorial

V = C0[0, 1] = {f : [0, 1]→ R / f es continua sobre [0, 1]}.

Sean f, g : [0, 1]→ R. Se define

〈f, g〉 :=

∫ 1

0

f(t)g(t)dt.

Es importante recordar que las funciones continuas son integrables, además de laspropiedades de linealidad de la integral definida. Veamos que 〈−,−〉 : C0[0, 1] ×C0[0, 1]→ R define un producto interno en C0[0, 1].

(a) Sean f, g, h ∈ C0[0, 1]. Recuerde

〈f + g, h〉 =

∫ 1

0

(f + g)(t)h(t)dt =

∫ 1

0

(f(t) + g(t))h(t)dt

=

∫ 1

0

(f(t)h(t) + g(t)h(t))dt =

∫ 1

0

f(t)h(t)dt+

∫ 1

0

g(t)h(t)dt

= 〈f, h〉+ 〈g, h〉 .

(b) Sean f, g ∈ C0[0, 1]:

〈f, g〉 =

∫ 1

0

f(t)g(t)dt =

∫ 1

0

g(t)f(t)dt = 〈g, f〉 .

5

Page 6: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

(c) Sean f, g ∈ C0[0, 1] y α ∈ R:

〈αf, g〉 =

∫ 1

0

αf(t)g(t)dt = α

∫ 1

0

f(t)g(t)dt = α 〈f, g〉 .

(d) Sea f ∈ C0[0, 1]:

〈f, f〉 =

∫ 1

0

f(t)f(t)dt =

∫ 1

0

(f(t))2dt ≥ 0, ya que (f(t))2 ≥ 0 para todo t ∈ [0, 1].

Es claro que si f = 0, entonces 〈f, f〉 = 0. Ahora supongamos que 〈f, f〉 = 0.Tenemos entonces∫ 1

0

(f(t))2dt = 0 y f 2 ≥ 0.

Al ser f 2 continua en [0, 1], las dos condiciones anteriores implican que f 2(t) = 0para todo t ∈ [0, 1]. Por lo tanto, f = 0.

Como ejemplo, calculemos 〈f, g〉 para f(t) = t2 y g(t) = 4− t:

〈f, g〉 =

∫ 1

0

f(t)g(t)dt =

∫ 1

0

t2(4− t)dt =

∫ 1

0

(−t3 + 4t2)dt

= −∫ 1

0

t3dt+ 4

∫ 1

0

t2dt = − t4

4

∣∣∣∣10

+ 4t3

3

∣∣∣∣10

= −1

4+

4

3=

13

12∈ R.

4. Tomemos nuevamente K = R y consideremos el R-espacio vectorial de las funcionesintegrables (según Riemann) sobre [0, 1]:

V = R[0, 1] = {f : [0, 1]→ R / f es integrable sobre [0, 1]}.

Consideremos la función de dos variables del ejemplo anterior pero extendida aR[0, 1]×R[0, 1]:

〈−,−〉 : R[0, 1]×R[0, 1]→ R

〈f, g〉 :=

∫ 1

0

f(t)g(t)dt.

Tal función está bien definida pues el producto de funciones integrables es inte-grable. La diferencia de este ejemplo con el anterior es que 〈−,−〉 no define unproducto interno en R[0, 1], pues falla en ser definido-positivo (aunque sí satisfaceel resto de las propiedades de un producto interno). Es decir, podemos encontrar

6

Page 7: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

f 6= 0 en R[0, 1] tal que 〈f, f〉 = 0. En efecto, sea f : [0, 1]→ R la función dada por

f(t) =

{0 si t ∈ [0, 1)1 si t = 1.

Primero, notamos que ∫ 1

0

f(t)dt = 0,

por lo que f ∈ R[0, 1]. Por otro lado, es claro que f 6= 0 y además:

〈f, f〉 =

∫ 1

0

(f(f))2dt =

∫ 1

0

f(t)dt = 0.

3.2 Norma de un vector

Cuando estudiamos el espacio de n-uplas en el curso de GAL 1, aprendimos que el pro-ducto escalar en Rn induce una función || − || : Rn → R≥0 conocida como la norma en Rn,por medio de la igualdad

||(x1, . . . , xn)|| :=√〈(x1, . . . , xn), (x1, . . . , xn)〉.

En esta sección estudiaremos el concepto de norma de manera más general y presentare-mos algunos ejemplos. A diferencia de lo que ocurre con lo que ya sabemos de Rn, notoda norma en un espacio vectorial estará inducida por un producto interno.

Definición 3.2.1. Sea V un K-espacio vectorial. Una norma sobre V es una función

|| − || : V → R

que satisface las siguientes propiedades:

1. ||αv|| = |α| · ||v||, para todo v ∈ V y α ∈ K.

2. ||v|| ≥ 0, para todo v ∈ V . Más aún, ||v|| = 0 si, y sólo si, v = ~0.

3. Desigualdad triangular: ||u+ v|| ≤ ||u||+ ||v|| para todo u, v ∈ V . ♣

7

Page 8: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Ejemplo 3.2.2. Los siguientes son ejemplos de normas.

1. La norma p en Rn: Sea p ∈ N y consideremos V = Rn y K = R. Definimos la sigu-iente función:

||(x1, . . . , xn)||p := p

√√√√ n∑k=1

|xk|p.

Es claro que ||(x1, . . . , xn)||p ≥ 0 y además

||α(x1, . . . , xn)||p = ||(αx1, . . . , αxn)||p = p

√√√√ n∑k=1

|αxk|p = p

√√√√ n∑k=1

|α|p|xk|p

= p

√√√√|α|p n∑k=1

|xk|p = p√|α|p p

√√√√ n∑k=1

|xk|p = |α| p√√√√ n∑

k=1

|xk|p

= |α| · ||(x1, . . . , xn)||p.

Para probar la desigualdad triangular, usamos las siguientes desigualdades:

|x+ y|p ≤ |x|p + |y|p, y p√|x|+ |y| ≤ p

√|x|+ p

√|y|.

Entonces para (x1, . . . , xn), (y1, . . . , yn) ∈ Rn tenemos lo siguiente:

||(x1, . . . , xn) + (y1, . . . , yn)||p = ||(x1 + y1, . . . , xn + yn)||p = p

√√√√ n∑k=1

|xk + yk|p

≤ p

√√√√ n∑k=1

|xk|p + |yk|p = p

√√√√ n∑k=1

|xk|p +n∑

k=1

|yk|p

≤ p

√√√√ n∑k=1

|xk|p + p

√√√√ n∑k=1

|yk|p

= ||(x1, . . . , xn)||p + ||(y1, . . . , yn)||p.

Por lo tanto, la norma p en Rn es, en efecto, una norma.

2. La norma∞ en Rn: Consideremos de nuevo Rn y el cuerpo de escalares R. Se definela norma infinita como:

||(x1, . . . , xn)||∞ := max{|xk| : k = 1, . . . , n}.

8

Page 9: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Es claro que ||(x1, . . . , xn)||∞ ≥ 0, y por propiedades de máximos de conjuntos denúmeros reales, tenemos:

||α(x1, . . . , xn)||∞ = ||(αx1, . . . , αxn)||∞ = max{|αxk| : k = 1, . . . , n}= max{|α||xk| : k = 1, . . . , n} = |α| ·max{|xk| : k = 1, . . . , n}= |α| · ||(x1, . . . , xn)||∞

Para la desigualdad triangular, hace falta recordar que:

max(S + T ) ≤ max(S) + max(T ),

donde S y T son conjuntos no vacíos de números reales. Luego, para (x1, . . . , xn), (y1, . . . , yn) ∈Rn tenemos:

||(x1, . . . , xn) + (y1, . . . , yn)||∞ = ||(x1 + y1, . . . , xn + yn)||∞= max{|xk + yk| : k = 1, . . . , n}≤ max{|xk|+ |yk| : k = 1, . . . , n}≤ max{|xk| : k = 1, . . . , n}+ max{|yk| : k = 1, . . . , n}= ||(x1, . . . , xn)||∞ + ||(y1, . . . , yn)||∞.

Por lo tanto, la norma infinita define una norma sobre Rn.

3. La norma p en C0[a, b]: Sea p ∈ N, K = R y

V = C0[a, b] = {f : [a, b]→ R / f es continua en [a, b]}.

Sea f ∈ C0[a, b]. Se define la siguiente función:

||f ||p :=p

√∫ b

a

|f(t)|pdt.

Es claro que ||f ||p ≥ 0 y por propiedades de la intergral y de la raíz p-ésima, tenemospara α ∈ R, f, g ∈ C0[a, b] lo siguiente:

||αf ||p =p

√∫ b

a

|αf(t)|pdt =p

√∫ b

a

|α|p · |f(t)|pdt =p

√|α|p

∫ b

a

|f(t)|pdt

= p√|α|p p

√∫ b

a

|f(t)|pdt

= |α| · ||f ||p.

9

Page 10: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

||f + g||p =p

√∫ b

a

|f(t) + g(t)|pdt

≤ p

√∫ b

a

|f(t)|p + |g(t)|pdt (ya que |f(t) + g(t)|p ≤ |f(t)|p + |g(t)|p

y por monotonía de la integral.)

≤ p

√∫ b

a

|f(t)|pdt+

∫ b

a

|g(t)|pdt

≤ p

√∫ b

a

|f(t)|pdt+p

√∫ b

a

|g(t)|pdt

= ||f ||p + ||g||p.

Por lo tanto, || − ||p : C0[a, b]→ R define una norma en C0[a, b].

4. La norma∞ en C0[a, b]: Podemos definir otra norma en C0[a, b] por medio de la fun-ción

|| − ||∞ : C0[a, b]→ R||f ||∞ := max{|f(t)| : a ≤ t ≤ b}.

Primero note que || − ||∞ es una función bien definida ya que toda función continuasobre un intervalo cerrado y acotado tiene máximo absoluto. Por supuesto es claroque ||f ||∞ ≥ 0, y por propiedades del supremo/máximo de subconjuntos no vacíosde R, tenemos ||αf ||∞ = |α| · ||f ||∞. Finalmente, para f, g ∈ C0[a, b], tenemos:

||f + g||∞ = max{|f(t) + g(t)| : a ≤ t ≤ b}≤ max{|f(t)|+ |g(t)| : a ≤ t ≤ b}≤ max{|f(t)| : a ≤ t ≤ b}+ max{|g(t)| : a ≤ t ≤ b}= ||f ||∞ + ||g||∞.

3.3 Relaciones entre norma y producto interno

La primera relación que mencionaremos entre los conceptos de producto interno y denorma, es que todo producto interno induce una norma. Para demostrar esto, necesitamosun resultado conocido como la desigualad de Cauchy-Schwarz.

10

Page 11: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Lema 3.3.1 (desigualdad de Cauchy-Schwarz). Sea V un K-espacio vectorial con productointerno 〈−,−〉 : V × V → K, y sea || − || : V → R la función dada por

||v|| :=√〈v, v〉 para todo v ∈ V.

Entonces, para todo u, v ∈ V , se cumple la desigualdad

| 〈u, v〉 | ≤ ||u|| · ||v||.

Demostración: Si 〈u, v〉 = 0, entonces no hay nada que demostrar pues ||u|| · ||v|| ≥ 0.Podemos suponer entonces que 〈u, v〉 6= 0. Consideremos el polinomio p(t) con coefi-cientes reales dado por:

p(t) = ||v||2t2 − 2| 〈u, v〉 |t+ ||u||2.

Se trata de un polinomio no negativo p(t) ≥ 0, por lo que su discriminante ∆ debe sermejor o igual a cero, es decir:

0 ≥ ∆ := (2| 〈u, v〉 |)2 − 4 · ||u||2 · ||v||2 = 4| 〈u, v〉 |2 − 4 · ||u||2 · ||v||2

4| 〈u, v〉 |2 ≤ 4 · ||u||2 · ||v||2

| 〈u, v〉 | ≤ ||u|| · ||v||.

Para finalizar la prueba, nos enfocaremos en probar que p(t) ≥ 0. Para ello, consideremosel número complejo

z =| 〈u, v〉 |〈u, v〉

∈ C.

Para todo t ∈ R arbitrario, tenemos:

0 ≤ ||u− tzv||2 = 〈u− tzv, u− tzv〉0 ≤ ||u||2 + t2z · z||v||2 − 〈u, tzv〉 − 〈tzv, u〉0 ≤ ||u||2 + t2||v||2 − tz 〈u, v〉 − tz〈u, v〉 (ya que ||z||2 = 1)0 ≤ ||u||2 + t2||v||2 − 2t · Re(z 〈u, v〉)

2t · Re(z 〈u, v〉) ≤ t2||v||2 + ||u||2.

Como z 〈u, v〉 = 〈u,v〉|〈u,v〉| · 〈u, v〉 = | 〈u, v〉 |, tenemos que Re(z 〈u, v〉) = | 〈u, v〉 |. Por lo tanto:

2t · | 〈u, v〉 | = 2t · Re(z 〈u, v〉) ≤ t2||v||2 + ||u||2

0 ≤ ||v||2t2 − 2| 〈u, v〉 |t+ ||u||2 = p(t).

11

Page 12: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Teorema 3.3.2 (norma inducida). Todo K-espacio vectorial V con producto interno 〈−,−〉posee una norma || − || : V → R definida por

||v|| :=√〈v, v〉.

A tal || − || se le conoce como la norma inducida por 〈−,−〉. ♥

Demostración: Sean v, w ∈ V y α ∈ K. Sabemos que 〈v, v〉 ≥ 0, entonces

||v|| =√〈v, v〉 ≥ 0,

por lo que la segunda propiedad de la definición de norma queda demostrada. Por otrolado,

||αv|| =√〈αv, αv〉 =

√α 〈v, αv〉 =

√αα 〈v, v〉 =

√|α|2 〈v, v〉 =

√|α|2 ·

√〈v, v〉 = |α| · ||v||.

Finalmente:

||v + w||2 = 〈v + w, v + w〉 = 〈v, v + w〉+ 〈w, v + w〉= 〈v, v〉+ 〈v, w〉+ 〈w, v〉+ 〈w,w〉= ||v||2 + 〈v, w〉+ 〈v, w〉+ ||w||2

= ||v||2 + 2Re(〈v, w〉) + ||w||2

≤ ||v||2 + 2| 〈v, w〉 |+ ||w||2 (ya que Re(〈v, w〉) ≤ | 〈v, w〉 |)≤ ||v||2 + 2||v|| · ||w||+ ||w||2 (por Cauchy-Schwarz)= (||v||+ ||w||)2.

Tenemos entonces||v + w||2 ≤ (||v||+ ||w||)2,

por lo que finalmente se tiene

||v + w|| ≤ ||v||+ ||w||.

Por lo tanto, || − || es una norma en V .

Aunque todo producto interno induzca una norma, lo contrario no siempre ocurre. Esdecir, no es cierto en general que toda norma esté inducida por un producto interno.

Observación 3.3.3. Existen normas que no están inducidas por un producto interno. Estopara con cualquier norma p en Rn tomando p > 2. Consideremos por ejemplo V = R2 yK = R, y supongamos que ||−||p está inducida por un producto interno 〈−,−〉 : R2×R2 →R. Sean x = (x1, x2) y y = (y1, y2) en R2. Tenemos:

12

Page 13: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

〈x+ y, x+ y〉 = 〈x, x〉+ 〈y, y〉+ 2 〈x, y〉||x+ y||2p = ||x||2p + ||y||2p + 2 〈x, y〉

〈x, y〉 =||x+ y||2p − ||x||2p − ||y||2p

2

〈x, y〉 =1

2

(p√

(|x1 + y1|p + |x2 + y2|p)2 − p√

(|x1|p + |x2|p)2 − p√

(|y1|p + |y2|p)2)

y esta última expresión para 〈x, y〉 no es aditiva en ninguna componente si p > 2.

Para p = 2, sin embargo, tenemos:

〈x, y〉 =1

2

(√(|x1 + y1|2 + |x2 + y2|2)2 −

√(|x1|2 + |x2|2)2 −

√(|y1|2 + |y2|2)2

)=

1

2

(|x1 + y1|2 + |x2 + y2|2 − (|x1|2 + |x2|2)− (|y1|2 + |y2|2)

)=

1

2

((x1 + y1)

2 + (x2 + y2)2 − (x21 + x22)− (y21 + y22)

)=

1

2

(x21 + 2x1y1 + y21 + x22 + 2x2y2 + y22 − x21 − x22 − y21 − y22

)=

1

2(2x1y1 + 2x2y2)

= x1y1 + x2y2,

y esta expresión sí es aditiva en ambas componentes. ♠

Mencionamos anteriormente que el producto escalar de Rn representa la geometría deRn, ya que, por ejemplo, es posible definir el ángulo entre dos n-uplas. Para el contextomás abstracto dado por un espacio vectorial cualquiera con producto interno, también sepueden tener algunas nociones de geometría. Esto estará representado por medio de dosresultados conocidos como la igualdad del paralelogramo y el Teorema de Pitágoras. Empece-mos demostrando el primero de ellos, mientras que el Teorema de Pitágoras lo dejaremospara el final.

Proposición 3.3.4 (igualdad del paralelogramo). Sea V un K-espacio vectorial con pro-ducto interno, y || − || : V → R la norma inducida. Entonces,

||u+ v||2 + ||u− v||2 = 2(||u||2 + ||v||2)

para todo u, v ∈ V . ♥

13

Page 14: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Demostración: Basta con calcular ||u+ v||2 y ||u− v||2 y sumar.

||u+ v||2 = 〈u+ v, u+ v〉 = 〈u, u〉+ 〈u, v〉+ 〈v, u〉+ 〈v, v〉= ||u||2 + 〈u, v〉+ 〈u, v〉+ ||v||2

= ||u||2 + 2Re(〈u, v〉) + ||v||2,||u− v||2 = 〈u− v, u− v〉 = 〈u, u〉 − 〈u, v〉 − 〈v, u〉+ 〈v, v〉

= ||u||2 − 2Re(〈u, v〉) + ||v||2,||u+ v||2 + ||u− v||2 = (||u||2 + 2Re(〈u, v〉) + ||v||2) + (||u||2 − 2Re(〈u, v〉) + ||v||2)||u+ v||2 + ||u− v||2 = 2(||u||2 + ||v||2).

El resultado anterior es importante para caracterizar cuándo una norma está inducida porun producto interno. Tal caracterización viene dada por el Teorema de Jordan - von Neu-mann, del cual daremos su demostración.

Teorema 3.3.5 (teorema de Jordan - von Neumann). Sea || − || : V → R una norma en V ,con V un R-espacio vectorial. Entonces, las siguientes condiciones son equivalentes:

(a) || − || está inducida por un producto interno.(b) || − || satisface la igualdad del paralelogramo. ♥

Demostración: La implicación (a) =⇒ (b) ya fue probada en la proposición anterior.

Supongamos ahora que

||u+ v||2 + ||u− v||2 = 2(||u||2 + ||v||2).

Notamos entonces lo siguiente:

||u+ v||2 − ||u− v||2 = 2(||u||2 + ||v||2 − ||u− v||2). (i)

Si hacemos v = u en la igualdad anterior, tenemos

||u+ u||2 − ||u− u||2 = 4||u||2.

Tiene entonces sentido definir 〈−,−〉 : V × V → K como

〈u, v〉 :=1

4[||u+ v||2 − ||u− v||2].

Notamos que 〈u, u〉 = ||u||2, por lo que ||u|| =√〈u, u〉, por lo que || − || está inducida por

la función 〈−,−〉.

14

Page 15: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Debemos ahora probar que 〈−,−〉 es un producto interno en V . Para tal fin daremos var-ios pasos.

• Probemos primero la igualdad

〈u+ v, w〉+ 〈u− v, w〉 = 2 〈u,w〉 . (ii)

Tenemos:

〈u+ v, w〉 =1

4[||u+ v + w||2 − ||u+ v − w||2],

〈u− v, w〉 =1

4[||u− v + w||2 − ||u− v − w||2],

〈u+ v, w〉+ 〈u− v, w〉 =1

4[||u+ w + v||2 + ||u+ w − v||2 − ||u− w + v||2 − ||u− w − v||2]

=1

4[2||u+ w||2 + 2||v||2 − 2||u− w||2 − 2||v||2]

=1

2[||u+ w||2 − ||u− w||2]

= 2 〈u,w〉 .

• Aditividad: Sean u, v, w ∈ V y consideremos

u′ =u+ v

2y v′ =

u− v2

.

Tenemos por (ii) que:

〈u′ + v′, w〉+ 〈u′ − v′, w〉 = 2 〈u′, w〉

〈u,w〉+ 〈v, w〉 = 2

⟨u+ v

2, w

⟩.

Para terminar esta parte, probaremos que

2

⟨u+ v

2, w

⟩= 〈u+ v, w〉 .

Primero, es necesario observar por la ley del paralelogramo que:

||u+ v + 2w||2 + ||u+ v||2 = 2||u+ v + w||2 + 2||w||2

||u+ v + 2w||2 = 2||u+ v + w||2 + 2||w||2 − ||u+ v||2,||u+ v||2 + ||u+ v − 2w||2 = 2||u+ v − w||2 + 2||w||2

||u+ v − 2w||2 = 2||u+ v − w||2 + 2||w||2 − ||u+ v||2.

15

Page 16: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Luego:

2

⟨u+ v

2, w

⟩= 2 · 1

4

[∣∣∣∣∣∣∣∣u+ v

2+ w

∣∣∣∣∣∣∣∣2 − ∣∣∣∣∣∣∣∣u+ v

2− w

∣∣∣∣∣∣∣∣2]

=1

2· 1

4[||u+ v + 2w||2 − ||u+ v − 2w||2]

=1

8[2||u+ v + w||2 + 2||w||2 − ||u+ v||2 − 2||u+ v − w||2 − 2||w||2 + ||u+ v||2]

=1

8[2||u+ v + w||2 − 2||u+ v − w||2]

=1

4[||u+ v + w||2 − ||u+ v − w||2]

= 〈u+ v, w〉 .

Por lo tanto,

〈u,w〉+ 〈v, w〉 = 〈u+ v, w〉 .

• Como 〈−,−〉 es un candidato a producto interno con valores reales, debemos probarque es simétrico, es decir, 〈u, v〉 = 〈v, u〉. Tenemos:

〈u, v〉 =1

4[||u+ v||2 − ||u− v||2] =

1

4[||v + u||2 − || − (v − u)||2]

=1

4[||v + u||2 − ||v − u||2]

= 〈v, u〉 .

• Ser definida positiva: Ya sabemos que 〈u, u〉 = ||u||2 ≥ 0, y es claro que⟨~0,~0⟩

= 0.Ahora supongamos que 〈u, u〉 = 0. Luego, ||u||2 = 0. Como || − || es una norma,tenemos que ||u|| = 0 implica que u = ~0. Por lo tanto, la función 〈−,−〉 es definidapositiva.

• Homogeneidad: Ésta es la parte más difícil de probar. Queremos ver que 〈αu, v〉 =

α 〈u, v〉 para todo u, v ∈ V y α ∈ K. Probaremos esto por etapas: primero para αen los enteros, racionales y finalmente reales. Los argumentos a continuación in-volucran resultados de matemáticas discretas (inducción) y de análisis matemático(continuidad).

〈αu, v〉 =1

4[||αu+ v||2 − ||αu− v||2].

16

Page 17: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Sea S el siguiente conjunto:

S = {λ ∈ R : λ 〈u, v〉 = 〈λu, v〉}.

Veamos que S = R.

(i) Z ⊆ S : Es claro que −1, 0, 1 ∈ S. Para el primero de estos valores, por ejemplo,se tiene:

〈−u, v〉 =1

4[|| − u+ v||2 − || − u− v||2] =

1

4[|| − (u− v)||2 − || − (u+ v)||2]

=1

4[||u− v||2 − ||u+ v||2] = −1

4[||u+ v||2 − ||u− v||2]

= −〈u, v〉 .

Usemos ahora el principio de inducción para probar que N ⊆ S. Supongamosque k ∈ N es un número natural que cumple 〈ku, v〉 = k 〈u, v〉. Para k + 1,tenemos:

〈(k + 1)u, v〉 = 〈ku, v〉+ 〈u, v〉 (por la aditividad ya probada)= k 〈u, v〉+ 〈u, v〉= (k + 1) 〈u, v〉 .

Por lo tanto, el principio de inducción implica que 〈nu, v〉 = n 〈u, v〉 para todon ∈ N. Ahora, para el caso m ∈ Z, podemos escribir m = −|m|, donde |m| ∈ N.Así tenemos:

〈mu, v〉 = 〈−|m|u, v〉 = −〈|m|u, v〉 (porque −1 ∈ S)= −|m| 〈u, v〉 (porque N ⊆ S)= m 〈u, v〉 .

Por lo tanto, Z ⊆ S.

(ii) Q ⊆ S: Sean a, b ∈ Z tales que b 6= 0. Tenemos por el inciso anterior que:

〈au, v〉 =⟨b · a

bu, v⟩

a 〈u, v〉 = b⟨abu, v⟩

(porque Z ⊆ S)a

b〈u, v〉 =

⟨abu, v⟩.

Por lo tanto, Q ⊆ S.

17

Page 18: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

(iii) R = S: Fijamos u, v ∈ V , y definimos las siguientes funciones de variable real:

f : R→ R f : R→ Rf(λ) = λ 〈u, v〉 g(λ) = 〈λu, v〉 .

Tenemos que f y g son funciones continuas y que coinciden en Q. Por propiedadesde la continuidad, lo anterior implica que f = g sobre R. Es decir,

〈λu, v〉 = λ 〈u, v〉

para todo λ ∈ R.

Antes de estudiar ortogonalidad entre vectores, veamos cuándo son colineales.

Definición 3.3.6. Sean u y v dos vectores en un K-espacio vectorial V . Se dice que u y vson colineales si existe α ∈ K tal que u = αv. ♣

Podemos caracterizar en concepto anterior cuando trabajamos en un espacio vectorial conproducto interno.

Proposición 3.3.7. Sea V un K-espacio vectorial con producto interno 〈−,−〉 y sea ||− || lanorma inducida por 〈−,−〉. Entonces, u y v en V son colineales si, y solo si,

||u|| · ||v|| = | 〈u, v〉 |.

En otras palabras, dos vectores son colineales si para ellos la Desigualdad de Cauchy-Schwarz se convierte en igualdad. ♥

Demostración: Supongamos primero que u y v son colineales. Entonces, existe α ∈ K talque u = αv. Luego,

| 〈u, v〉 | = | 〈αv, v〉 | = |α 〈v, v〉 | = |α| · ||v||2 = (|α| · ||v||)||v|| = ||u|| · ||v||.

Ahora supongamos que se da la igualdad ||u|| · ||v|| = | 〈u, v〉 |. Debemos hallar α ∈ K talque ||u − αv|| = 0 para probar que u y v son colineales. Resolvemos entones la ecuaciónanterior:

||u− αv||2 = 〈u− αv, u− αv〉= ||u||2 − α 〈u, v〉 − α 〈v, u〉+ |α|2||v||2

= ||u||2 − 2Re(α 〈u, v〉) + |α|2||v||2.

18

Page 19: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Como queremos ||u− αv||2 = 0, nos queda:

||u||2 − 2Re(α 〈u, v〉) + |α|2||v||2 = 0

||u||2 + |α|2||v||2 = 2Re(α 〈u, v〉).

Tomamosα =

〈u, v〉||v||2

.

Luego,

α =〈u, v〉||v||2

α · 〈u, v〉 =〈u, v〉||v||2

· 〈u, v〉 =| 〈u, v〉 |2

||v||2=||u||2 · ||v||2

||v||2= ||u||2

2Re(α · 〈u, v〉) = 2||u||2.

|α|2 =

∣∣∣∣〈u, v〉||v||2

∣∣∣∣2 =| 〈u, v〉 |2

||v||4=||u||2 · ||v||2

||v||4=||u||2

||v||2

||u||2 + |α|2||v||2 = ||u||2 +||u||2

||v||2· ||v||2 = 2||u||2.

Por lo tanto, ||u||2 + |α|2||v||2 = 2Re(α 〈u, v〉) para α = 〈u,v〉||v||2 . Es decir,

u =〈u, v〉||v||2

v.

Cerramos esta sección enunciando y demostrando el Teorema de Pitágoras, el cual carac-teriza los vectores ortogonales.

Definición 3.3.8. Sea V un espacio vectorial con producto interno 〈−,−〉. Dos vectoresu, v ∈ V se dicen ortogonales si 〈u, v〉 = 0. Esto suele denotarse como u ⊥ v. ♣

Teorema 3.3.9 (teorema generalizado de Pitágoras). Sea V un K-espacio vectorial con pro-ducto interno 〈−,−〉 y sea || − || la norma inducida por 〈−,−〉. Si u y v son dos vectoresortogonales, entonces

||u||2 + ||v||2 = ||u+ v||2.

Mas aún, para el caso K = R, el recíproco también se cumple. ♥

19

Page 20: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Demostración: Por un lado, sabemos que

||u+ v||2 = ||u||2 + 2Re(〈u, v〉) + ||v||2.

Entonces, si u y v son ortogonales, tenemos que 〈u, v〉 = 0, por lo que la igualdad anteriorse convierte en ||u+ v||2 = ||u||2 + ||v||2.

Ahora supongamos que se cumple la igualdad anterior. Entonces, Re(〈u, v〉) = 0. Sisuponemos además que K = R, tenemos entonces que 〈u, v〉 ∈ R, y por lo tanto 〈u, v〉 =Re(〈u, v〉) = 0, es decir, u y v son ortogonales.

Observación 3.3.10. Para el caso K = C, el recíproco de Teorema de Pitágoras no es nece-sariamente cierto. Por ejemplo, consideremos el espacio vectorial complejo C con pro-ducto interno

〈−,−〉 : C× C→ C〈u, v〉 = u · v.

Sean u = 1 y v = i. Tenemos que ||u + v||2 = ||1 + i||2 = (√

2)2 = 2 y que ||u||2 + ||v||2 =1 + 1 = 2. Por otro lado, 〈1, i〉 = 1 · (−i) = −i. ♠

3.4 Conjuntos ortogonales y ortonormales.Proceso de ortonormalización de Gram-Schmidt

El objetivo de esta sección es estudiar conjuntos de vectores que son ortogonales dos ados. Esto nos llevará a la noción de base ortogonal de un espacio vectorial con productointerno. Demostraremos que siempre es posible hallar tales bases, mediante un proced-imiento conocido como el Proceso de ortonormalización de Gram-Schimidt.

Definición 3.4.1. Sea V un K-espacio vectorial con producto interno y A un conjunto novacío de vectores en V . Se dice que A es ortogonal si los vectores de A son ortogonalesdos a dos, es decir, si para cualesquiera u, v ∈ V con u 6= v se tiene que u ⊥ v. Si ademásse cumple que ||u|| = 1 para todo u ∈ V , se dice que A es un conjunto ortonormal. ♣

Observación 3.4.2. Podemos notar lo siguiente de la definición de ortogonalidad:1. ~0 ⊥ v para todo v ∈ V , pues

⟨~0, v⟩

= 0.

2. v ⊥ v si, y sólo si, v = ~0. Esto se sigue de la definición de norma inducida y de ladefinición de norma, ya que ||v||2 = 〈v, v〉.

20

Page 21: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

3. Si A es un conjunto ortogonal y ~0 6∈ A, entonces{1

||v||v : v ∈ A

}es un conjunto ortonormal. Es otras palabras, todo conjunto ortogonal formado porvectores no nulos se puede normalizar. ♠

Ejemplo 3.4.3. Los siguientes son ejemplos de conjuntos ortonormales:1. La base canónica E = {e1, . . . , en} de Rn (o de Cn) es un conjunto ortonormal (re-

specto al producto interno estándar del Ejemplo 3.1.4). Recuerde que

ei = (0, . . . , 0, 1, 0, . . . , 0) (con 1 en la i-ésima posición)

para cada 1 ≤ i ≤ n.

2. Los vectores (1, 2) y (−2, 1) de R2 son ortogonales respecto al producto escalar. Con-sideremos ahora la función

〈−,−〉 : R2 × R2 → R2

〈(x, y), (x′, y′)〉 := xx′ − yx′ − xy′ + 4yy′.

Se puede verificar que 〈−,−〉 define otro producto interno en R2. Con respecto a estenuevo producto, se tiene que

〈(1, 2), (−2, 1)〉 = 1 · (−2)− 2 · (−2)− 1 · 1 + 4 · 2 · 1 = −2 + 4− 1 + 8 = 9,

por lo que (1, 2) y (−2, 1) no son ortogonales respecto a este nuevo producto interno.

3. Sea V = Mn(C) con el producto interno dado por:

〈−,−〉 : Mn(C)×Mn(C)→Mn(C)

〈A,B〉 := tr(A ·Bt).

El conjunto A = {Epq : 1 ≤ p, q ≤ n} es ortonormal, donde Epq es la matriz con 1 enla entrada (p, q) y 0 en el resto.

4. Consideremos ahora el espacio vectorial real V = C0[0, 1] de las funciones continuasf : [0, 1]→ R y con el producto interno del Ejemplo 3.1.4:

〈f, g〉 =

∫ 1

0

f(t)g(t)dt.

21

Page 22: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Definamos fn(t) =√

2cos(2πnt) y gn(t) =√

2sen(2πnt) con n ∈ N. Tenemos unconjunto ortonormal infinito dado por

A = {1, f1, g1, f2, g2, . . . }.

El resto de esta sección se dedicará a demostar que todo espacio vectorial con prodcutointerno posee una base ortonormal, es decir, una base que es un conjunto ortonormal enel sentido de la Definición 3.4.1. El primer paso hacia esto es demostrar que todo conjuntoortogonal formado con vectores no nulos es linealmente independiente.

Proposición 3.4.4. Sea V un K-espacio vectorial con producto interno 〈−,−〉. Si A ⊆ V esun conjunto ortogonal de vectores no nulos, entoncesA es linealmente independiente. ♥

Demostración: Probaremos sólo en caso en el que el conjuntoA es finito, aunque el argu-mento mostrado a continuación también sirve para el caso infinito. Supongamos entoncesA = {v1, v2, . . . , vm} y sean α1, α2, . . . , αm ∈ K tales que

α1v1 + α2v2 + · · ·+ αmvm = ~0.

Consideremos i fijo entre 1 y m. Luego,

0 =⟨~0, vi

⟩=

⟨m∑k=1

αkvk, vi

=m∑k=1

αk 〈vk, vi〉 (por propiedades del producto interno)

= αi 〈vi, vi〉 (porque vk ⊥ vi para todo k 6= i).

Tenemos entonces αi||vi||2 = 0 donde ||vi|| 6= 0 ya que A está formado por vectores nonulos. Por lo tanto, αi = 0. Esto último vale para cualquier 1 ≤ i ≤ m, por lo cual A es unconjunto linealmente independiente.

Veamos un par más de propiedades de los conjuntos ortonormales.

Proposición 3.4.5. Si A = {v1, v2, . . . , vm} es un conjunto ortonormal en un K-espaciovectorial V con producto interno 〈−,−〉, entonces

||α1v1 + α2v2 + · · ·+ αmvm||2 = |α1|2 + |α2|2 + · · ·+ |αm|2

para todo α1, α2, . . . , αm ∈ K. ♥

22

Page 23: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Demostración: Consideremos la combinación lineal α1v1 + α2v2 + · · · + αmvm. Tenemosentonces por propiedades del producto interno lo siguiente:

||α1v1 + α2v2 + · · ·+ αmvm||2 =

⟨m∑k=1

αkvk,m∑j=1

αjvj

⟩=

m∑k=1

αk

⟨vk,

m∑j=1

αjvj

=m∑k=1

m∑j=1

αkαj 〈vk, vj〉 .

Como A es un conjunto ortonormal, tenemos:

〈vk, vj〉 =

{0 si k 6= j,||vk||2 si k = j

=

{0 si k 6= j,1 si k = j

Por lo tanto:

||α1v1 + α2v2 + · · ·+ αmvm||2 =m∑k=1

m∑j=1

αkαj 〈vk, vj〉 . =m∑k=1

αkαk · 1 =m∑k=1

|αk|2

= |α1|2 + |α2|2 + · · ·+ |αm|2.

Proposición 3.4.6. Sea V un K-espacio vectorial con producto interno 〈−,−〉 y de dimen-sión n, y B = {e1, e2, . . . , en} una base ortonormal de V . Entonces,

v = 〈v, e1〉 e1 + 〈v, e2〉 e2 + · · ·+ 〈v, en〉 en

y||v||2 = | 〈v, e1〉 |2 + | 〈v, e2〉 |2 + · · ·+ | 〈v, en〉 |2

para todo v ∈ V . ♥

Demostración: Sea v ∈ V . Sabemos que existen escalares α1, α2, . . . , αn ∈ K tales que

v = α1v1 + α2v2 + · · ·+ αnvn =n∑

k=1

αkvk.

Fijamos i entre 1 y n. Tenemos:

〈v, vi〉 =

⟨n∑

k=1

αkvk, vi

⟩=

n∑k=1

αk 〈vk, vi〉 = αi 〈vi, vi〉 = αi||vi||2 = αi

porque B es una base ortonormal. Entonces αi = 〈v, vi〉 para cada i = 1, 2, . . . , n. Por lotanto, al sustituir cada escalar obtenemos:

23

Page 24: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

v = 〈v, e1〉 e1 + 〈v, e2〉 e2 + · · ·+ 〈v, en〉 en.

La igualdad||v||2 = | 〈v, e1〉 |2 + | 〈v, e2〉 |2 + · · ·+ | 〈v, en〉 |2

es consecuencia de la igualdad anterior y de la Proposición 3.4.5.

Estamos listos para demostrar cómo construir una base ortonormal en cualquier espaciovectorial con producto interno.

Teorema 3.4.7 (proceso de ortonormalización de Gram-Schmidt). Sea V un K-espaciovectorial con producto interno y B = {v1, v2, . . . , vn} una base de V (dim(V ) = n). En-tonces, existe una base ortonormal B′ = {y1, y2, . . . , yn} de V tal que 〈{v1, v2, . . . , vk}〉 =〈{y1, y2, . . . , yk}〉 para todo k = 1, 2, . . . , n. ♥

Demostración: Sólo basta con hallar una base ortogonal Bo = {u1, u2, . . . , un} que sat-isfaga la condición 〈{v1, v2, . . . , vk}〉 = 〈{u1, u2, . . . , uk}〉, ya que ésta se puede normalizaral estar formada por vectores no nulos. La demostración la haremos usando inducciónsobre n = dim(V ).

1. Paso inicial n = 1:

Aquí no hay nada que demostrar, pues basta tomar Bo = {v1} = B.

2. Para que se entienda el paso inductivo más adelante, probemos también el pason = 2:

Lo primero que hacemos es escoger u1 = v1. Considere el triángulo formado por losvectores αu1, v2 y v2 − αu1. Debemos hallar α ∈ K tal que este triángulo sea rectán-gulo (lo cual es equivalente a pedir que u1 y v2 − αu1 sean ortogonales). Entonces,hacemos:

0 = 〈v2 − αu1, u1〉 = 〈v2, u1〉 − α 〈u1, u1〉α 〈u1, u1〉 = 〈v2, u1〉

α =〈v2, u1〉〈u1, u1〉

.

Seau2 := v2 −

〈v2, u1〉〈u1, u1〉

u1.

Tenemos que u2 ⊥ u1 por construcción.

24

Page 25: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Ahora veamos que 〈{v1, v2}〉 = 〈{u1, u2}〉. La contención 〈{u1, u2}〉 ⊆ 〈{v1, v2}〉 esclara porque u1, u2 ∈ 〈{v1, v2}〉. Por otro lado, v1 ∈ 〈{u1, u2}〉 ya que v1 = u1.Además, v2 = u2 + 〈v2,u1〉

〈u1,u1〉u1, y así v2 ∈ 〈{u1, u2}〉. La contención restante tambiénse cumple, y así 〈{v1, v2}〉 = 〈{u1, u2}〉.

Falta verificar que {u1, u2} es un conjunto linealmente independiente. Supongamosque α1u1 + α2u2 = ~0. Luego:

~0 = α1u1 + α2u2 = αu1 + α2

(v2 −

〈v2, u1〉〈u1, u1〉

u1

)=

(α1 − α2

〈v2, u1〉〈u1, u1〉

)v1 + α2v2.

Como {v1, v2} es linealmente independiente, tenemos que α2 = 0 y α1−α2〈v2,u1〉〈u1,u1〉 = 0.

Entonces, α1 = 0 también. Por lo tanto, {u1, u2} es linealmente independiente.

3. Supongamos que el resultado vale para cualquier espacio vectorial de dimensiónn− 1 (hipótesis inductiva), y veamos que vale también para V con dim(V ) = n (tesisinductiva). A partir de la base B = {v1, v2, . . . , vn} que se nos da para V , consid-eremos el subconjunto linealmente independiente {v1, v2, . . . , vn−1}, el cual es unabase del subespacio W = 〈{v1, v2, . . . , vn−1}〉 generado por {v1, v2, . . . , vn−1}. Por lahipótesis inductiva, podemos hallar una base ortogonal {u1, u2, . . . , un−1} de W talque 〈{u1, u2, . . . , uk}〉 = 〈{v1, v2, . . . , vk}〉 para todo k = 1, 2, . . . , n − 1. Ahora defi-namos el vector un como sigue:

un = vn −〈vn, un−1〉〈un−1, un−1〉

un−1 − · · · −〈vn, u2〉〈u2, u2〉

u2 −〈vn, u1〉〈u1, u1〉

u1 = vn −n−1∑k=1

〈vn, uk〉〈uk, uk〉

uk.

Veamos que un ⊥ ui para todo i = 1, . . . , n− 1:

〈un, ui〉 =

⟨vn −

n−1∑k=1

〈vn, uk〉〈uk, uk〉

uk, ui

⟩= 〈vn, ui〉 −

n−1∑k=1

〈vn, uk〉〈uk, uk〉

〈uk, ui〉

= 〈vn, ui〉 −〈vn, ui〉〈ui, ui〉

〈ui, ui〉 = 〈vn, ui〉 − 〈vn, ui〉

= 0.

Ahora veamos que 〈{u1, . . . , un}〉 = 〈{v1, . . . , vn}〉. Sabemos que 〈{u1, . . . , un−1}〉 =〈{v1, . . . , vn−1}〉. Además, un ∈ 〈{v1, . . . , vn}〉 por la definición de un y porque ademásu1, . . . , un−1 ∈ 〈{v1, . . . , vn−1}〉. Así, 〈{u1, . . . , un}〉 ⊆ 〈{v1, . . . , vn}〉. Usando de nuevola definición de un, se tiene claramente que vn ∈ 〈{u1, . . . , un}〉. Esto, sumado aque 〈{u1, . . . , un−1}〉 = 〈{v1, . . . , vn−1}〉, implica la otra contención 〈{u1, . . . , un}〉 ⊇〈{v1, . . . , vn}〉.

25

Page 26: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Finalmente, comprobemos que {u1, . . . , un} es un conjunto linealmente independi-ente. Supongamos que tenemos una combinación lineal como sigue:

α1u1 + · · ·+ αnun = ~0.

Luego, para cada i = 1, . . . , n− 1 se tiene:

0 =⟨~0, ui

⟩= 〈α1u1 + · · ·+ αnun, ui〉 = α1 〈u1, ui〉+ · · ·+ αn 〈un, ui〉 = αi||ui||2.

Como ui 6= ~0, nos queda que αi = 0 para cada i = 1, . . . , n−1. Tenemos entonces queαnun = ~0. Nótese que un 6= ~0. De lo contrario, se tendría que vn ∈ 〈{u1, . . . , un−1}〉 =〈{v1, . . . , vn−1}〉, lo cual es una contradicción por ser {v1, . . . , vn} un conjunto lineal-mente independiente.

Algunas consecuencias de este procedimiento son las siguientes.

Corolario 3.4.8. Sea V un K-espacio vectorial con producto interno y de dimensión finita.Las siguientes afirmaciones de cumplen:

1. V posee una base ortonormal.

2. Todo conjunto ortonormal de vectores en V se puede extender a una base ortonor-mal de V . ♥

Demostración: Para la primera parte, usamos el hecho conocido de que todo espaciovectorial V posee una base, digamos B. Por el proceso de ortonormalización de Gram-Schmidt, a partir de B podemos obtener una base ortonormal B′ de V .

Para la segunda parte, supongamos que A es un conjunto ortonormal de vectores. Loprimero a notar es que ~0 6∈ A, ya que A es ortonormal y ||~0|| = 0. Entonces, por laProposición 3.4.4, sabemos que A es linealmente independiente. Como todo conjuntolinealmente independiente se puede extender a una base de V , podemos construir unabase B de V tal que A ⊆ B. Finalmente, aplicando el proceso de ortonormalización deGram-Schmidt a B, obtenemos una base ortonormal B′ de V tal que A ⊆ B′. Tenga encuenta que los vectores de A no se ven afectados por el proceso de ortonormalizaciónporque A ya de entrada es un conjunto ortonormal.

Estudiemos algunos ejemplos de cómo aplicar este procedimiento.

26

Page 27: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Ejemplo 3.4.9. Veamos cómo aplicar el proceso de ortonormalización de Gram-Schmidt abases particulares.

1. Considere el R-espacio vectorial R3 equipado con el producto escalar y junto con labase B = {v1, v2, v3} donde

v1 = (3, 0, 4),

v2 = (−1, 0, 7),

v3 = (2, 9, 11).

Construyamos una base ortonormal a partir de B. Primero, hacemos

u1 = v1 = (3, 0, 4).

Para obtener el segundo y tercer vector debemos calcular:

u2 = v2 −〈v2, u1〉〈u1, u1〉

u1,

u3 = v3 −〈v3, u2〉〈u2, u2〉

u2 −〈v3, u1〉〈u1, u1〉

u1.

Entonces:

〈v2, u1〉 = 〈(−1, 0, 7), (3, 0, 4)〉 = −3 + 0 + 28 = 25,

〈u1, u1〉 = 〈(3, 0, 4), (3, 0, 4)〉 = 9 + 0 + 16 = 25,

u2 = (−1, 0, 7)− 〈(−1, 0, 7), (3, 0, 4)〉〈(3, 0, 4), (3, 0, 4)〉

(3, 0, 4)

= (−1, 0, 7)− 25

25(3, 0, 4)

= (−4, 0, 3).

〈v3, u2〉 = 〈(2, 9, 11), (−4, 0, 3)〉 = −8 + 0 + 33 = 25,

〈u2, u2〉 = 〈(−4, 0, 3), (−4, 0, 3)〉 = 16 + 0 + 9 = 25,

〈v3, u1〉 = 〈(2, 9, 11), (3, 0, 4)〉 = 6 + 0 + 44 = 50,

u3 = v3 −〈v3, u2〉〈u2, u2〉

u2 −〈v3, u1〉〈u1, u1〉

u1

= (2, 9, 11)− 25

25(−4, 0, 3)− 50

25(3, 0, 4)

= (0, 9, 0).

27

Page 28: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Ahora sólo resta normalizar los vectores u1, u2 y u3:

y1 =u1||u1||

=1

5(3, 0, 4) =

(3

5, 0,

4

5

),

y2 =u2||u2||

=1

5(−4, 0, 3) =

(−4

5, 0,

3

5

),

y3 =u3||u3||

=1

9(0, 9, 0) = (0, 1, 0).

Por lo tanto,

B′ ={(

3

5, 0,

4

5

),

(−4

5, 0,

3

5

), (0, 1, 0)

}es una base ortonormal de R3 tal que

〈{(3, 0, 4)}〉 =

⟨{(3

5, 0,

4

5

)}⟩,

〈{(3, 0, 4), (−1, 0, 7)}〉 =

⟨{(3

5, 0,

4

5

),

(−4

5, 0,

3

5

)}⟩, y

〈{(3, 0, 4), (−1, 0, 7), (2, 9, 11)}〉 =

⟨{(3

5, 0,

4

5

),

(−4

5, 0,

3

5

), (0, 1, 0)

}⟩= R3.

2. Sea V = R2[x] es R-espacio vectorial de polinomios con coeficientes reales y de gradoa lo sumo 2, equipado con el siguiente producto interno:

〈−,−〉 : R2[x]× R2[x]→ R

〈p, q〉 :=

∫ 1

0

p(x)q(x)dx.

Apliquemos el proceso de ortonormalización de Gram-Schimidt a la base canónicaB = {v0, v1, v2} donde v0(x) = 1, v1(x) = x y v2(x) = x2.

Tenemos un primer vector (que ya tiene norma 1):

y0(x) = u0(x) = 1.

Para hallar el segundo, hacemos el siguiente cálculo:

〈v1, y0〉 =

∫ 1

0

v1(x)y0(x)dx =

∫ 1

0

xdx =x2

2

∣∣∣∣10

=1

2,

u1(x) = v1(x)− 〈v1, y0〉〈y0, y0〉

y0(x) = x− 1

2.

28

Page 29: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Ahora normalizamos el vector anterior:

||u1||2 =

∫ 1

0

(u1(x))2dx =

∫ 1

0

(x2 − x+

1

4

)dx =

x3

3

∣∣∣∣10

− x2

2

∣∣∣∣10

+x

4

∣∣∣10

=1

3− 1

2+

1

4

=4− 6 + 3

12=

1

12,

||u1|| =1

2√

3.

y1(x) =u1(x)

||u1||=x− 1

21

2√3

= 2√

3x−√

3.

Finalmente, calculemos el vector restante:

〈v2, y0〉 =

∫ 1

0

v2(x)y0(x)dx =

∫ 1

0

x2dx =x3

3

∣∣∣∣10

=1

3,

〈v2, y1〉 =

∫ 1

0

v2(x)y1(x)dx =

∫ 1

0

x2 · (2√

3x−√

3)dx = 2√

3

∫ 1

0

x3dx−√

3

∫ 1

0

x2dx

=2√

3

4−√

3

3=

√3

2−√

3

3=

3√

3− 2√

3

6=

√3

6.

u2(x) = v2(x)− 〈v2, y0〉〈y0, y0〉

y0(x)− 〈v2, y1〉〈y1, y1〉

y1(x) = v2(x)− 〈v2, y0〉 y0(x)− 〈v2, y1〉 y1(x)

= x2 − 1

3· 1−

√3

6· (2√

3x−√

3) = x2 − x+1

2− 1

3= x2 − x+

1

6.

Ahora normalicemos u2:

||u2||2 =

∫ 1

0

(x2 − x+

1

6

)2

dx =

∫ 1

0

(x4 − 2x3 +

4

3x2 − 1

3x+

1

36

)dx

=

∫ 1

0

x4dx− 2

∫ 1

0

x3dx+4

3

∫ 1

0

x2dx− 1

3

∫ 1

0

xdx+1

36

∫ 1

0

1dx

=1

5− 2

4+

4

9− 1

6+

1

36=

1

5− 7

36=

1

5 · 62,

||u2|| =1

6√

5,

y2(x) =u2(x)

||u2(x)||=x2 − x+ 1

61

6√5

= 6√

5x2 − 6√

5x+√

5.

Por lo tanto,B′ = {1, 2

√3x−

√3, 6√

5x2 − 6√

5x+√

5}

es una base ortonormal de R2[x] tal que

29

Page 30: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

〈{1, x}〉 =⟨{1, 2√

3x−√

3}⟩

⟨{1, x, x2}

⟩=⟨{1, 2√

3x−√

3, 6√

5x2 − 6√

5x+√

5}⟩

= R2[x].

3.5 Descomposición QR

En esta sección analizaremos la primera aplicación práctica del proceso de ortonorma-lización Gram-Schmidt (más allá de las ventajas de trabajar con una base ortonormal,entre las cuales destaca por ejemplo la Proposición 3.4.6).

La descomposición QR se refiere a poder escribir cualquier matriz A ∈Mn×m(R) como unproducto A = Q · R donde Q ∈ Mn×m(R) y R ∈ Mm(R) son matrices tales que Qt · Q = Iy R es una matriz triangular superior. Este hecho, el cual vamos a demostrar, se usa parapoder resolver problemas de mínimos cuadrados y representa además la base del algoritnoQR, uno de los algoritmos más estables usados en análisis numérico para el cálculo devalores y vectores propios de un operador.

El objetivo de esta sección es demostrar el siguiente teorema.

Teorema 3.5.1 (descomposición QR). Sea A ∈ Mn×m(R) una matriz de rango m (es de-cir, las m columnas de A son linealmente independientes), entonces existe una matrizQ ∈ Mn×m(R) tal que Qt · Q = Im (donde Im es la matriz identidad de orden m) y unamatriz triangular superior R ∈Mm(R) tal que A = Q ·R. ♥

Antes de probar esto, necesitamos un resultado previo, que es una consecuencia del pro-ceso de ortonormalización de Gram-Schmidt.

Lema 3.5.2. Sea V un espacio vectorial real de dimensión m con base B, y sea B′ la baseobtenida mediante el proceso de ortonormalización de Gram-Schmidt. Entonces, la ma-triz de cambio de base B′((idV ))B es una matriz triangular superior. ♥

Demostración: SeaB = {v1, v2, . . . , vm} una base de V . Sabemos por el proceso de ortonor-malización de Gram-Schmidt que podemos obtener una base ortogonalBo = {u1, u2, . . . , um}donde los vectores uk tienen la siguiente forma:

u1 = v1, · · · uk = vk −k−1∑i=1

〈vk, ui〉〈ui, ui〉

ui. (con 2 ≤ k ≤ m).

30

Page 31: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

La base ortonormal B′ = {y1, y2, . . . , ym} viene dada por

yk =uk||uk||

(para todo 1 ≤ k ≤ m).

Debemos escribir los vectores de la base B es términos de la base ortonormal B′. Tenemoslo siguiente:

y1 =v1||v1||

, v1 = ||v1||y1.

y2 =u2||u2||

, u2 = ||u2||y2

v2 −〈v2, u1〉||u1||2

u1 = ||u2||y2

v2 =〈v2, u1〉||u1||

y1 + ||u2||y2.

......

yk =uk||uk||

, uk = ||uk||yk

vk −k−1∑i=1

〈vk, ui〉||ui||2

ui = ||uk||yk

vk =k−1∑i=1

〈vk, ui〉||ui||

yi + ||uk||yk.

Entonces:

coordB′(v1) =

||u1||

0...0

, coordB′(v2) =

〈v2,u1〉||u1||||u2||

...0

, · · · coordB′(vk) =

〈vk,u1〉||u1||〈vk,u2〉||u2||

...〈vk,uk−1〉||uk−1||||uk||

0...0

,

· · · coordB′(vm) =

〈vm,u1〉||u1||〈vm,u2〉||u2||

...〈vm,um−1〉||um−1||||um||

.

31

Page 32: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Tenemos entonces la matriz de cambio de base B′((idV ))B, que resulta ser una matriz tri-angular superior:

B′((idV ))B =

||u1|| 〈v2,u1〉

||u1||〈v3,u1〉||u1|| · · · 〈vm,u1〉

||u1||

0 ||u2|| 〈v3,u2〉||u2|| · · · 〈vm,u2〉

||u2||

0 0 ||u3|| · · · 〈vm,u3〉||u3||

......

... . . . ...0 0 0 · · · ||um||

Con este resultado estamos listos para probar el Teorema de Descomposición QR.

Demostración del Teorema 3.5.1: Denotemos por v1, v2, . . . , vm las columnas de la matrizA. Como A tiene rango m, dichas columnas forman un conjunto de vectores en Rn lineal-mente independiente, que puede ser visto también como una base B = {v1, v2, . . . , vm} delsubespacio 〈{v1, v2, . . . , vm}〉 ⊆ Rn.

A =(v1 v2 · · · vm

)=

a11 a12 · · · a1ma21 a22 · · · a2m

...... . . . ...

an1 an2 · · · anm

.

Aplicando a B el proceso de ortonormalización de Gram-Schmidt a B, obtenemos unabase ortonormal B′ = {y1, y2, . . . , ym} de 〈{v1, v2, . . . , vm}〉 tal que

〈{v1, v2, . . . , vk}〉 = 〈{y1, y2, . . . , yk}〉 (para todo k = 1, 2, . . . ,m).

Sea R = B′((id))B la matriz de cambio de la base B a la base B′. Sabemos por el lema ante-rior que R es una matriz triangular superior y cuadrada de orden m.

Por otro lado, vamos a escoger la matriz Q ∈Mn×m(R) de la siguiente manera:

Q =(y1 y2 · · · ym

)=

b11 b12 · · · b1mb21 b22 · · · b2m...

... . . . ...bn1 bn2 · · · bnm

.

Ahora calculemos (Qt · Q)ij . Denotemos por Fi(Qt) la i-ésima fila de Qt, y por Cj(Q) la

j-ésima columna de Q:

32

Page 33: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

(Qt ·Q)ij = Fi(Qt) · Cj(Q) =

(b1i b2i · · · bni

b1jb2j...bnj

=n∑

k=1

bkibkj

(Qt ·Q)ij = 〈yi, yj〉 =

{1 si i = j0 si i 6= j.

Tenemos entonces que Qt ·Q es la identidad de orden m.

Finalmente, falta verificar que Q ·R = A:

Q ·R =(y1 y2 · · · ym

||u1|| 〈v2,u1〉

||u1||〈v3,u1〉||u1|| · · · 〈vm,u1〉

||u1||

0 ||u2|| 〈v3,u2〉||u2|| · · · 〈vm,u2〉

||u2||

0 0 ||u3|| · · · 〈vm,u3〉||u3||

......

... . . . ...0 0 0 · · · ||um||

=

b11 b12 · · · b1mb21 b22 · · · b2m...

... . . . ...bn1 bn2 · · · bnm

·||u1|| 〈v2,u1〉

||u1||〈v3,u1〉||u1|| · · · 〈vm,u1〉

||u1||

0 ||u2|| 〈v3,u2〉||u2|| · · · 〈vm,u2〉

||u2||

0 0 ||u3|| · · · 〈vm,u3〉||u3||

......

... . . . ...0 0 0 · · · ||um||

=

b11||u1|| b11

〈v2,u1〉||u1|| + b12||u2|| · · · b11

〈vm,u1〉||u1|| + b12

〈vm,u2〉||u2|| + · · ·+ b1m||um||

b21||u1|| b21〈v2,u1〉||u1|| + b22||u2|| · · · b21

〈vm,u1〉||u1|| + b22

〈vm,u2〉||u2|| + · · ·+ b2m||um||

...... . . . ...

bn1||u1|| bn1〈v2,u1〉||u1|| + bn2||u2|| · · · bn1

〈vm,u1〉||u1|| + bn2

〈vm,u2〉||u2|| + · · ·+ bnm||um||

=(||u1||y1 〈v2,u1〉

||u1|| y1 + ||u2||y2 · · · 〈vm,u1〉||u1|| y1 + 〈vm,u2〉

||u2|| y2 + · · ·+ ||um||ym)

=(v1 v2 · · · vm

)= A.

Analicemos un ejemplo particular para apreciar cómo desarrollar el proceso de descom-posición QR.

33

Page 34: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Ejemplo 3.5.3. Hallar la descomposición QR de la matriz

A =

1 0 10 2 11 1 0

.

Notamos primero que la matrizA tiene rango 3 por ser invertible, por lo cual sus columnasforman un conjunto de vectores en R3 linealmente independiente. Tenemos así una base

B = {v1, v2, v3} = {(1, 0, 1), (0, 2, 1), (1, 1, 0)}

de R3. Apliquemos el proceso de ortonormalización de Gram-Schmidt a esta base.

u1 = v1 = (1, 0, 1),

u2 = v2 −〈v2, u1〉〈u1, u1〉

u1 = (0, 2, 1)− 〈(0, 2, 1), (1, 0, 1)〉〈(1, 0, 1), (1, 0, 1)〉

(1, 0, 1)

= (0, 2, 1)− 1

2(1, 0, 1) =

(−1

2, 2,

1

2

),

u3 = v3 −〈v3, u2〉〈u2, u2〉

u2 −〈v3, u1〉〈u1, u1〉

u1

= (1, 1, 0)−⟨(1, 1, 0),

(−1

2, 2, 1

2

)⟩⟨(−1

2, 2, 1

2

),(−1

2, 2, 1

2

)⟩ (−1

2, 2,

1

2

)− 〈(1, 1, 0), (1, 0, 1)〉〈(1, 0, 1), (1, 0, 1)〉

(1, 0, 1)

= (1, 1, 0)−2− 1

214

+ 4 + 14

(−1

2, 2,

1

2

)− 1

2(1, 0, 1) = (1, 1, 0)−

3292

(−1

2, 2,

1

2

)− 1

2(1, 0, 1)

= (1, 1, 0)− 1

3

(−1

2, 2,

1

2

)− 1

2(1, 0, 1) = (1, 1, 0) +

(1

6,−2

3,−1

6

)+

(−1

2, 0,−1

2

)=

(6 + 1− 3

6,1

3,−4

6

)=

(2

3,1

3,−2

3

).

Normalizamos:

y1 =u1||u1||

=(1, 0, 1)

||(1, 0, 1)||=

(1, 0, 1)√2

=

(1√2, 0,

1√2

),

y2 =u2||u2||

=

(−1

2, 2, 1

2

)∣∣∣∣(−12, 2, 1

2

)∣∣∣∣ =

(−1

2, 2, 1

2

)√14

+ 4 + 14

=

(−1

2, 2, 1

2

)3√2

=

(−√

2

6,2√

2

3,

√2

6

),

y3 =u3||u3||

=

(23, 13,−2

3

)∣∣∣∣(23, 13,−2

3

)∣∣∣∣ =

(23, 13,−2

3

)√49

+ 19

+ 49

=

(2

3,1

3,−2

3

).

34

Page 35: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Tenemos entonces:

Q =(y1 y2 y3

)=

1√2−√26

23

0 2√2

313

1√2

√26−2

3

,

Qt ·Q =

1√2

0 1√2

−√26

2√2

3

√26

23

13−2

3

·

1√2−√26

23

0 2√2

313

1√2

√26−2

3

=

1 0 00 1 00 0 1

,

R =

||u1||〈v2,u1〉||u1||

〈v3,u1〉||u1||

0 ||u2|| 〈v3,u2〉||u2||

0 0 ||u3||

=

2 1√2

1√2

0 3√2

323√2

0 0 1

=

2 1√2

1√2

0 3√2

√22

0 0 1

.

1 0 10 2 11 1 0

=

1√2−√26

23

0 2√2

313

1√2

√26−2

3

·√

2 1√2

1√2

0 3√2

√22

0 0 1

.

3.6 Complemento ortogonal y proyección ortogonal

El concepto de ortogonalidad estudiado en secciones anteriores puede emplearse paradefinir nuevos subespacios vectoriales de un espacio vectorial con producto interno. Talessubespacios se conocen como complementos ortogonales, y además de ser teóricamenteinteresantes, tienen aplicaciones en problemas de aproximación por mínimos cuadrados,que estudiaremos en la última sección de estas notas.

Definición 3.6.1. Sea V un espacio vectorial con producto interno 〈−,−〉 : V × V → K yS ⊆ V un subconjunto no vacío de vectores de V (no tiene por qué ser un subespacio deV ). Se define el complemento ortogonal de S, denotado como S⊥, como el conjunto detodos los vectores de V que son ortogonales a todos los vectores de S, es decir:

S⊥ = {v ∈ V : v ⊥ s para todo s ∈ S} = {v ∈ V : 〈v, s〉 = 0 para todo s ∈ S}.

Aunque S ⊆ V no necesariamente sea un subespacio vectorial de V , vamos a ver que talsí va a ser el caso de S⊥. Antes de esto, veamos algunos ejemplos.

35

Page 36: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Ejemplo 3.6.2.

1. Es fácil notar que V = {~0}⊥ y V ⊥ = {~0}, para todo espacio vectorial V con productointerno.

2. Considere R3 con el producto interno usual (el producto escalar). Sea S el conjuntode puntos en el plano de ecuación x+ 2y + 3z = 0. Entonces, S⊥ es la recta que pasapor el origen de R3 y de dirección (1, 2, 3). Recíprocamente, {(1, 2, 3)}⊥ es el planode ecuación x+ 2y + 3z = 0.

Lo anterior puede notarse simplemente al dibujar los conjuntos involucrados, perovamos a hacer la verificación a partir de la definición. Sea s = (x, y, z) ∈ S. Tenemosentonces,

s = (−2y − 3z, y, z) = (−2y, y, 0) + (−3z, 0, z) = (−2, 1, 0)y + (−3, 0, 1)z.

Luego, S = 〈{(−2, 1, 0), (−3, 0, 1)}〉. Sea v = (a, b, c) ∈ S⊥. Tenemos lo siguiente:

〈(a, b, c), (−2, 1, 0)〉 = 0, y 〈(a, b, c), (−3, 0, 1)〉 = 0

−2a+ b = 0, y −3a+ c = 0

b = 2a, y c = 3a.

Luego, v = (a, 2a, 3a) = a · (1, 2, 3) con a ∈ R. Es decir, v pertenece a la recta en R3

que pasa por el origen y con dirección (1, 2, 3). De manera similar, se puede ver quetodo vector v en dicha recta es ortogonal a S (basta demostrar que v es ortogonal a(−2, 1, 0) y a (−3, 0, 1)).

Ahora veamos que {(1, 2, 3)}⊥ = S. Ya sabemos que tanto (−2, 1, 0) como (−3, 0, 1)son ortogonales a (1, 2, 3), por lo que cualquier combinación lineal de (−2, 1, 0) y(−3, 0, 1) también lo será, y así S ⊆ {(1, 2, 3)}⊥. Ahora, supongamos que v = (a, b, c)es un vector en {(1, 2, 3)}⊥. Luego, a+2b+3c = 〈(a, b, c), (1, 2, 4)〉 = 0, es decir, v ∈ S.Por lo tanto, {(1, 2, 3)}⊥ = S.

3. Consideremos nuevamente el R-espacio vectorial V = C0[0, 1] de funciones conti-nuas [0, 1]→ R con el producto interno del Ejemplo 3.1.4 (3). Sea S = {f} el conjuntounitario formado por la función f : [0, 1] → R dada por f(t) = 1 para todo t ∈ [0, 1].Calculemos S⊥.

Sea g ∈ S⊥. Luego,

0 = 〈g, f〉 =

∫ 1

0

g(t)f(t)dt =

∫ 1

0

g(t)dt.

36

Page 37: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Recíprocamente, podemos ver que toda función g ∈ C0[0, 1] que satisfaga∫ 1

0g = 0

es ortogonal a f . En otras palabras, {f}⊥ está dado por aquellas funciones contin-uas sobre [0, 1] cuya área algebraica comprendida entre su curva y el ejeX es cero. ♦

Proposición 3.6.3. Sea S ⊆ V un subconjunto no vacío de V . Entonces, el complementoortogonal de S, S⊥, es un subespacio vectorial de V . ♥

Demostración: Lo primero que debemos verificar es que S⊥ es no vacío. Esto es claro yaque ~0 ∈ S⊥. Ahora sean v1, v2 ∈ S⊥ y α ∈ K. Veamos que αv1 + v2 ∈ S⊥. Sea s ∈ S.Tenemos lo siguiente:

〈αv1 + v2, s〉 = α 〈v1, s〉+ 〈v2, s〉 (por propiedades del producto interno)= α · 0 + 0

= 0.

Como lo anterior se cumple para todo s ∈ S, se tiene que αv1 + v2 ∈ S⊥. Por un resultadodel curso de Geometría y Álgebra Lineal 1, lo anterior implica que S⊥ es un subespaciovectorial de V .

El siguiente resultado es una generalización de algo que notamos en el Ejemplo 3.6.2 (2).

Proposición 3.6.4. Sea V un K-espacio vectorial de dimensión finita y S ⊆ V un subespa-cio de V con base BS = {s1, s2, . . . , sh}. Entonces, v ∈ S⊥ si, y sólo si, v ⊥ si para todoi = 1, 2, . . . , h. ♥

Demostración: Sea v ∈ V . Supongamos primero que v ∈ S⊥. Entonces, v ⊥ s para todos ∈ S. En particular, v ⊥ si para cada i = 1, 2, . . . , h ya que si ∈ S.

Recíprocamente, supongamos que v ⊥ si para cada s ∈ S. Como BS es una base de S,existen escalares únicos α1, α2, . . . , αh ∈ K tales que s = α1s1 + α2s2 + · · ·+ αhsh. Luego:

〈v, s〉 = 〈v, α1s1 + α2s2 + · · ·+ αhsh〉= α1 〈v, s1〉+ α2 〈v, s2〉+ · · ·+ αh 〈v, sh〉 (por propiedades del producto interno)= α1 · 0 + α2 · 0 + · · ·+ αh · 0 (ya que v ⊥ si)= 0.

Ejemplo 3.6.5. Consideremos el plano S del Ejemplo 3.6.2 (2), el cual es un subespacio deR3 con base BS = {(−2, 1, 0), (−3, 0, 1)}. En dicho ejemplo notamos que v ∈ S⊥ si, y sólosi, v ⊥ (−2, 1, 0) y v ⊥ (−3, 0, 1), lo cual corresponde con la conclusión de la proposiciónanterior. ♦

37

Page 38: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Ya sabemos que S⊥ siempre es un subespacio vectorial de V . Acabamos de probar ademásque para el caso en el que S es también un subespacio, entonces para probar v ∈ S⊥ nohace falta verificar v ⊥ s para todos los elementos s de S, sino que basta con verificardicha condición para cualquier base de S. Como último resultado que tiene que ver concomplementos ortogonales, demostraremos que V puede descomponerse como suma di-recta de los subespacios S y S⊥.

Teorema 3.6.6 (un teorema de descomposición en sumas directas). Sea V un K-espaciovectorial con producto interno 〈−,−〉 : V × V → K, y sea S ⊆ V un subespacio de V .Entonces,

V = S ⊕ S⊥.

Demostración: Debemos probar dos cosas: S ∩ S⊥ = {~0} y V = S + S⊥.

1. Como S y S⊥ son subespacios de V , tenemos que {~0} ⊆ S, S⊥, y así {~0} ⊆ S ∩ S⊥.Ahora, sea s ∈ S ∩ S⊥. Tenemos entonces que 〈s, s〉 = 0, por lo cual s = ~0. Por lotanto, S ∩ S⊥ = {~0}.

2. Ahora veamos que todo v ∈ V puede escribirse como v = s + w, donde s ∈ S yw ∈ S⊥. Para esto, consideremos BS = {s1, s2, . . . , sh} una base ortonormal de S(podemos escogerla ortonormal por el Corolario 3.4.8). Podemos extender la baseanterior a una base ortonormal de V , digamos

B = {s1, s2, . . . , sh, vh+1, . . . , vn}.

Por la Proposición 3.4.6, podemos escribir v de la siguiente manera:

v = 〈v, s1〉 s1 + 〈v, s2〉 s2 + · · ·+ 〈v, sh〉 sh + 〈v, vh+1〉 vh+1 + · · ·+ 〈v, vn〉 vn.

Hacemos s = 〈v, s1〉 s1+〈v, s2〉 s2+ · · ·+〈v, sh〉 sh y w = 〈v, vh+1〉 vh+1+ · · ·+〈v, vn〉 vn.Es claro que s ∈ S. Como B es una base ortonormal, se tiene que vi ∈ S⊥ para todoi = h+ 1, . . . , n. Como S⊥ es un espacio vectorial, se tiene finalmente que w ∈ S⊥.

El teorema anterior puede demostrarse también con un argumento geométrico en el casoV = R2 o R3. Para simplificar, trabajemos el caso particular en el cual S es una recta en R2

(aunque los escenarios posibles en R3 se pueden analizar de manera parecida). Podemosescribir cada v ∈ R2 como v = s + w donde s es la proyección de v sobre la recta S, yw = v − s (para tal s, los vectores v, s y w forman un triángulo rectángulo). Se tieneentonces que s ∈ S y w ∈ S⊥.

38

Page 39: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Sin embargo, para llevar el argumento anterior a casos más abstractos, debemos estudiarel concepto de proyección ortogonal sobre un subespacio vectorial.

Definición 3.6.7. Sea V un K-espacio vectorial con producto interno 〈−,−〉 : V × V → K,S ⊆ V un subespacio vectorial de V , y BS = {s1, s2, . . . , sh} una base ortonormal de S.Para cada v ∈ V , se define la proyección ortogonal de v sobre el subespacio S como elvector

PS(v) =h∑

k=1

〈v, sk〉 sk ∈ S.

Debemos verificar que el concepto anterior está bien definido, es decir, que PS(v) no de-pende de la base elegida para S. En efecto, supongamos que B′S = {s′1, s′2, . . . , s′h} es otrabase ortonormal para S. Debemos ver que:

h∑k=1

〈v, sk〉 sk =h∑

k=1

〈v, s′k〉 s′k.

Pero esto es consecuencia de la Proposición 3.4.6.

Observación 3.6.8. Si BS = {w1, w2, . . . , wh} es una base ortogonal de S (pero no necesari-amente ortonormal), entonces podemos aún definir la proyección ortogonal de v sobre Scomo:

PS(v) =h∑

k=1

〈v, wk〉||wk||

wk.

Podemos notar la siguiente consecuencia de Teorema 3.6.6.

Corolario 3.6.9. Sean V y S como en el Teorema 3.6.6. Entonces, cada v ∈ V se escribecomo

v = PS(v) + PS⊥(v).

Demostración: Por la prueba del Teorema 3.6.6, sabemos que dada BS una base ortonor-mal de S, podemos escribir v ∈ V como

v = 〈v, s1〉 s1 + 〈v, s2〉 s2 + · · ·+ 〈v, sh〉 sh + 〈v, vh+1〉 vh+1 + · · ·+ 〈v, vn〉 vn,

dondePS(v) = 〈v, s1〉 s1 + 〈v, s2〉 s2 + · · ·+ 〈v, sh〉 sh.

39

Page 40: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Veamos ahora quePS⊥(v) = 〈v, vh+1〉 vh+1 + · · ·+ 〈v, vn〉 vn.

Basta probar que {vh+1, . . . , vn} es una base de S⊥. Pero esto último es una consecuenciade la descomposición de V en suma directa V = S ⊕ S⊥.

Ejemplo 3.6.10. Consideremos el R-espacio vectorial R3 con el producto escalar. Sea S larecta en R3 que pasa por el origen (0, 0, 0) y con dirección (3, 12,−1). Entonces, la proyec-ción ortogonal de v = (−10, 2, 8) sobre S viene dado por:

PS((−10, 2, 8)) =

⟨(−10, 2, 8),

(3, 12,−1)√154

⟩(3, 12,−1)√

154

=−30 + 24− 8

154(3, 12,−1) = − 14

154(3, 12,−1) = − 7

77(3, 12,−1)

= − 1

11(3, 12,−1),

ya que BS = {(3, 12,−1)/√

154} es una base ortonormal de S. ♦

Teorema 3.6.11 (teorema de aproximación de la norma). Sea V un K-espacio vectorial conproducto interno 〈−,−〉 : V × V → K y S ⊆ V un subespacio de V de dimensión finita.Entonces,

||v − PS(v)|| ≤ ||v − s|| para todo s ∈ S,

donde || − || es la norma inducida por 〈−,−〉. ♥

Demostración: Sea v ∈ V y s ∈ S. Calculemos ||v−s||2 para poder comprobar la desigual-dad. Como la expresión PS(v) aparece del lado izquierdo de la desigualdad a probar,conviene escribir v como v = PS(v) + PS⊥(v) como indica el Corolario 3.6.9.

||v − s||2 = 〈v − s, v − s〉= 〈PS(v) + PS⊥(v)− s, PS(v) + PS⊥(v)− s〉= 〈PS⊥(v), PS⊥(v)〉+ 〈PS⊥(v), PS(v)− s〉

+ 〈PS(v)− s, PS⊥(v)〉+ 〈PS(v)− s, PS(v)− s〉= ||PS⊥(v)||2 + ||PS(v)− s||2

Como lo anterior vale para cualquier s ∈ S, en particular podemos considerar s = PS(v),y tenemos:

||v − PS(v)||2 = ||PS⊥(v)||2 + ||PS(v)− PS(v)||2 = ||PS⊥(v)||2.

40

Page 41: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Sustituyendo, obtenemos:

||v − s||2 = ||PS⊥(v)||2 + ||PS(v)− s||2

= ||v − PS(v)||2 + ||PS(v)− s||2

||v − s||2 ≥ ||v − PS(v)||2

||v − s|| ≥ ||v − PS(v)||.

Observación 3.6.12. El teorema anterior puede interpretarse de la siguiente forma. Elvalor ||v− s||mide la distancia de v ∈ V a cualquier punto s del subespacio S. El conjuntode todos los valores ||v− s|| tiene entonces una cota inferior, a saber ||v− PS(v)||. Por otrolado, como PS(v) ∈ S, dicha cota resulta ser un mínimo. Es decir

min{||v − s|| : s ∈ S} = ||v − PS(v)||.

Por otro lado, el valor min{||v − s|| : s ∈ S} es precisamente la distancia de v al subespa-cio S. En otras palabras, el teorema anterior afirma que la distancia de v al subespacio Spuede calcularse mediante la expresión ||v − PS(v)||.

Para tener un contexto más geométrico de este teorema, piense usted el caso en el cualV = R3 con el producto interno usual, S es cualquier plano en R3 que pasa por el origen,y v cualquier vector fuera de dicho plano. ♠

3.7 Mínimos cuadrados

En la última sección de estas notas estudiaremos el método de aproximación por míni-mos cuadrados. Quizá la primera pregunta que se nos viene a la mente es a qué tipo deaproximación se refiere tal método, y qué se pretende aproximar. Hablando de manerabastante general, podríamos decir que el método de aproximaxión por mínimos cuadra-dos básicamente busca hallar una función que aproxime mejor los datos registrados dealgún fenómeno estudiado, como por ejemplo el movimiento de un objeto a velocidadconstante.

Para ser un poco más específicos, supongamos que observamos un móvil que se des-plaza a velocidad constante, y medimos su distancia recorrida yi en el instante xi, parai = 1, 2, . . . , n. Ordenamos los datos registrados en n mediciones usando pares ordena-dos, de la forma (x1, y1), (x2, y2), . . . , (xn, yn). Si realizamos dicho experimento, y colo-camos las mediciones registradas en un plano ordenado, nos daremos cuenta que la nubede puntos en este plano se asemeja a una recta. Podemos plantearnos hallar la recta quemejor aproxime a dicha nube de puntos. Tenga en cuenta que es prácticamente imposiblehallar la recta que contenga a todos los puntos del experimento, ya que durante las medi-ciones ocurren ciertas perturbaciones que crean un margen de error entre nuestro modelo

41

Page 42: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

(en este caso lineal) y los datos registrados. Entre tales perturbaciones para el caso delmovimiento de un objeto a velocidad constante podemos mencionar: frinción con el sueloo el aire, calibración de los instrumentos de medición, error humano al registrar las medi-ciones, etc.

Hallar la mejor recta que aproxime los puntos (x1, y1), (x2, y2), . . . , (xn, yn) significa hallarα, β ∈ R tales que las diferencias yi− (αxi−β) (los errores) sean lo más pequeñas posibles.Esto se puede plantear como un sistema de ecuaciones de la forma

A · ~X = ~Y ,

donde

A =

x1 1x2 1...

...xn 1

, ~X =

(αβ

), ~Y =

y1y2...yn

.

Este sistema no va a tener solución. Recordemos que hace poco se mencionó la imposi-bilidad de hallar una recta que contenga a los n puntos (xi, yi). Sin embargo, podemospodemos hallar α y β (es decir, una recta) de tal manera que la siguiente cantidad, a la quellamaremos error, sea lo más pequeña posible:

||~ε||2 = e21 + e22 + · · ·+ e2n,

donde

~ε = (e1, e2, . . . , en) = (y1 − αx1 − β, y2 − αx2 − β, . . . , yn − αxn − β) = ~Y − A · ~X.

Hallar ~X de tal manera que la norma de ~ε = ~Y − A · ~X sea mínima tiene mucho que vercon el Teorema 3.6.11. Para enlazar con este resultado, necesitaremos probar lo siguiente.

Proposición 3.7.1. Sea A ∈Mn×m(R) y S el subespacio vectorial de Rn generado por las mcolumnas de A. Se considera Rn con el producto interno usual. Entonces,

S⊥ = {~U ∈ Rn : At~U = ~0}.

Demostración: Lo primero a notar es que S puede escribirse como

S = {A · ~X : ~X ∈ Rm}.

Ahora, sea ~U ∈ S⊥. Luego,⟨A · ~X, ~U

⟩= 0 para todo ~X ∈ Rm, es decir,

0 = (A · ~X)t · ~U = ~X t · At · ~U.

42

Page 43: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

Como lo anterior vale para todo ~X ∈ Rm, se tiene que At · ~U = ~0. Por lo tanto, se tieneque ~U ∈ {~U ∈ Rn : At~U = ~0} y así la inclusión S⊥ ⊆ {~U ∈ Rn : At~U = ~0}. La inclusióncontraria se prueba de manera similar.

Volvamos a nuestro análisis de movimiento rectilíneo. Queremos minimizar la norma||~Y −A · ~X||. Notamos que A · ~X está en el subespacio S generado por las columnas de A.De hecho, todos los elementos de S son de la forma A · ~X . Por el Teorema 3.6.11, tenemosque

||~Y − PS(~Y )|| ≤ ||~Y − A · ~X|| para todo A · ~X ∈ S.

Luego, existe ~X0 =

(α0

β0

)tal que PS(~Y ) = A · ~X0 y ||~Y −A · ~X0|| es la mejor aproximación

de ||~Y −A · ~X||. Para hallar explícitamete tal ~X0, debemos aplicar la proposición anterior.

Por un lado, sabemos por el Corolario 3.6.9 que ~Y − A · ~X0 = ~Y − PS(~Y ) = PS⊥(~Y ). Porotro lado, la proposición anterior establece que At · PS⊥(~Y ) = ~0. Luego:

~Y − A · ~X0 = PS⊥(~Y )

At · (~Y − A · ~X0) = At · PS⊥(~Y ) = 0

At · ~Y = (At · A) · ~X0.

La última igualdad representa un sistema de ecuaciones que debe resolverse para encon-trar finalmente ~X0, la recta que mejor aproxima los datos del experimento realizado.

Observación 3.7.2. Generalmente los datos registrados para un experimento deben sermuchos (es decir, n bastante grande en la situación anterior) si se quiere tener un modelobastante aproximado a la realidad. Mientras más datos se tengan, mejor será el modelomatemático diseñado para describir el fenómeno que nos interesa. Por supuesto, esto úl-timo hace que el sistema (At ·A) · ~X0 = At · ~Y posea muchas ecuaciones, y por lo tanto loscálculos sean largos de hacer.

La situación anterior puede optimizarse un poco en el caso en el que A tiene rango 2 (=número de filas de ~X0), para poder aplicar el teorema de descomposición QR. Así, existenQ ∈ Mn×2(R) y R ∈ M2(R) triangular superior tal que Qt · Q = I2 y A = Q · R. Tenemosentonces lo siguiente:

(At · A) · ~X0 = At · ~Y((Q ·R)t · (Q ·R)) · ~X0 = At · ~Y

43

Page 44: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

(Rt ·Qt ·Q ·R) · ~X0 = At · ~Y(Rt · I2 ·R) · ~X0 = At · ~Y

(Rt ·R) · ~X0 = At~Y ,

donde la matriz Rt ·R es más fácil de reducir por filas que At · A. ♠

Estudiemos un primer ejemplo de cómo aplicar el método de aproximación de mínimoscuadrados.

Ejemplo 3.7.3. Encontrar la recta que mejor ajuste los puntos (1, 4), (−2, 5), (3,−1) y (4, 1).

Por lo explicado anteriormente, debemos hallar α, β ∈ R tales que el valor ||~Y − A · ~X||2sea el menor posible, o equivalentemente, resolver el sistema de ecuaciones

At · ~Y = (At · A) · ~X

donde

A =

1 1−2 1

3 14 1

, ~Y =

45−1

1

, y ~X =

(αβ

).

Hagamos entonces los cálculos pertinentes para resolver el sistema anterior:

At · A =

(1 −2 3 41 1 1 1

1 1−2 1

3 14 1

=

(30 66 4

),

At · ~Y =

(1 −2 3 41 1 1 1

45−1

1

=

(−5

9

),

(30 66 4

)·(αβ

)=

(−5

9

).

Al resolver este sistema se obtiene α = −37/7 y β = 25/7, es decir, la recta que mejor seadapta a los puntos dados al inicio es y = −37

7x+ 25

7. ♦

44

Page 45: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

El método de mínimos cuadrados no solamente sirve para construir modelos de predic-ción lineales. También se pueden diseñar modelos más complicados para fenónemos cuyanube de puntos registrados en distintas mediciones no se parezcan a una recta sino, porejemplo, a una parábola. Para esta situación, queremos hallar constantes α, β, γ ∈ R talesque la curva y = αx2 + βx + γ sea la que mejor se acople a los puntos registrados. Unejemplo de esto es cuando estudiamos el movimiento de un objeto con velocidad variablepero con aceleración constante. Para este caso, las matrices A, ~Y y ~X tienen la siguienteforma (teniendo en cuenta que hemos hecho n mediciones):

A =

x21 x1 1x22 x2 1...

......

x2n xn 1

, ~Y =

y1y2...yn

, y ~X =

αβγ

.

Nuevamente, el objetivo es hallar α, β, γ ∈ R tales que el error ||~Y − A · ~X||2 sea el menorposible, o equivalentemente, resolver el sistema de ecuaciones (At · A) · ~X = At~Y .

Ejemplo 3.7.4. Supongamos que desde una altura de 200 metros se deja caer una pelotade tenis. Mientras cae, se toman las siguientes medidas de la distancia al suelo en variosinstantes:

tiempo transcurrido (en segundos) distancia al suelo (en metros)0 2001 1952 1804 1206 25

Sabemos que la distancia respecto al suelo y de la pelota después de haber transcurrido xsegundos viene dada por

y(x) = 200− 1

2gx2

donde g es la aceleración de gravedad. Nuestro objetivo en este ejemplo es hallar la mejoraproximación de g para los datos registrados (es conocido que g varía ligeramente depen-diendo de a qué latitud estemos en el planeta).

Obtener la mejor estimación de g equivale a hallar la parábola y = αx2 +βx+ γ que mejorse acople a los datos registrados. Tenemos las siguientes matrices:

45

Page 46: GEOMETRIA Y ALGEBRA LINEAL 2 TEMA ESPACIOS CON …maperez.net/documents/GAL2-producto_interno.pdfESPACIOS CON PRODUCTO INTERNO ... en el concepto de espacio vectorial. Resulta ser

A =

0 0 11 1 14 2 116 4 136 6 1

, ~Y =

20019518012025

, ~X =

αβγ

.

El sistema de ecuaciones a resolver es el siguiente:

(At · A) · ~X = At · ~Y

0 1 4 16 360 1 2 4 61 1 1 1 1

·

0 0 11 1 14 2 116 4 136 6 1

· α

βγ

=

0 1 4 16 360 1 2 4 61 1 1 1 1

·

20019518012025

1569 289 57

289 57 1357 13 5

· α

βγ

=

37351185720

.

Para obtener α, β, γ ∈ R, podemos multiplicar la igualdad anterior por la inversa de At ·A.

(At · A)−1 =

1569 289 57289 57 1357 13 5

−1 =

29/1876 −44/469 127/1876−44/469 1149/1876 −981/1876127/1876 −981/1876 739/938

,

1569 289 57289 57 1357 13 5

· α

βγ

=

37351185720

α

βγ

=

29/1876 −44/469 127/1876−44/469 1149/1876 −981/1876127/1876 −981/1876 739/938

· 3735

1185720

α

βγ

=

−8805/1876−2115/187694005/469

≈ −4, 69−1, 13200, 44

Obtenemos así el modelo cuadrático que mejor aproxima la caída de la pelota de tenis:

y(x) ≈ 200, 44− 1, 13x− 4, 69x2.

Tenemos entonces que g/2 ≈ 4, 69, por la que la aceleración de gravedad aproximada parael sitio en el que hemos realizado el experimento es g ≈ 9, 38 m/s2. ♦

46