1 · web view... tal que 1/n ( a. 3). no hay ningún elemento del campo que sea mayor que todo...

122
Matemáticas para economistas 1 Ramón García-Cobián Introducción El propósito de la presente obra es el de presentar al estudiante de la carrera de Economía las nociones matemáticas básicas que le han de ser indispensables en las actuales presentaciones formales de la teoría económica. Para tal fin, se ha creído oportuno dar dichas nociones como se las presenta en los cursos de Matemáticas en las carreras de ciencias, pues se considera que el economista debe conocerlas con toda la exactitud del caso y que no hay razón para dorarle la píldora. Para tal fin, el modo escogido es el de motivar las definiciones mediante consideraciones intuitivas, para presentar luego los resultados principales en forma de teoremas, acompañados de aplicaciones. A continuación, y en la medida en que la extensión lo permita, se dan ejemplos ilustrados, a veces, de figuras. Se aconseja al profesor del curso aumentar el número de ejemplos y de aplicaciones, así como el de figuras presentadas en clase para ayudar a la comprensión de las complejas nociones requeridas en este curso. También se le sugiere omitir un buen número de demostraciones, aunque de ellas debiera, al menos, dar la idea intuitiva que justifique el enunciado por demostrar. Esto deberá ajustarse al tiempo disponible, que, normalmente, debiera ser de unas quince semanas a razón de cuatro horas semanales de clase. Sería conveniente, además, disponer de unas treinta horas en total para sesiones de prácticas en las que habría que presentar soluciones de ejercicios propuestos en el texto y de otros adicionales que el profesor escogerá. De esas treinta horas, debieran dedicarse a prácticas calificadas unas quince horas. 1

Upload: buicong

Post on 17-Dec-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Matemáticas para economistas 1

Ramón García-Cobián

Introducción

El propósito de la presente obra es el de presentar al estudiante de la carrera de Economía las nociones matemáticas básicas que le han de ser indispensables en las actuales presentaciones formales de la teoría económica. Para tal fin, se ha creído oportuno dar dichas nociones como se las presenta en los cursos de Matemáticas en las carreras de ciencias, pues se considera que el economista debe conocerlas con toda la exactitud del caso y que no hay razón para dorarle la píldora. Para tal fin, el modo escogido es el de motivar las definiciones mediante consideraciones intuitivas, para presentar luego los resultados principales en forma de teoremas, acompañados de aplicaciones. A continuación, y en la medida en que la extensión lo permita, se dan ejemplos ilustrados, a veces, de figuras. Se aconseja al profesor del curso aumentar el número de ejemplos y de aplicaciones, así como el de figuras presentadas en clase para ayudar a la comprensión de las complejas nociones requeridas en este curso. También se le sugiere omitir un buen número de demostraciones, aunque de ellas debiera, al menos, dar la idea intuitiva que justifique el enunciado por demostrar. Esto deberá ajustarse al tiempo disponible, que, normalmente, debiera ser de unas quince semanas a razón de cuatro horas semanales de clase. Sería conveniente, además, disponer de unas treinta horas en total para sesiones de prácticas en las que habría que presentar soluciones de ejercicios propuestos en el texto y de otros adicionales que el profesor escogerá. De esas treinta horas, debieran dedicarse a prácticas calificadas unas quince horas.

1

Page 2: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Índice

Prefacio 11. Sistema de números reales 4 1.1 Sucesiones y series 5 1.2 Algunas propiedades de límites de sucesiones de números reales 6 1.3 Límites infinitos de sucesiones de números reales 9

2. Funciones, relaciones y correspondencias 132.1 Funciones 142.2 Correspondencias 152.3 Relaciones 16

3. Continuidad de funciones reales de variable real 18

3.1 Conjuntos abiertos, cerrados y compactos en 18 3.2 Límites de funciones 25

3.3 Continuidad de funciones 31

4. Derivadas de funciones 40

4.1 Crecimiento y decrecimiento locales 45

4.2 Derivadas de orden superior y fórmula de Taylor 50

4.3 Concavidad y convexidad de funciones 52

5. Integrales de funciones 56

5.1 Integral indefinida 56

5.2 Integral definida 57

5.3 Algunos métodos de integración 61

6. Álgebra Lineal 63

6.1 Vectores del espacio IRn 64

6.2 Producto escalar y norma de vectores 66

6.3 Matrices y operaciones con ellas 69

6.4 Determinantes e inversas de matrices cuadradas 74

2

Page 3: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

6.5 Dependencia e independencia lineal de vectores 79

6.6 Rango y nulidad de matrices 80

6.7 Autovalores y autovectores de matrices cuadradas 82

Referencias bibliográficas 85

3

Page 4: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

1. Sistema de números reales es un “campo”, es decir, es un conjunto en el que hay dos operaciones binarias internas: adición y multiplicación, siendo que ambas son conmutativas y asociativas, poseen elementos “neutros” (el 0 y el 1), hay “inversos” según la adición para todos los elementos (-x), y según la multiplicación para todos los elementos no nulos (i/x); además, la multiplicación es distributiva respecto a la adición.Ha de notarse que también el sistema de números racionales, , es un campo en el mismo sentido, pero que, en cambio, no lo son ni el sistema de números enteros ni el de números naturales.

Además, es un “campo ordenado”, es decir, que contiene un subconjunto, el de los positivos, , que es cerrado para la adición (la suma de positivos de positiva) y cumple la propiedad de tricotomía (cualquier número real, o es positivo, o es nulo o su inverso aditivo es positivo, debiendo darse una y sólo una de estas tres posibilidades). Así, se define la relación de orden entre números reales estableciendo que un número, x, es mayor que otro, y, si y sólo si, x – y es positivo.

Ha de notarse que también el sistema de números racionales es un campo ordenado. Sin embargo, entre este sistema y el de los números reales hay una fundamental diferencia: en éste vale el axioma del supremo pero en aquél, no. Esto significa que si un subconjunto de es superiormente acotado (existe algún número que no es menor que ningún elemento del subconjunto), entonces existe la mínima cota superior (llamada también supremo del subconjunto). En el sistema de números racionales esto no se cumple, pues, por ejemplo, el subconjunto de formado por los racionales cuyo cuadrado es menor que 2 es superiormente acotado (por 8, por ejemplo) pero no existe la mínima cota superior de dicho subconjunto de racionales (pues ya desde la Antigüedad, los pitagóricos habían descubierto que no hay ningún número racional cuyo cuadrado sea 2). Esto puede formularse de modo preciso como sigue. Si hubiera dos números naturales, m y n, digamos, tales que su cociente fuera igual a 2, puede suponerse, sin pérdida de generalidad, que dichos naturales son primos relativos (por ejemplo la fracción 28/16 es equivalente a 14/8 y ésta a su vez lo es a 7/4, siendo que 7 y 4 son primos relativos). Así, 2 sería igual a m2 / n2, de donde 2 m2 = n2, por lo que n ha de ser par, digamos n = 2k; luego, 2 m2 = 4 k2, y entonces, m2 = 2 k2, que muestra que m también es par. Es ésta conclusión contradictoria con la condición de ser m y n primos relativos. Así, pues, se comprueba que no existe ningún número racional igual a 2. También debe tenerse en cuenta que ambos campos, y , son “campos arquimedianos”, es decir que en ellos se cumplen las tres siguientes propiedades, que son equivalentes entre sí. 1) Para todo par de elementos, a y b, del campo tales que a sea positivo, hay un número natural, n, tal que n a b. 2) Para todo elemento positivo, a, del campo, hay un número natural, n, tal que 1/n a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1).

Sin embargo, nuevamente se encuentra una diferencia fundamental entre ambos campos arquimedianos, a saber, es “completo” pero no lo es. Esta propiedad des ser completo (llamada propiedad de “compleción” del sistema de los números reales),

4

Page 5: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

consiste en que toda sucesión de Cauchy es convergente. A continuación se explicará esto detalladamente.

1.1 Sucesiones y series

Definición 1.1: Dado un conjunto cualquiera, X, una “sucesión en X” es cualquier función definida en el conjunto de números naturales, , y que toma valores en el conjunto X.Así, si X es , se habla de sucesiones de números reales; si X es , se habla de sucesiones de números racionales, etc.

Como ejemplos, se tienen las siguientes sucesiones: s(k) = 3/k, s’(k) = (k3) y s’’(k) = 3. La primera es una “sucesión decreciente”, es decir, que k h s(k) s(h); la segunda es una “sucesión creciente”, es decir, que k h s(k) s(h), y la tercera es una “sucesión constante”. Si en cambio se cumpliera que k h s(k) s(h), se diría que la sucesión es “no creciente”; y si se tuviera que k h s(k) s(h), se diría que la sucesión es “no decreciente”. Se dice que un subconjunto, A, de es “acotado”, si hay algún número real, C, tal que C x , x de A. Se dice que A es “superiormente acotado”, si hay algún número, C, tal que C x, x de A; y se dice que A es “inferiormente acotado”, si hay algún número, C, tal que C x, x de A.

Definición 1.2: Una “subsucesión”, s1, de una sucesión, s, es una composición de una sucesión creciente de naturales, , con la sucesión s, es decir, s1 = s. Por ejemplo, si (k) = 2k+1 y s(k) = 1/k, entonces se obtiene la subsucesión s1 de s dada por s1(k) = s (k) = s(2k+1) = 1/(2k+1), esto es, s1 = (1/3, 1/5, 1/7, …).

Para expresar de manera simple los siguientes conceptos, conviene adoptar los siguientes términos: “cabeza” y “cola” de una sucesión, definidos respectivamente por los “primeros” términos y por los “últimos” términos, es decir, que para la sucesión s, podría hablarse de la h-cabeza y de la h-cola, entendidos respectivamente por (s(1), …, s(h)) y (s(h+1), s(h+2), …).

Definición 1.3: Se dice que una sucesión es “convergente” si tiene límite, y se define el “límite” de una sucesión de números reales, s, como aquel número real, L, tal que cualquiera que sea el positivo , en el intervalo ]L- , L+[ cabe una cola entera de la sucesión, es decir, que hay algún natural, h, tal que la h-cola de la sucesión s está incluida en dicho intervalo llamado también la -vecindad de L. Esto, dicho de manera simbólica es: positivo, h en tal que k h L - s(k) . Caso que la sucesión no sea convergente, se dice que es “divergente”. Se escribirá: L = lim s ó L = lim (xk) ó L = lim xk , si s = (xk), para indicar que L es el límite de la sucesión s. Una manera de parafrasear el concepto de límite de una sucesión es la que dice que un número real es límite de una sucesión de números reales si “tan cerca como se quiera de dicho número se encuentran casi todos los términos de la sucesión, es decir, todos salvo, quizá, una cantidad finita de ellos ”.

Por ejemplo, la sucesión dada por s(k) = 1/k tiene por límite al número 0, pues cualquiera que sea el valor del positivo , hay algún natural, h, tal que h 1/ (recuérdese que es un campo arquimediano ). Por lo tanto, k h s(k)= 1/k .

5

Page 6: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Definición 1.4: Se dice que una sucesión, s, es “de Cauchy” si cualquiera que sea el positivo , hay algún natural, h, tal que la distancia de dos términos cualesquiera de la h-cola de la sucesión es menor que , es decir, que m h n h s(m) – s(n) . Este concepto puede también parafrasearse como sigue. La sucesión s es de Cauchy si tan cerca entre sí como se quiera están los términos de la sucesión que se hallen en alguna h-cola si es que h es bastante grande.

Un ejemplo de sucesión de Cauchy en que sea divergente (¡en pero no en !) es la dada por: s(k+1) = (s(k) + 2/s(k))/2, siendo s(1) = 2. Entonces ella es (2, 3/2, 17/12, …). Para demostrar que sea de Cauchy basta con establecer que (ejercicio) s(k) – s(k+1) k-1 (s(1) – s(2), siendo), siendo := ¾, y que, por ende, (s(k) – s(k+m)) k-

1 (s(2) – s(1))/(1 - ); además ha de comprobarse que ella es una sucesión decreciente e inferiormente acotada por 2. También ha de probarse que sí tiene límite que es 2, por lo cual carece de límite en .

1.2 Algunas propiedades de límites de sucesiones de números reales

1ª) Unicidad del límite: Ninguna sucesión puede tener más de un límite, es decir, que si existe límite de una sucesión, él es único. La justificación intuitiva es clara, pues, si hubiera dos límites diferentes, a y b, de una sucesión, entonces, definiendo como a-b / 10, debería haber h y k, naturales, tales que la h-cola de la sucesión estuviera en la -vecindad de a, y la k-cola de la sucesión estuviese en la -vecindad de b, por lo que si h k, la h-cola estaría en ambas vecindades; y, en cambio, si k h, sería la k-cola la que estaría en ambas. Ahora bien, ambos casos son imposibles porque las -vecindades de a y b son disjuntas, ya que no puede haber ningún número que diste de a y de b menos de un décimo de la distancia que separa a de b.

2ª) Convergencia de toda subsucesión de una sucesión convergente: Si la sucesión, s, tiene límite, a, entonces toda subsucesión de s converge al mismo número a. Demostración: Sea s una sucesión convergente al número a, y sea s1 = s una subsucesión cualquiera de s. Entonces, dado un positivo cualquiera, por definición de límite se sabe que hay algún natural, h, tal que la h-cola está en la -vecindad de a. Además, como la sucesión de naturales, , es creciente, ha de haber algún natural, h1,tal que (h1) h. Por lo tanto, la h1-cola de la subsucesión ha de estar en la -vecindad de a, ya que dicha h1-cola de la subsucesión está incluida en la h-cola de la sucesión.

3ª) Acotación de toda sucesión convergente: Toda sucesión convergente es acotada. Demostración: Por definición de sucesión convergente, ella ha de tener un límite, y por definición de límite, dentro de una 1-vecindad del límite cabe una cola entera de la sucesión. La cabeza de la sucesión consta sólo de un numero finito de términos. Luego, todos los términos de la sucesión cabrán dentro del intervalo abierto ]-M, M[ si es que se define el número M como la suma de 1½ con el valor absoluto del límite de la sucesión y el máximo de los valores absolutos de los términos de la cabeza. Es decir, si (sk)1

es la sucesión y su límite es a, entonces m, k m, sk ]a-1, a+1[; sea M: = 1½ + a + max {s1, …, sm}. Entonces ha de ser claro que h, sh ]-M, M [, con lo que se comprueba que la sucesión es acotada.

6

Page 7: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Ejemplo: (de que la recíproca no se cumple en general) La sucesión sk: = (-1)k = (-1, 1, -1, 1, -1, …) es obviamente acotada pero no converge pues no hay ningún número real, a, tal que casi todos los términos de la sucesión caigan dentro del intervalo ]a-¼, a+¼[.

4ª) Convergencia de sucesiones monótonas acotadas: Toda sucesión monótona y acotada es convergente.

Demostración: Supongamos que la sucesión es no decreciente (el caso en que ella es no creciente se trata similarmente). Como es acotada, entonces el axioma del supremo garantiza que exista el supremo de los términos de la sucesión. Ahora sólo queda demostrar que dicho supremo, s, es el límite de la sucesión. Por definición de supremo, dado un positivo cualquiera, , hay un término de la sucesión, digamos el k-ésimo, que cae en el intervalo ]s-, s[, y como la sucesión es no decreciente, entonces todos los términos posteriores al k-ésimo caerán en ese mismo intervalo. Luego, s es el límite de la sucesión.

Como un corolario de esta propiedad se obtiene el teorema de Bolzano-Weierstrass:Teorema 1.1 (de Bolzano-Weierstrass): Toda sucesión acotada de números reales posee al menos una subsucesión convergente.

Demostración: Gracias a la propiedad de convergencia de sucesiones monótonas acotadas (cuarta de arriba), basta demostrar que la sucesión dada posee al menos una subsucesión monótona. Llamemos destacado a un término de la sucesión que sea mayor o igual que todos los términos siguientes (podría no haber tal), y sea D el conjunto de índices de todos los términos destacados (podría ser vacío). Sólo hay dos casos posibles, a saber, que D sea infinito o que sea finito. En el primer caso, la subsucesión formada por los términos de índice en D es claramente una subsucesión monótona no creciente, con o cual se obtiene la tesis del teorema. En el segundo caso, sea k1 el primer índice que no esté en D; luego, el término de índice k1 no es mayor o igual que todos los siguientes, así que ha de haber algún término siguiente a él que le sea mayor, y llamemos k2 a su índice. Igualmente el término de índice k2 no es mayor que todos los que le siguen, así que ha de haber otro término siguiente a él que le sea mayor; llamemos k3 a su índice. Continuando de este modo, se obtiene la subsucesión de índices k1, k2, k3, … que es monótona creciente, con lo cual también en este caso se obtiene la tesis del teorema.

Ejemplo: La sucesión (a, a2, a3, …), con a un positivo menor que 1, es decreciente y acotada, pues todos sus términos tienen valor absoluto menor que 1. Luego, por la cuarta propiedad de arriba, ella ha de ser convergente. Como ejercicio, demuéstrese que su límite es 0.

5ª) Preservación de desigualdades por paso al límite: Si dos sucesiones convergentes son tales que los términos de una son respectivamente menores o iguales que los correspondientes términos de la otra, entonces lo propio ocurre con sus respectivos límites, esto es,( xk yk, k) (lim xk lim yk ).

Demostración: Un simple razonamiento por reducción al absurdo basta para demostrar esta propiedad, pues si se tuviera que (lim xk lim yk ), entonces tomando el positivo como la tercera parte de la diferencia entre dichos límites, y teniendo en cuenta que casi

7

Page 8: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

todos los términos de la primera sucesión caen en la -vecindad del lim xk y que también casi todos los términos de la segunda sucesión caen en la -vecindad del lim yk, se encontraría que algunos términos de la primera sucesión serían mayores que los respectivos términos de la segunda, contradiciendo así la hipótesis.

6ª) Preservación de operaciones aritméticas por paso al límite: (1º) Si dos sucesiones son convergentes, entonces la sucesión que se obtiene al sumar los correspondientes términos de ellas es también convergente y el límite de ésta es igual a la suma de los límites de aquéllas. Esto es, (a = lim xk b = lim yk ) (lim( xk + yk )= a + b ).(2º) Si dos sucesiones son convergentes, entonces la sucesión que se obtiene al restar los correspondientes términos de ellas es también convergente y el límite de ésta es igual a la resta de los límites de aquéllas. Esto es, (a = lim xk b = lim yk ) (lim( xk - yk ) = a - b).(3º) Si dos sucesiones son convergentes, entonces la sucesión que se obtiene al multiplicar los correspondientes términos de ellas es también convergente y el límite de ésta es igual al producto de los límites de aquéllas. Esto es, (a = lim xk b = lim yk ) (lim ( xk yk )= a b.(4º) Si dos sucesiones son convergentes y el límite de la segunda no es cero, entonces la sucesión que se obtiene al dividir los términos de la primera por los correspondientes términos de la segunda es también convergente y el límite de ésta es igual al cociente de los límites de aquéllas. Esto es, (a = lim xk b = lim yk 0) (lim( xk / yk )= a / b.

Demostración: (1º) Basta tener en cuenta la propiedad de números reales llamada “desigualdad triangular” según la cual el valor absoluto de una suma de números reales ha de ser menor o igual que la suma de los valores absolutos de dichos números. En efecto, de ella se sigue que (a + b) – (xk + yk) a –xk + b –yk , y, como los dos términos de la derecha pueden hacerse tan pequeños como se quiera tomando k bastante grande, entonces el término de la izquierda también podrá hacerse tan pequeño como se quiera tomando k bastante grande, que es lo que demuestra la tesis.(2º) Es fácil demostrar que b = lim yk -b = lim (-yk). Ahora basta aplicar (1º) a las sucesiones xk y –yk cuyos respectivos límites son a y –b.(3º) Como a b – xk yk = (a - xk)b + (b - yk) xk , basta con aplicar la “desigualdad triangular” a esta suma para obtener que a b – xk yk (a - xk) b +(b - yk) xk , de donde se sigue la tesis de (3º), pues el primer sumando de la derecha puede hacerse tan pequeño como se quiera con sólo tomar k bastante grande, y el segundo sumando también, pues se trata del producto de algo que puede hacerse arbitriamente pequeño con algo que se acerca indefinidamente al número a.(4º) Basta con demostrar que 1/b es el límite de la sucesión (1/yk), pues entonces una aplicación directa de (3º) permite concluir que la sucesión ( xk / yk ), que es la que se obtiene mediante multiplicación de términos correspondientes de las sucesiones (xk) y (1/yk), tiene por límite al producto de a y 1/b, es decir, a/b. Así, pues, como b 0, a partir de cierto término de la sucesión (yk), digamos el h-ésimo, todos los siguientes quedan “lejos” del 0, es decir, en el intervalo ]b/2, 3b/2[ si b > 0, ó en el intervalo ]-3b/2, b/2[ si b < 0. Luego, para k > h, ha de tenerse que 1/b – 1/yk yk – b / ( b yk ) yk – b / ( b yk ) yk – b /( b b/2)= = (2/ b2) yk - b, y como en este último producto el primer factor es constante distinto de 0 pero el segundo se hace arbitrariamente pequeño, resulta que el

8

Page 9: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

producto ha de ser arbitrariamente pequeño, con lo que el límite de la sucesión (1/yk) ha de ser 1/b.

Ejemplo: Sea (xk) una sucesión de números reales positivos todos y tal que lim ( xk+1 / xk ) < 5/7. Entonces, ha de establecerse que dicha sucesión es convergente y que su límite es 0. En efecto, pues para todo k suficientemente grande, ( xk+1 / xk ) < 6/7, de donde, para esos valores de k, xk+1 = (xk+1 / xk) xk <( 6/7) xk , por lo que la sucesión es monótona decreciente (al menos lo es la cola conformada por dichos términos bastante grandes de k). Como ella es obviamente acotada, ha de tener un límite, digamos b. Ahora bien como xk+1 <(6/7) xk para k bastante grande, se sigue, tomando límites a ambos lados de la inecuación, que b (6/7)b, y ya que b es 0, no puede sino ser que b = 0.

1.3 Límites infinitos de sucesiones de números reales

Definición 1.5: Se dirá que “una sucesión de números reales, (xk), tiende a ” (o que tiene por límite a ) si para cualquier número real positivo, M, hay algún término de ella tal que la cola entera que le corresponde se encuentra por encima de dicho positivo, esto es, que M > 0, hay algún número natural, k, tal que si h > k, entonces xh > M.

Ejemplo: La sucesión (k2) tiende a , pues cualquiera que sea el número real positivo M, si k es el menor entero mayor que M, entonces (h > k) h2 > M.

Definición 1.6: Se dirá que “una sucesión de números reales, (xk), tiende a -” (o que tiene por límite a -) si para cualquier número real positivo, M, hay algún término de ella tal que la cola entera que le corresponde se encuentra por debajo de -M, esto es, que M > 0, hay algún número natural, k, tal que si h > k, entonces xh < - M.

Ejemplo: La sucesión (-k2) tiende a - y la demostración de este aserto queda como una tarea simple para el estudiante.

Ejercicio 1.1: Demostrar que si una sucesión tiende a ó a -, entonces la sucesión formada por los inversos multiplicativos de los términos de la primera sucesión (los diferentes de 0) tiende a 0.

Ejercicio 1.2: ¿Será verdad que si una sucesión tiende a 0, entonces la sucesión formada por los inversos multiplicativos de los términos de la primera sucesión (los diferentes de 0) tiende a ó a -? Caso que sí, demostrarlo; caso que no, dar contraejemplos.

Teorema 1.2 : (1) Si una sucesión tiende a y otra sucesión está inferiormente acotada (esto es, que hay algún número real positivo tal que ningún término de esta sucesión es menor que dicho positivo), entonces la suma de ambas sucesiones tiende a . Simbólicamente, si lim (xk) = > 0, k, yk > , entonces lim (xk + yk) = .(2) Si una sucesión tiende a y otra sucesión está inferiormente acotada por un positivo, entonces la sucesión obtenida por la multiplicación de términos correspondientes de ambas sucesiones tiende a . Simbólicamente, si lim (xk) = > 0, k, yk > , entonces lim (xk yk) = .(3) Si una sucesión (xk) es acotada, es decir, que hay algún número real positivo tal que ningún término de la sucesión tiene valor absoluto mayor que dicho positivo; y otra

9

Page 10: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

sucesión (yk) tiende a , entonces la sucesión obtenida por la división de términos correspondientes de ambas sucesiones, (xk / yk), tiende a 0.

Demostración: (1) Sea el positivo tal que ningún término de la sucesión (yk) es menor que él. Entonces, si (xk) es la sucesión que tiende a , se tendrá que k, xk + yk >xk + , de donde se sigue que los términos de esta última sucesión se hacen tan grandes como se quiera con sólo que k sea bastante grande, es decir, que lim (xk + yk)= .(2) Sea el positivo c una cota inferior positiva de la segunda sucesión; entonces dado cualquier número real positivo, M, hay un número natural, h digamos, tal que k > h xk

> M / c, por lo cual para tales valores de h ha de tenerse que xk yk > xk c > (M/c) c = M. Así, se concluye que la sucesión (xk yk) tiende a .(3) Sea c el positivo que acota a la sucesión (xk) y sea (yk) la sucesión que tiende a . Entonces, xk / yk c /yk , de donde se sigue que el valor absoluto del cociente xk / yk ha de tender a 0 pues yk tiende a .

Definición 1.7: Dada una sucesión, (xk) , su “serie” es la sucesión de sus sumas parciales, (x1, x1 + x2, x1 + x2 + x3,… ). Cuando ésta es convergente, se dice que se tiene una “serie convergente”; caso contrario, se dice que se tiene una “serie divergente”. En cualquier caso se la representa por xk . Si el límite de la sucesión de sumas parciales existe y es un número, b, por ejemplo, se escribe: b = xk . A veces hay que

especificar los posibles valores para el índice k, y en tales casos se usa la notación

, en donde a representa el primer valor que ha de tomar el índice (que a veces puede ser 0).

Ejemplos: 1) xk , con xk := k3, es una serie divergente, pues la sucesión (1, 1 + 8, 1 + 8 + 27, …) es divergente.2) xk , con xk := 2-k, es una serie convergente, pues la sucesión (1/2, 1/2 + 1/4, 1/2 + 1/4 + 1/8, …) es convergente, siendo su límite 1, como bien se sabe desde el colegio, pues se trata de la llamada serie geométrica de razón ½ y término inicial 1/2.

Teorema 1.3 (“Criterio de comparación”): Dadas dos series de términos innegativos, xk y yk , si ocurre que a partir de cierto término, n0 , los términos de la primera serie son menores o iguales que cierto múltiplo positivo de los correspondientes términos de la segunda, entonces la primera serie es convergente si la segunda lo es. Esto es, que si c > 0, n0 , k > n0 , xk c yk , siendo xk 0 yk 0 ; entonces la convergencia de la segunda serie implica la convergencia de la primera.

Demostración: Basta considerar las sucesiones de sumas parciales de cada una de las

series, ( ) =: (sn ) y ( ) =: (tn). Si la segunda converge, entonces la sucesión de

sus sumas parciales, (tn), es acotada y monótona creciente. Luego, la sucesión de sumas parciales de la primera, (sn), también será acotada y monótona creciente, y por lo tanto, será convergente. Así, por definición, la primera serie será convergente.

10

Page 11: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Ejemplo: Como ya se ha visto antes, es convergente la serie xk , con xk := 2-k. En vista de que la serie 3/2 + 3/8 + 3/32 + … es igual a la serie 3/2 + 0 + 3/8 + 0 + 3/32 + 0 + 3/ 128 + … y de que 3/2 5 x1 , 0 5 x2 , 3/8 5 x3 , 0 5 x4 , 3/32 5 x5, …; se sigue que es convergente la serie 3/2 + 3/8 + 3/32 + … .

Teorema 1.4: Una serie es convergente sólo si su término general tiende a cero, es decir, que la convergencia de xk implica que 0 = lim xk.

Demostración: Como la serie es convergente, entonces la sucesión de sumas parciales, (sk), tiene un límite, digamos, b. Pero xk = sk – sk-1 , de donde, tomando límites a ambos miembros de esta igualdad, se obtiene que lim xk = b – b = 0.

Definición 1.8: Se dice que una serie, xk , es “absolutamente convergente” cuando es convergente la serie xk .

Ejemplo: Es convergente la serie 1 – 1/2 + 1/4 - 1/8 + 1/16 - …, pues lo es la serie formada con los valores absolutos de sus términos, que es la serie geométrica de razón ½.

Teorema 1.5: Si una serie es absolutamente convergente, entonces es convergente.

Demostración: Sea absolutamente convergente la serie xk ; entonces, por definición, es convergente la serie xk . Formemos dos nuevas series, yk y zk , definiendo respectivamente yk := xk si xk > 0, pero yk := 0, si xk 0; similarmente, defínase zk := - xk si xk < 0 pero zk := 0, si xk > 0. Es claro que xk = yk – zk xk/ = yk + zk , k. Puesto que ambas series, yk y zk , son de términos innegativos, por el teorema anterior, llamado criterio de comparación, se concluye que ellas son convergentes, ya que ambas son de términos no mayores que los de la serie xk . Ahora bien, como es convergente la suma o resta de dos series convergentes (ejercicio simple para el estudiante), se concluye que ha de ser convergente la serie xk ya que ella es igual a yk - zk.

Ejemplos:1) Consideremos la serie 1 + 1 + 1/2! + 1/3! + … y llamemos sn a la suma parcial hasta el término 1/n!. Entonces, se ve fácilmente que la sucesión de sumas parciales (sn) es

acotada pues 2 < sn < 1 + (1 + 1/2! + 1/3! + …) = 1 + = 3. Por la propiedad de

convergencia de las sucesiones monótonas acotadas (sección 1.2), concluimos que es ésta una serie convergente a cierto número del intervalo ]2, 3]; por ahora, llamémoslo (léase “eta”).

2) Consideremos, ahora, la sucesión n := (1 + 1/n)n. Por la fórmula del binomio de

Newton, tenemos que n = 1 + = 1 + 1 +

+ … + . Ahora vemos que n, n <

sn del ejemplo anterior. Como la sucesión (sn) de dicho ejemplo es convergente, también lo será la sucesión (n). A continuación, hemos de ver que ambas sucesiones tienen el mismo límite. En efecto, por lo que acabamos de ver, ya sabemos que lim n lim sn ,

11

Page 12: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

luego, sólo falta ver que se cumple la desigualdad opuesta. Es fácil comprobar que si n > m, entonces n m > sm ; manteniendo fijo el valor de m, hagamos tender n a . Obtenemos lim n sm , m. Por ende, lim n lim sn . A este límite común hemos de denotar por e, constante positiva que es la base de los logaritmos neperianos.

Una interpretación financiera del número e

Como ya sabemos, e = limn (1 + 1/n)n. Veremos ahora que e es el valor adquirido al cabo de un año por un sol colocado en ahorros a una tasa de interés del 100% anual con capitalización instantánea. En efecto, si la capitalización fuera anual, el sol colocado en ahorros a un interés de 100% se habría convertido al cabo del año en 1 +1; si, en cambio, la capitalización fuese semestral, el sol se habría convertido den (1+ ½)1/2

, ya que al cabo del primer semestre habría ganado ½, convirtiéndose así en 1+ ½. Ahora, esta suma ha de ganar intereses de (1+ ½)/2 durante el segundo semestre, convirtiéndose a su vez en (1+ ½)1/2. Similarmente, si la capitalización hubiera sido cuatrimestral, el sol inicial se habría vuelto (1 + 1/3)3, al cabo del año. En general, si la capitalización se hiciera n veces al año, el sol inicial se volvería (1 + 1/n)n. ahora ya podemos entender por qué es que con capitalizaciones instantáneas, que es lo que corresponde cuando n tiende a infinito, se obtendría limn (1 + 1/n)n como el valor en que un sol se convertiría al cabo de un año.

Ejercicios:

1.3 Demostrar que si 0 < a = lim (xk), entonces lim (xk )= a.1.4 Demostrar que si una sucesión monótona posee alguna subsucesión convergente, entonces dicha sucesión es convergente.1.5 Demostrar que si el límite de una sucesión es menor que el límite de otra, entonces casi todos los términos de la primera son menores que los correspondientes términos de la segunda, esto es, que si a = lim (xk), b = lim (yk) y a < b entonces n, k > n, xk yk.1.6 Se llama “valor (ó punto) de adherencia” de una sucesión al límite de cualquier subsucesión de ella. Hallar, si existieren, los valores de adherencia de la sucesión (xk) definida por x2k = k y x2k-1 = 1/k . ¿Es convergente dicha sucesión?1.7 Demostrar que una sucesión acotada es convergente si, y sólo si, posee un único valor de adherencia.1.8 Se dice que una sucesión de números reales, (xk), es “de Cauchy” si la diferencia de dos términos cualesquiera de una “cola” de la sucesión puede hacerse tan pequeña como se quiera con sólo definir convenientemente esa “cola”, es decir, que > 0, n, (h > n k > n) xh - xk < . Demostrar que toda sucesión convergente de números reales es de Cauchy.Demostrar que toda sucesión de números reales que sea de Cauchy es acotada.1.9 Demostrar que lim (xk) = si xk = 2 k - k.1.10 Demostrar que es divergente la serie xk donde xk = (k + 1)1/2 – (k)1/2 , a pesar de que tienda a 0 su término general (sugerencia: usar la identidad a2 – b2 = (a - b)(a + b) y calcular explícitamente las sumas parciales).1.11 Sabiendo que es convergente la serie xk donde xk = 2/(n + n2), y usando el criterio de comparación, demostrar la convergencia de la serie yk donde yk = 1/n2. 1.12 Demostrar la convergencia de la serie geométrica de razón positiva menor que 1, a saber, a + a r + a r2 + a r3 + … .1.13 Sabiendo que la serie de términos innegativos, xk , es convergente, demostrar la convergencia absoluta de la serie xk ak, siendo a un número del intervalo [-1, 1].

12

Page 13: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

2. Funciones, relaciones y correspondencias

Vale la pena recordar los conceptos básicos requeridos por las nociones de funciones y correspondencias. Lo primero que ha de tenerse claro es el concepto de par ordenado. Se entiende por tal una pareja de objetos en la que puede inequívocamente distinguirse al primero del segundo; se los denota por (a, b) en donde a se llama primer elemento del par ordenado y b se llama segundo elemento del par ordenado. Suele decirse que en Teoría de Conjuntos, si algo no es conjunto, entonces no es nada. Por lo tanto, habría que preguntarse qué clase de conjunto es un par ordenado. Existen varias formas de definir la noción de par ordenado en términos de la Teoría de Conjuntos. Una de ellas es la siguiente: (a, b):=1{{a}, {a, b}}. Ahora es posible definir el primer elemento del par como aquel que aparece en todos los elementos del conjunto de la derecha, a saber, a, y el segundo elemento del par como aquel que no aparece en todos los elementos del conjunto de la derecha, a saber, b. De manera muy similar se definen tríos ordenados, cuartetos ordenados, etc. Cuando no se quiera precisar el número, n, de elementos, se hablará de éntuples ó éntuplas, denotadas por n- tuple.

Ejercicio 2.1 ¿Sería aceptable la siguiente definición alternativa de par ordenado (a, b) := {b, {a}}? Recuérdese que lo que se quiere es poder reconocer inequívocamente el primer elemento del par. ¿Habría manera de extender este modo de definir par ordenado al caso de trío ordenado?

2.1 Funciones Ahora puede definirse el concepto general de función simplemente como un conjunto de pares ordenados, tal que no hay en él dos pares ordenados diferentes que posean el mismo primer elemento. Al conjunto de todos los primeros elementos de los pares ordenados pertenecientes a la función se lo llama el dominio de la función, y al conjunto de todos los segundos elementos de los pares ordenados pertenecientes a la función se lo llama el codominio ó el alcance de la función2. Esto es, que el codominio de una función f es el conjunto {f (x) : x dom (f)}; suele denotárselo por cod (f). También es frecuente decir que “la función va de su dominio a su alcance”. Si A* es un subconjunto del dominio de la función f, entonces se llama imagen de A*, denotada por f (A*), al conjunto de imágenes mediante f de todos los elementos de A*, esto es, al {f (x) : x A*}.

A manera de ejemplo, considérese la función f := {(2, 1), (5, -2), (3, 1)}. Se ve claramente que f es en efecto una función, pues no hay en f dos pares diferentes que posean el mismo primer elemento (sí hay dos pares diferentes, a saber, (2, 1) y (3, 1), que poseen el mismo segundo elemento, pero esto no es lo que la definición de función prohibe). Entonces el dominio de la función, denotado comúnmente por dom (f), es el conjunto {5, 2, 3}, y el alcance de la función, denotado por cod (f), es el conjunto {-2, 1}. Todo esto se representa también mediante la notación: f :{5, 2, 3} {-2, 1}, y se

1 En general, cuando una igualdad se use para definir algo, al lado del definiendum se pondrán dos puntos.2 Es frecuente también hablar de la imagen de la función entendida como sinónimo del alcance de ella.

13

Page 14: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

pone f (2) = 1, f (5) = -2 y f (3) = 1. Verbalmente se expresa lo anterior diciendo que 1 es la imagen de 2 mediante f, que -2 es la imagen de 5 mediante f, etc.

Ejercicio 2.2 ¿Cuáles de los siguientes conjuntos son funciones y por qué no lo son los otros? a) {(1, 0), (0, 1), (2, 1). (1, 2)} b) {(1, 0), (0, 1), (2, 1), ({1}, 2)}c) {(x, y) : x y2 = x } d) {(x, y) : x y = x2 }

Cuando el dominio, D, de la función incluye como subconjunto al codominio de dicha función, suele decirse que se trata de una función de D en D. Más generalmente, si con C se denota al codominio de la función, se dice que se trata de una función de D en C. Hay que hacer notar, sin embargo, que frecuentemente con la expresión f : A B se entiende que A es el dominio de la función f y que el codominio de dicha función es un subconjunto de B. En adelante habremos de atenernos a esta práctica común entre los usuarios de las matemáticas.

Dadas dos funciones, f : X y g : Y , tales que el codominio de f esté incluido en el dominio de g, entonces se llama “composición de f con g” (denotada por g f) a la función de dominio X que a cada elemento, x del dominio de f asigna g (f(x)). Esto es, que si f (X) Y, entonces g f : X , x g(f (x)).

Dada una función f : X , se llama “función inversa de f ” a una función g : cod (f) IR tal que g f = f g = idX , donde idX es la función identidad que a cada elemento de X le asigna como imagen el mismo x, es decir, idX (x) = x, x de X. Es común denotar a la función inversa de f mediante f -1.

Ha de tenerse en cuenta que no toda función real de variable real posee una función inversa, como por ejemplo, la función cuadrática dada por f (x) = x2, ya que como 9 = f (3) = f (-3), entonces si existiera f -1, debiera tenerse que f -1(9) debería ser a la vez igual a 3 e igual a -3 lo que es imposible para una función. En cambio, por ejemplo, la función cúbica g (x) = x3 sí que posee función inversa, a saber, g -1(y) = y 1/3.

Todo esto motiva las siguientes definiciones respecto a funciones. Se dice que una función es “inyectiva” si no asigna una misma imagen a ningún par de elementos distintos del dominio. A veces también se dice en este caso que la función es una “inyección”. Se dice que una función f : A B es “sobreyectiva” si f (A) = B. Sin embargo al respecto hay que hacer notar que se da cierta imprecisión, pues si B fuera el codominio de la función f, entonces obviamente ella sería sobreyectiva por definición de codominio. Ocurre que en la notación f : A B con frecuencia se entiende B simplemente como un conjunto que contiene al codominio de la función. Por ello, sería más preciso decir que una función f : A B es sobreyectiva respecto al conjunto B. También se dice con frecuencia que tal función es una “sobreyección”. Finalmente, se dice que una función f : A B es “biyectiva” si es inyectiva y sobreyectiva. Es frecuente decir que se trata de una “biyección”. Debemos notar que en lo que concierne a la existencia de función inversa para una función dada f : A B, en el caso de ser f una biyección, ha de existir su función inversa, ya que para cada elemento de B, existe un único elemento de A cuya imagen por f sea dicho elemento de B. En los otros dos casos es sólo posible que exista la función inversa, pero no es necesario.

14

Page 15: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Ejercicio 2.3 ¿Cuáles de las funciones dadas en el ejercicio anterior tienen inversa, cuáles de ellas son inyectivas, y cuáles son biyectivas?

2.2 Correspondencias

La noción de correspondencia es parecida a la de función, sólo que al decir que F es una correspondencia de D en C, se expresa el hecho de que en verdad se trata de una función de D en el conjunto potencia de C, es decir, F : D P(C) . Para expresar esto mismo también se usará la notación F : D C. Ejemplos:1. La función cuadrática de en es la que a cada número real le asigna su cuadrado. Así, ella suele representarse como una f : , x x2, aunque en rigor ella es, más bien, el conjunto {(x, x2) : x }.2. La correspondencia que a cada número real, x, del intervalo cerrado [0, 1] le asigna el intervalo abierto ] x, x + 1 [.3. La función logaritmo natural, que a cada número real positivo, x, le asigna el exponente al que hay que elevar el número e para obtener x.

2.3 Relaciones

Hay relaciones que usamos desde los primeros niveles escolares, como la relación de “mayor que” ó la relación de “menor que” ó la de “igual a”. En forma general puede definirse una relación binaria en un conjunto dado simplemente diciendo que es un subconjunto cualquiera del cuadrado cartesiano de dicho conjunto. Esto es, que R será una relación binaria en el conjunto C si R C C. En forma similar, se define una relación ternaria en un conjunto dado como cualquier subconjunto del cubo cartesiano de dicho conjunto; y una relación cuaternaria, como un subconjunto de la cuarta potencia cartesiana del conjunto, etc.

Ejemplos:

1. Sea C el conjunto {2, 5, 1} y sea R el conjunto {(2, 1), (5, 1), (5, 2)}. Claramente, R C C = {(2, 2), (2, 5), (2, 1), (5, 2), (5, 5), (5, 1), (1, 2), (1, 5), (1, 1)}. Luego, R es una relación binaria en el conjunto C, y debe estar claro que merece el nombre de “mayor que” en el conjunto C. Así, para expresar el hecho de que el elemento 2 del conjunto C es mayor que el elemento 1 de C, podría simplemente escribirse: (2, 1) R, aunque lo habitual sería, más bien, escribir 2 R 1. La práctica muy antigua ha denotado dicha relación con el símbolo >, en vez del símbolo R, y se acostumbra escribir más bien 2 > 1 en vez de 2 R 1.

2. La relación de identidad, que se denota por el símbolo =, en el conjunto C del ejemplo anterior es el conjunto {(2, 2), (5, 5), (1, 1)}. Para decir que el elemento a del conjunto C es igual al elemento b de dicho conjunto podría escribirse: (a, b) =, pero esto resultaría sumamente extraño, y, más bien, se acostumbra escribir a = b.

Algunas propiedades de las relaciones binarias

15

Page 16: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

1. Se dice que una relación, R, es reflexiva si todo elemento del conjunto en el cual se da la relación está en dicha relación consigo mismo. Por ejemplo, en el conjunto de números naturales, la relación de “ser menor ó igual” es reflexiva, pues todo número es menor ó igual que él mismo.

2. Se dice que una relación, R, es simétrica si el hecho de que un elemento del conjunto en el cual se ha dado la relación esté en dicha relación con otro implica que este otro estará en esa relación con aquel elemento; esto es, que si a R b, entonces b R a. Por ejemplo, la relación de “ser primo de” entre seres humanos es simétrica por razones obvias.

3. Se dice que una relación, R, es transitiva si a R b b R c a R c. Por ejemplo, la relación de “ser preferido a” en general es transitiva, pues si uno prefiere dulce entre salado y dulce, y prefiere salado entre salado y agrio, entonces preferirá dulce entre dulce y agrio. Por supuesto, es posible que haya gente que no se comporte de esta manera, pues sólo se trata de un ejemplo sencillo.

4. Se dice que una relación es una equivalencia si ella es reflexiva, simétrica y transitiva. Por ejemplo, la relación de igualdad entre números naturales es una equivalencia, pues todo número es igual a sí mismo (reflexividad), si un número es igual a otro, este otro es igual a aquél (simetría) y si un número es igual a otro y este otro es igual a un tercero, entonces el primero es igual al tercero (transitividad).

5. Dado un conjunto cualquiera, A, se llama una partición de A a cualquier colección de subconjuntos no vacíos de A tal que la unión de todos ellos sea igual a A y que ellos sean mutuamente disjuntos, es decir, que la intersección de dos cualesquiera de ellos sea vacía si ellos son diferentes entre sí. Por ejemplo, una partición del conjunto de los números naturales es {pares, nones}, en donde “pares” designa al conjunto de todos los números naturales divisibles enteramente por 2 y “nones” designa al conjunto de todos los números naturales indivisibles enteramente por 2. Hay otras particiones del mismo conjunto de los números naturales como, por ejemplo, {primos, no-primos}. Así pues, un mismo conjunto puede admitir (y generalmente así ocurre) muchas particiones diferentes.

6. Dada una relación de equivalencia en un conjunto dado, A, para cada elemento de A, x, se llama clase de equivalencia de x al conjunto de todos los elementos de A que son equivalentes a x. Por ejemplo, en el conjunto de los números naturales, la relación a R b ssi1 (ab) tiene la paridad de a y de b, es una relación que resulta ser reflexiva, simétrica y transitiva, por lo que es una equivalencia. Las clases de equivalencia de los diversos elementos de según esta relación son: el conjunto de naturales pares y el conjunto de naturales impares. Ha de estar claro que estas dos clases, la de los naturales pares y la de los naturales impares constituyen una partición del conjunto . En general, cada relación de equivalencia en un conjunto A determina una partición en dicho conjunto mediante sus clases de equivalencia. Se acostumbra designar tal partición como A/ R, si R es la relación de equivalencia en A. A esta partición, A/ R, se la llama el conjunto cociente de la relación R.

7. Similarmente, dada una partición de un conjunto, puede definirse una relación binaria entre los elementos de dicho conjunto, a saber, que x R y ssi2 x y y pertenecen al mismo

1 Ssi se usará como abreviatura de: si, y sólo si.2 Se usará la abreviatura “ssi” para: “si, y sólo si”.

16

Page 17: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

elemento de la partición. Es fácil verificar que es ésta una relación de equivalencia. Así, pues, resulta que cada partición de un conjunto determina en éste una relación de equivalencia. A esta relación de equivalencia se la llama la relación de equivalencia inducida por la partición.

8. En la Teoría del Consumidor de la Microeconomía, en el llamado espacio de complejos mercantiles (“canastas de bienes de consumo”) se considera una “relación de preferencias” entre dichos complejos mercantiles (se escribe: x preferible a y, ó también: x y) de tal manera que de ella se asume que es reflexiva, transitiva y “total” (también se dice “completa”), esto es, que dados dos complejos cualesquiera del espacio mercantil, x y y ; ha de tenerse que (x y y x). De ella se desprenden dos nuevas relaciones, a saber, la llamada “relación de preferencia estricta” (se escribe: x estrictamente preferible a y, ó también: x y), que se a partir de la relación de preferencias mediante: (x y 1 (y x)); y la llamada “relación de indiferencia” (se escribe: x indiferente de y, ó también: x y), que se define a partir de la relación de preferencias mediante: (x y y x). A manera de ejercicio, ha de demostrarse que la relación de preferencia estricta es transitiva pero no es ni reflexiva ni simétrica ni total; y que la relación de indiferencia es reflexiva y simétrica pero no total. Nótese también que ninguna de estas tres relaciones es una relación de equivalencia.

9. Ha de tenerse en cuenta que toda función puede ser vista también como una correspondencia

Ejercicios 2.4 Demostrar que si una relación binaria en un conjunto dado es total, entonces ella es también reflexiva.

2.5 Si una relación binaria en un conjunto dado es simétrica, ¿tendrá también que ser transitiva? ¿Y a la inversa sí? ¿Qué se podrá responder a estas cuestiones si se sabe además que la relación es total?

2.6 En el conjunto de los números naturales se define la relación binaria S como a S b si es que a b a + b. ¿Cuáles de las propiedades estudiadas en este curso son satisfechas por ésta relación?

3. Continuidad de funciones reales de variable real

Primero ha de definirse la noción de límite de una función en un punto, y, luego, se definirá la noción de continuidad de una función en un punto de su dominio, para culminar definiéndose la noción de continuidad de una función. Para esto han de requerirse algunas nociones auxiliares de la topología 2 de, con las cuales ya será posible precisar las nociones de límites de funciones y continuidad de ellas.

3.1 Conjuntos abiertos, cerrados y compactos en

1 El símbolo lógico denota negación de la proposición que le sigue.2 Por “topología” se entiende una rama muy general de las matemáticas, y, en lo que sigue no hará falta adentrarse en ella; bastará tomar este término como parte del nombre de la propiedad definida.

17

Page 18: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Por respeto a la tradición, en lo que sigue se adoptarán algunos términos provenientes de la Geometría, como puntos, para referirse a números reales, y recta real para referirse al conjunto .

Definición 3.1: Se dice que z es un “punto interior” del subconjunto X de , cuando hay algún positivo, , tal que el intervalo abierto ] z- , z+ [ está incluido en X. Al conjunto de todos los puntos interiores de X se lo llama el “interior de X”, y se lo denota por int (X). Al intervalo ] z- , z+ [ se lo llama la “la -vecindad” del punto z. Si no se especifica el número , entonces sólo se habla de “una vecindad” de z.

Nota: De la definición se sigue fácilmente que int (X) X, cualquiera que sea X.

Ejemplos: 1) Si X es el conjunto de los números reales negativos, entonces no son puntos interiores de X ni el 4.016 ni el 7 ni el 0, pero sí lo son el -8.41, el -11 y el -2.

2) Si X es el conjunto de los números enteros (visto como subconjunto de la recta real), entonces no hay ningún punto interior de X, por lo cual int (X)= .

3) Si X es el conjunto de los números reales de valor absoluto mayor que 3, entonces todos sus elementos son puntos interiores de X y no hay más puntos interiores de X. Pero si X hubiera sido el conjunto de los números reales de valor absoluto no menor que 3, entonces no todos los elementos de X habrían sido puntos interiores de X, sino sólo los que tienen valor absoluto mayor que 3.

Definición 3.2: Se dice que un subconjunto de es “abierto” cuando coincide con su interior, es decir, cuando todos sus elementos son puntos interiores del conjunto.

Ejemplos: 1) Todo intervalo abierto de la recta es un subconjunto abierto de ella.

2) El intervalo ]2, 8] no es un abierto de la recta, pues uno de sus elementos, a saber, el 8, no es punto interior del intervalo dado, ya que ninguna - vecindad de 8, con positivo, está incluida en el intervalo dado.

3) Es obvio que si se toma el mismo como subconjunto de , entonces ha de ser un subconjunto abierto de .

4) No parece muy obvio, pero mediante un válido argumento de Lógica, puede demostrarse que el subconjunto vacío de , , es también un subconjunto abierto de . La razón de esto radica en que si no fuera cierto esto, entonces debería haber algún punto del vacío para el cual ninguna - vecindad de él estuviera incluida en el vacío. Pero es claro que en el vacío no hay ningún punto, luego de suponer la falsedad del enunciado se seguiría una contradicción.

Teorema 3.1: La unión de cualquier colección de subconjuntos abiertos de es un subconjunto abierto de .

Demostración: La idea es simple: si se toma un punto, x, cualquiera de la unión de una colección dada de subconjuntos abiertos de , entonces dicho punto ha de pertenecer a algún miembro, A, de esa colección. Como todos los miembros de ella son abiertos, entonces hay alguna vecindad del punto x que está contenida en A. Pero ya que A está contenido en la unión de la colección dada, resulta que la vecindad anterior de x está

18

Page 19: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

contenida en la unión de la colección. Luego, todo punto de la unión pertenece al interior de la unión, por lo que esta unión ha de ser un abierto de .

Teorema 3.2: La intersección de cualquier colección finita de subconjuntos abiertos de es un subconjunto abierto de .

Demostración: Si la colección de subconjuntos abiertos es finita, entonces ella consta de n miembros. Designémosla por {A1, …, An}. Igual que en la demostración del teorema anterior, se va a demostrar que todo punto de la intersección de la colección finita dada es punto interior de dicha intersección, con lo cual se habrá demostrado que ésta es un subconjunto abierto de la recta real. Sea, pues, x un punto cualquiera de la intersección. Entonces x pertenece a todos los n miembros de la colección, por lo cual habrá números positivos, 1, …, n , tales que la i – vecindad de x está incluida en Ai , para todo valor de i comprendido entre 1 y n. Tomemos el mínimo de estos positivos y llamémoslo . Entonces, él ha de ser positivo, y la - vecindad de x estará incluida en todas las i – vecindades de x. Por lo tanto, la - vecindad de x estará incluida en todos los miembros de la colección finita dada, y, por ende, estará incluida en la intersección de dicha colección.

Nota: Ha de advertirse que la intersección de una colección infinita de subconjuntos abiertos de la recta podría no ser un subconjunto abierto de ella, como sería el caso con la colección {A1, …, An , … }, donde se define cada miembro Ai := ] -1/i, 1/i [. Es un ejercicio interesante y sencillo el demostrar que la intersección de esta familia es el conjunto simple1 {0}. También ha de ser claro que este subconjunto de la recta real no es abierto en ella, pues, cualquiera que sea el valor del positivo , la - vecindad de x está incluida en {0}.

Definición 3.3: Se dice que un subconjunto de IR es “cerrado” cuando su complemento en IR es abierto, es decir, que A, subconjunto de IR, es un subconjunto cerrado de , si \ A es un subconjunto abierto de .

Ejemplos: 1) Todo intervalo cerrado es un subconjunto cerrado de la recta real, pues, si, por ejemplo, el intervalo cerrado es el [a, b], entonces su complemento en la recta, que es \ [a, b] = ] -, a [ ] b, [ , ha de ser un subconjunto abierto de la recta, ya que es la unión de dos subconjuntos abiertos de ella.

2) El subconjunto de es también un subconjunto cerrado de la recta, ya que su complemento en la recta es el vacío, y, por una nota anterior, sabemos que el vacío es un subconjunto abierto de .

3) El vacío también es un subconjunto cerrado de la recta, ya que su complemento en ella es , y ya se ha hecho notar antes que es un subconjunto abierto de la recta.

Nota: Téngase en cuenta que aparte del vacío y de , que son a la vez subconjuntos abiertos y cerrados de , no hay ningún otro subconjunto de la recta que también goce de esta propiedad de ser a la vez abierto y cerrado. La demostración de esto puede tomarse como un interesante ejercicio conceptual para el estudiante.

4) Todo subconjunto finito de es un subconjunto cerrado de , pues su complemento en es un subconjunto abierto, como se prueba a continuación. Si x es un punto

1 Se llamará conjunto simple a todo aquel que posea sólo un elemento.

19

Page 20: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

cualquiera del complemento, entonces, si el conjunto finito dado es A = {a1, …, an}, han de ser positivos todos los x – a1, …, x - an, por lo que también será positivo el mínimo de ellos, digamos un x - ah. Llamemos d a este mínimo. Entonces la (d/2) – vecindad de x está incluida en el complemento de A. Luego, dicho complemento es abierto.

5) Hay subconjuntos infinitos de que también son subconjuntos cerrados de la recta real. Por ejemplo, el conjunto formado por todos los enteros, , es cerrado. La demostración de esto es similar a la dada en el ejemplo anterior. En efecto, el complemento de es abierto, pues es la unión de los intervalos abiertos ]0, 1[, ]-1, 0[, ]1, 2[, ]-2, -1[, ]2, 3[, … . Luego, es cerrado.

Teorema 3.3: La intersección de cualquier colección de subconjuntos cerrados es un subconjunto cerrado de .

Demostración: Basta demostrar que el complemento de dicha intersección es un subconjunto abierto de . Pero esto se sigue de las llamadas leyes de De Morgan, según las cuales el complemento de una intersección es la unión de los complementos, y el complemento de una unión es la intersección de los complementos. Así, pues, el complemento de la intersección de la colección dada de cerrados es la unión de los complementos de dichos cerrados. Por lo tanto, como estos complementos de cerrados han de ser abiertos, se trata de una unión de abiertos, y entonces se trata de un abierto. Luego, la intersección de la colección dada de cerrados es un cerrado.

Teorema 3.4: La unión de cualquier colección finita de cerrados es un subconjunto cerrado de .

Demostración: Es muy similar a la anterior y basta con utilizar que el complemento de una unión es la intersección de los complementos. En efecto, dada una colección finita de cerrados, el complemento de su unión será la intersección de los complementos de dichos cerrados, es decir, que será la intersección de una colección finita de abiertos, y, por ende, será un abierto de . Por lo tanto, ya que su complemento es un abierto, la unión de la colección finita de cerrados será un cerrado de .

Nota: Ha de advertirse que la unión de una colección infinita de subconjuntos cerrados de la recta podría no ser un subconjunto cerrado de ella, como sería el caso con la colección {Ax : x ]0, 1[}, donde se define cada miembro Ax := {x}. Así, resulta que la unión de dicha colección ha de ser el mismo intervalo ]0, 1[, que no es un subconjunto cerrado de IR sino un subconjunto abierto.

Definición 3.4: Dados un subconjunto, A, de la recta real y un punto, x, de , se dice que x es “punto fronterizo” (o “punto de frontera”) de A si cualquiera sea el valor del positivo , en la - vecindad de x hay al menos un punto de A y al menos un punto del complemento de A. Al conjunto de todos los puntos fronterizos de A se lo llama la “frontera” de A y se lo designa ya sea por fr(A) ó por A.

Ejemplos: 1) Si A := [2, 5[ ]-1, 0[ , entonces los puntos fronterizos de A son los elementos del conjunto {2, -1, 5, 0}. Además, este conjunto es la frontera de A.

2) Ha de estar claro que la frontera del vacío y la de son vacías, pues ningún punto de la recta real puede ser punto fronterizo de ninguno de estos dos conjuntos, ya que

20

Page 21: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

ninguna vecindad de cualquier punto puede poseer puntos del vacío. Es decir, que = A = .

3) También ha de estar claro que la frontera del subconjunto de formado por los números enteros es dicho mismo subconjunto, es decir, que = , ya que si un punto, x, no pertenece al conjunto de los enteros, entonces es positivo el mínimo, , del conjunto { x – z : z }, por lo que la (/2) – vecindad de x no posee ningún elemento que sea un número entero; además, cualquiera sea el entero, z, que se considere, para todo positivo, , la -vecindad de z posee al menos un entero, a saber, z y posee también puntos que no son números enteros, ya que tan cerca como se quiera de un número entero hay puntos que no son números enteros.

Definición 3.5: Dado un subconjunto, A, de , se llama “clausura de A” (y se la denota por cl (A)) a la unión de A con su frontera, esto es, cl (A) = A A.

Ejemplos : 1) Si A := , entonces, puesto que la frontera de es , se sigue que la clausura de es , ya que = . 2) Si A := {1/k : k }, entonces cl (A) = A {0}, pues todo punto de A pertenece a la frontera de A y el 0 también, ya que cualquiera sea el positivo , la -vecindad del 0 posee puntos de A y del complemento de A.

3) Si A es un intervalo cualquiera, entonces su clausura es el intervalo cerrado que tiene los mismos extremos que el intervalo dado, es decir, que si A es un intervalo de extremos a y b, entonces cl (A) = [a, b].

Teorema 3.5: Un subconjunto A de es cerrado si, y sólo si, no hay ninguna sucesión convergente de puntos de A cuyo límite no pertenezca a A.

Demostración: 1º) Sea a un subconjunto cerrado de , y sea (xk) una sucesión convergente de puntos de A. Ha de demostrarse que el límite, b, de dicha sucesión pertenece a A. Supóngase, por reducción al absurdo, que no fuera así. Entonces habría algún positivo, , tal que en la -vecindad de b no habría ningún punto de A, pues, siendo abierto el complemento de A, dicha vecindad estaría contenida en el complemento de A. Luego, b no podría ser límite de ninguna sucesión de puntos de A, según la definición de límite de una sucesión. Es ésta una clara contradicción, por lo que el límite de la sucesión convergente (xk) ha de pertenecer a A.

2º) Sea A un subconjunto de tal que no hay ninguna sucesión convergente de puntos de A cuyo límite no pertenezca a A. Ha de demostrarse que A es cerrado. Pero esto equivale a demostrar que el complemento de A es abierto. Sea, pues, b un punto del complemento de A. Por hipótesis, b no puede ser límite de ninguna sucesión de puntos de A. Entonces ha de haber algún positivo tal que en la -vecindad de b no hay ningún punto de A. Pero esto equivale a decir que b es un punto interior del complemento de A, es decir, que, como b era un punto arbitrario de dicho complemento, que éste es un subconjunto abierto de .

Teorema 3.6: 1º) La clausura de un subconjunto A de es el menor subconjunto cerrado de IR que contiene a A. 2º) El interior de un subconjunto A de es el mayor subconjunto abierto de que está contenido en A. Esto equivale a decir que 1º) cl (A) es un subconjunto cerrado de y que cualquiera que sea el subconjunto cerrado B de , si A

21

Page 22: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

está contenido en B, entonces cl (A) también está contenida en B; y 2º) que int (A) es un subconjunto abierto de IR y que si B es un subconjunto abierto de y está contenido en A, entonces B está contenido en int (A).

Demostración: En aras de cubrir otros temas más urgentes para las aplicaciones a la Economía, puede omitirse la demostración detallada de este teorema, aunque su significado sí que es esencial.

Definición 3.6: Se dice que un subconjunto de la recta real es “compacto” si es cerrado y acotado, esto es, si su complemento es abierto y hay algún positivo tal que ningún elemento de dicho subconjunto tiene valor absoluto mayor que ese positivo.

Ejemplo: 1) Todo intervalo cerrado de extremos finitos, es decir, [a, b], con a y b números reales, es compacto, pues obviamente es cerrado y es también acotado, ya que el positivo a + b es mayor que el valor absoluto de cualquier elemento del intervalo dado.

2) Ningún intervalo abierto es compacto, ya sea que tenga extremos finitos o infinitos, pues o no es cerrado o, si lo es (como sería en el caso del intervalo ]-, [ que es a la vez abierto y cerrado), no es acotado.

3) Todo subconjunto de que sea unión de una colección finita de intervalos cerrados de extremos finitos es un compacto, pues, siendo unión de una colección finita de cerrados, ha de ser cerrado y es acotado obviamente.

4) El conjunto {1/k : k } {0} es compacto pero, en cambio, no lo es el conjunto {1/k : k }. La demostración de estos dos asertos queda como ejercicio simple a cargo del estudiante.

A continuación se enuncian dos teoremas que pueden ser útiles para aplicaciones posteriores a la Economía omitiéndose sus demostraciones por razones de limitación de tiempo en el dictado del curso. Sin embargo, el estudiante que se interese en ver sus demostraciones puede hallarlas en cualquier texto básico como, por ejemplo, el libro de E. L. Lima, Análisis Real, vol.1.

Teorema 3.7: Un subconjunto, X, de es compacto si, y sólo si, toda sucesión de puntos de X posee al menos una subsucesión convergente a un punto de X.

Teorema 3.8: Dada una sucesión de subconjuntos compactos y no vacíos de tales que cada uno de ellos contiene a todos los siguientes, existe al menos un punto común a todos los miembros de la sucesión; esto es, que si se tiene la sucesión (Ak) tal que (k de , Ak Ak compacto Ak Ak+1) { Ak : k } .

Ejemplos: 1) Sea X el subconjunto de la recta real formado por todos los números positivos. Este subconjunto no es compacto pues no es ni cerrado ni acotado. Por lo tanto ha de haber en él alguna sucesión de puntos carente de subsucesiones convergentes. En efecto, por ejemplo la sucesión (xk) con xk := 3 k + 1, es una en la que no hay ninguna subsucesión convergente, pues ella es estrictamente creciente e inagotada. La diferencia entre dos términos consecutivos cualesquiera es de valor

22

Page 23: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

absoluto igual a 3, razón por la cual ni ella ni ninguna de sus subsucesiones puede ser convergente.

2) Sea X el subconjunto de formado por la unión de los intervalos [2, 5] y [0, 1]. Entonces, por ser unión de dos cerrados, X es cerrado, y por ser acotado, X es compacto. Luego, cualquier sucesión que tomemos en X ha de tener alguna subsucesión convergente. Por ejemplo, consideremos la sucesión (3, ½, 3, ½, 3, …). Esta no es una sucesión convergente, pero sí tiene subsucesiones convergentes, a saber, la (1/2, 3, 3, ½, 3, 3, 3, 3, …) formada con los términos 2º, 3º, 5º, 6º, 7º, 8º, etc.

3) No toda sucesión de intervalos cerrados y no vacíos que vayan encajándose unos en otros posee intersección no vacía, como lo muestra el caso de la sucesión (Ak) con Ak := [k, [. La intersección de todos estos intervalos es vacía, pues si hubiera algún número real en ella, digamos z, entonces, como hay algún número natural, h, mayor que z, ninguno de los intervalos [h, [, ]h+1, [, etc., tienen a z como uno de sus elementos.

Nota (Propiedad de conexión de ) Hay una propiedad del sistema de los números reales que es de gran importancia y cuya demostración se omitirá en este curso pues requeriría más tiempo del disponible; ella es la que se expresa diciendo que la recta real es conexa. Lo que esto significa se expresa como una imposibilidad, a saber, que no es posible encontrar dos subconjuntos de que, siendo abiertos y no vacíos, den al formar su unión la recta real entera, es decir, A, B, A B A B = A y B son abiertos. Ha de ser obvio que esto equivale a que no haya dos subconjuntos de la recta real cerrados y no vacíos cuya unión sea igual a .

Ejercicios : 3.1 Demostrar que cualesquiera fuesen los subconjuntos A y B de la recta real, la intersección de los interiores de ellos es igual al interior de la intersección de ellos, es decir, que int (A B) = (int A) int B. Pero, en cambio, la unión de los interiores de ellos, en general, sólo está incluida en el interior de la unión de ellos, es decir, que int (A B) (int A) int B. Para establecer este último resultado, considérense los casos en que A = [0, 1] y B = [1, 2]. Ha de comprobarse que el interior de A B tiene como subconjunto propia a la unión de los interiores de A y de B.

3.2 Demostrar que si la frontera de un subconjunto de es el vacío, entonces dicho subconjunto es el vacío ó es todo .

3.3 Demostrar que la unión de una colección finita de subconjuntos compactos de es un subconjunto compacto y que la intersección de cualquier colección de subconjuntos compactos de es un subconjunto compacto.

3.2 Límites de funciones

Definición 3.7: Dados un subconjunto, A, de la recta real y un punto, z, de ésta, se dice que z es un “punto de acumulación de” A si cualquiera que sea el positivo , la -vecindad de z posee algún punto de A distinto de z. Al conjunto de todos los puntos de acumulación de A, se lo llama el “conjunto derivado” de A y se lo denota por A.

Ejemplo: Si A = [2, 5[ {7}, entonces 7 pertenece a A pero no es un punto de acumulación de A, pues, por ejemplo, la (1/3)-vecindad de 7 no posee ningún punto de A distinto de 7. En cambio, el punto 5, que no pertenece a A, sí es un punto de

23

Page 24: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

acumulación de A, ya que toda -vecindad de 5 posee puntos de A distintos de 5. Igual ocurre con el punto 2, que siendo elemento de A, también es punto de acumulación de A. En este caso el conjunto derivado de A es A = [2, 5]. De paso, nótese que en general, ni el conjunto dado está incluido en su conjunto derivado ni éste está incluido en aquel.

Definición 3.8: Dados una función f :A cuyo dominio A es un subconjunto de la recta real, un punto de acumulación, z, de dicho subconjunto y un número real, l, se dice que l es el “límite de f en z” si tan cerca como se quiera del número l están las imágenes mediante f de todos los puntos de A que estén bastante cerca de z pero sin ser el mismo z, esto es, que > 0, > 0 tal que x de A, (0 < /x - z/ < /f(x) – l / < ). Esto se representará por la expresión: limz f = l, lo que se leerá como: el límite en z de la función f es l. También se escribe a veces l = limxz f(x).

Ha de notarse aquí que la expresión “tan cerca como se quiera del número l están las imágenes mediante f ” usada en la expresión verbal de la definición es reformulada en la expresión simbólica de esa definición como “ f(x) – l < ”; asimismo, la expresión “todos los puntos de A que estén bastante cerca de z pero sin ser el mismo z” es reformulada en la expresión simbólica mediante “0 < x – z < ”. El número arbitrario representa la idea de “tan cerca como se quiera de l ”, y el número (ya no arbitrario sino, posiblemente algo dependiente de ) representa la idea de “bastante cerca de z”.

También es de notarse que sólo se imponen condiciones para las imágenes mediante la función f de puntos cercanos a z pero distintos de z. Luego, no interesa para nada qué valor toma la función en z, si es que toma alguno, ya que z podría no pertenecer al dominio de la función. Intuitivamente, podría interpretarse el valor del límite de la función en un punto de acumulación del dominio como si fuera un juramento hecho por la función en el sentido de que si se le permitiera asignar imagen a dicho punto de acumulación, entonces le asignaría el valor del límite. No es prudente creer en juramentos de cualquiera. Por esto es que más adelante se dará un nombre especial a aquellas funciones la palabra empeñada.

Por último, conviene tener presente que la negación de limz f = l implica que hay algún positivo, , tal que para todo positivo, , existe un punto, x , del dominio de f tal que 0 < x - z < f(x) – l . En forma verbal, esto dice que hay cierta distancia, , tal que arbitrariamente cerca de z hay puntos del dominio de la función cuyas imágenes distan de l al menos .

Ejemplos : 1) Sea f la función de dominio {0} definida por x f(x):= 1/x. Entonces, 0 no pertenece al dominio de la función pero sí es punto de acumulación de dicho dominio. Luego, cabría preguntarse si la función f tiene límite en 0. La respuesta es que no, porque conforme x se acerca por la derecha al 0, la imagen de x se hace más y más grande positiva; y conforme x se acerca por la izquierda al 0, la imagen de x se hace más y más grande negativa, lo que significa que no hay ningún número real al que se acerque la imagen de la función conforme el punto se acerca a 0.

24

Page 25: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

2) Para la misma función del ejemplo anterior considérese la posible existencia del límite de la función en el punto z = 2. Se verá que 2 es punto de acumulación del dominio de la función y que ahora sí existe el lim2 f que además vale ½. La demostración de este aserto es como sigue. (1º) 2 es punto de acumulación del dominio de la función, pues cualquier -vecindad de 2 posee puntos del dominio que son distintos de 2. (2º) El lim2 f es ½ pues cualquiera sea el positivo , si definimos := 2, entonces podemos comprobar que x - 2 < f(x) – 1/2 < . En efecto, por las propiedades del valor absoluto pueden comprobarse las equivalencias lógicas siguientes: x - 2 < 2 - < x < 2 + 1/(2+) < 1/x < 1/(2-) 1/(2+) – 1/2 < 1/x - ½ < 1/(2-) – ½ - /(2+) < 1/x – ½ < /(2-). Ahora bien, se quiere que de esto se siga que 1/x – 1/2 < . Pero, como /(2+) < /(2-), bastaría con que /(2+) fuera menor que el dado, cosa que se logra, por ejemplo, con la definición propuesta := 2/, ya que entonces la expresión /(2+) = /(1+) < .

3) Sea f := {x : x > 0 } , x x si x < 1 pero x 1 si x 1. Entonces, 1 es punto de acumulación del dominio de la función y existe el límite de ésta en 1, y se tiene que lim1

f = 1. Obsérvese, de pasada, que el valor del límite en 1 coincide con el valor de la imagen del número 1. Los detalles de las demostraciones de estoas aseveraciones quedan a cargo del estudiante.

Teorema 3.9: Si dos funciones reales, f y g, definidas en un mismo dominio X son tales que para cierto punto de acumulación del dominio común, z, existen los límites de ambas funciones en z, siendo el de f menor que el de g, entonces, para todo punto de X bastante cercano a z ha de ser el caso que la imagen según f será menor que la imagen según g. En lenguaje simbólico es: limz f < limz g ,x ] z- , z+ [ X, f(x) < g(x).

Demostración: Por definición de límite de una función en un punto, puede afirmarse que todo punto del dominio X que esté bastante cerca de z ha de tener imagen según f muy cerca de limz f y, asimismo, tendrá imagen según g muy cerca de limz g , lo cual, por hipótesis implica que las imágenes según f de puntos bastante próximos a z han de ser menores que las imágenes según g de esos mismos puntos, ya que lo que está muy cerca del número menor debe ser menor que lo que está muy cerca del número mayor. En lenguaje simbólico, esto se expresa como sigue. Sean F y G, respectivamente, los limz f y limz g. Entonces F < G. Sea := (G - F) /3. Por definición de límite, ha de haber un positivo, , tal que x ] z- , z+ [ f(x) - F < (G - F) /3 y g(x) - G < (G - F) /3. Es fácil, luego, comprobar que de esto se sigue que f(x) < g(x).

Consecuencias (ó corolarios): 1) Si el límite de una función en un punto de acumulación de su dominio es menor que otro número, entonces todo punto del dominio que esté bastante cercano al punto de acumulación tendrá imagen menor que ese otro número, esto es, que si limz f = F < M, entonces ,x ] z- , z+ [ X, f(x) < M.

25

Page 26: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

2) Si dos funciones f y g, de dominio común, X, tienen límite en un punto de acumulación z del dominio común y ocurre que en cualquier punto de dicho dominio que sea distinto de z la imagen según f es no mayor que la imagen según g; entonces limz f limz g. En lenguaje simbólico, si f : X , g: X , z es punto de acumulación de X y x de X{z}, f(x) g(x); entonces limz f limz g.

Las demostraciones de estos dos asertos quedan como ejercicios a cargo del estudiante. Nótese que para la primera basta con considerar un caso particular del teorema en el que se tome una función constante de valor M. Para la segunda, úsese el principio de reducción al absurdo, es decir, muéstrese que si fuera falsa la tesis, es decir, que si se tuviera que limz f > limz g, entonces se contradiría la hipótesis en virtud del teorema precisamente.

Teorema 3.10 (del emparedado): Si tres funciones reales, f, g y h, definidas en un mismo dominio X son tales que para cierto punto de acumulación del dominio común, z, existen los límites de las funciones f y g en z y ellos son iguales, entonces, caso que x de X{z}, f(x) h(x) g(x), ha de tenerse que limz h = limz f = limz g.

Demostración: Sea M el límite común de f y g en z. Basta con tener en cuenta que para cualquier positivo, , por definición de límite de f en z y de g en z, ha de haber positivos, 1 y 2 , tales que (x X 0 < x – z < 1 f(x) – M < ) y (x X 0 < x - z < 2 g(x) - M < ). Ahora, defínase := min (1 , 2). Entonces ha de estar claro que x X 0 < x - z < - < f(x) h(x) g(x) < , de donde se sigue que x X 0 < /x - z/ < - < h(x) < , es decir, que limz h = M.

El siguiente teorema, cuya demostración ha de omitirse por razones de tiempo disponible en el curso, relaciona los conceptos de límite de una función en un punto de acumulación de su dominio con el concepto de límite de sucesiones de números reales.

Teorema 3.11: Dada una función f : X , una condición necesaria y suficiente para que limz f = l es que para toda sucesión (xk) de puntos de X{z} que tienda a z se tenga que l = lim (xk).

Corolario 1 (unicidad del límite): Dada una función f : X y un punto de acumulación, z, del dominio X, o no existe el limz f ó sí existe y es único.

Demostración: Basta usar el teorema anterior, pues tomando una sucesión cualquiera de puntos de X{z}, ésta ha de tender al limz f si éste existe. Por lo tanto, caso que sí exista, ya que una sucesión de números reales no puede tener más de un límite, también el limz f ha de ser único.

Corolario 2 (límites y operaciones): Sean f y g funciones reales definidas en un mismo dominio, X IR, y sea z un punto de acumulación de X tal que existan los limz f y limz g. Entonces, (1º) existe limz (f + g) y es igual a limz f + limz g ; (2º) existe limz (f - g) y es igual a limz f - limz g ; (3º) existe limz (f g) y es igual a (limz f)(limz g); además, si la función g está acotada en alguna vecindad de z y 0 = limz f, entonces 0 = (limz f)(limz g); (4º) si limz g 0, entonces existe limz (f/g) y es igual a (limz f)/(limz g).

26

Page 27: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Demostración: En todos los casos basta con usar el último teorema ya que para sucesiones de números reales es inmediato probar los correspondientes resultados, es decir, que el límite de una suma o resta de sucesiones es la suma o resta de los límites de las sucesiones dadas; que el límite de un producto de sucesiones es el producto de los límites de las sucesiones dadas; que el límite de un cociente de sucesiones es el cociente de los límites de las sucesiones dadas si es que no es nulo el límite de la sucesión divisor, y que es nulo el límite de un producto de sucesiones tales que es nulo el límite de una de ellas y es acotada la otra sucesión.La redacción simbólica queda como ejercicio a cargo del estudiante.

Ejemplos : 1) Si f es una función real constante de valor h y g es la función identidad, esto es, que g(x) = x, entonces ha de ser claro que para cualquier punto de IR (nótese que cualquier punto de la recta real es punto de acumulación de IR), existen los límites de f y g en z y valen respectivamente h y z. Entonces, cualquiera que sea el polinomio p(x) = a0 + a1 x + a2 x2 + … + an xn, ha de tenerse que limz p(x) = a0 + a1 z + a2 z2 + … + an zn. Esto se sigue de una simple aplicación del último teorema, pues, limz p(x) = limz (a0) + limz (a1 x) + limz (a2 x2) + … + limz (an xn) = a0 + limz (a1) limz (x) + limz (a2) limz (x2) + … + limz (an) limz (xn) = a0 + a1 z + a2 z2 + … an zn. Nótese que primero se ha usado la propiedad de que el límite de una suma de funciones es igual a la suma de los límites de esas funciones, y, luego, se ha usado la propiedad de que el límite de un producto de funciones es igual al producto de los límites de esas funciones.

2) Si f y g son funciones reales definidas en y ocurre que existen los límites de ellas en un punto z, siendo el caso de que 0 limz g, entonces existe el límite del cociente de f y g en z y vale (limz f)/(limz g). La demostración de este aserto puede fácilmente hacerse mediante el uso de sucesiones de números reales tendentes respectivamente a esos dos límites.

3) Sea f la función real definida en que asigna a todo número racional el número 1, y a todo número irracional, el valor 0. Entonces, cualquiera que sea z, no existe el lím fz , pues en cualquier vecindad de z los valores asignados por la función f a los puntos vecinos de z no dejan de saltar entre el 1 y el 0. Así, ningún número real, l¸podría ser el lím fz , ya que, por ejemplo, en la 0.001-vecindad de l no es posible que estén todos los valores que la función f asigna a los puntos de cualquier vecindad de z, por pequeña que ésta sea.

A continuación han de definirse dos nociones de límites de una función en un punto que pretenden recoger los respectivos comportamientos de ellas por la derecha (ó por encima) de dicho punto y por la izquierda (ó por debajo) de dicho punto.

Definición 3.9: Dados una función f : X y un punto z de tal que z sea punto de acumulación del conjunto X ]z, [ y un número real, l ; se dice que l es el “límite lateral diestro de f en z” si tan cerca como se quiera del número l están las imágenes mediante f de todos los puntos de X que estén bastante cerca de z siendo mayores que z, esto es, que > 0, > 0 tal que x de X ]z, z+ [, se tenga que f(x) – l < . Esto se representará por la expresión: limz+ f = l, que se leerá como: el límite lateral diestro en z de la función f es l.

27

Page 28: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Definición 3.10: Dados una función f : X y un punto z de tal que z sea punto de acumulación del conjunto X ]-, z [ y un número real, l ; se dice que l es el “límite lateral siniestro de f en z” si tan cerca como se quiera del número l están las imágenes mediante f de todos los puntos de X que estén bastante cerca de z siendo menores que z, esto es, que > 0, > 0 tal que x de X ]z - , z[,se tenga que f(x) – l < . Esto se representará por la expresión: limz- f = l, que se leerá como: el límite lateral siniestro en z de la función f es l.

Ejemplos : 1) Sea f : , x 2 – x, si x > 0, pero x 1 + x, si x 0. Entonces, lim0+ f = 2 y lim0- f = 1. Ha de ser obvio que no existe lim0 f.

2) También ha de ser obvio (y su demostración queda como ejercicio para el estudiante) que si en un punto de acumulación del dominio de una función existen ambos límites laterales y son iguales, entonces ha de existir el límite en dicho punto de la función; además, este límite habrá de ser igual a ambos límites laterales, esto es, ( limz+ f limz- f limz+ f = limz- f ) limz f limz+ f = limz f = limz- f.

Definición 3.11: Dados un subconjunto de no acotado superiormente, X, una función real de dominio X, f, y un número real, l; se dice que “l es el límite de f en ”, cosa que se escribe como l = lim f, si tan cerca de l como se quiera caen las imágenes de todos los puntos de X que sean positivos bastante grandes. Dicho simbólicamente, si >0, M > 0, x de X, (x > M f(x) – l < . Para representar esto se escribirá: l = lim f ó, también, l = limx f(x)

Similarmente, se define el límite de una función real en - como sigue.

Definición 3.12: Dados un subconjunto de no acotado inferiormente, X, una función real de dominio X, f, y un número real, l ; se dice que “l es el límite de f en -”, cosa que se escribe como l = lim- f, si tan cerca de l como se quiera caen las imágenes de todos los puntos de X que sean negativos bastante grandes. Dicho simbólicamente, si >0, M < 0, x de X, (x < M f(x) – l < . Para representar esto se escribirá: l = lim- f ó, también, l = limx - f(x).

28

Page 29: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Definición 3.13: Si a es un punto de acumulación del dominio de la función f : X , entonces se dice que “el límite de f en a es ” si M > 0, >0, x de X, x-a < f(x) > M. Esto se expresa simbólicamente por: = lima f. En forma similar se define también el que una función tenga a - por límite en un punto de acumulación de su dominio. También es obvio el modo en que ha de definirse el que sea infinito el límite lateral (diestro o siniestro) de una función real en un punto de acumulación de su dominio.

Ejemplos: 1) Para la función f :{0} , x 1/x se cumple que 0 = lim f = lim - f. En efecto, pues dado cualquier positivo, , se tiene que f(x) < si es que x > M , siendo M definido como 1 + 1/, ya que esto implica que 1/(x ) < 1/M = 1/(1 + 1/) = /(1 + ) < .

2) Para la función f(x) = 1/(x-1)2, se tiene que 0 = lim f, quedando la demostración de este hecho como un ejercicio para del estudiante.

Nota: Se obtienen resultados análogos a los ya vistos respecto a límites de suma, diferencia, producto o cociente de funciones para los casos que involucren al infinito.

Ejercicios: 3.4 Sean f una función real definida en el subconjunto X de la recta real, z un punto de acumulación de X y L un número real, tales que limz f = L. Defínase Y := f(X{z}). Demostrar que L pertenece a la clausura de Y.

3.5 Sea f : , x x, si x es racional, pero x 0 si x es irracional; y sea g : , x 0 si x 0, pero 0 1. Es claro que puede hacerse la composición de f con g, ya que el codominio de f está incluido en el dominio de g. Demostrar que si bien existen los límites de f y g en 0, sin embargo no existe el límite de g f en 0.

3.6 Demostrar que para la función real de variable real, f, dada por x 1/ (1+x2), se cumple que lim0+ f = 1.

3.7 Demostrar que si p y q son polinomios de segundo y tercer grado respectivamente entonces = lim p = lim- p = lim q = - lim- q. Luego, generalizar esta proposición considerando, ya no grados segundo y tercero, sino pares e impares.

3.3 Continuidad de funciones

Cuando se definió la noción de límite de una función en uno de los puntos de acumulación del dominio de la función, se hizo el comentario de que el hecho de que existiera ese límite y fuese igual a cierto número real podía interpretarse (con un poquito de fantasía) como que la función jurase que si tuviera que asignar imagen al punto de acumulación de marras, entonces le asignaría el aquel número real. También se advirtió que en esta vida no es muy prudente quien cree a pie juntillas en los juramentos de cualquiera. Pues bien, ahora ha llegado el momento de poner en descubierto a las perjuras, es decir, a las funciones que juran en falso. Se llamarán continuas (o “buenas”) aquellas funciones que sean incapaces de jurar en falso, y se llamarán discontinuas las otras.

29

Page 30: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Definición 3.14: Dada una función real definida en un subconjunto de la recta real y dado un punto de su dominio, se dice que dicha función es “continua en ese punto” si tan cerca como se quiera de la imagen del punto caen las imágenes de todos los puntos del dominio que estén bastante cerca del punto considerado. Es decir, que dados una función f : X y un punto z de X, f es continua en z si > 0, > 0, x de X ( x – z < f(x) – f(z) < ).

Notas: 1) También aquí ha de notarse que el “tan cerca como se quiera de la imagen del punto” es representado en la expresión simbólica por el , y el “bastante cerca de z” es representado por el .

2) Si el punto z fuera un punto de acumulación del dominio de la función, entonces la definición de continuidad de f en z equivale a que f (z) sea igual al límite de f en z. Es decir, que la función estaría cumpliendo su juramento.

3) Ha de observarse que no es preciso que el punto z sea punto de acumulación del dominio, pues si no lo fuera, mal podría la función ser perjura, ya que no puede jurar en falso quien no jura. Recordemos que el juramento sólo puede hacerse en puntos de acumulación del dominio.

4) Si la función f no es continua en un punto z de su dominio, se dice que ella es “discontinua en z”.

Ejemplos: 1) Sea la función f : , x 1/(1+x ), definida en el conjunto de los enteros. Entonces, compruébese que no hay ningún número real que sea punto de acumulación del dominio de f, a saber, . Luego, por lo dicho antes, cualquiera que sea x de , ha de ser el caso que f sea continua en x, ya que, dado un positivo cualquiera, bastará con tomar := 1/3 para que se cumpla que x de ( x – z < f (x) – f (z) < ). En efecto, pues el único elemento de que diste menos de 1/3 de z es el mismo z, y entonces la premisa de la implicación será z – z < 1/3, que es verdadera, y la tesis será f(z) – f(z) < , que también es verdadera. Este ejemplo sirve para ilustrar el hecho de que toda función real de variable real ha de ser continua en cualquier punto de su dominio que sea aislado, es decir, que no sea punto de acumulación del dominio de la función. La demostración de este aserto es casi idéntica a la que acaba de darse en el ejemplo y queda a cargo del diligente estudiante.

2) Sea f la función real de variable real que a cada número real asigna su cubo. Entonces, en todo número real, z, f es continua en z. En efecto, pues cualquier número real, z, es punto de acumulación del dominio, IR, de la función. Ahora bien lo que se quiere es que para un positivo arbitrario, , haya un positivo, , tal que x de IR, si x - z < , entonces x3 – z3 < . Esto último equivale a x - zx2 + xz + z2 < . Pero el lado izquierdo de esta última desigualdad es menor ó igual que (z2 + z x + x2) y como x z + z < z + , dicho lado izquierdo no ha de ser mayor que 3 (z + )2. Así, se trata de, dado un arbitrario, hallar un positivo que garantice que 3 (z + )2 < . Hay que considerar dos casos: (1º) Que z = 0; entonces debería ser 3 3 < , lo que se consigue definiendo, por ejemplo, como la raíz cúbica de la tercera parte de , es decir, := (/3)1/3. (2º) Que z 0; entonces debería ser 3 z2 + 6 2 z + 3 3 < . Esto se consigue con un positivo tal que, por ejemplo, cumpla con que cada uno de los tres sumandos del lado izquierdo de la última desigualdad sea menor que /3. Para esto basta con que sea

30

Page 31: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

menor que el mínimo de las tres siguientes cantidades: /(9 /z/2), ( / (18 /z/))1/2 y (/9)1/3. Como z 0, tal mínimo ha de ser positivo, con lo que todo funciona bien.

Definición 3.15: Se dice que una función real de variable real es “continua” si en cada punto de su dominio ella es continua según la definición anterior. Caso contrario, se dice que la función es “discontinua”.

Ejemplos: 1) La función f : , x 2 x – 1, es continua, como se demuestra a continuación. Sea z un elemento cualquiera del dominio de la función f, es decir, un número real arbitrario. Entonces ha de demostrarse que f es continua en z. Pues bien, para establecer este resultado, hemos de empezar considerando un positivo, , cualquiera, y adecuado a él, hemos de hallar un positivo, , que satisfaga la implicación de la definición, a saber, x de IR, x - z < (2 x - 1)-(2 z - 1) < . Pero esta implicación equivale a: x - z < 2 x - 2 z < , que, a su vez, equivale a: x - z < 2 x - z < . De la premisa de la implicación se sigue que 2 x – z < 2 . Luego, la implicación deseada originalmente se satisfará si, por ejemplo, se define como /3, pues entonces se obtiene la implicación: x - z < 2 x - 2 z < 2 < 2 (/3) < , como se quería.

2) La función f : {0} , x 1/x, es continua, pues lo es en cada punto de su dominio. En efecto, si z es un elemento cualquiera del dominio de f, entonces él ha de ser diferente de 0, y, cualquiera que sea el positivo , se quiere un positivo que garantice la implicación deseada, a saber, x - z < (1/ x – 1/ z) < . Pero como (1/ x – 1/ z) = (x - z) / (x z) < / (x z) y se querría que esto último fuera menor que . El peligro radica en que, si bien z 0, el hecho de que x esté “cerca” de z, no garantiza que x 0. Sin embargo, exigiendo que < (½) z, puede afirmarse que x > (½) z, de lo que se sigue que / (x z) < 2 / (z2). Ahora bien, para que esta expresión sea menor que , bastaría con que fuera menor que (/2) (z2). Entonces, definiendo como (/3) (z2), se obtendría la implicación deseada, siempre que también se tuviese que < (½) z. Por lo tanto, hemos de definir como el mínimo entre los dos positivos

31

Page 32: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

siguientes: (½) z y (/3) (z2). De esta manera se satisfará la implicación x - z < (1/ x – 1/ z) < .

Nota: A menudo se comete el error de sostener que la función de este último ejemplo es discontinua, pues, se dice que ella exhibe un salto infinito al pasar x de valores negativos a valores positivos. Vale la pena, aquí, precisar que esta expresión carece de sentido, ya que las variables no pasan de un valor a otro sino que toman valores concretos; así, cuando se ha tomado un valor concreto del dominio de la función, digamos z, entonces éste tiene que ser diferente de 0, y, como ya se ha hecho líneas arriba, la función es continua en z. Lo que ocurra en torno al cero es algo que no nos concierne, pues el cero no es un elemento del dominio de la función.

3) La función f : , x 1/x , si x 0 pero tal que f (0) = 8, sí que es discontinua, pues aunque ella es continua en cualquier punto del dominio que sea diferente del cero, ocurre que no es continua en 0, ya que en este punto el valor que toma la función, 8, no puede ser igual al límite de la función en 0, pues este límite no existe, como fácilmente ha de demostrar el estudiante.

A continuación se enunciarán algunos teoremas importantes relativos a la continuidad de funciones reales de variable real. Sus demostraciones pueden dejarse como ejercicios ó pueden hacerse en sesiones de prácticas dirigidas.

Teorema 3.12: Si f y g son funciones reales definidas en un subconjunto X de y ocurre que, siendo ambas continuas en cierto punto z, f (z) < g (z); entonces cerca de z los valores que toma f son menores que los respectivos valores que toma g, esto es, que positivo tal que x de X tal que x – z < , f (x) < g (x).

Demostración: La idea de la demostración es simple: lo cercano al menor ha de ser menor que lo cercano al mayor. Así, si todo punto cercano a z recibe imagen por f cercana a f (z) y recibe imagen por g cercana a g (z), entonces como f (z) < g (z), ha de tenerse que f (x) < g (x). De manera más rigurosa, para obtener el positivo del enunciado del teorema, consideremos la tercera parte de la diferencia g(z) – f (z) y llamémosla . Es claro que es positivo. Por definición de continuidad de f en z, se sabe que hay algún positivo, 1 , tal que si x - z< 1 entonces f(x ) – f(z) < . Similarmente, puede afirmarse que hay algún positivo, 2 , tal que si x - z < 2 entonces g(x ) – g(z) < . Defínase := min (1 , 2) . Entonces si x - z < , ha de ser verdad que x - z < 1 y que x - z < 2 , de donde se sigue que f(x ) – f(z) < g(x) – g(z) < . Entonces, f(x) < f(z) + y g(x) > g(z) - pero como = (1/3) (g(z) – f(z)), se sigue que f(x) < g(x).

32

Page 33: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Corolario: Si una función continua f asigna un valor no nulo a un punto z de su dominio, entonces a todo punto bastante cercano a z asignará un valor del mismo signo que f (z). Dicho simbólicamente: si f : X es continua en z f (z) 0, entonces positivo tal que x de X, x - z < signo (f (x)) = signo (f (z)).

Demostración: Queda como ejercicio para el estudiante.

Teorema 3.13: Una función real f : X es continua en un punto z de su dominio si, y sólo si, para toda sucesión que converja a dicho punto z se tiene que f (z) es igual al límite de las imágenes de los puntos de la sucesión; esto es, que si z = lim (xk), entonces f (z) = lim (f(xk)).

Demostración: 1º Necesidad de la condición. Sea f continua en z X y sea z = lim (xk). Ha de demostrarse que f (z) = lim (f (xk)). Sea pues un positivo cualquiera. Por definición de límz f, hay un positivo, , tal que para todo punto de X que diste de z menos que ha de tenerse que su imagen distará de f (z) menos que . Ahora, por definición de límite de una sucesión, hay un número natural, h, tal que para todo k > h, ha de tenerse que xk dista de z menos que . Luego, para todo k > h, ha de ser el caso que f (xk) diste de f (z) menos que . Es decir, que f (z) es el límite de (f (xk)).

2º Suficiencia de la condición. Sean f y z tales que para toda suceción convergente a z ocurre que f (z) es el límite de (f (xk)). Ha de demostrarse que limz f = f (z). Esto se hará por reducción al absurdo. En efecto, si no fuera así, entonces, negando la definición de límite de una función en un punto, se concluiría que habría un positivo, , tal que cualquiera que fuera el positivo , existiría algún punto de X situado a distancia menor que de z y tal que la distancia entre f (z) la imagen de dicho punto no sería menor que . Pues bien, entonces para cada natural, k, existiría un punto, xk en X, tal que f (z) – f (xk). De este modo se habría obtenido una sucesión de puntos de X, (xk) tal que f (z) no sería el límite de la sucesión (f (xk)), lo cual sería una contradicción.

Corolario: Si las funciones f y g son continuas en el punto z, entonces también son continuas en z las funciones f + g, f – g, f g y f / g, requiriéndose para esta última que 0 lim0 g.

Demostración: Basta con usar la equivalencia en términos de convergencia de sucesiones establecida en el teorema anterior, y así, queda a cargo del estudiante.

Nota : Como ya sabemos, toda función polinómica es continua. Ahora bien la suma resta y multiplicación de polinomios dan polinomios. Por lo tanto, son funciones continuas la suma de polinomios, la resta de polinomios y la multiplicación de polinomios. Pero no ocurre exactamente así con el cociente de polinomios (conocido como función racional), pues no es un polinomio el cociente de polinomios. Sin embargo, sí que es una función continua el cociente de polinomios, debido al último corolario. Nótese también que dicha continuidad se da en el dominio de la función cociente de polinomios, el cual no incluye a los puntos en donde se anula el denominador, es decir, en las raíces del polinomio denominador.

Teorema 3.14: La composición de funciones continuas es una función continua, es decir, que si f :X y g :Y son tales que f (X) Y f es continua en z g es continua en f (z), entonces g f es continua en z.

33

Page 34: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Demostración: Lo que hay que demostrar es que tan cerca de g (f (z)) como se quiera estarán las imágenes mediante g f de puntos bastante cercanos a z. Pero sabemos que tan cerca de g (f (z)) como se quiera estarán las imágenes mediante g de puntos bastante cercanos a f (z); y sabemos también que tan cerca de f (z) como se quiera estarán las imágenes mediante f de puntos bastante cercanos a z. Entonces, la idea es simple: dado un positivo cualquiera, , hay un positivo tal que

y – f (z) < g (y) – g (f (z)) < . Ahora bien, para el positivo ha de haber un positivo tal que x – z < f (x) – f (z) < . Concatenando estas dos implicaciones obtenemos la siguiente: x – z< g (f (x)) – g (f (z)) < , que demuestra la continuidad de g f en z.

Ejemplo: Aunque no se demuestra en este curso ni la continuidad de las funciones trigonométricas ni la de las exponenciales y logarítmicas, tales demostraciones pueden verse en cualquiera de los libros de las referencias. Asumiéndolas, entonces, es ahora posible convencerse de la continuidad de la función f : + , x sen (log x), pues sólo se trata de la composición de dos funciones continuas.

El siguiente teorema es uno que nos dice que una función continua definida en un intervalo no puede “saltar”, es decir, que si entre los diversos valores que toma se encuentran dos números dados cualesquiera, entonces todos los números comprendidos entre estos dos también son valores que toma la función. Así, que si los números a y b están en el codominio de la función f , entonces y (a y b x en dom (f) tal que y = f (x)).

Teorema 3.15 (del valor intermedio): Si f : [c, d] es una función continua, entonces cualquiera que sea el número y que tomemos entre f (c) y f (d), él será imagen de algún punto del intervalo [c, d], es decir, que x de este intervalo tal que y = f (x).

Demostración: Se basa en un resultado de la topología de la recta real según el cual todo intervalo de ella es conexo, es decir, que no es igual a la unión de dos subconjuntos abiertos no vacíos y disjuntos ni tampoco es igual a la unión de dos cerrados no vacíos y disjuntos. Este resultado no puede demostrarse en este curso pues él requiere de nociones topológicas que no se han de ver aquí. Ahora ya se hace fácil demostrar el teorema del valor intermedio del siguiente modo. Definamos los subconjuntos A y B del intervalo [c, d] mediante: A := {x [c, d] : f (x) y} B := {x [c, d] : y f (x)}. Ellos son no vacíos ya que, por ejemplo, si f (c) f (d), entonces c A d B; pero si f (d) f (c), entonces d A c B. Además, como es fácil demostrar, ambos son cerrados, ya que toda desigualdad con es preservada por paso al límite en sucesiones. En efecto, si (xk) converge a z k, xk A, entonces k, f (xk) y, de donde f (z) y. De modo similar se demuestra que B es cerrado. Es obvio que A B = [c, d]. Finalmente, como este intervalo es conexo, entonces A B . Pero esto último permite concluir que x, x A B, y, así, f (x) y y f (x), es decir, que y = f (x).

Ejemplo: Si se tiene un polinomio p (x) que toma valores positivos y negativos, entonces él tiene al menos una raíz, es decir, que x en tal que 0 = p (x). En efecto, por hipótesis c en tal que 0 < p (c) d en tal que 0 > p (d). Consideremos el intervalo de extremos c y d. Como 0 es un número que está entre p (c) y p (d), y, como ya se ha hecho notar, todo polinomio es función continua, se puede aplicar el

34

Page 35: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

teorema del valor intermedio para concluir que ha de haber algún número del intervalo de extremos c y d tal que su imagen mediante p será igual a 0.

Dada una función real de variable real con frecuencia hay interés en saber si ella alcanza un valor máximo ó un valor mínimo entre todos los valores que asigna a puntos de su dominio. Pero antes de buscar un anillo en un pajar hay que estar seguros de que el anillo se encuentra en el pajar. Por eso, conviene tener criterios que aseguren que una función dada posee máximos ó mínimos.

Ejemplos: 1) La función identidad id : , x x, no posee ni máximo ni mínimo en el sentido de las siguientes definiciones.

Definición 3.16: Un punto del dominio de una función real es un “punto máximo” de la función si en ningún otro punto de su dominio dicha función alcanza un valor mayor que el que alcanza en aquel punto máximo. A veces se llama a tal punto un “máximo global” de la función. De manera similar se define un “punto mínimo” de la función como uno tal que el valor que la función alcanza en él no es mayor que el valor que ella alcanza en cualquier otro punto de su dominio. En tal caso también se habla de dicho punto como de un “mínimo global” de la función. En cambio, para referirse a los valores alcanzados en puntos máximos y puntos mínimos de una función se emplean las expresiones “valor máximo” y “valor mínimo” de la función.

2) La función f : , x 1/(1 + x2) tiene un único punto máximo en 0 pero carece de puntos mínimos, pues si x > x, entonces f (x) > f (x). Además, su valor máximo global es 1 y, naturalmente, carece tanto de valor mínimo global como de valor mínimo local.

35

Page 36: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Del teorema del valor intermedio se deduce una propiedad muy importante, a saber, la de que la imagen de un intervalo mediante una función continua es también un intervalo, como se enuncia en el siguiente corolario.

Corolario: Si f es una función real y continua definida en algún subconjunto de la recta real y J es un intervalo contenido en el dominio de f, entonces la imagen f (J) de dicho intervalo es un intervalo.

Demostración: Hay que demostrar que se cumple en f (J) la propiedad característica de todo intervalo, a saber, que para dos puntos cualesquiera de f (J), el intervalo determinado por esos puntos está contenido en f (J). Sean, pues, y1 y y2 dos puntos arbitrarios de f (J). Entonces, han de existir dos puntos, x1 y x2 de J tales que f (x1) = y1 y f (x2) = y2 . Se debe demostrar que el intervalo [y1 , y2] está contenido en f (J). Tomemos un punto cualquiera, y, del intervalo [y1 , y2]. Por el teorema del valor intermedio, deducimos que ha de existir algún punto, x, del intervalo [x1 , x2] tal que f (x) = y. Por lo tanto, concluimos que y f (J).

Notas: 1) Respecto a conjuntos compactos hay que tener en cuenta que todo conjunto compacto posee un elemento máximo y un elemento mínimo, es decir, que si A es un subconjunto compacto de la recta real, entonces hay en A elementos, x y y, tales que x z y, z de A. La razón para esto es que siendo compacto A, ha de poseer ínfimo y supremo por el axioma del supremo y el del ínfimo. Ahora bien, por ser cerrado A, tales ínfimo y supremo deben pertenecer a A, ya que por definición de supremo de A para cualquier número natural, m, ha de haber algún elemento, xm , de A tal que xm diste del supremo en menos que 1/m. Pero entonces, es claro que la sucesión (xm) converge al supremo de A y, como A es cerrado, este límite, es decir, el supremo de A pertenecerá a A. El argumento para establecer que el ínfimo de A también pertenece a A es similar.

2) La imagen de un subconjunto compacto de la recta real mediante una función continua es un subconjunto compacto de dicha recta. En efecto, para establecer este resultado, tomemos un subconjunto compacto A de y una función continua f tal que su dominio incluya a A. Entonces para demostrar que f (A) es compacto bastará con demostrar que toda sucesión (yk) de puntos de f (A) posees alguna subsucesión convergente a un punto de f (A). Por definición de imagen de un subconjunto del dominio, hay una sucesión (xk) de puntos de A tal que k, f (xk) = yk. Por ser A compacto, hay una subsucesión (x(k))k , donde es una función estrictamente creciente de a , tal que esta subsucesión converge a un punto z de A. Ahora, por la continuidad de f, f (z) ha de ser el límite de la subsucesión (f (x(k)))k . Esto muestra que la sucesión dada en f (A) posee una subsucesión convergente a un punto de f (A), y que, por lo tanto, f (A) es compacto.

De estas dos notas últimas se sigue el siguiente teorema muy importante en problemas de optimización.

Teorema 3.16 (de Weierstrass): Sea f una función real y continua y sea A un subconjunto compacto del dominio de f. Entonces, existe al menos un punto máximo global de f en A y existe al menos un punto mínimo global de f en A.

Demostración: Basta tener presentes las notas 1 y 2 anteriores para poder afirmar que f (A) es compacto y que posee un máximo y un mínimo. Ha de ser claro que dichos

36

Page 37: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

máximo y mínimo de f (A) son, respectivamente, los valores máximo y mínimo globales de f en A.

Corolario: La imagen mediante una función continua de un subconjunto compacto de la recta real es un subconjunto acotado de la recta.

Demostración: Por la segunda nota inmediata anterior al teorema de Weierstrass sabemos que la imagen de un compacto mediante una función continua es un compacto, y por definición de compacto se sigue inmediatamente que dicha imagen es entonces acotada.

Teorema 3.17: Toda función continua y biyectiva f : A B definida sobre un compacto tiene función inversa y continua.

Demostración: Que tenga función inversa es sólo consecuencia de la definición de función biyectiva. Sea pues g : B A esa inversa de f . Sólo queda por demostrar la continuidad de g. Para tal fin, tomemos una sucesión cualquiera (yk) en B que converja a un punto y de B. Por la biyectividad de f y de g, existen únicos puntos x y x1 , x2 , … en A tales que f (x) = y y f (xk) = yk , k . Debemos comprobar que g (y) = lim (g(yk)). Procedamos por reducción al absurdo. Si no fuera esto cierto, entonces, negando la definición de límite de una sucesión, obtendríamos la existencia de un positivo, , tal que habría alguna subsucesión de (g(yk)) todos cuyos puntos distarían de g (y) al menos . Pero como A es compacto, habría una subsucesión de la anterior que convergiría a un punto z de A; denotemos como (zk) a dicha subsucesión. Como z - g (y) , debería ser z g (y). Sin embargo, puesto que k , f (g(zk)) = yk y que f es continua, se tendría que f (z) = y. Pero esto contradiría el que la función f sea inyectiva ya que f (x) = y , siendo x = g (y) z.

Ejercicios:

3.8 Demostrar que si son continuas las funciones f : X y g : X , entonces también los son las funciones F : X y G : X , definidas respectivamente por F (x) := max (f (x), g (x)) y G (x) := min (f (x), g (x)).

3.9 Demostrar que si son continuas las funciones f : X y g : X , siendo abierto el subconjunto X de , entonces es abierto el subconjunto de X formado por los puntos en donde difieren entre sí las imágenes de las funciones dadas, y que es cerrado el subconjunto de X formado por los puntos en donde coinciden dichas imágenes.

3.10 Sea f : [0, 1] una función continua tal que f (0) = f (1). Demostrar que hay al menos un punto x del intervalo [0, 1] tal que f (x) = f (x + ½). (Sugerencia: aplicar el teorema del valor intermedio a la función g (x) := f (x) - f (x + ½)). A continuación enunciar y demostrar un ejercicio similar pero con 1/3 en vez de ½. Finalmente, ver si todo esto podría generalizarse para cualquier número positivo menor que 1.

3.11 A una función f : se la llama “periódica” cuando hay algún positivo, p, tal que x de , f (x) = f (x + p). Demostrar que toda función periódica continua es acotada y que alcanza un valor máximo global y un valor mínimo global.

4. Derivadas de funciones

37

Page 38: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Dada una función f : X , si a es un punto de acumulación de X que pertenece a X, entonces para cualquier punto x de X diferente de a pero cercano a él, puede hacerse el cociente (f (x) – f (a)) / (x - a). Su interpretación puede hacerse a partir de la gráfica de la función: tal cociente representa la pendiente ó inclinación de la recta que pasa por los puntos (a, f (a)) y (x, f (x)), llamada una secante por (a, f (a)). También puede interpretarse ese cociente como un cambio medio en el valor de la función al pasar del punto a al punto x. Incluso, en contextos de la física en donde suele interpretarse la variable independiente como el tiempo y la variable dependiente como el espacio recorrido, el cociente mencionado se interpreta como la velocidad media entre los instantes a y x. Cualquiera sea la interpretación que se haga de dicho cociente, resulta natural preguntarse por el límite al que él pudiera tender cuando x tienda a a. Si existiese tal límite, se lo llamaría pendiente de la tangente en a a la gráfica de la función f ó cambio puntual en a ó velocidad instantánea en a, dependiendo de cuál sea el contexto. En cualquier caso ese límite puede interpretarse como un indicador de la sensibilidad del valor de la función respecto a la variable independiente en el punto a.

Definición 4.1: Dada una función f : X , si a es un punto de acumulación de X que pertenece a X, se llama “derivada de f en a” al lima ((f (x) – f (a)) / (x - a)), cuando este límite existe. En este caso, se dice que la función f es “derivable en a” ó, también, que ella es “diferenciable en a”. Suele representarse la derivada de f en a por f (a). Cuando f es diferenciable en todo punto de X, se dice que f es “derivable en X” ó “diferenciable en X”. En este caso aparecería de modo natural una nueva función, f : X . Finalmente, si esta nueva función resultare ser continua, se diría que la función f es “de clase C1 en X” lo que se representaría por f C1 (X).

También se denota la derivada de f en a por Df (a) y por ; y, si los posibles

valores de la variable dependiente se denotasen por y, entonces también se escribe

(a). Ha de hacerse notar, sin embargo, que estas dos últimas notaciones no son muy recomendables pues se fomenta con ellas cierto fetichismo del símbolo debido a que se refuerza en el estudiante la convicción de que son esenciales los símbolos con los que se representen las variables dependiente e independiente, x y y, cuando en verdad lo único que realmente cuenta en todo esto son, de un lado, el símbolo que represente a la función de la que se habla, f, y, de otro lado, el punto a en el que se toma la derivada de la función. Así, pues, Df (a) es la más recomendable, ya que, si en lugar de escribir y = f

(x) se escribiera z = f (u), con las notaciones tradicionales habría que usar (a),

mientras que con la notación Df (a) no cambiaría nada.

El siguiente teorema es de extrema importancia en relación a la derivada de una función en un punto. Nos dice que con ella se obtiene una función lineal1 que aproxima de modo óptimo los valores de la función dada en puntos vecinos del punto en el que se tiene la derivada (punto de referencia); el modo óptimo aquí quiere decir que los errores cometidos con esa aproximación lineal son despreciables respecto a la magnitud de la distancia entre el vecino y el punto de referencia. Esto se aclarará con el mismo enunciado del teorema.

1 Se dice, frecuentemente, que una función es lineal si es polinómica de primer grado. En verdad esto no es exacto, pues haría falta exigir que, además, tuviese término independiente nulo.

38

Page 39: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Teorema 4.1: Una función f : X es diferenciable en un punto a de X que es punto de acumulación de X si, y sólo si (ssi) existe algún número real, c, tal que definiendo la función r como r (h):= f (a + h) – (f (a) + c h), h tal que a + h X ; se tenga, entonces, que 0 = limh0 r (h) / h .

Nota: A la función h f (a) + c h, se la llama la aproximación lineal a f en a, y a la función r (h) definida arriba se la llama función de error, pues cuando, en vez de usar la verdadera función f para calcular el valor que toma en a + h, se usa la aproximación lineal, ha de cometerse en general un error, a saber: f (a + h) – (f (a) + c h). Ahora bien, lo que dice el teorema es que para valores bastante pequeños de la desviación h, el error cometido, r(h), es de magnitud despreciable respecto a la magnitud de la desviación h. También se dice que la magnitud del error es infinitamente menor que la magnitud de la desviación. En tal caso esto se abrevia diciendo que el error cometido con la aproximación lineal es una nada respecto a la desviación. Simbólicamente se expresa esto como r(h) = (h), cosa que se lee como: r(h) es un cero de h. Finalmente, si llamamos función identidad a la que a cada número asigna como imagen ese mismo número, resulta más apropiado decir que la función de error, r, es un cero de la función identidad, id, esto es, que r = (id)

Demostración: 1) Necesidad de la condición: Ha de estar claro que 0 es punto de acumulación del conjunto {h : a + h X} y pertenece a él, pues a es punto de acumulación de X y pertenece a X. Por hipótesis existe f (a) = limh0 (f (a + h) – f (a)) / h. Luego, definiendo el número real c como igual al número real f (a), se obtiene que limh0 (f (a + h) – f (a) – c h) / h = limh0 (f (a + h) – f (a)) / h – c = f (a) – c = 0. Es decir, que se cumple que 0 = limh0 r (h) / h .

2) Suficiencia de la condición: Asumamos que 0 = limh0 r (h) / h. entonces, por la definición de la función de error se sigue que 0 = limh0 (f (a + h) – (f (a) + c h)) / h = limh0 (f (a + h) – (f (a)) / h - limh0 c h / h = limh0 (f (a + h) – (f (a)) / h – c. Por lo tanto, obtenemos que sí existe el limh0 (f (a + h) – (f (a)) / h y vale c.

Corolario: Si una función es diferenciable en un punto de su dominio, entonces es continua en dicho punto.

Demostración: Sea f : X diferenciable en un punto a de X que es punto de acumulación de X. Entonces, del teorema se sigue que f (a + h) = f (a) + f (a) h + r (h) h, con 0 = limh0 r (h) / h . Por lo tanto, limh0 f (a + h) = f (a) + limh0 f (a) h = f (a), por lo que f es continua en a.

Ejemplos: 1) Si f : es una función constante, esto es, que x de , f (x) = c, entonces a de , (f (a + h) – f (a)) / h = (c - c) / h = 0, de donde se sigue que a de , existe f (a) y vale 0. Así, como la función nula es obviamente continua, se concluye que toda función constante es de clase C1.

2) Si f : es una función lineal, esto es, que x de , f (x) = b x + c, entonces (f (a + h) – f (a)) / h = (b (a + h) + c –(b a + c) / h = b, de donde se sigue que a de , existe f (a) y vale b. Así, como la función constante es obviamente continua, se concluye que toda función lineal es de clase C1.

39

Page 40: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

3) Si f : es la función que x de , f (x) = xn, con n un número natural (esto es, entero positivo), entonces como f (a + h) – f (a) = (a + h)n – an = n an-1h + … + n a hn-1 + hn, se sigue que (f (a + h) – f (a)) / h = n an-1 + (1/2) n (n - 1) an-2h + … + hn-1. Así, se obtiene limh0 (f (a + h) – (f (a)) / h = n an-1 = f (a). Es decir, que la función f (x) = xn es diferenciable y de clase C1, pues mediante un proceso inductivo se establece que n número natural, es continua la función x n xn-1.

4) Si f : es la función que x de , f (x) = x, entonces f es diferenciable en todo punto distinto de 0. En efecto, si a es positivo, entonces x de ]a – a/2, a +a/2[, f (x) = x, por lo que como se vio en el ejemplo (2), existe f (a) y vale 1. Similarmente, si a es negativo, entonces x de ] a + a/2, a – a/2[, f (x) = - x, por lo que como se vio en el ejemplo (2), existe f (a) y vale - 1. A modo de ejercicio, compruébese que no existe f(0). A tal fin, ha de establecerse que el cociente (f (0 + h) – (f (0)) / h toma el valor 1si h > 0, pero toma el valor – 1 si h < 0. Por ello, no puede existir el límite f (0).

5) Si en lugar de usar el valor de la derivada como coeficiente de la variable independiente en la aproximación lineal usáramos otro coeficiente, entonces no se obtendría el resultado consistente en la nulidad del límite del cociente de dividir el error entre la desviación. En efecto, si, por ejemplo, en el caso de la función f (x) = x2 para el punto a = 1, en lugar de usar la aproximación lineal dada por f (a + h) = f (a) + f (a) h = 1 + 2 h, usáramos, por ejemplo, 1+1.5 h, entonces la función de error sería h (1 + h)2 – (1 + 1.5 h) = 0.5 h + h2 y el cociente de dividir esto entre h resulta ser 0.5 + h con lo que se obtiene que limh0 (0.5 h + h2) / h = 0.5 0. Esto nos muestra cuál es el sentido de decir que la derivada nos proporciona la aproximación lineal óptima a los valores de la función dada en puntos vecinos del punto en el que se tiene la derivada.

El siguiente teorema nos dará algunas reglas de derivación respecto a la derivada de una suma de funciones, de una resta de funciones, de un producto de funciones y de un cociente de funciones. En esto téngase en cuenta que dadas dos funciones, f y g, reales definidas ambas en el mismo subconjunto, X, de , se definen las funciones: suma de f y g como (f+g) (x) := f (x) + g (x), siendo su dominio X ; resta de f y g como (f - g) (x) := f (x) - g (x), siendo su dominio X; producto de f y g como (f g) (x) := f (x)g (x), siendo su dominio X , y cociente de f y g como (f / g) (x) := f (x) / g (x), siendo su dominio X \ {x : g (x) 0}.

Teorema 4.2: Si las funciones f : X y g : X son ambas diferenciables en el punto a de X que es punto de acumulación de X, entonces las funciones suma, resta y producto de f y g también son diferenciables en ese punto; la función cociente f / g es,

40

Page 41: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

en cambio, diferenciable en a ssi g (a) 0. Además: (f g)(a) = f (a) g (a) (f g)(a) = f (a) g(a) + f (a)g (a) (f /g)(a) = (f (a) g(a) - f (a)g (a)) / g (a)2.

Demostración: Caso de la función suma: (f + g)(a+h) – (f + g)(a) – (f (a)+ g (a))h = f (a+h) + g(a+h) – f (a) – g(a) - f (a)h - g (a) h = (f (a+h) – f (a) – f (a)h) + (g(a+h) – g(a) - g (a) h) = rf (h) + rg (h), donde rf (h) y rg (h) son respectivamente las funciones de error correspondientes a las funciones f y g en el punto a. Como sabemos, 0 = limh0 rf (h) / h = limh0 rg (h) / h por lo que (f + g)(a) = f (a)+ g (a).

Caso de la función resta: es casi idéntico al de la función suma.

Caso de la función producto: (f g)(a+h) – (f g)(a) – (f (a) g(a)+ f (a) g (a))h = f (a+h) g(a+h) – f (a) g(a) - f (a) g (a)h – f (a) g (a) h = (f (a)+f (a)h + rf (h)) (g(a)+g(a)h + rg (h)) – f (a)g(a) - f (a)g(a)h – f (a)g(a)h = f (a) rg (h) + f (a) g(a)h2 + f (a)h rg (h) + rf (h)) (g(a)+g(a)h + rg (h)). Ahora bien, dividiendo esta expresión entre h y tomando límites cuando h tiende a 0 se obtiene que dicho límite vale 0 ya que 0 = limh0 rg (h)/h, 0 = limh0 rg(h) y g(a) = limh0 (g(a)+g(a)h + rg (h)). Luego, (f g)(a) = f (a)g (a) + f (a)g (a).

Caso de la función cociente: es muy similar al caso de la función producto sólo que hay que tener en cuenta que como g (a) 0, entonces hay una vecindad de a en la que g no se anula, y para los procesos de límites basta con considerar que h es tan pequeño que a + h permanece en dicha vecindad en la que g no se anula.

El siguiente teorema, llamado regla de la cadena, nos asegura, grosso modo, que la composición de funciones diferenciables es diferenciable.

Teorema 4.3: Sean f : X y g : Y funciones tales que f (X) Y; sea a un punto de acumulación de X que pertenece a X y tal que f (a) es punto de acumulación de Y. Entonces, si f es diferenciable en a y g es diferenciable en f (a), resulta que g f es diferenciable en a y su derivada en a es (g f)(a) = g (f (a)) f (a).

Demostración: Debe demostrarse que es nulo el límite del cociente que se obtiene al dividir la expresión gf (a + h) – (gf (a) + g (f (a)) f (a) h) por la desviación h. Para esto téngase en cuenta que g(f (a + h)) = g (f (a) + f (a)h + rf (h)) que puede ser vista como g (f (a) + k), donde k representa la desviación producida en Y desde el punto f (a) como consecuencia de la desviación h en X desde a. como g es diferenciable en f (a), ha de ser g (f (a) + k) = g (f (a)) + g (f (a)) k + rg(k), siendo rg la función de error para la función g. Con estas consideraciones hemos de obtener que gf (a + h) – (gf (a) + g (f (a)) f (a) h) = g (f (a)) (rf (h) + rg (f (a) h + rf (h))). Es claro que si h tiende a 0, entonces f (a) h + rf (h)) tiende también a 0. Además, puesto que 0 = limh0 (rf (h)h) , y que rg (f (a) h + rf (h)) h = (rg (f (a) h + rf (h)) (f (a) h + rf (h)))(f (a) + rf

(h)h), se concluye que si h tiende a 0, entonces también tiende a 0 el cociente de dividir gf (a + h) – (gf (a) + g (f (a)) f (a) h) entre h, con lo que se demuestra que (g f)(a) = g (f (a)) f (a).

41

Page 42: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Como un corolario de este importante teorema se obtiene otro resultado de igual importancia, a saber, el llamado teorema de la función inversa.

Corolario (teorema de la función inversa): Sea f : X una biyección entre X y f (X) =: Y. Si f es diferenciable en el punto de acumulación de X, a X y la inversa de f, denotada por g, es continua en b := f (a), entonces g es diferenciable en b si, y sólo si, 0 f (a), y en tal caso ocurre que g (b) = 1 f (a).

Demostración: Basta tener presente que la función identidad en X, id : X X, es el resultado de componer la función f con su inversa g: id = gf. Además, como ya se demostró antes, la derivada de la identidad en cualquier punto de acumulación de X vale 1. Luego, 1 = g (f (a)) f (a), de donde, g (b) = 1 f (a).

Ejemplo: 1) Dada una función diferenciable f : , consideremos las dos nuevas funciones g : , x f (x3) , y : , x f (x)3. Entonces se comprueba fácilmente, por la regla de la cadena, que g (a) = 3 a f (a3) y que (a) = 3 f (a)2 f (a). 2) La función g : + + , x (x)1/3 es diferenciable y su derivada en cualquier positivo, b, es g (b) = (1/3)(b)2/3, pues g es la inversa de la bisección f : + + , x (x)3, y por el corolario anterior se tiene que g (b) = 1f (a), donde a es tal que f (a) = b. Ahora bien como f (a) = 3 a2 y a = b1/3, se obtiene que g (b) = 1(3 b2/3).

4.1 Crecimiento y decrecimiento locales

Si en el cociente (f (x) – f (a)) / (x - a) se impusiera la condición de que x > a y existiera el límite de él cuando el valor de la variable x descienda tendiendo a a, entonces a dicho límite se le llamaría “derivada lateral diestra” de f y se la denotaría por f+ (a) := limxa+ (f (x) – f (a)) / (x - a).

De manera similar se define la “derivada lateral siniestra” de f , haciendo que en el cociente de arriba el valor de x ascienda tendiendo a a, y se la denota por f- (a) := limxa- (f (x) – f (a)) / (x - a).

42

Page 43: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Teorema 4.4: Si la derivada lateral diestra de una función f : X en un punto a es positiva, entonces en todos los puntos bastante cercanos al punto a y mayores que a la función toma valores mayores que el que toma en a, esto es, > 0, a < x < a + f (a) < f (x).

Demostración: De la definición de límite lateral diestro se sigue que como es positivo el limxa+ (f (x) – f (a)) / (x - a), entonces ha de haber un positivo, , tal que a < x < a + (f (x) – f (a)) / (x - a) > 0. Pero entonces, ya que el denominador es positivo, también el numerador habrá de serlo, es decir, que f (a) < f (x).

Nota: De la misma manera se demuestra la versión correspondiente para el caso de la derivada lateral siniestra: Si la derivada lateral siniestra de una función f : X en un punto a es positiva, entonces en todos los puntos bastante cercanos al punto a y menores que a la función toma valores menores que el que toma en a, esto es, > 0, a - < x < a f (a) > f (x).

Corolario: Si una función es monótona creciente, entonces sus derivadas laterales, cuando existan, serán mayores ó iguales que 0.

Demostración: De no ser así, habría un punto, a, en el que alguna derivada lateral sería negativa. Digamos que fuese la diestra. Entonces habría algún punto a la derecha de a en el que el valor de la función sería menor que el que toma en a. Esto contradiría el que la función fuese monótona creciente. Similar argumentación nos convencerá de que tampoco podría ser negativa una derivada lateral siniestra.

Definición 4.2: Dada una función f : X y un punto a de X, se dice que a es un “máximo local” de la función si hay alguna vecindad de a en la que f no alcanza un valor mayor que f (a). Se dice que a es un “mínimo local” de la función si hay alguna vecindad de a en la que f no alcanza un valor menor que f (a). Se dice que a es un “máximo global” de la función si en ningún punto de X f alcanza un valor mayor que f (a). Se dice que a es un “mínimo global” de la función si en ningún punto de X f alcanza un valor menor que f (a). Con frecuencia se dice también máximo y mínimo absoluto en vez de máximo y mínimo global. Se habla de un “máximo local estricto” cuando en alguna vecindad del punto en cuestión ocurre que en todos los otros puntos la función alcanza valores menores que f (a). Similarmente, s e habla de un “mínimo local estricto” cuando en alguna vecindad del punto en cuestión ocurre que en todos los otros puntos la función alcanza valores mayores que f (a).

43

Page 44: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Ha de estar claro que todo máximo global es un máximo local y que todo mínimo global es un mínimo local. Las proposiciones recíprocas obviamente no son ciertas en general.

Corolario: Si existe la derivada lateral diestra de una función f : X en un punto a de X que, siendo punto de acumulación de X, es un máximo local de f, entonces dicha derivada ha de ser menor ó igual que cero.

Demostración: Es que si fuera positiva la derivada lateral diestra de una función f en a, entonces por el teorema se podría afirmar la existencia de puntos bastante cercanos al punto a situados a su derecha en los que f alcanzaría valores mayores que f (a), lo cual contradiría el que a fuese un máximo local de f.

Nota: De modo similar se obtiene el resultado que dice que si existe la derivada lateral siniestra de una función f : X en un punto a de X que, siendo punto de acumulación de X, es un máximo local de f, entonces dicha derivada ha de ser mayor ó igual que cero. Hay los correspondientes enunciados para el caso de mínimos locales, y ellos se dejan como ejercicios para el estudiante.

Corolario: Si existe la derivada de una función f : X en un punto a del int(X) que es un máximo local ó un mínimo local de f, entonces dicha derivada ha de ser igual a cero.

Demostración: De los corolarios anteriores se sigue que en el punto a, máximo local, las derivadas laterales diestra y siniestra de la función f han de ser respectivamente 0 y 0. Como ambas tienen que ser iguales entre sí, ya que existe la derivada de f en a, se concluye que no pueden sino ser nulas ambas. De manera similar se trata el caso de un mínimo local.

El siguiente teorema, de gran importancia, dice que si una función, cuyo dominio es un intervalo cerrado, toma un mismo valor en los extremos del intervalo, y ella es diferenciable en todos los puntos del intervalo abierto, entonces ha de haber al menos un punto del intervalo abierto en donde la derivada de la función se anule.

44

Page 45: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Teorema 4.5 (de Rolle): Sea f : [a, b] una función continua tal que f (a) = f (b). Si f es diferenciable en todo punto de ]a, b[, entonces c ]a, b[ tal que f (c) = 0.

Demostración: El teorema de Weierstrass garantiza que la función f alcanza su valor máximo y su valor mínimo en puntos del intervalo cerrado [a, b]. Hay ahora dos posibilidades: (1) ó hay un punto del intervalo abierto en el que la función alcanza máximo ó minimo; (2) o bien no lo hay. En el primer caso, el último corolario garantiza que es nula la derivada en ese punto. En el segundo, el máximo y el mínimo se alcanzan en los extremos, razón por la cual la función tiene que ser constante. Pero entonces su derivada es nula en todos los puntos del intervalo abierto.

El próximo teorema, llamado del valor medio, es una generalización del teorema de Rolle. En términos intuitivos, lo que afirma es que si una función continua está definida en un intervalo cerrado y es diferenciable en el intervalo abierto correspondiente, entonces hay al menos un punto en este intervalo abierto en donde la derivada de la función vale lo mismo que la pendiente de la recta que une los extremos de la gráfica de la función.

Teorema 4.6 (del valor medio): Sea f : [a, b] una función continua tal que ella es

diferenciable en todo punto de ]a, b[; entonces c ]a, b[ tal que f (c) = .

Demostración: La idea es simple: se trata de transformar este contexto en otro como el del teorema de Rolle. Para tal fin, hemos de considerar la diferencia entre la función dada, f , y otra que tiene por gráfica a la recta que pasa por los puntos (a, f (a)) y (b, f (b)). La función que se obtiene satisface las hipótesis del teorema de Rolle y, por lo tanto, ha de haber un punto del intervalo abierto en el que se anule la derivada de dicha función. Pero, como se verá luego, esto equivale a que la derivada de la función f en dicho punto ha de valer lo que vale la pendiente de la recta que pasa por los puntos (a, f (a)) y (b, f (b)).

Así, pues, para abreviar, llamemos m al cociente ; y definamos la función

F : [a, b] , mediante F (x) := f (x) – (f (a) + m (x - a) ). Se comprueba inmediatamente que F (a) = 0 = F (b). Además, como la resta de funciones continuas es continua y la resta de funciones diferenciables es diferenciable, se sigue que F es continua en el intervalo cerrado y es diferenciable en el intervalo abierto. Luego, se puede aplicar el teorema de Rolle a la función F para concluir que c en ]a, b[ tal que 0

45

Page 46: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

= F (c) = f (c) – m, de donde f (c) = (f (b) – f (a)) (b - a) como había que demostrar.

Ejercicios:

4.1 Sean tres funciones f, g y h : X tales que x de X, f (x) g (x) h (x). Se sabe que f y g son diferenciables en un punto aX que es de acumulación de X y que f (a) = h (a) f (a) = h (a). Demuéstrese que g es diferenciable en a y que g (a) = f (a).

4.2 Sea f : X una función diferenciable en a. Demostrar que limh0 (f (a+h) – f (a-h))2h = f (a).

4.3 Calcular mediante la definición de derivada de una función en un punto el valor de f (2) si f : \{0} es la función definida por f (x) = 1/x.

4.4 Admitiendo (lo que es verdad pero que no lo demostraremos aquí) que para la función exponencial exp (x) := ex se cumple que exp (x) = ex y que lim (ex/x) = , demostrar que, definiendo la función f mediante f (x) = exp (-1/x2), para x 0, y, en cambio, f (0) := 0, se tendrá que 0 = f (0).

4.5 Se sabe que la función f : es diferenciable y tal que x, t, f (tx) = t f (x). Demuéstrese, entonces, que c , x, f (x) = c x. Sugerencia: Demostrar, antes, que a, f (a) = f (a) a, y, luego, que este cociente vale 1.

4.6 Se llama punto crítico de una función f a todo punto del dominio de la función en donde se anule su derivada. Demostrar, entonces, que es cerrado el conjunto de puntos críticos de una función real definida en la recta real si ésta de de clase C1.

4.7 Demostrar la Regla de L’Hôpital (pronúnciese como /lopital/, que es francés pero nunca como /lejóspital/, que no es inglés) Si las funciones f y g son diferenciables en el punto a y ambas toman el valor 0 en dicho punto, siendo además que 0 = lima f = lima g,

46

Page 47: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

entonces lima (f / g) = f (a) / g (a) si es que 0 g (a). La demostración es simple, pues en tal caso ocurre que f (a) = lima (f (x) / (x - a)) y también que g (a)= = lima (g(x) / (x - a)); por lo tanto, lima (f / g) = limxa (f (x) / (x-a))(g (x) / (x-a)) = (limxa f (x)/(x-a))(limxa g (x)/(x-a)) = f (a) / g (a), ya que 0 g (a).

Ejemplos: 1) Si se tiene en cuenta que puede demostrarse que sen (x) = cos (x), entonces por la regla de L’Hôpital se deduce que lim0 (sen x / x) = lim0 (cos x / 1) = 1. De paso, vale la pena anotar que también se demuestra que cos (x) = - sen x.

2) Recordando lo que ya se dijo antes: que exp (x) = exp (x), se obtiene por la misma regla que lim0 ((ex - 1) / x) = lim0 ex lim0 1 = 1.

4.2 Derivadas de orden superior y fórmula de Taylor

Habiendo visto que la derivada de una función es también una función, cabe preguntarse si la derivada de esta última existe y, en tal caso, hasta dónde puede esto continuar. De esta manera hemos de llegar a los conceptos de derivadas de segundo orden, de tercer orden, etc. En los casos de algunas funciones, y cada una de éstas nos dará información específica sobre la función original y su gráfica.

Definición 4.3: La “segunda derivada de una función f : X en un punto a” es la derivada de la función derivada de f, a saber, de la función f , evaluada en el punto a. Se la denota por f (a) := (f) (a). Si consideramos la función que a cada punto a de X que sea punto de acumulación de X le asigna, cuando exista, el valor de f (a), obtendremos la función “segunda derivada de f” denotada por f.

Ejemplo: Si f es la función definida en mediante f (x) := x3 – sen x, entonces f es dada por f (x) = 6 x – (- sen x) = 6 x + sen x, ya que, como se ha indicado líneas arriba, cos (x) = - sen x.

Definición 4.4: En forma similar se definen la “tercera derivada de una función” , la “cuarta derivada de una función”, etc., cuando ellas existan.

Ejemplo: Para la función f : , definida por f (x) := x , se encuentra que f tiene dominio \{0} y está dada por: f (x) = 1, si x > 0, pero f (x) = -1, si x < 0. Igualmente, se encuentra que f tiene el mismo dominio que f , a saber, \{0}, y que está dada por f (x) = 0, x 0. Finalmente, se comprueba fácilmente que f coincide con f y que lo mismo pasa con las siguientes derivadas de f. A propósito, a partir de la cuarta derivada de una función f se usa la notación f (m) donde m indica el orden de la derivada. Así, las derivadas sucesivas de f se denotan por f , f, f, f f (4), f (5), etc.

Definición 4.5: Se dice que una función f definida en un intervalo de la recta real es “de clase Cm ” cuando en cada punto del intervalo existen y son continuas todas las derivadas de f hasta el orden m, esto es, f, f, f, … f (m). Suele escribirse f (0) para referirse a la misma función f. Cuando ocurre que la función f es de clase Cm para todo número natural m, se dice que f es de “clase C ”.

Ejemplo: A manera de ejercicio, compruébese que toda función polinómica es de clase C.

47

Page 48: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Así como se ha hablado de la aproximación lineal a una función, f, en un punto a, para referirse al polinomio de primer grado f (a) + f (a) (x - a), puede también hablarse de la aproximación cuadrática a la función f en el punto a para referirse al polinomio de segundo grado f (a) + f (a) (x - a) + f (a) (x - a)2, y también de la aproximación cúbica de f en el punto a para referirse al polinomio de tercer grado f (a) + f (a) (x - a) + f (a) (x - a)2 + f (a) (x - a)3. En general se tiene la siguiente definición, si se representa por h el valor de la desviación (x - a).

Definición 4.6: Para una función, f, de clase Cm, si n < m, se llama “polinomio de Taylor de orden n de la función f en el punto a” al polinomio denotado por Pf ,n (a) y definido por Pf, n (a) (h) := f (a) + f (a) h + f (a) h2/2! + … + f (n)(a) hn/n!. A la función diferencia f (a + h) - Pf ,n (a) (h) se la llama “resto de orden n de f en a”. El siguiente teorema, cuya demostración se omitirá por razones de tiempo, nos asegura que el resto de orden n de f en a es un cero (ó una nada) de la función identidad.

Teorema 4.7: Si la función f , definida en el intervalo I , tiene derivadas en el punto a hasta el orden n, entonces la función resto de orden n de f en a, definida en el intervalo J := {h : a + h I}, mediante rf, n (a)(h) := f (a + h) - Pf, n (a) (h), satisface la condición 0 = limh0 rf, n (a)(h) / hn .

Aplicación a la optimización irrestricta: Sea f : J una función diferenciable hasta el orden n en un punto a del interior del intervalo J y tal que en dicho punto se anulan las derivadas de f hasta el orden n – 1 pero no se anula la de orden n. Hemos de comprobar (1) que si n es par y f (n)(a) > 0, entonces a es un punto mínimo local estricto de f, pero (2) que si n es par y f (n)(a) < 0, entonces a es un punto máximo local estricto de f. Además, (3) que si n es impar, entonces a no es ni punto mínimo local ni punto máximo local. La justificación de esto es la que sigue. Por la definición del resto de orden n se puede escribir f (a + h) – f (a) = hn (f (n)(a) / n ! + rf, n (a)(h) / hn). Como por el teorema anterior se tiene que 0 = limh0 rf, n (a)(h) / hn, entonces por la definición de límite y dado que a es punto interior de J, se puede afirmar que positivo tal que si 0 < h < , entonces f (n)(a) / n ! + rf, n (a)(h) / hn es del mismo signo que f (n)(a), por lo cual en el caso en que n es par ocurre que, como hn es positivo, f (a + h) – f (a) será del mismo signo que f (n)(a). Así, pues, cuando f (n)(a) < 0, los valores que f toma en puntos vecinos de a son menores que el que toma en a, de donde se sigue que a es un punto máximo local de f. Similarmente, cuando f (n)(a) > 0, los valores que f toma en puntos vecinos de a son mayores que el que toma en a, de donde se sigue que a es un punto mínimo local de f. Esto justifica las afirmaciones (1) y (2). Finalmente, cuando n es impar, ocurre que hn es del mismo signo que h por lo que f (a + h) – f (a) cambiará de signo cuando h lo haga. Entonces, a no será ni máximo local ni mínimo local de f, lo que justifica (3).

Ejemplo: Sea f : la función definida por f (x) := xk con k . Entonces el punto 0 es candidato a máximo local ó a mínimo local. Veamos: si k es impar, ocurre que se anulan en 0 las k – 1 primeras derivadas de f, siendo no nula la k-ésima derivada en 0, que vale 1. Según la aplicación que acabamos de ver, estamos en el caso (3), por lo cual el punto 0 no es ni máximo local ni mínimo local. En cambio, si k es par, ocurre que estamos en el caso (1), por lo cual el punto 0 es un mínimo local de f (nótese que para esta función f (x) := xk el punto 0 es también un mínimo global). Finalmente, si considerásemos la función g (x) := - x3, entonces por razones similares concluiríamos

48

Page 49: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

que si k fuera par, el punto 0 sería un máximo local (y también global en este caso específico) de la función g; en cambio, que si k fuera impar, el punto 0 no sería ni máximo local ni mínimo global.

4.3 Concavidad y convexidad de funciones

Se dirá que una función real, f, definida en un intervalo J de la recta real es cóncava cuando ocurre que ningún punto de la gráfica de la función se encuentra por debajo de la recta que une dos puntos cualesquiera de la gráfica entre los cuales esté el punto considerado. Más exactamente, si z de J, a, b de J el punto de coordenadas (z, f (z)) no está debajo de la recta que une los puntos de coordenadas (a, f (a)) y (b, f (b)). Ahora bien, la ecuación de dicha recta es dada por: y – f (a) = (x - a) (f (b) – f (a)) / (b - a). Entonces, la ordenada del punto de abscisa z de dicha recta valdrá f (a) + (z - a) (f (b) – f (a)) / (b - a). Luego, la condición antedicha para la concavidad de la función f exigirá que f (z) f (a) + (z - a) (f (b) – f (a)) / (b - a). Con un poco de cálculo algebraico de hallará que esta condición equivale a esta otra: f (z) f (a) (b - z)/(b - a) + f (b) (z - a) / (b - a). Si observamos la expresión del lado derecho veremos que se trata de un promedio ponderado de los números f (a) y f (b), siendo las ponderaciones los números innegativos (b - z)/(b - a) y (z - a) / (b - a) cuya suma vale 1. El nombre usual que se da a tal promedio ponderado es el de una combinación convexa de los números f (a) y f (b). Notemos también que cualquiera que sea el punto z ha de cumplirse la igualdad: z = a (b - z)/(b - a) + b (z - a) / (b - a). Esto nos muestra que z es también un promedio ponderado de a y de b, siendo las ponderaciones las mismas que encontramos antes aplicadas a f (a) y f (b). Por ello, podemos afirmar que z es una combinación convexa de a y de b. De manera más general, entonces, puede afirmarse que si escogemos dos números reales innegativos de suma 1, digamos y , obtendremos con ellos una combinación convexa de los puntos a y b; pero también obtendremos con ellos una correspondiente combinación convexa de las imágenes mediante la función f de dichos puntos. Así, la idea que se introdujo primero acerca de la concavidad de la función f definida en el intervalo J puede ahora expresarse diciendo que si z es una combinación convexa de dos puntos cualesquiera a y b del intervalo, entonces f (z) no deberá ser menor que la correspondiente combinación convexa de las imágenes de a y b mediante la función f. Expresado de manera simbólica: a, b, z de J, ( 0, 0 tales que + = 1 z = a + b f (z) f (a) + f (b).

Definición 4.7: Una función, f, definida en un intervalo J de la recta real es “cóncava” si a, b, z de J, si 0, 0 son tales que + = 1 z = a + b entonces debe ser f (z) f (a) + f (b). Se la llama “estrictamente cóncava” si a, b, z de J, si > 0, > 0 tales que a b + = 1 z = a + b entonces debe ser f (z) > f (a) + f (b). Obviamente, el ser estrictamente cóncava implica el ser cóncava.

Esta definición expresa simbólicamente la idea intuitiva de que la gráfica de la función comprendida entre de puntos cualesquiera de ella no esté nunca por debajo de la recta secante que determinan esos dos puntos.

49

Page 50: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

De manera similar se ha de expresar la propiedad de convexidad de una función diciendo que la gráfica de la función comprendida entre de puntos cualesquiera de ella no esté nunca por encima de la recta secante que determinan esos dos puntos. Dicho de manera simbólica llegamos a la siguiente definición.

Definición 4.8: Una función, f, definida en un intervalo J de la recta real es “convexa” si a, b, z de J, si 0, 0 tales que + = 1 z = a + b entonces debe ser f (z) f (a) + f (b). Se la llama “estrictamente convexa” si a, b, z de J, si > 0, > 0 tales que a b + = 1 z = a + b entonces ha de ser f (z) < f (a) + f (b). Obviamente, el ser estrictamente convexa implica el ser convexa.

Los siguientes teoremas, cuyas demostraciones omitiremos a fin de ganar tiempo para cubrir más temas, nos dan importantes caracterizaciones de las funciones cóncavas y convexas.

Teorema 4.8: Si una función f : J es cóncava ó convexa en el intervalo J, entonces ella es continua en todo punto del interior del intervalo.

Nota: Con el fin de sopesar bien la importancia de la restricción de la continuidad de la función al interior del intervalo, consideremos el ejemplo de una función f definida en el intervalo [0, 1] mediante: f (0) := 0 x de ]0, 1], f (x) := 1. Ha de comprobarse fácilmente que si bien esta función es cóncava en el intervalo [0, 1] no es continua en dicho intervalo sino en su interior ]0, 1[. Notemos de pasada que en este caso particular ocurre que la función es continua en un superconjunto propio del interior del intervalo [0, 1], a saber, en ]0, 1]; pero eso no quita que ella sea continua en el interior del intervalo dado como dominio de la función. En otros casos podría no ser así. Por ejemplo, si definiéramos una función g en el intervalo [0, 1] mediante g (0) := 0 g (1) = 0 x de ]0, 1[, g (x) := 1, entonces obtendríamos que g es cóncava en [0, 1] pero es continua sólo en el interior de este intervalo, es decir, en ]0, 1[.

Teorema 4.9: Si una función f : J es diferenciable en el intervalo J, entonces son equivalentes entre sí las tres siguientes afirmaciones.

50

Page 51: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

(1) f es cóncava. (2) Su derivada, f, es monótona decreciente. (3) a, x de J, f (x) f (a) + f (a) (x - a).

Nota: La afirmación (3) de este teorema puede interpretarse diciendo que la gráfica de la función f nunca se encuentra por encima de las rectas tangentes trazadas por cualesquiera de sus puntos. Esto es así porque la recta tangente a la gráfica de la función f que pasa por el punto (a, f(a)) tiene pendiente f (a), y, si el punto (x, y) se encuentra en dicha recta, entonces han de coincidir la pendiente de la tangente y la del segmento formados por los puntos (a, f(a)) y (x, y). Esto es, que f (a) = (y – f (a)) / (x - a), de donde se sigue que y = f (a) + f (a) (x - a).

Teorema 4.10: Si una función f : J es diferenciable en el intervalo J, entonces son equivalentes entre sí las tres siguientes afirmaciones. (1) f es convexa. (2) Su derivada, f, es monótona creciente. (3) a, x de J, f (x) f (a) + f (a) (x - a).

Nota: La afirmación (3) de este teorema puede interpretarse diciendo que la gráfica de la función f nunca se encuentra por debajo de las rectas tangentes trazadas por cualesquiera de sus puntos.

De estos dos últimos teoremas se obtienen los dos siguientes corolarios.

Corolario (del penúltimo teorema): Si se anula la derivada de una función diferenciable y cóncava en un punto del intervalo en que está definida, entonces dicho punto es un máximo global de la función.

Corolario (del último teorema): Si se anula la derivada de una función diferenciable y convexa en un punto del intervalo en que está definida, entonces dicho punto es un mínimo global de la función.

Corolario (del penúltimo teorema): Si una función f : J es diferenciable hasta el orden 2, entonces ella es cóncava si, y sólo si, f (x) 0, x de J.

Corolario (del último teorema): Si una función f : J es diferenciable hasta el orden 2, entonces ella es convexa si, y sólo si, f (x) 0, x de J.

Ejemplos: 1) Veamos cómo comprobar que es estrictamente convexa la función f (x) := x2. De acuerdo con la definición, debe establecerse que a, b, z de J, si > 0, > 0 tales que + = 1 z = a + b entonces debe ser f (z) < f (a) + f (b). Esto equivale a: a, b, z de J, si > 0, > 0 tales que + = 1 z = a + b entonces debe ser (a + b)2 < a2 + b2. A su vez, esto equivale a: a, b, z de J, si > 0, > 0 tales que + = 1 z = a + b entonces debe ser 0 < (a - b)2. Es claramente verdadera esta afirmación si a b.

2) Vale la pena mostrar cómo puede también comprobarse la convexidad de la función cuadrática del ejemplo anterior usando esta vez la tercera afirmación del último teorema: a, x de J, f (x) f (a) + f (a) (x - a). Teniendo en cuenta la definición de la función, ella equivale a: a, x de J, x2 a2 + 2 a (x - a). Fácilmente se establece que esta última equivale a: a, x de J, (x - a)2 0. La verdad de esto nos convence de la convexidad de la función cuadrática del ejemplo.

51

Page 52: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

3) Finalmente, la misma comprobación de los ejemplos anteriores se vuelve trivial si aplicamos el último corolario, pues, siendo de clase C2 la función cuadrática considerada, su convexidad equivale a que sea innegativa la función segunda derivada de f que es f (x) = 2 0, x de . Ha de apreciarse que, en general, resulta más fácil comprobar la convexidad ó la concavidad de una función mediante el criterio de la segunda derivada; luego, el criterio de comparación entre la gráfica de la función y la recta tangente se muestra más manejable que el de la definición.

4) Como último ejemplo consideremos el caso de la función cúbica, f (x) := x3. Ya que ella es diferenciable hasta cualquier orden, vemos que es de clase C. Entonces, si aplicamos el criterio de la segunda derivada, que es f (x) = 6 x, notamos que el signo de f (x) es el mismo que el de x. Luego, la función cúbica no es ni cóncava ni convexa vista como función de dominio . Sin embargo, su restricción al intervalo [0, [ sí que es convexa, ya que x del [0, [, f (x) 0. Igualmente, su restricción al intervalo ]0, [ es estrictamente convexa, ya que x del ]0, [, f (x) > 0. De manera similar podemos comprobar que la restricción de la función cúbica al intervalo ]- , 0] es cóncava y su restricción al intervalo ]- , 0[ es estrictamente cóncava.

Ejercicios: 4.8 Calcular las derivadas en el punto x = 0 de la función f (x) = 1 / (1 - x). Con ellas, hallar el polinomio de Taylor de la función f , y comprobar que el resto de orden n dividido por la n-ésima potencia de la desviación x tiende a 0 cuando así hace la desviación .

4.9 Si P (x) es un polinomio de grado n y coeficientes enteros, hallar sus distintos polinomios de Taylor y demostrar que cualesquiera que sean los números reales a y x ha de cumplirse que P(x) = P(a) +P(a) (x - a) + … + P(n)(a) (x - a)n/ n!.

4.10 Demostrar que la suma de dos funciones cóncavas definidas en un mismo intervalo es también una función cóncava y que la suma de dos funciones convexas definidas en un mismo intervalo es también una función convexa.

4.11 Comprobar que las funciones polinomiales de primer grado son a la vez cóncavas y convexas. ¿Habrá otra clase de funciones de clase C2 que gocen de esta propiedad de ser a la vez cóncavas y convexas?

4.12 Demostrar que si f y g son funciones diferenciables por lo menos hasta el segundo orden y definidas respectivamente en intervalos I y J tales que f(I) J, siendo ambas cóncavas, con g monótona creciente; entonces la composición de ellas g f es también cóncava. En forma similar, demostrar que si f y g fueran convexas más bien, con g monótona creciente; entonces la composición de ellas g f sería también convexa. Dar ejemplos de funciones tales pero ahora con g ya no monótona creciente, de modo que la composición ya no resulte ser cóncava.

4.13 Se llama función cuasicóncava a una función f : J que posea la propiedad de que k de , el conjunto {x de J : f (x) k} sea un intervalo ó sea el vacío. Similarmente, se llama función cuasiconvexa a una función f : J que posea la propiedad de que k de , el conjunto {x de J : f (x) k} sea un intervalo ó sea el vacío. Demostrar que toda función cóncava es cuasicóncava y que toda función convexa es cuasiconvexa. Además, demostrar que si una función es monótona (creciente o decreciente) entonces es a la vez cuasicóncava y cuasiconvexa.

52

Page 53: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

5. Integración de funciones

La noción de integral de una función puede provenir de ésta de dos maneras aparentemente diferentes. Éstas son la noción de antiderivada ó integral indefinida y la noción de área comprendida entre la gráfica de la función y el eje de abscisas, designada como integral definida. Para lo primero tenemos la siguiente definición.

5.1 Integral indefinida

Definición 5.1: Una “antiderivada” de una función f es una función F tal que la derivada de ésta es aquélla, es decir, que F = f . También se la llama “integral indefinida” de f y se la representa por f ó también por la notación más tradicional f (x) dx. Es frecuente, además, encontrar textos en donde se la conoce por una “primitiva” de f .Téngase presente que en esto el símbolo dx no significa nada y puede hacerse de cuenta que daría igual escribir f (y) dy. Es que en los inicios del Cálculo Integral (siglo XVIII), se pensaba que había entidades matemáticas muy especiales, los infinitesimales ó infinitamente pequeños que se representaría por los diferenciales denotados por dx, dy, etc. Para mayores detalles, ver cualquier libro de historia de las matemáticas. En suma, que si hablamos de la función cúbica, x3, entonces podemos escribir x3dx = x4/4 - 8, x3dx = x4/4 + 16, etc. Al proceso de hallar integrales indefinidas de una función se le conoce como el proceso de integración de dicha función y se dice que hay que integrar esa función.

Ejemplos: 1) Todas las antiderivadas de la función cuadrática f (x) := 3x2 están dadas por la familia de funciones x3 + k donde k denota a cualquier constante de . En efecto, puesto que la derivada de la función x x3 es la función f y la derivada de cualquier función constante es la función nula, entonces, ya que la derivada de una suma de funciones es la suma de las derivadas de dichas funciones, se sigue que cualquiera que sea el valor de la constante k, las derivadas de las funciones x x3+ k, son todas iguales a la función x x2. Además, notemos que no puede haber otro tipo de funciones que cumplan esta condición, pues si tuviéramos que las funciones F y G fueran ambas antiderivadas de la función f, entonces debería ser verdad que (F - G) = F - G = f – f = 0; y sabemos bien que las únicas funciones que tienen como derivada a la función nula son las funciones constantes.

2) cos x dx = sen x + k, ya que la derivada de la función sen x es la función cos x. Pero es claro que también sen x dx = - cos x + k, puesto que cos x = - sen x.

3) Como ya se ha dicho antes, en vista de que la derivada de la función exponencial es ella misma, se tendrá que ex dx = ex + k.

4) También puede demostrarse que si se designa como ln x a la función llamada logaritmo natural ó logaritmo neperiano, y que representa el exponente al que hay que elevar el número e, base de los logaritmos naturales cuyo valor es aproximadamente 2.718282; entonces la derivada de esta función es dada por ln x = 1 / x, si x > 0. Por ello (1/x) dx = ln x + k.

Si tuviéramos que integrar una suma de funciones, sabríamos que el resultado sería la suma de las integrales de dichas funciones, pues ya sabemos que la derivada de una

53

Page 54: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

suma es la suma de las derivadas. Igualmente, si hubiera que integrar el producto de una función por un número real, el resultado sería el producto de ese número real por la integral de la función. En otras palabras, puesto que en cierto sentido el proceso de integración es inverso del proceso de derivación y éste es lineal, entonces también ha de ser lineal el proceso de integración. Así, por ejemplo, si hubiese que integrar una función polinómica, tendríamos que (a0 + a1x + a2 x2 + … + an xn) dx = a0 x + a1x2/2 + a2 x3/3 + … + an xn+1/(n + 1) + constante.

Para mayor información hay que consultar las tablas de integrales indefinidas que pueden encontrarse en muchos libros de Cálculo Integral.

5.2 Integral definida

Dada una función continua, f, definida en un intervalo [a, b], si ella no tomase valores negativos en ese intervalo, entonces el área de la región comprendida entre la gráfica de la función, el eje de abscisas y las rectas verticales que pasan por puntos de abscisas a y b sería dada por la expresión F(b) – F(a), siendo F una antiderivada de f. Por ejemplo, si se quisiera hallar el área del rectángulo formado por las rectas que pasan por puntos de abscisas 2 y 9 y por el eje de abscisas y la horizontal que pasa por puntos de ordenada 11, sabríamos de antemano que dicha área sería igual a (9 - 2) 11 = 77. Ahora bien, como la recta de ordenada 11 es la gráfica de la función constante f (x) = 11 y una antiderivada de esta función f es la función F (x) = 11 x, obtendríamos F(9) – F(2) = 99 – 22 = 77. Notemos de pasada que si en lugar de esa función f hubiéramos usado otra antiderivada de f como la función G (x) = 11 x – 287, el resultado habría sido el mismo, puesto que G(9) – G(2) = (-188) – (-265) = 77. Similarmente, si se quisiera encontrar el valor del área comprendida por el eje de abscisas, las verticales de abscisas 2 y 9 y la recta que pasa por los puntos (0, 2) y (10, 3), entonces, ya que la ecuación de esta última recta es y = x /10 + 2, y una de las antiderivadas de esta función es la función F (x) = x2/20 + 2x, por lo que el área deseada valdría F(9) – F(2) = (81/20 + 18) – (4/20 + 4) = 357/20. Por la geometría elemental del colegio se calcula que el área de ese trapecio ha de ser (((2/10 + 2) + (9/10 + 2))2) (9 - 2) = 357/20. Esto motiva la siguiente definición.

Definición 5.2: La integral definida de una función continua, f , definida en un intervalo [a, b] se define por := F (b) – F (a), donde F es cualquier antiderivada de f .

Otra notación para la integral definida de f en ese intervalo es , lo que parece ser lo más recomendable, porque cuando se dice integral definida de f entre a y b no se hace mención de ninguna variable en especial y, menos aun, de misteriosos diferenciales ó infinitesimales. Sin embargo, a veces puede ser útil apelar a la carga intuitiva detrás de estos diferenciales cuando se los interpreta como si fueran magnitudes pequeñísimas.

Ejemplo: Si f (x) := = [x2 - x] = (9-3) – (1 – (-1)) = 4.

Propiedades de la integral definida

54

Page 55: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

1) Si en una integral definida se invierten los límites de integración el nuevo valor difiere del antiguo sólo en signo: .

2) Si en una integral definida coinciden entre sí los límites de integración, el valor de la integral es nulo: = 0.

3) La integral definida de un múltiplo numérico de una función es ese múltiplo numérico de la integral definida de esa función: .

4) La integral definida es aditiva en los límites de integración, es decir, que el valor de la integral entre límites a y b es la suma de los valores de la integral entre a y c y de la integral entre c y b: .

Demostración: 1) Si F es una primitiva ó antiderivada de f, entonces el lado izquierdo de (1) vale F(b) – F(a), y el lado derecho vale – (F(a) – F(b)), por lo cual la igualdad (1) es inmediata. 2) La integral vale F(a) – F(a) = 0. 3) El lado izquierdo vale (F) (b) - (F) (a), puesto que (F)(x) = () F (x). Luego, por definición de múltiplos numéricos de funciones reales, el valor del lado izquierdo será F (b) - F(a) = (F(b) – F(a)) que es igual a . 4) El lado derecho vale (F(c) – F(a)) + (F(b) – F(c)) que es igual a (F(b) – F(a) =

.

Notas: 1) Como sabemos, a partir de la definición de integral indefinida, la expresión f (x) dx denota a una infinidad de funciones todas las cuales tienen por derivada a la función f ; por ende, la derivada de cualquiera de ellas ha de ser f , es decir, que

= f (x). Esto suele expresarse mediante el enunciado: la integración y la

derivación son transformaciones inversas entre sí.

2) Cuando en una integral definida se trata al límite superior como variable, entonces cabe ver a dicha integral como una función de ese límite superior. También podríamos preguntarnos si ella es diferenciable; la respuesta es afirmativa, puesto que = F(t) – F(a).

Entonces, = F (t) = f (t). Así, pues, la derivada de la integral definida

respecto al límite superior es igual al integrando evaluado en dicho límite superior. Similarmente, cuando en una integral definida se trata al límite inferior como variable, entonces cabe ver a dicha integral como una función de ese límite inferior. Por un

razonamiento casi idéntico al anterior, se concluye que = - F (t) = - f (t).

Así, pues, la derivada de la integral definida respecto al límite inferior es igual al negativo del integrando evaluado en dicho límite inferior. De modo un poco más general, podemos considerar el caso de una integral definida cuyos límites superior e inferior son, a su vez, funciones de una variable: .

55

Page 56: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

En tal caso lo que se obtiene respecto a la derivada de esta función de la variable t es lo

siguiente. = f (b (t)) b (t) - f (a (t)) a (t). La justificación es casi igual a

las anteriores. En efecto, puesto que el valor de la integral, para cualquier valor de t es F(b(t)) - F(a(t)), entonces si derivamos esta expresión respecto a t, usando la regla de la cadena, obtenemos el resultado deseado, teniendo en cuenta que F es una antiderivada de f. En cursos siguientes se verá que ésta es sólo un caso particular de la más general fórmula de Leibniz para el caso en que también el integrando puede depender de la variable t.

Hay un caso mucho más general consistente en que el integrando sea una función continua definida en cierto intervalo [a, b]. Aunque, en general, no hay un método que permita determinar antiderivadas de funciones continuas arbitrarias, que es lo que se requeriría para poder calcular el valor de la integral definida, se puede, sin embargo, hacer uso de un teorema muy importante que nos garantiza que dicha antiderivada existe.

Teorema 5.1: Si f es una función continua definida en el intervalo [a, b], entonces existe alguna función F diferenciable en dicho intervalo y tal que ella es una antiderivada de f en ese intervalo (en verdad existen infinitas funciones tales, siendo la diferencia entre dos cualesquiera de ellas una función constante). Entonces, = F(b) – F(a), sin importar cuál sea la antiderivada de f que se tome en el papel de F.

Ejemplos: 1) En vista de que = n xn-1, si n es un entro positivo ó un entero

negativo, podemos concluir que = [ ] = , siempre que m sea

diferente de -1.

2) Si se quisiera calcular el valor de la integral , habríamos de tener en

cuenta que como una antiderivada del primer término del integrando es la función y

una antiderivada del segundo término es , entonces una antiderivada del integrando

es la función - = + . Así, pues, el valor buscado de la integral ha de ser

= = .

3) Dados los números y tales que 0, se quiere calcular la integral definida . Como sabemos, la derivada de la función exponencial es ella misma, es

decir, que exp (x) = exp (x). Así. = = . Luego, una

56

Page 57: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

primitiva del integrando será , de donde el valor de la integral definida es [ ]

= (e - 1).

Ejercicios: 5.1 Calcular las integrales siguientes: a) b)

.

5.2 Calcular las siguientes derivadas:

a) b)

5.3 Hallar el área comprendida entre la parábola de ecuación y = 2 – x2 y el eje de abscisas.

5.4 Calcular el valor de la derivada en t = 2 de la función f (t) := .

5.5 Hallar el valor del área comprendida entre las curvas de ecuaciones y =1 – x2 y y = x2.

5.6 Hallar el área comprendida entre las curvas de ecuaciones x = 1 – y2 y x = y2.

5.3 Algunos métodos de integración

Además de los casos en que se ve de inmediato cuáles son las antiderivadas de una función dada como integrando, hay muchos otros casos en que esto ya no es así y se hace necesario conocer algunos métodos que conduzcan a hallar lo que ya no es tan fácilmente visibles. Aquí veremos dos de ellos que son los de uso más frecuente, a saber, el llamado método de integración por partes y el método de sustitución.

Método de integración “por partes” : Cuando el integrando es el producto de funciones cuyas antiderivadas son conocidas la integral indefinida aún puede ser difícil de encontrar, ya que la derivada de un producto de funciones no es el producto de las derivadas de ellas. Sin embargo, de la conocida fórmula de la integral de un producto podremos obtener interesantes ideas para poder alcanzar la antiderivada del producto de funciones que forman el integrando. Así, de (f (x) g(x)) = f (x) g(x) + f (x) g(x) se obtiene que (f (x) g(x))dx = f (x) g(x) dx + f (x) g(x) dx y de aquí, ya que u (x) dx = u(x), se sigue que f (x) g(x) dx = f (x) g(x) - f (x) g(x) dx. Ésta es la llamada fórmula de la integración por partes para la integral indefinida. Si se hubiera tratado de una integral definida en el intervalo [a, b], se habría obtenido la fórmula de la integración por partes para la integral definida que es:

. Si bien estas fórmulas no siempre nos permitirán hallar la integral indefinida de f(x) g (x), sí que lo harán en muchos casos como ilustran los siguientes ejemplos.

57

Page 58: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Ejemplos: 1) Se quiere calcular x exdx. Como sabemos ya que = ex, entonces

podemos asignar a la función ex el papel de g(x) y a la función x el papel de f (x) en la fórmula de integración por partes. Así obtendremos que

x exdx = x ex – (1) exdx , pues 1 = .

Finalmente, la integral indefinida del lado derecho es fácil de hallar; ella es ex. En suma, la integral indefinida buscada es x ex dx = x ex – ex + constante. Fácilmente podemos comprobar la corrección de esta expresión, pues (x ex – ex + cte.) = x ex.

Notemos, de pasada, que si hubiéramos elegido los papeles de las funciones de otro modo, ya no habríamos podido hallar tan fácilmente este resultado. En efecto, si hubiéramos escogido la función ex como la función f (x) y la función x como la función g (x), entonces habría resultado x ex dx = (x2/2) ex - (x2/2) ex dx , ya que (x2/2) = x. Ahora bien, aunque esta expresión es correcta, no nos permite encontrar tan fácilmente la integral indefinida. Así que en la aplicación de este método de integración hemos de requerir alguna maña que sólo la práctica nos ha de dar.

2) Se quiere hallar . Escoger la función ln x para el papel de g (x) no es lo

más indicado, pues no es muy fácil encontrar una antiderivada de ella. Más bien, escojámosla para el papel de f (x). Entonces 1/x será g (x), de donde g (x) = ln x, con lo cual la fórmula de integración por partes para integrales definidas nos dará:

, pues como ya se ha indicado antes .

Entonces se sigue que = = .

Método de integración “por sustitución”: Cuando el integrando tiene la forma de f (g (x)) g (x) es posible aplicar este método. Para ello, y de manera puramente formal, digamos que la “diferencial” de una función f (x) ha de entenderse como el producto de su derivada f (x) por dx, esto es, f (x) dx. No hemos de prestar mucha atención a esta misteriosa variable: dx. Más adelante veremos que no hay necesidad de ella para justificar el método. Entonces, si la integral dada fuera f (g (x)) g (x) dx, introduciríamos el cambio de variable u := g (x), con lo que resultaría du = g (x) dx y la integral se transformaría en esta otra f (u) du y quizá ésta ya resultaría más fácil. Si así fuese, entonces desharíamos luego el cambio de variable retornando a la original x. Si F fuera una antiderivada de f, entonces habríamos obtenido F (u) como f (u) du y, finalmente, F (g(x)) + cte. como resultado final. La corrección del método se desprende

de que, por la regla de la cadena, se tiene que (F (g(x)) + cte.) = F (g(x)) g(x) + 0.

Ejemplos: 1) Para calcular 3(x3- 2)100 x2dx se podría desarrollar la centésima potencia del binomio x3- 2 pero eso sería sumamente tedioso y laborioso. En cambio, de manera mucho más económica podríamos hacer el cambio de variable u := x3- 2, con lo que, como du = 3 x2 dx, tendríamos que la integral original se habría transformado en esta:

u100 du que es fácilmente calculable como + C.

58

Page 59: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Finalmente, regresando a la variable original se obtiene como antiderivada general la

expresión + C. La corrección de este cálculo se sigue de derivar esta última

expresión para obtener el integrando de la integral original.

2) Se quiere calcular el valor de . Podemos notar que = ex, por lo

que el método por sustitución podría dar buen resultado. Veamos. Haciendo el cambio

de variable u := 1 + ex, con lo que du = ex dx, la integral dada se transforma en

= ya que cuando x = 0, u = 2 y cuando x = 2, u = 1 + e2. Entonces, el

resultado final es ((1 + e2 )2/3 – (2)2/3).

Ejercicios: 5.7 Mediante el método de integración por partes hallar las integrales indefinidas siguientes:

(a) (b) (2 x -1) e3x dx (c)

5.8 Mediante el método de integración por partes hallar las integrales definidas siguientes:

(a) (b) (c)

5.9 Mediante el método de integración por partes demostrar que f (x) dx = x f (x) - x f (x) dx. Sugerencia: tener presente que f (x) = 1 f (x).

5.10 Sean U y C funciones diferenciables tales que el dominio de esta última es el intervalo [0, T] y el dominio de la primera contiene como subconjunto al codominio, C([0, T]), de la segunda. Demostrar, entonces, que si 0 = U(C(0)), entonces

.

5.11 Mediante el método de integración por sustitución hallar las integrales indefinidas siguientes:

(a) (x3 - 2)9 x2dx (b) x (1 + x) dx (c)

5.12 Mediante el método de integración por sustitución hallar las integrales definidas siguientes:

(a) (b) (c)

59

Page 60: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

6. Álgebra Lineal

Este tema surge naturalmente en el contexto de los sistemas de ecuaciones lineales, es decir, polinómicas de primer grado. Surgen así los conceptos de vector, espacio vectorial, matriz, transformación lineal , determinantes, valores propios, etc. El ejemplo más inmediato en el estudio de las matemáticas básicas es el espacio n , que es el producto cartesiano de consigo mismo n veces, y, a veces también, el espacio n, que es el producto cartesiano del conjunto de los números complejos consigo mismo n veces. Ambos espacios son sólo casos particulares del concepto más general de espacio vectorial que es el que hemos de presentar en primer lugar.

6.1 Vectores del espacio n

El espacio n es el producto cartesiano de la recta real consigo misma n veces. Entonces, sus elementos, llamados en adelante vectores ó puntos, son n-tuples de números reales: (x1 , …, xn) que, para abreviar, podrán designarse por la misma letra sin subíndice: x. Se llamarán componentes del vector a los números x1…xn. Se dirá que se trata de un vector n-dimensional cuando él tenga n componentes. También diremos que en ese caso el vector tiene dimensión n. A veces será conveniente representar un vector como una fila: [x1 … xn] y se los llamará vectores fila; otras veces, se los representará

como columnas y se los llamará vectores columna: . Normalmente aquí hablaremos

simplemente de vectores y los representaremos como n-tuples (x1 , …, xn).

Operaciones con vectores:

1) Se dirá que dos vectores son iguales cuando ambos tengan la misma dimensión y los componentes de uno coincidan con los respectivos componentes del otro.

2) Se define la suma vectorial como la operación que a partir de dos vectores de igual dimensión obtiene otro vector de esa misma dimensión siendo los componentes del nuevo vector la suma de los correspondientes componentes de los vectores dados: (a1 , …, an) + (b1 , …, bn) := (a1 + b1 , …, an + bn). Se comprueba inmediatamente que esta operación de suma vectorial goza de las siguientes propiedades: a) Es conmutativa, esto es, que (a1 , …, an) + (b1 , …, bn) = (b1 , …, bn) + (a1 , …, an), ó, en notación abreviada (sin subíndices) a + b = b + a, a y b de n.b) Es asociativa, esto es, que (a + b) + c = a + (b + c), a, b, c de n.c) Posee un elemento neutro, es decir, hay un vector que sumado a cualquier otro deja a éste inalterado. En efecto, el llamado vector nulo, a saber, (0, … , 0) denotado simplemente por 0, tiene esa característica: (a1 , …, an) + (0, … , 0) = (a1 , …, an), ó, dicho en forma abreviada, a + 0 = a, a de n.d) Para cada vector de n hay un vector que sumado a aquél da como resultado el vector nulo: a de n, b de n, a + b = 0. En efecto, si, dado el vector a, definimos el vector b := (-a1, … , -an), entonces es obvio que la suma de ellos dará el vector nulo. Es usual

60

Page 61: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

representar el vector (-a1, … , -an) por –a. En tal caso la suma a + (-a) se representa simplemente por a – a y se habla de la diferencia de los vectores a y b.

3) Se define la multiplicación de vectores por números reales (en adelante llamados escalares por respeto a la jerga tradicional del Álgebra Lineal) como una función definida en el producto escalar n y que toma valores en n del siguiente modo: al par ordenado (, x) de n le hace corresponder el vector ( x1 , …, xn). Esto se indicará de modo abreviado simplemente como (, x) x. Se comprueba inmediatamente que esta operación goza de las siguientes propiedades: 1) Es distributiva en escalares, es decir, que , de , x de n , (+) x = x + x.2) Es distributiva en vectores, es decir, que de , x, y de n, (x + y ) = x + y.3) Es asociativa en escalares, es decir, que , de , x de n, ( x) = () x.4) Tiene al escalar 1 como elemento neutro, es decir, que x de n, 1 x = x.

Al conjunto n, provisto de estas dos operaciones así definidas, se le conoce como el espacio vectorial n.

Definición 6.1: Si se tienen m vectores de n, entonces una “combinación lineal” de ellos es cualquier suma de múltiplos escalares de dichos vectores; es decir, que si x1, …, xm son vectores de n, entonces con cualesquiera escalares 1 , …, m se obtiene la combinación lineal 1 x1 + … + m xm. Nótese que no hay ninguna relación entre los números naturales n y m.

Ejemplo: El problema de resolver un sistema de ecuaciones lineales puede plantearse como el de hallar una combinación lineal de vectores dados que dé como resultado otro vector también dado. Por ejemplo, consideremos el problema de resolver el sistema de dos ecuaciones en tres incógnitas siguiente.

2 x – 3 y + z = 6- x + 5 z = 1

Podemos definir los vectores a := (2, -1), b := (-1, 0), c := (1, 5) y d := (6, 1). Entonces el problema consiste en encontrar una combinación lineal de los tres vectores a, b y c que dé como resultado el vector d. En efecto, hay que hallar los escalares x, y y z tales

que .

Definición 6.2: Si una combinación lineal de un conjunto de vectores da como resultado el vector nulo, se dice que dicha combinación es la “combinación lineal nula” de esos vectores. Si en una combinación lineal de un conjunto de vectores todos los coeficientes escalares de ella son nulos, se dice que dicha combinación es la “combinación lineal trivial” de esos vectores.

Es claro que una combinación lineal trivial tiene que ser nula, aunque lo recíproco no es cierto como lo muestra la combinación lineal de los vectores a := (2, -1), b := (-1, 0) y c := (1, 5) que se obtiene con los coeficientes escalares 5, 11 y 1, pues es claro que 5a + 11 b + 1 z = 0 (recordar que también el vector nulo se representará como 0, siendo el contexto el que permitirá saber si el símbolo 0 denota al número cero ó al vector nulo del espacio que se esté considerando). Así, pues, esta combinación lineal de a, b y c es nula pero no es trivial.

61

Page 62: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Cuando se trabaje en 2, es posible interpretar los vectores como puntos de 2 cuyas coordenadas serán los componentes del vector, ó, también, como flechas que parten del origen y llegan al punto de coordenadas iguales a los componentes del vector. Si, en cambio, se trabaja en 3, todavía es posible una interpretación geométrica similar. Pero en n, con n > 3, dicha interpretación ya no es posible pues normalmente el cerebro humano no puede imaginar gráficamente ni la cuarta dimensión ni otras que pudiera haber. Felizmente, dicha interpretación no es necesaria para poder comprender cabalmente las matemáticas del álgebra lineal.

6.2 Producto escalar y norma de vectores

En el espacio vectorial n se define aún una tercera operación, frecuentemente designada como producto escalar ó, también, producto interno. Es ésta una operación binaria externa, lo que significa que, a diferencia de la suma vectorial que es una operación binaria interna, a cada pareja de vectores se le hace corresponder algo que no es un vector sino un escalar. De pasada, notemos también que la segunda operación del espacio vectorial, la multiplicación de vectores por escalares, es igualmente una operación binaria externa, ya que a parejas mixtas conformadas por escalar y vector asigna un escalar.

Definición 6.3: El “producto escalar de dos vectores”, a = (a1 ,…, an) y b = (b1,…,bn), se define como a1 b1 + … + an bn lo que se denota por a b = .Ejemplo: En 3, si a = (2, 0, -1) y b = (1/2, 3, 5), entonces a b = -4. Si, además, c = (1/2, 3, 1), entonces a b = 0.

Propiedades del producto escalar de vectores

1) Es conmutativo, esto es, que a, b de n, a b = b a .2) Es distributivo respecto a la suma vectorial, esto es, que a, b y c de n, a (b + c) = a b + a c.3) Es asociativo en escalares, esto es, que de, a, b de n, ( a) b = a ( b) = (a b).4) Es positivo-definido, esto es, que a de n, a a 0 (a a = 0 a = 0).

Las demostraciones de estas cuatro propiedades son muy simples y quedan a cargo del estudiante.

El producto escalar de vectores permite definir la longitud ó como se dice más formalmente, la norma de un vector.

Definición 6.4: Para cada vector, a, de n, se define la “norma” de a mediante a := (a a)1/2 = ( (a1)2 + … + (an)2 )1/2. Aquí ha de tomarse la raíz positiva ó nula.

Con la interpretación antes sugerida para los espacios 2 y 3, puede verse, recordando el teorema de Pitágoras, que la norma del vector nos da la longitud de la flecha, si es que es ésta la interpretación adoptada, ó que es la distancia entre el origen y el punto representativo del vector, si es en cambio esta otra la interpretación adoptada.

62

Page 63: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Ejemplo: En 4, la norma del vector (-2, 0, 2/3, 1) es (-2)2 + 02 + (2/3)2 + 12 = 5 .

Con ayuda del concepto de norma de un vector es posible, ahora, definir la distancia entre dos vectores del siguiente modo.

De la definición de norma de un vector se deducen inmediatamente algunas propiedades: 1) Todo vector de n tiene norma innegativa, esto es, a de n, 0 a.2) Únicamente el vector nulo tiene norma nula: a de n, 0 = a 0 = a.3) La norma de un múltiplo escalar de un vector es igual al producto de la norma de este vector por el valor absoluto del escalar: a de n, a = a.4) La norma de una suma de dos vectores no es mayor que la suma de las respectivas normas de dichos vectores, esto es, a, b de n, a + ba + b. Esta desigualdad general es conocida como la desigualdad triangular. Las demostraciones de las tres primeras propiedades no requieren de nada más que de las definiciones. La de la desigualdad triangular sí es más difícil y requiere de la llamada desigualdad de Cauchy-Schwarz que será presentada y demostrada un poco más adelante.

Definición 6.5: La “distancia” entre dos vectores cualesquiera, a y b, es dada por la norma del vector diferencia, a – b, es decir, d(a, b) := a - b.

Ejemplo: Dados los vectores de 3 a = (2, -1, 7) y b = (4, 0, 5) , entonces la distancia entre ellos es d (a, b) = ((2 - 4)2 + (-1 - 0)2 + (7 - 5)2)1/2 = 3.

El producto escalar de vectores nos permite poder hablar con precisión acerca de la perpendicularidad, ó, como se la llama en lenguaje técnico, la ortogonalidad de vectores en espacios en donde nuestra imaginación se queda ciega por tratarse de dimensión mayor que tres.

Definición 6.6: Se dice que dos vectores de n, a y b, son “ortogonales entre sí” si su producto escalar es nulo. A veces esto se indica por la notación a b.

Definición 6.7: Dados los vectores a y b de n, si b 0, entonces la “proyección de a sobre b” es prb (a) := (a 1b) 1b donde 1b , el vector unitario (esto es, de norma igual a

1) según b, se define como ( ). Así, prb (a) = (a b / b2) b.

Ejemplo: Los vectores a = (2, -1, 7) y b = (4, 0, 5) de 3 no son ortogonales entre sí, pues su producto escalar vale 43. En cambio, los vectores (a - b) y c, definido como (1/2, -1, 0) sí son ortogonales entre sí pues su producto escalar vale (-2, -1, 2) (1/2, -1, 0) = 0. Además, como b 0, el vector unitario según b es 1b = (1/41) (4, 0, 5). Entonces la proyección de a sobre b es (43/41) (4, 0, 5).

Hay una muy importante propiedad del producto escalar de vectores conocida como desigualdad de Cauchy-Schwarz que nos asegura que la magnitud, o valor absoluto, del producto de dos vectores de n en ningún caso puede ser mayor que el producto de las normas de dichos vectores, como se demuestra en el siguiente teorema.

63

Page 64: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Teorema 6.1 (desigualdad de Cauchy-Schwarz) Cualesquiera sean los vectores a y b de n, a b ab.

Demostración: Si alguno de los vectores a ó b es el vector nulo, entonces la desigualdad se verifica trivialmente, pues ella se reduce a 0 0. Por lo tanto nos queda por considerar sólo el caso en que ninguno de esos vectores es el vector nulo. Como sabemos a partir de la definición de producto escalar, ningún vector tiene norma negativa; en particular, el vector que se obtiene al restar al vector a su proyección sobre el vector b: a – prb (a) = a – (a (1/b) b) (1/b) b. Es decir, que 0 (a – prb (a))( a – prb (a)) = a a – 2 a prb (a) + prb (a) prb (a). Pero a prb (a) = (a b)2 / b2 y prb (a) prb (a) = (a b / b2) b (a b / b2) b = (a b)2 / b2, así que reemplazando den la última desigualdad se obtiene que 0 a a - (a b)2 / b2, de donde se sigue que (a b)2 a2 b2. Ahora basta con tomar raíces cuadradas a ambos lados para obtener (a b) ab. Definición 6.8: En n se define el ángulo formado por dos vectores no nulos cualesquiera, a y b, mediante (a, b) [0, ] tal que cos = (a b) (ab).

Así como en el espacio tridimensional hay rectas y planos, también en n hay cosas similares, llamadas rectas e hiperplanos. La característica esencial de una recta es que desde un punto de ella se sigue una dirección dada para generarla y la característica esencial de un plano de 3 es que divide al espacio en dos regiones incomunicadas, es decir, que desde un punto de una de esas dos regiones no es posible desplazarse de modo continuo hasta llegar a un punto de la otra región sin pasar por algún punto del plano. Esto mismo es lo que caracterizará a los hiperplanos de n.

Definición 6.9: La “recta por el punto a de dirección el vector no nulo p” se define como {x de n : , x = a + p}.

Definición 6.10: El “hiperplano por el punto a y ortogonal al vector no nulo p” se define como {x de n : p (x - a) = 0}. Al vector no nulo p se lo llama el vector normal del hiperplano. Nótese que todo múltiplo no nulo del vector p es también un vector normal del hiperplano, pues \{0}, p(x - a) = 0 p(x - a) = 0.

Ejemplo: En 4, el hiperplano que pasa por (-2, 1, 0, 7) y es ortogonal al vector (1, 0, 2, 0) es el {x de 4 : (1, 0, 2, 0) (x1 + 2, x2 – 1, x3 , x4 - 7 )} = {x de 4 : x1 + 2 x3 = -2}. En este espacio, la recta por (-2, 1, 0, 7) y vector dirección (1, 1, -1, 0) es el {x de 4 : , x = (-2, 1, 0, 7) + (1, 1, -1, 0)} = {x de 4 : , x = (-2 + , 1 + , -, 7)}. Obsérvese que los puntos de esta recta se generan dando al parámetro todos los valores posibles en .

Nota: De la definición de hiperplano en n se desprende que él ha de estar determinado por cierta ecuación de la forma p1 x1 + … + pn xn = , siendo un escalar obtenido como el producto escalar del vector normal por un punto cualquiera del hiperplano: = p a. Así, pues, para abreviar hemos de convenir en representar por H (p, ) al hiperplano de vector normal p y de escalar . Es inmediato, entonces, que H (p, ) = H (h p, h ), h de \{0} . También conviene introducir una notación para designar a la recta por a con dirección p : L (a, p).

64

Page 65: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Ejercicios: 6.1 Demostrar que no existe ninguna combinación lineal de los vectores (1, 3, -2), (2, 0, 1) y (1, -3, 3) que dé por resultado el vector (1, 2, 3).

6.2 Hallar todas las combinaciones lineales de los vectores (1, 3, -2), (2, 0, 1) y (1, 2, 3) que den por resultado el vector (-2, 6, -6).

6.3 ¿Hay soluciones para la ecuación 0 = (x, x + 1, 3)(x, x, 2 x)?

6.4 Hallar el punto de intersección en 4 del hiperplano H(p, 2) con la recta L(a, p) si p = (2, -1, 3, 0) y a = (4, 3, 2, 1).

6.5 Hallar la recta que pasa por los puntos (4, -3, 2, 1) y (0, 2, 1, -3).

6.6 Hallar la ecuación del hiperplano de 4 que pasa por los puntos (1, 2, 3, 4), (0, 1, 0, -1), (4, -3, 2, 1) y (0, 2, 1, -3).

6.3 Matrices y operaciones con ellas

Así como un vector de n se definió como un n-tuple de números reales, una matriz m n ha de definirse como un “arreglo” de m filas y n columnas de números reales. Luego se definirán algunas operaciones binarias entre ellas.

Definición 6.11: Una “matriz m n” es un arreglo en m filas y n columnas de números

reales. Se las denotará por . En forma abreviada se pondrá (aij)mn

Operaciones con matrices 1) Dos matrices mn, A = (aij) y B = (bij), son iguales si i,j, aij = bij .2) Adición de matrices: La suma de dos matrices mn, A = (aij) y B = (bij), se define como la matriz mn, A +B := (aij + bij).3) Multiplicación de matrices por escalares. Dados: una matriz mn, A = (aij) y un escalar , se define la matriz mn, A := (aij).

Propiedades de las operaciones de adición matricial y de multiplicación por escalares1) La adición matricial es asociativa: (A + B) + C = A + (B + C), A,B,C matrices m n.2) La adición matricial es conmutativa: A + B = B + A, A,B matrices m n.3) Hay un elemento neutro: la matriz nula m n : A + O = A, matriz m n, A.4) Cada matriz m n tiene una inversa aditiva: matriz m n, A,matriz m n, A, tal que A + A = O. A esta matriz A se la llama inversa aditiva de la matriz A. 5) La multiplicación de matrices por escalares es distributiva respecto a la suma escalar: , de , matriz mn A, ( + )A = A + A.6) La multiplicación de matrices por escalares es distributiva respecto a la suma matricial: de , matrices mn A y B, (A+B) = A + B.

65

Page 66: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Las demostraciones de estas seis propiedades se desprenden fácilmente de las definiciones de adición matricial y de multiplicación de matrices por escalares, y quedan, por lo tanto, a cargo del estudiante.

Ejemplos: Calcular las matrices 23 A +B, A – 2B y 3A – 5B, dado que

A = y B = . Resulta que A +B = ,

A – 2B = y 3A – 5B = .

Multiplicación matricial Como justificación intuitiva de la aparentemente extraña definición de multiplicación matricial consideremos los dos siguientes sistemas de ecuaciones lineales:

y . Si en el primero reemplazamos los

valores de las variables yi por sus valores en términos de las variables xj dados por el segundo sistema, obtendremos el nuevo sistema que relaciona las variables zi con la

variables xj : . Notemos también que los coeficientes del primer sistema

hacen la matriz 23: y que los del segundo sistema hacen la matriz 32:

. En el sistema final los coeficientes hacen la matriz 22: . Como

hemos de ver enseguida, esta matriz es el producto de las dos anteriores tomadas en el orden dado.

Definición 6.12: Dadas dos matrices, A y B, tales que el número de columnas de A coincida con el número de filas de B, se define el producto de ellas, la matriz AB, como aquella que posee tantas filas como A y tantas columnas como B, siendo su elemento de fila i y de columna j definido como el producto escalar de los vectores correspondientes a la fila i de A y a la columna j de B. Así, si A es mh y B es hn, entonces AB es mn, y su elemento de fila i y de columna j, (AB)ij := ( )( ) = ai1b1j +…+ aihbhj.

Ejemplo: 1) Las matrices del último ejemplo, y tienen por

matriz producto a . Notemos que es posible multiplicarlas pues la primera tiene

3 columnas y la segunda tiene 3 filas. Luego, por ejemplo, el elemento de segunda fila y primera columna de la matriz producto, el 1, es el resultado de hacer el producto escalar de los vectores (-1. 1, 0) y (-1, 0, 1). Notemos también que no habría sido posible

66

Page 67: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

multiplicar las matrices y , pues no coinciden los números de

columnas de la primera (2) y de filas de la segunda (3).

Finalmente, notemos que los sistemas de ecuaciones del ejemplo anterior podrían haberse escrito matricialmente, si los vectores x, y y z se interpretaran respectivamente como matrices 21, 31 y 21, como: z = Ay, el primero, y y = Bx el segundo. Ahora, si formalmente reemplazáramos en segundo en el primero obtendríamos z = ABx, encontrando con sorpresa que en el papel de la matriz de coeficientes del sistema final aparece la matriz producto AB.

2) Mediante estas operaciones es posible representar un sistema de ecuaciones como un problema en términos de matrices. Sea el sistema lineal

a11 x1 + … + a1n xn = b1 … an1 x1 + … + ann xn = bn.

Este sistema puede representarse como = . Ahora de lo que se

trata es de hallar el vector columna x que satisfaga la ecuación dados la matriz A y el vector columna b.

Propiedades de la multiplicación matricial

1) Es asociativa: (AB) C = A (BC) siempre que las multiplicaciones involucradas puedan realizarse de acuerdo con la definición.

2) Es diestro-distributiva, es decir, que A (B + C) = AB + AC.

3) Es siniestro-distributiva, es decir, que (A + B) C = AB + AC.

Las demostraciones de estas propiedades son simples, salvo la de la primera, que es un poco más laboriosa pero no conceptualmente difícil.

Nota: Es muy importante advertir que la conmutatividad no es una propiedad de la multiplicación matricial, pues aunque exista el producto AB, es posible que no exista el producto BA; pensemos simplemente en el caso en que A se una matriz 25 y B sea una 53. En tal caso la multiplicación BA no puede realizarse pues B tiene 3 columnas y A tiene 2 filas. Incluso en el caso de que tanto A como B fueran matrices cuadradas (igual número de filas que de columnas), bien puede ocurrir que AB sea diferente de BA. Por

ejemplo, si A = y B = , ocurre que AB = mientras que BA

= AB.

Potencias de matrices cuadradas

67

Page 68: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Si se tiene una matriz cuadrada, entonces ella podrá multiplicarse consigo misma y el resultado será una matriz que también podrá multiplicarse con la original; la matriz que se obtenga de esta nueva multiplicación también podrá multiplicarse con la original y esto puede continuar indefinidamente. De esta manera van obteniéndose las diversas potencias de la matriz original.

Definición 6.13: Dada una matriz nn, A, se define su segunda potencia, también llamada su cuadrado, como A2 := AA; se define su tercera potencia también llamada su cubo, como A3 := A2A. De manera más general e inductiva, diremos que si ya se ha obtenido su n-ésima potencia, An, entonces se define su (n +1)-ésima potencia como An+1:= AnA. Por un afán de compleción, se define también su primera potencia como A1:= A.

Ejemplo: Sea A = . Entonces A2 = y A3 = . Podemos

conjeturar que k , Ak = . Para demostrarlo ha de usarse el método de

inducción matemática que consiste en comprobar la validez de la fórmula en cuestión para el valor inicial k = 1; luego, asumiendo que ella vale para un valor indeterminado, k, demostrar que también vale para el siguiente valor, k +1. En efecto, si k = 1, se tiene

que A1 = por definición de primera potencia. A continuación ha de

demostrarse que si la fórmula vale para k, entonces valdrá para k +1. Asumamos, pues

que Ak = , y deduzcamos de allí, que Ak+1 = . En efecto, Ak+1 =

AkA = = .

Recordando que en álgebra elemental se define la potencia cero de un número no nulo como igual a 1, se define también en álgebra lineal la potencia cero de una matriz A como igual a la matriz identidad , que es por definición la matriz que tiene la propiedad de que (aij = 0 si i j pero aii = 1), ij . Suele representársela por I. En el caso de ser

33, ella sería I = . Así, por definición la potencia cero de A es I, esto es, A0

= I.

Operación de transposición matricial

Definición 6.14: Dada una matriz mn, A, se llama “matriz transpuesta” de A, y se la denotará por A , a la matriz nm definida por aij := aji , i,j. Se dice que una matriz cuadrada es “simétrica” si es igual a su transpuesta, es decir, si A = A.

68

Page 69: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Ejemplo: Si A = , entonces A = . Una matriz simétrica es la

, pues su transpuesta es la misma matriz.

Propiedades de la transposición y de la matriz identidad

1) Si I es la matriz identidad nn, entonces cualquiera sea la matriz nh, B, se tendrá que I B = B, y cualquiera sea la matriz kn, C, se tendrá que C I= C.

2) La operación de transposición es idempotente, es decir que la transpuesta de la transpuesta de una matriz es esta misma matriz, es decir, (A) = A.

3) La transpuesta de una suma de matrices es la suma de las transpuestas de dichas matrices, esto es, (A + B) = A + B.

4) La transpuesta de un múltiplo escalar de una matriz es el mismo múltiplo escalar de la transpuesta, es decir, (A) = A .

5) La transpuesta de un producto es el producto de las transpuestas pero en orden inverso, es decir, que (AB) = BA.

Las demostraciones de estas propiedades se reducen todas sólo a aplicar las correspondientes definiciones, y, por ello, quedan a cargo del estudiante.

Ejercicios: 6.7 Encontrar todas las matrices B que conmutan con A = , es decir,

tales que AB = BA.

6.8 Dado que las matrices A y B son cuadradas nn, averiguar bajo qué condiciones puede garantizarse la igualdad (A + B) (A - B) = AA – BB.

6.9 Dada la matriz A = , hallar, si existen tales, un vector de norma

igual a 1, v, tal que A v = v.

6.10 ¿Para qué valores de x es simétrica la matriz ?

6.11 Se dice que una matriz nn, A, es ortogonal si A A = I, donde I es la matriz

identidad nn. ¿Es ortogonal la matriz para algunos valores de x?

69

Page 70: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

6.4 Determinantes e inversas de matrices cuadradas

Los determinantes aparecen de manera natural en el contexto de los sistemas de ecuaciones polinómicas de primer grado y tienen una interpretación geométrica natural. Veamos primero la manera en que aparecen en el contexto de sistemas de ecuaciones lineales. Consideremos el sistema siguiente:

.

Como es bien sabido la solución es dada por x1 = (b1a22 - b2a12)(a11a22 - a21a12) x2 = (b2a11 - b1a21)(a11a22 - a21a12).

Hemos de notar que los denominadores de estas dos últimas expresiones coinciden entre sí. Dicho denominador común será lo que ha de definirse como el determinante de la

matriz de coeficientes del sistema .

En cuanto a la interpretación geométrica: Si en el plano cartesiano representamos los vectores (a11, a12) y (a21 , a22), entonces se comprobará sin mayor dificultad que la expresión a11a22 - a21a12 que antes hemos encontrado en los denominadores de la solución del sistema ahora representa el área del paralelogramo determinado por el origen y dichos dos vectores. Así, pues, el determinante de la matriz formada con estos vectores nos daría un indicador del área determinada por los vectores, su suma y el vector nulo. Pasemos a la definición formal.

Definición 6.15: Se da una definición inductiva:

(1º) Si la matriz es 11, A = [a], entonces det (A):= a.

(2º) Si la matriz es 22, A = , entonces det (A):= a11a22 - a21a12.

(3º) Si la matriz es nn, A = , det (A):= a11 det (A-11) - a12 det (A-12) + …

(hay alternancia de suma y resta) a1n det (A-1n), en donde adoptaremos la notación que especifica que A-ij denota a la matriz que se obtiene al su`primir en la matriz original A su i-ésima fila y su j-ésima columna.

70

Page 71: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Ejemplo: 1) Si se quisiera calcular el determinante de la matriz , entonces

según la anterior definición éste sería dado por la suma siguiente: 2 det -

3 det + 6 det = 2 (5 - 12) -3 (-5 -0) +6 (-3 -0) = -17.

2) En el modelo macroeconómico simple: Y = C + A, C = a +b (Y-T), T = d + tY en el que Y designa el ingreso, C el consumo, T los impuestos y A es el gasto autónomo (exógeno constante) y hay parámetros positivos a, b, d y t. Hallar los valores de equilibrio de Y, C y T. El sistema puede escribirse como Y - C = A, -bY + C + bT = a, -tY + T = d. Este sistema en forma

matricial es: = . La solución podría encontrarse si se tuviera una

matriz tal que post-multiplicada por la matriz de coeficientes del sistema diera la matriz

identidad. Tal matriz, como es fácil comprobar, es (1 + bt - b)-1.

Luego, la solución buscada es = (1 + bt - b)-1 .

Propiedades de los determinantes

1) El determinante de una matriz nn, A, puede también calcularse desarrollando las sumas y restas desde cualquier fila ó desde cualquier columna como se indica a

continuación. Det (A) = = .

2) Si todos los elementos de una línea (fila ó columna) de la matriz son nulos, el determinante de ella es 0.

3) El determinante de la transpuesta de una matriz es igual al determinante de la matriz.

4) Si se intercambian de posición dos filas ó dos columnas, el determinante de la matriz resultante difiere sólo en signo del de la matriz original.

5) Si todos los elementos de una línea de la matriz se multiplican por un mismo número, el determinante de la matriz resultante es igual al de la original multiplicado por ese número.

6) Si en la matriz hay dos líneas paralelas que sean iguales entre sí, el determinante es nulo.

7) Si en la matriz hay dos líneas paralelas que sean proporcionales entre sí, el determinante es nulo.

71

Page 72: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

8) Si en una matriz a una línea se le suma un múltiplo de otra línea paralela, el determinante de la matriz resultante es igual al de la original.

9) El determinante del producto de matrices cuadradas es igual al producto de los determinantes de dichas matrices: det (AB) = det (A) det (B).

10) El determinante de un múltiplo escalar de una matriz nn es igual al determinante de la matriz original multiplicado por la n-ésima potencia del escalar por el cual se ha multiplicado la matriz: det (A) = ndet (A).

Las demostraciones de estas propiedades han de omitirse por exigir más tiempo del disponible en este curso y pueden encontrarse en libros propiamente de álgebra lineal y multilineal.

Inversa de una matriz

Definición 6.16: La inversa de una matriz cuadrada nn, A, es una matriz B tal que AB = BA = I, siendo I la matriz identidad nn. Si existe, la inversa de A, se la denota por A-

1.

Hemos de tener presente que no toda matriz cuadrada tiene inversa; por ejemplo, si A

= , entonces no hay ninguna matriz B que premultiplicando a la matriz A ó

postmultiplicándola dé la matriz identidad. En efecto, si hubiera tal, digamos B =

, entonces debiéramos tener: 2 a + c = 1 y 6 a + 3 c = 0, lo que es claramente

contradictorio. Similarmente, si AB = I , entonces debiera ser 2a + 6b = 1 y a + 3 b = 0, cosa que también es contradictoria.

Cabe, pues, preguntarse qué matrices poseen inversa. Es fácil hallar una condición necesaria para ello, a saber, que su determinante sea distinto de cero, pues el producto del determinante de la matriz original con el de su inversa ha de ser necesariamente igual a 1, cosa que sería imposible si la matriz original tuviese determinante nulo. Que el determinante de la matriz identidad valga 1 es cosa fácil de demostrar.

También cabe preguntarse si una matriz pudiera tener dos ó más inversas. La respuesta es que no, pues si X y Y fueran inversas de A, entonces tendríamos que X = X I = X (A Y) = (X A) Y = I Y = Y.

Propiedades de la inversa de una matriz

1) La inversa de la inversa de una matriz es esa misma matriz, es decir, que (A-1)-1 = A.

2) Si A y B son matrices nn invertibles, entonces AB es también invertible y (AB)-1 = B-1 A-1.

3) La inversa de la transpuesta de una matriz es la transpuesta de la inversa de esa matriz, esto es, que (A)-1 = (A-1).

72

Page 73: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

4) La inversa de un múltiplo escalar de una matriz es igual a la inversa de la matriz

multiplicada por el inverso de dicho escalar si éste no es cero, es decir, que (A)-1 = A-

1.

Demostración: 1) Hay que demostrar que A (A-1) = I, pero esto es inmediato a partir de la definición de inversa de una matriz.

2) Hay que demostrar que B-1 A-1 = (AB)-1. Pero esto equivale a (B-1A-1) AB = I. Ahora, el lado izquierdo de esta igualdad, que está por demostrarse, vale B-1(A-1 A)B = B-1I B = B-

1B = I.

3 Hay que demostrar que (A-1) A = I. Pero sabemos que la transpuesta del producto matricial es igual al producto de las transpuestas, por lo que el lado izquierdo de esta igualdad es igual a (A A-1) = I = I.

4) Hay que demostrar que ( A-1) (A) = I, pero ya que el producto matricial es

asociativo en escalares, el lado izquierdo de esta igualdad es igual a A-1ª = I.

Nota: Ahora está claro cómo puede determinarse si un sistema de ecuaciones tiene solución y cómo encontrarla. Si el sistema es Ax = b, entonces, caso de existir la inversa de A, bastaría con premultiplicar ambos miembros por dicha inversa para obtener la solución x = A-1b.

En lo tocante a la obtención de la inversa de una matriz cuadrada, hay que tener en cuenta, como la garantiza el siguiente teorema (cuya demostración se omitirá), que ésta existe si, y sólo si, no es nulo el determinante de la matriz.

Teorema 6.2: La inversa de una matriz existe si, y sólo si, no es nulo el determinante de ella. En tal caso, dicha inversa se obtiene por medio de la siguiente fórmula:

A-1 = adj (A), donde la matriz adj (A), llamada matriz adjunta de A, se define

mediante adj (A) := transpuesta(MA), donde ésta es la matriz cuyo elemento de fila i y columna j es (MA)ij := (-1)i+j det (A-ij).

Ejemplo: Sea A = . Que exista su inversa se sigue de que det (A) = -5. Para

encontrarla, calculemos primero su matriz MA.

Para esto, (MA)11 = (-1)1+1det = 10; (MA)12 = (-1)1+2det = -4;

(MA)13 = (-1)1+3det = -9, etc. Finalmente se encuentra que la adjunta de A es

y que A-1 = .

73

Page 74: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Ejercicios: 6.12 Dada la matriz A = , calcular la matriz A3-2 A2 + A - I.

¿Es verdad que A (A - I)2 = I ?

6.13 Si A = , ¿existe la inversa de A A ?

6.14 Demostrar que la matriz A A es simétrica, cualquiera que sea la matriz A.

6.15 Si son cuadradas las matrices A, P y D, demostrar mediante inducción finita que Am

= P DmP-1, m de .

6.16 Sabiendo que A es una matriz tal que A2 + A = I, ¿puede garantizarse que ella sea invertible?

6.17 Dado el sistema de ecuaciones , averiguar para qué valores del

parámetro existen soluciones no triviales del sistema.

6.5 Dependencia e independencia lineal de vectores

Definición 6.17: Se dice que un conjunto finito de vectores {a1, … , am} de n es “linealmente dependiente” si existe alguna combinación lineal de ellos que, siendo nula, no es trivial. En caso contrario, se dice que dicho conjunto es “linealmente independiente”. También suele aplicarse estas calificaciones a los vectores mismos, en lugar del conjunto de ellos.

Ejemplo: En 3, el conjunto {(1, 2, 0), (0, 2, 1), (2, 2, -1)} es linealmente dependiente, pues 2 (1, 2, 0) – (0, 2, 1) – (2, 2, -1) = (0, 0, 0), siendo ésta una combinación lineal nula pero no trivial de los vectores dados. En cambio, el conjunto {(1, 2, 0), (0, 2, 1), (2, 2, 1)} es linealmente independiente, pues si hubiera escalares, , , , tales que (1, 2, 0) + (0, 2, 1) + (2, 2, 1) = (0, 0, 0), entonces tendría que ser = 0 = 0 = 0, como fácilmente se ha de comprobar.

Ejercicios: 6.18 Demostrar que un conjunto finito de vectores {a1, … , am} de n es linealmente dependiente si, y sólo si, hay entre ellos al menos uno que sea combinación lineal de los otros,6.19 Demostrar que todo conjunto finito de vectores que posea al vector nulo es linealmente dependiente.6.20 Demostrar que si los vectores x, y, y z son linealmente independientes, entonces también lo son los vectores x + y, y + z y z + x, pero que no ocurre lo mismo con los vectores x + y, y - z y z + x .6.21 Demostrar que si un conjunto finito de vectores de n es linealmente dependiente, entonces todo superconjunto de él es también un conjunto linealmente dependiente y que si un conjunto finito de vectores de n es linealmente independiente, entonces todo subconjunto de él es también un conjunto linealmente independiente.

74

Page 75: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

6.22 Demostrar que una matriz 22, , tiene determinante nulo si, y sólo si, son

linealmente dependientes. 6.23 Sea A una matriz nn triangular inferior, es decir, que es cuadrada y que son nulos todos los elementos situados por encima de la diagonal principal: 0 = aij si i < j. Demostrar que su determinante es igual al producto de los elementos de la diagonal principal, esto es, a11 a22 … ann.

6.6 Rango y nulidad de matrices

Entre los diversos subconjuntos de n se encuentran algunos que poseen tres propiedades muy importantes como son la de poseer al origen ó vector nulo, la de ser cerrados respecto a la suma vectorial y respecto a la multiplicación por escalares. Dichos subconjuntos reciben el nombre de subespacios vectoriales.

Definición 6.18: Un “subespacio vectorial” de n es cualquiera de sus subconjuntos, U, tal que 0 U x, y de U, de , (x, y U x + y U x U).Ejemplo: Sea U := {x de 3 : 2 x1 – x2 + x3 = 0}. Entonces ha de comprobarse fácilmente que U es un subespacio vectorial de 3. En cambio, el subconjunto V := {x de 3 : 2 x1 – x2 + x3 = 8} no es un subespacio vectorial de 3, ya que, entre otras razones, el vector nulo no le pertenece.

Definición 6.19: Dado un conjunto finito, C, de vectores de n, se llama “subespacio generado” por C al conjunto de todas las combinaciones lineales de los vectores de C, y lo denotaremos por S [C].

Ejemplo: Si se define el conjunto C := {(1, 0, -2), (0, 1, 1)}, entonces, el subespacio generado por C es S [C] = { (1, 0, -2) + (0, 1, 1) : , }.

Ejercicio: Demostrar que el S [C] del último ejemplo es igual al subespacio U del penúltimo ejemplo.

Definición 6.20: Si U es un subespacio de n, entonces una “base” de U es cualquier subconjunto finito, C, de U que sea linealmente independiente y que genere a U, es decir, que S [C] = U.

Ejemplo: Una base del subespacio U del último ejemplo es el subconjunto C de dicho ejemplo. Otra base es el {(-1, 0, 2), (0, 1, 1)}, como ha de comprobar el estudiante. En general un mismo subespacio posee infinitas bases.

Hay un teorema muy importante del álgebra lineal, cuya demostración trasciende el marco de nuestro curso, que nos asegura la existencia de bases para ciertos subespacios vectoriales.

Teorema 6.3: Cualquiera sea el número natural n, todo subespacio vectorial de n que no sea trivial, es decir, que posea al menos un vector no nulo, posee bases.Notas: 1) Es que aunque {0} es obviamente un subespacio vectorial de n, no hay ninguna base de dicho subespacio, pues {0} es linealmente dependiente.

75

Page 76: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

2) En el otro extremo, el mismo n es un subespacio vectorial de n y, por ende, ha de tener bases. Por ejemplo {(1, 0, …, 0), …, (0, …, 0, 1)} es una base de n, llamada base canónica de n.

Teorema 6.4: Dada una matriz cualquiera mn , A, el {x n : A x = 0} es un subespacio vectorial de n; similarmente, el {y m : xn, y = A x} es un subespacio vectorial de m.Demostración: 1º) Si x y x pertenecen al {x n : A x = 0}, y , entonces x + y {x n : A x = 0}, ya que A (x + y) = Ax + Ay = 0 + 0 = 0.2º) Si y y y {y m : xn, y = A x}, entonces x n, xn, y = Ax y = Ax. Luego, y + y = Ax + Ax = A(x + x) de donde, x + x {x n : A x = 0}. Entonces, y + y = A (x + x) = 0, y así, y + y {y m : xn, y = A x}.

Definición 6.21: Al subespacio {y m : xn, y = A x} se lo llama la “imagen”de A, y al subespacio {x n : A x = 0} se lo llama el “núcleo” de A. A la dimensión del núcleo de A se la llama la “nulidad” de A, y se llama el “rango” de A a la dimensión del subespacio {y m : xn, y = A x}.

Nota: Puede demostrarse que el rango de una matriz A es igual el número máximo de vectores columnas linealmente independientes de la matriz A.

Ejemplo: Si A es la matriz , entonces el rango de A es 2, ya que las

columnas de A no son linealmente independientes, pues -2 (-1, 1) + (0, 1) – (2, -1) = (0, 0). Pero como (-1, 1) y (0, 1) sí son linealmente independientes, entonces el rango de A es 2. Así, la nulidad de A, que es la dimensión del núcleo de A, valdrá 1, ya que dicho núcleo es {x 3: -x1 + 2 x3 = 0 x1 + x2 – x3 = 0} = {(2h, -h, h) : h } cuya dimensión es 1 pues es generado por {(2, -1, 1)}.

Hay un teorema muy importante en álgebra lineal, cuya demostración no se verá en este curso, que dice que para una matriz mn, la suma del rango de la matriz y la nulidad de ella es igual a n.

Teorema 6.5: Si A es una matriz mn, entonces n = rango (A) + nulidad (A).

Definición 6.22: Un “menor” de orden k de la matriz A es el determinante de cualquier submatriz cuadrada que se obtenga con k filas y k columnas de la matriz.

Ejemplo: Para la matriz A = , los menores de orden 2 de A son -1, -2, y

los menores de orden 1 son -1, 0, 2 y 1.

Teorema 6.6: El rango de una matriz A es igual al orden máximo de un menor no nulo de A.

Ejemplo: Para la matriz del ejemplo anterior, ocurre que como hay menores no nulos de orden 2, y no puede haber menores de orden 3, el rango de la matriz es 2. Este teorema nos permite deducir que el rango de una matriz es igual al rango de su transpuesta.

Teorema 6.7: El rango de una matriz es igual al rango de su transpuesta.

76

Page 77: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Ejercicios: 6.24 Si se tiene una matriz 85, entonces sabiendo que su nulidad es 2, se pregunta si es posible que haya una base de su imagen con 4 elementos. Caso que no, entonces ¿cuántos elementos ha de tener cualquier base de la imagen de la matriz?6.25 Demostrar que el conjunto de soluciones del sistema lineal Ax = b, con A matriz mn, es convexo, es decir, que si x y x son soluciones del sistema, entonces cualquiera que sea el valor de en [0, 1], x + (1-) x es también solución del sistema.6.26 Demostrar que en cualquier matriz mn, si m > n, entonces el rango de la matriz será necesariamente menor que m; y demostrar que si m < n, entonces la nulidad de la matriz es al menos 1.6.27 Sea el sistema de ecuaciones A x = b. Si A es una matriz mn, con m > n, entonces el sistema tendrá soluciones si, y sólo si, el vector b es muy especial, esto es, que haya un vector, c, tal que c b = 0 cA = 0.

6.7 Autovalores y autovectores de matrices cuadradas

Definición 6.23: Sea A una matriz cuadrada; se dice que el escalar es un “autovalor” de A si hay algún vector no nulo, x, tal que A x = x. En tal caso se dirá que dicho vector x es un “autovector” de a asociado al autovalor .Nota: Si se interpreta la matriz A como una función lineal (suele decirse en el contexto del álgebra lineal: una transformación lineal ), entonces un autovector de esa matriz es uno que al ser transformado por ella resulta ser un vector múltiplo del original, y el autovalor correspondiente resulta ser el múltiplo del vector original que da la imagen. También se habla de “valores propios” y “vectores propios”

Ejemplo: Si A = , entonces los autovalores de A, así como sus autovectores

satisfarán la ecuación Ax = x, es decir, = . Esto equivale al sistema

. A su vez, esto equivale al . Es éste un sistema lineal

homogéneo, por lo que habrá soluciones no triviales sólo si no es nulo el determinante

de la matriz . Pero esto equivale a

que 0 = 2 -2 + 1, de donde = 1. Luego, hay sólo un autovalor de A, a saber 1. Los

correspondientes autovectores serán, para el autovalor 1, las soluciones de

= , es decir, el {x 2 : x2 = 0}. Fácilmente nos convenceremos de que este conjunto

es el eje de abscisas del plano cartesiano.

Teorema 6.8: Para una matriz cuadrada, A, sus autovalores son las soluciones de la ecuación, llamada característica de A, 0 = det (A - I). Los correspondientes autovectores de A resultan ser las soluciones de las ecuaciones (A - I) x = 0.

Demostración: Es inmediata a partir del ejemplo anterior.

77

Page 78: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

Diagonalización de matrices cuadradas

Definición 6.24: Se dice que una matriz cuadrda, A, es “diagonalizable” si hay alguna matriz invertible, P, tal que la matriz P-1AP resulte ser diagonal, esto es, que sean nulos todos sus elementos que estén fuera de la diagonal principal.

Ejemplo: Es diagonalizable la matriz , pues si definimos la matriz P por

, obtendremos que P-1AP = .

Cabe preguntarse qué matrices son diagonalizables y cómo se las puede diagonalizar. Las respuestas a estas interrogantes vienen dadas por el siguiente teorema.

Teorema 6.9: Una matriz nn, A, es diagonalizable si, y sólo si, hay algún conjunto formado por n autovectores propios linealmente independientes. En tal caso, una matriz P que diagonaliza a la matriz A, mediante P-1AP, es una cuyas columnas sean esos vectores propios linealmente independientes. La matriz diagonal que se obtenga será de

la forma , donde los 1, … n son los autovalores de la matriz A.

Finalmente, tenemos el llamado teorema espectral (cuya demostración se omitirá) para las matrices simétricas, aunque antes necesitamos uno previo. Teorema 6.10: Si A es una matriz simétrica, entonces su ecuación característica tiene todas sus raíces en , por lo que todos los autovalores de a son números reales, y si x y y son autovectores asociados a diferentes autovalores, entonces ellos son ortogonales, es decir, que x y = 0.

Demostración: La demostración de que todos los autovalores son números reales se omite por requerir de ciertos resultados del álgebra lineal que nos tomarían mucho más tiempo del disponible. La demostración de la ortogonalidad de los autovectores asociados a autovalores diferentes es como sigue. Si Ax = x Ay = y, entonces, denotando por x y por y a los transpuestos de x y y, obtenemos que yAx = y x xAy = x y. Puesto que A es simétrica, de la primera igualdad se obtiene transponiendo que xAy = x y. Luego, de la segunda igualdad anterior se obtiene que ( - ) x y = 0. como , se sigue que x y = 0, lo que equivale a que x y = 0.

Teorema 6.11 (espectral): Si A es una matriz simétrica nn, entonces existe una matriz

ortogonal P (es decir: P-1 = P ) tal que P-1AP = , siendo los 1, …, n los

autovalores de A y las columnas de P los autovectores asociados a dichos autovalores.

Ejemplo: Sea la matriz A = . Para ver si ella es diagonalizable hemos,

primero, de encontrar su autovalores. Luego, hemos de resolver su ecuación

78

Page 79: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

caracterísitica: 0 = 2 - 3 + 5/4. Las raíces características son ½ y 5/2. Ahora debemos hallar autovectores correspondientes a estos autovalores. Para el autovalor ½, hay que buscar un vector v tal que A v = (1/2) v. Esto equivale al sistema (A –(1/2) I) v = 0, el

vector nulo, es decir, = . A su vez, esto equivale a:

, que da, por ejemplo, v = (-1, 2) . Similarmente, para el autovalor

5/2, hay que buscar un vector v tal que A v = (5/2) v. Esto equivale al sistema (A –(5/2)

I) v = 0, es decir = . A su vez, esto equivale a:

, que da, por ejemplo, v =

(3, 2). Así, una matriz diagonalizadora, P¸puede ser la . Entonces P-1 = (1/8)

, con lo que se obtendrá P-1AP = (1/2) .

Ejercicios: 6.28 Verificar el teorema espectral para las matrices y .

6.29 Si P es una matriz cuadrada tal que los productos escalares de sus columnas dan 0 si es que son columnas diferentes, ¿es ella una matriz ortogonal? Caso que sí, ¿por qué? Caso que no, ¿cómo habría que modificarlas para que lo fuesen?

Referencias bibliográficas

Caballero, R. E., A. C. González y F. A. Triguero, Métodos matemáticos para la economía, McGraw-Hill, Madrid, 1992.Lima, E. L., Análisis Real, vol.1, Instituto de Matemática y Ciencias Afines, Lima, 2005.Simon, C. P. y L. Blume, Mathematics for economists, Norton, N. York, 1994.Sydsaetter, K. y P. J. Hammond, Matemáticas para el Análisis Ecnómico, Prentice Hall, Madrid, 1996.

79

Page 80: 1 · Web view... tal que 1/n ( a. 3). No hay ningún elemento del campo que sea mayor que todo número natural (Véase: Lima, Elon Lages “Análisis Real”, vol. 1). Sin embargo,

80