análisis i (notas de la teórica - 2c 2011)
TRANSCRIPT
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
1/50
Análisis I
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
2/50
Contenidos
1. R como cuerpo ordenado completo . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Construcción axiomática de R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Supremo, ́ınfimo y el axioma de completitud . . . . . . . . . . . . . . . . . . . 5
Valor absoluto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5Principio arquimediano de N . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2. Lı́mite de sucesiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Sucesiones acotadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Sucesiones monótonas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Subsucesiones y el Teorema de Bolzano-Weierstrass . . . . . . . . . . . . . . . 6
Métricas en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Lı́mite de sucesiones en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Nociones de topologı́a en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3. Continuidad y lı́mite de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Álgebra de lı́mites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Teorema de Bolzano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Teorema de valores extremos de Weierstrass . . . . . . . . . . . . . . . . . . . 16
4. Derivabilidad y diferenciabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Derivabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Teoremas de valor medio de Rolle, Lagrange y Cauchy . . . . . . . . . . . . . 17
Derivadas parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Derivadas direccionales y vector gradiente . . . . . . . . . . . . . . . . . . . . 20
Diferenciabilidad y plano tangente . . . . . . . . . . . . . . . . . . . . . . . . . 20
Matriz diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Regla de la cadena en funciones de Rn a Rk . . . . . . . . . . . . . . . . . . . . 25Generalización del teorema de valor medio . . . . . . . . . . . . . . . . . . . . 27
5. Derivadas parciales de orden superior y Teorema de Taylor . . . . . . . . . . . . 29
Derivadas parciales cruzadas en funciones C2 . . . . . . . . . . . . . . . . . . . 29
Teorema de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Matriz hessiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
6. Extremos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Extremos locales y el Teorema de Fermat . . . . . . . . . . . . . . . . . . . . . 32
Criterio de la matriz hessiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
7. Teoremas de la función inversa y la función implı́cita . . . . . . . . . . . . . . . . 35
Teorema de la función inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
3/50
Teorema de la función implı́cita . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
8. Extremos restringidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Multiplicadores de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389. Integración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Sumas inferiores y superiores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Propiedades de la integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Teorema fundamental del cálculo . . . . . . . . . . . . . . . . . . . . . . . . . . 43
Regla de Barrow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Fórmula de cambio de variable . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Integrales impropias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
Integración en varias variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
Conjuntos de contenido cero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Teorema de Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Criterio de convergencia integral de Cauchy-Maclaurin . . . . . . . . . . . . . 48Cambio de variables en integrales dobles . . . . . . . . . . . . . . . . . . . . . 49
Coordenadas polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
4/50
1. R como cuerpo ordenado completo
Definición 1.1. Llamamos conjunto de n´ umeros reales (notado
R) al conjunto que conformaun cuerpo ordenado completo (R, +, ·, 0).Observación 1.1.3. Los axiomas que definen a R implican, para todo a ∈R:
(1). 0a = 0 = a0
(2). (−a) = (−1)a(3). 0 < 1
Dem. Derivamos utilizando los axiomas:
3
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
5/50
(1).
(∀
a ∈R)a = a
S3⇐⇒ a = 0 + aP3⇐⇒ 1a = 0 + aS3⇐⇒ (0 + 1)a = 0 + aD⇐⇒ 0a + 1a = 0 + aP3⇐⇒ 0a + a = 0 + aS4⇐⇒ 0a + a + (−a) = 0 + a + (−a)S4
⇐⇒ 0a + 0 = 0 + 0
S3⇐⇒ 0a = 0(2).
(∀a ∈R)0a = 0S4⇐⇒ (1 + (−1))a = 0D⇐⇒ 1a + (−1)a = 0P3⇐⇒ a + (−1)a = 0S4
⇐⇒ a + (−1)a + (−a) = 0 + (−a)S1⇐⇒ a + (−a) + (−1)a = 0 + (−a)S4⇐⇒ 0 + (−1)a = 0 + (−a)S3⇐⇒ (−1)a = (−a)
(3). Supongamos 1 < 0. Elegimos a ∈ R tal que a > 0. Entonces, por O4, 1a < 0a P3⇐⇒a < 0a
(1)⇐⇒ a < 0, lo cual es contradictorio.
Definición 1.2. Definimos al conjunto de reales positivos (notados R+) de modo que R+ =
{x ∈R : x > 0}Definición 1.3. Dados a, b ∈ R definimos al intervalo abierto (a, b) como el conjunto (a, b) ={x ∈R : a < x < b} y al intervalo cerrado [a, b] como el conjunto [a, b] = {x ∈ R : a ≤ x ≤ b}Definición 1.4. Dado A ⊆R, decimos que A es acotado superiormente si existe x ∈R tal que x ≥ y para todo y ∈ A. Cualquier x que satisfaga esta condición es llamada cota superior de A.Análogamente, decimos que A es acotado inferiormente si existe x ∈R tal que x ≤ y para todo y ∈ A. Cualquier x que satisfaga esta condición es llamada cota inferior de A.
Proposición 1.1. Todo subconjunto finito de R es acotado inferior y superiormente.
4
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
6/50
Definición 1.5. Dado A ⊆ R, A = ∅ acotado superiormente, decimos que s ∈ R es elsupremo de A y notamos s = sup A si s es cota superior de A y si, dada otra cota superior s
de A, se cumple que s ≤ s. Si sup A ∈ A lo llamamos m´ aximo y lo notamos max A.Análogamente, decimos que i ∈ R es el ı́nfimo de A y notamos i = inf A si i es cota inferiorde A y si, dada otra cota inferior i de A, se cumple que i ≥ i. Si inf A ∈ A lo llamamosmı́nimo y lo notamos min A.
Proposición 1.2. Dado A ⊆R, A = ∅ acotado superiormente, s = sup A es equivalente a:(1) s es cota superior de A y, para todo s < s, existe as ∈ A tal que s < as ≤ s(2) s es cota superior de A y, para todo ε > 0, existe aε ∈ A tal que s − ε < aε ≤ s
Se pueden demostrar afirmaciones análogas para el ı́nfimo utilizando un argumento simétrico
a la siguiente demostración:
Dem. Si s = sup A entonces s es la menor de las cotas superiores de A, por lo tanto paracualquier s < s existe as ∈ A tal que s < as ≤ s ya que, en caso contrario, s serı́a cotasuperior de A y s no serı́a supremo. (2) es equivalente ya que si s 0tal que s = s + ε (ver Observación 1.1.2).
Axioma de completitud. Para todo A ⊆R, A = ∅ acotado superiormente, existe sup A.Corolario del axioma de completitud. Para todo A ⊆ R, A = ∅ acotado inferiormente,existe inf A.
Dem. Dado A, construimos el conjunto A = {−x : x ∈ A}. Ya que A ⊆ R y A = ∅ , existes = sup A
por el axioma de completitud. Entonces, s
≥ −x para todo x
∈ A, y deducimos
ası́ que s ≤ x para todo x ∈ A, por lo tanto s = inf A.
Definición 1.6. Definimos la función m´ odulo o valor absoluto (notada |x|) tal que:
|x| =
x si x ≥ 0−x si x < 0
Propiedades del módulo. Dados a, x, y ∈R con a > 0 se verifica que:
(1) x ≤ |x| = |− x|(2) x
2
= |x2
| = |x|2
(3) |x| < a ⇐⇒ x ∈ (−a, a)(4) |x| > a ⇐⇒ x ∈ (−∞, −a) ∪ (a, +∞)(5) |x + y| ≤ |x| + | y| (desigualdad triangular)(6) ||x| − | y|| ≤ |x − y|(7) ||x| − | y|| ≤ |x + y|(8) |xy| = |x|| y|
Principio arquimediano de N. Para todo x ∈R existe n ∈N de modo que n > x.Dem. Dado x ∈R, x + 1 ∈ N verifica lo pedido.
5
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
7/50
2. Lı́mite de sucesiones
Definición 2.1. Llamamos una sucesi´ on de elementos de A a cualquier función f :
N → A. Engeneral, utilizaremos la notación (xn)n∈N para referirnos a una sucesión f de números reales
y notaremos xn a f (n). Además, notamos (xn)n∈N ⊆ B si xn ∈ B para todo n ∈N.
Definición 2.2. Una sucesión (xn)n∈N se dice acotada superiormente si existe x ∈ R tal quex ≥ xn para todo n ∈ N. Análogamente, (xn)n∈N se dice acotada inferiormente si existex ∈ R tal que x ≤ xn para todo n ∈ N. (xn)n∈N se dice acotada si es acotada inferior ysuperiormente.
Definición 2.3. Decimos que una sucesión (xn)n∈N de números reales tiende a x ∈R (o bienx es el lı́mite de (xn)n∈N ) si, para todo ε > 0, existe n0 ∈ N tal que |xn − x| < ε para todon ≥ n0. En este caso notamos limn→∞xn = x, o bien xn −−−→n→∞ x. Una sucesión que tienelı́mite se dice convergente.
Proposición 2.1. Dados A ⊆ R, A = ∅ y acotado superiormente, s = sup A, existe unasucesión (xn)n∈N ⊆ A tal que xn −−−→
n→∞ s.Análogamente, dados A ⊆R, A = ∅ y acotado inferiormente, i = inf A, existe una sucesión(xn)n∈N ⊆ A tal que xn −−−→
n→∞ i.
Dem. Dado s = sup A, para cada n ∈ N elegimos xn ∈ A de modo que s − 1n < xn ≤ s <s + 1n (ver Proposición 1.2). Queda determinada ası́ una sucesión (xn)n∈N ⊆ A en donde severifica que
|xn
− s
| <
1
n
para todo n
∈ N. Consecuentemente, dado ε
∈ R+ basta tomar
n0 ≥ 1ε para que se verifique |xn − s| < ε para cualquier n ≥ n0. Entonces xn −−−→n→∞ s.La demostración es análoga para el ı́nfimo.
Definición 2.4. (xn)n∈N se dice mon´ otona creciente si xn ≤ xn+1 para todo n ∈N. Análogamente,(xn)n∈N se dice mon´ otona decreciente si xn ≥ xn+1 para todo n ∈N.Decimos que la monotonı́a es estricta si xn = xn+1 para todo n ∈N.Proposición 2.2. Si (xn)n∈N es monótona creciente y acotada superiormente, xn −−−→
n→∞ supn∈N{xn}.Análogamente, si (xn)n∈N es monótona decreciente y acotada inferiormente, xn −−−→
n→∞ inf n∈N{xn}.
Dem. Consideremos el conjunto A = {xn : n ∈ N}. Llamaremos s al supremo de A, elcual existe ya que (xn) es acotada. Entonces, dado ε ∈ R+, vemos que existe n0 tal ques − ε
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
8/50
Dem. Dado que (xn)n∈N es acotada, basta con ver que tiene una subsucesión monótona paraasegurarnos de que también es convergente. Para demostrar esta proposición, primero in-
troduciremos la siguiente definición:
Dada (xn) ⊆ R, decimos que el ı́ndice n es un punto cumbre de la sucesión si para todo p > n se verifica que xn > x p
Consideremos entonces el conjunto A = {n ∈N : n es punto cumbre de (xn)}Supongamos que A es finito. Entonces existe n1 ∈ N tal que para todo n ≥ n1, n no es unpunto cumbre. Por lo tanto, existe n2 ∈ N tal que n2 > n1 y xn1 ≤ xn2 , dado que n1 no espunto cumbre. A su vez, también existe n3 ∈ N tal que n3 > n2 y xn2 ≤ xn3 , dado que n2tampoco es punto cumbre. De este modo, podemos construir una subsucesión estrictamente
creciente de la sucesión original.
Ahora bien, supongamos que A es infinito. Entonces, podemos construir una sucesión cre-
ciente n1 < n2 < n3 < . . . de puntos cumbre de la sucesión. Pero entonces xn1 ≥ xn2 ≥xn3 ≥ . . . dado que cada ı́ndice es un punto cumbre. De este modo, podemos construir unasubsucesión estrictamente decreciente de la sucesión original.
Definición 2.6. Dado un conjunto A, decimos que la función d : A × A → R define unam´ etrica en A si verifica que, para todo x, y, z ∈ A:
(1). d(x, y) ≥ 0
(2). d(x, y) = d( y, x)(3). d(x, y) ≤ d(x, z) + d( z, y)Observación. d(x, y) = |x − y| define una métrica sobre R.Definición 2.7. Llamamos norma euclı́dea a la función · : Rn → R definida como:
x = n∑
j=1
x2 j
La norma euclı́dea es tambı́en notada x2
Observación. La norma euclı́dea verifica que, para todo x ∈Rn
:(1) 0 ≤ x(2) cx = |c| · x para todo c ∈R(3) x ∈R ⇒ x = |x|Definición 2.8. Llamamos norma infinito o norma sup a la función · ∞ : Rn → R definidacomo:
x∞ = max j∈{1,2,...,n}
|x j|Observación. Tanto la norma euclı́dea como la norma infinito definen métricas sobre Rn;
nos referimos a la norma euclı́dea al hacer referencia a distancias en Rn salvo que sea especi-
ficado lo contrario.
7
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
9/50
Proposición 2.3. Para todo x ∈Rn se cumple que x∞ ≤ x ≤ √
nx∞Dem.
x
∞
≤ x
si y sólo si
|x j
| ≤ x
para todo j
∈ {1 , 2 , . . . , n
}, pero esto es obvio ya
que:
|x j| =
x2 j ≤
x21 + x22 + · · · + x2 j + · · · + x2n = x
Además, como x∞ = max|x j|:
x =
x21 + x22 + · · · + x2n ≤
nx2∞ =
√ nx∞
Definición 2.9. Definimos la bola de centro x ∈ Rn y radio r ∈ R (notada Bx(r) o bien B(x, r))al conjunto definido como:
Bx(r) = { y ∈Rn : d(x, y) < r}Definición 2.10. Un conjunto A ∈Rn se dice acotado si existe M ∈ R tal que ||a|| ≤ M(∀a ∈ A), o, equivalentemente, A ⊆ B M(0) (en general, entendemos como el punto 0 ∈ Rk al punto(0 , . . . , 0)). Una sucesión ( pn)n∈N ⊆ Rn se dice acotada si existe M ∈ R tal que pn ≤ Mpara todo n ∈N.
Definición 2.11. Decimos que una sucesión ( pn)n∈N ⊆ Rn tiende a p ∈ Rn (o bien p es ellı́mite de ( pn)n∈N) si para todo ε > 0 existe n0 ∈ N tal que pn − p < ε, para todo n ≥ n0; o,equivalentemente, si para todo ε > 0 existe n0 ∈ N tal que pn ∈ B p(ε), para todo n ≥ n0.
Esto generaliza la noción de lı́mite introducida en la Definición 2.3, de la que seguiremos
utilizando su notación.
Proposición 2.4. Una sucesión ( pk = ( pk 1 , pk 2 , . . . , pk n ))k ∈N ⊆ Rn converge a un valor l =(l1, l2, . . . , ln) si y sólo si se verifica:
( pk j ) −−→k →∞
l j para todo j ∈ {1 , 2 , . . . , n}
Dem. (⇒) Supongamos que pk −−−→n→∞ l, es decir, para todo ε > 0 existe k 0 ∈ N de modo que
pk − l < ε para cualquier k ≥ k 0. Pero, por lo demostrado en la Proposición 2.3, tenemosque:
max j∈{1,2,...,n}
| pk j − l j|
= pk − l∞ ≤ pk − l < ε
lo cual implica que cada coordenada de la sucesión tiende a su correspondiente coordenada
del lı́mite.
(⇐) Supongamos que pk j tiende a l j para todo j ∈ {1 , 2 , . . . , n}. Dado ε > 0, definimosε = ε√
n. Dado que todas las coordenadas tienden a su correspondiente lı́mite, existe k 0 ∈ N
tal que | pk j − l j| < ε si k ≥ k 0 para todo j ∈ {1 , 2 , . . . , n}. Entonces, tenemos que:
max j∈{1,2,...,n}| pk j − l j| < ε
8
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
10/50
Y por lo demostrado en la Proposición 2.3:
p
k −l ≤
√ n p
k −l∞ < ε
Por lo tanto, pk −−−→n→∞ l
Proposición 2.5. Si una sucesión de puntos de Rn es convergente, entonces es acotada.
Dem. Llamemos (xn)n∈N a la sucesión y l a su lı́mite. Existe entonces n0 ∈ N tal que |xn −l| < 1 para todo n ≥ n0, por lo que m = l + 1 > xn a partir de n0. Sea A = {xn : n ≤ n0}, essimple ver que A es finito y, por lo demostrado en la Proposición 1.1, acotado. Por lo tanto,
sup ( A ∪ {m}) es cota superior de la sucesión.La demostración es análoga para cotas inferiores.
Definición 2.12. El complemento de un conjunto A ∈ Rn, notado Ac, es el conjunto definidocomo Ac = {x ∈ Rn : x ∈ A}Definición 2.13. Un conjunto A ∈Rn se dice abierto si para todo p ∈ A existe r ∈R+ tal que B p(r) ⊆ A. Además, A se dice cerrado si Ac es abierto.
Proposición 2.6. Un conjunto A ∈ Rn es cerrado si y sólo si toda sucesión de elementos de A converge a un elemento de A.
Dem. (⇒) Supongamos A ∈ Rn cerrado y (xn) ⊆ A tal que xn → p. Si p ∈ A, entonces p ∈ Ac. Ac es abierto por hipótesis, ya que A es cerrado. Por lo tanto, existe r ∈ R+ tal quela bola centrada en p de radio r está totalmente contenida en A
c
. Pero, dado este r , existen0 ∈ N tal que |xn0 − p| < r ya que xn → p. Entonces xn0 ∈ A y xn0 ∈ Ac, lo cual es absurdo.Por lo tanto, p ∈ A.
(⇐) A ∈ Rn es un conjunto tal que toda sucesión de elementos de A converge a un ele-mento de A. Supongamos que A no es cerrado. Entonces, Ac no es abierto, por lo tanto
existe x ∈ Ac tal que toda bola centrada en x contiene elementos de A. Construimos en-tonces la sucesión (xn) tal que xn es un punto de A contenido en la bola centrada en x deradio 1n . Pero entonces xn es una sucesión de elementos de A que converge a x ∈ A, lo cuales absurdo. Por lo tanto, A es cerrado.
Definición 2.14. Dado un conjunto A ∈Rn, definimos los siguientes conjuntos:(1) La frontera de A, notada ∂ A y definida:
∂ A = {x ∈Rn : Bx(r) ∩ A = ∅ y Bx(r) ∩ Ac = ∅ para todo r > 0}
(2) La clausura de A, notada ¯ A y definida ¯ A = A ∪ ∂ A(3) El interior de A, notado Ao y definido:
Ao = {x ∈ A : existe r > 0 tal que Bx(r) ⊆ A)}
Observación. Dado un conjunto A ∈Rn, ¯ A es el menor cerrado que contiene a A, y Ao es elmayor abierto contenido en A.
9
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
11/50
Definición 2.15. Definimos la bola cerrada de centro x ∈Rn y radio r ∈ R (notada Bx(r) o bienB(x, r)) al conjunto definido como:
Bx(r) = { y ∈Rn : d(x, y) ≤ r}
o equivalentemente, como la clausura de Bx(r)
Definición 2.16. Un conjunto A ∈Rn se dice compacto si es cerrado y acotado.
10
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
12/50
3. Continuidad y lı́mite de funciones
Definición 3.1. Dada una función f : A → B, la imagen de f , notada Im( f ), es el conjuntodefinido como
Im( f ) = { y ∈ B : existe x ∈ A tal que y = f (x)}Definición 3.2. Dada una función f : A ⊆ Rn → R, el gr´ afico de f , notado gr( f ), es elconjunto definido como
gr( f ) =
(x1, . . . , xn, xn+1) ∈Rn+1 : ( y = (x1, . . . , xn) ∈ A ∧ xn+1 = f ( y))
Definición 3.3. Dados una función f : A ⊆ R2 → R y c ∈R, definimos la curva de nivel de f asociada a c, notada CNc( f ), como el conjunto:
CNc( f ) =
(x1, x2) ∈R2 : f (x1, x2) = cObservación. CNc( f ) = ∅ si y sólo si c ∈ Im( f )Definición 3.4. Dados una función f : A ⊆Rn → R, p ∈ ¯ A y l ∈ R, decimos que f (x) tiendea l cuando x tiende a p, o bien que l es el lı́mite de f (x) al tender x a p si se cumple que:
(∀ε ∈R+)(∃δ ∈R+) tal que (0 < x − p < δ con x ∈ A) ⇒ | f (x) − l| < εEn tal caso, notamos lim
x→ p f (x) = l , o bien f (x) −−→x→ p l.
Proposición 3.1 ( Álgebra de lı́mites). Dados un conjunto A ⊆ Rn, el punto p ∈ ¯ A y lasfunciones f : A →R y g : A →R tales que limx→ p f (x) = l1 y limx→ p g(x) = l2. Entonces:
(1). limx→ p( f + g)(x) = l1 + l2(2). (∀c ∈R)limx→ p(c f )(x) = cl1(3). limx→ p( f g)(x) = l1l2(4). Si l1 = 0, entonces existe δ ∈ R+ tal que, si 0 < ||x − p|| < δ (con
x ∈ A) entonces | f (x)| ≥ |l1|2 > 0. En particular, f (x) = 0 en algún entorno de p.
(5). Si l1
= 0, entonces limx→ p 1 f (x) = 1l1
(6). Si l2 = 0, entonces limx→ p
f g
(x) = l1l2
Dem. (1). Dado ε ∈ R+, definimos ε = ε2 . Dado que f tiende a l1 y g tiende a l2 al acer-carnos a p, existen δ, δ ∈ R+ de modo que:
0 < x − p < δ ⇒ | f (x) − l1| < ε y 0 < x − p < δ ⇒ | g(x) − l2| < ε
Definimos entonces δ = min{δ, δ}. Entonces, si 0 < x − p < δ:| f (x) + g(x) − (l1 + l2)| ≤ | f (x) − l1| + | g(x) − l2| < 2ε = ε
Por lo tanto ( f + g)(x) tiende a l1 + l2 cuando x tiende a p.
11
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
13/50
(2). Dado ε ∈R+, definimos ε = ε|c| . Dado que f tiende a l1 existe δ ∈R+ de modo que:0 <
x
− p
< δ
⇒ | f (x)
−l1|< ε
Pero entonces:
0 < x − p < δ ⇒ |c f (x) − cl1| = |c| · | f (x) − l1| < εPor lo tanto c f (x) tiende a cl1 cuando x tiende a p.
(3). Tomemos un cierto ε ∈R+. Observemos entonces que:| f (x) g(x) − l1l2| = | f (x) g(x) + f (x)l2 − f (x)l2 − l1l2|
= | f (x)( g(x) − l2) + l2( f (x) − l1)|≤ | f (x)( g(x) − l2)| + |l2( f (x) − l1)|= | f (x)| · | g(x) − l2| + |l2| · | f (x) − l1|
Ahora bien, ya que f (x) es convergente a l1, podemos asegurar que f (x) es acotado enun cierto entorno de p. Para demostrarlo, partimos de que, ya que f (x) tiende a l1 altender x a p, existe δ ∈ R+ tal que:
0 < x − p < δ ⇒ | f (x) − l1| < 1Entonces es f ́acil ver que 0 < | f (x)| < max {|l1 − 1|, |l1 + 1|} = M para nuestraelección de δ.Ahora bien, dado que g(x) tiende a l2 al tender x a p, entonces existe δ ∈ R+ tal que:
0 < x − p < δ ⇒ | g(x) − l2| <ε
2 M
y, consecuentemente:
0 < x − p < min δ, δ ⇒ | f (x)| · | g(x) − l2| ≤ M| g(x) − l2| < ε2
A su vez, dado que f (x) tiende a l1 al tender x a p, entonces existe δ ∈ R+ tal que:
0 < x − p < δ ⇒ | f (x) − l1| < ε2|l2| ⇐⇒ |l2| · | f (x) − l1| <
ε
2
Por lo tanto, definimos δ = min {δ, δ , δ}. Se deduce entonces que, si 0 < ||x − p|| <δ:
| f (x) g(x) − l1l2| ≤ | f (x)| · | g(x) − l2| + |l2| · | f (x) − l1| < ε2
+ ε2
= ε
Finalmente ( f g)(x) tiende a l1l2 cuando x tiende a p.
(4). Dado que f tiende a l1 existe δ ∈R+ de modo que:
0 < x − p < δ ⇒ | f (x) − l1| < |l1|2
Esto se cumple ya que, por hipótesis, l1 = 0. Deducimos entonces que, si 0
|l1
| − |l1|
2
= |l1|
2
> 0
12
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
14/50
(5). Remarquemos primero que 1 f (x)
está bien definido en un cierto entorno de p por lo
probado en el punto anterior; formalmente, decimos que existe δ ∈ R+ tal que si0 < x − p < δ entonces | f (x)| > |
l1 |2 > 0, y consecuentemente, f (x) = 0.
Ahora bien, dado ε ∈ R+, definimos ε = ε · |l1 |22 . Como f tiende a l1 cuando x tiendea p, existe δ ∈ R+ tal que si 0 0,entonces f (x) > 0 en un entorno de p; formalmente, existe r ∈ R+ tal que f (x) > 0 paratodo x ∈ Br( p).Análogamente, si l < 0, entonces f (x) < 0 en un entorno de p.Dem. Por lo demostrado en la Proposición 3.1, existe r ∈ R+ tal que, si 0 0.Ahora bien, si l > 0, entonces | f (x)| ≥ l2 > 0 para todo x ∈ Br( p), pero f (x) < 0, ya que,si lo fuera, | f (x) − l| > |l| = l y entonces f (x) no tenderı́a a l . Concluimos entonces que f (x) > 0 para todo x ∈ Br( p).La demostración para l < 0 es análoga.
Corolario. Si f (x) ≥ 0 para todo x ∈ A y limx→ p f (x) = l , entonces l ≥ 0Análogamente, si f (x) ≤ 0 para todo x ∈ A y limx→ p f (x) = l , entonces l ≤ 0
Dem. Este enunciado es el contrarrecı́proco de la Proposición 3.2
Proposición 3.3. Dada una función f : A ⊆Rn → R y un punto p ∈ A, se verifica que: f (x) −−→
x→ p 0 ⇐⇒ | f (x)| −−→x→ p 0
Dem. (⇒) Si f tiende a 0 al aproximarse a p, entonces, dado ε ∈R+, existe δ ∈R+ de modoque, si 0 < x − p < δ entonces | f (x) − 0| = || f (x)| − 0| < ε, por lo que | f | también tiendea 0.
(⇐) Si | f | tiende a 0 al aproximarse a p, entonces, dado ε ∈R+, existe δ ∈R+ de modo que,si 0
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
15/50
Definición 3.5. Dados una función f : A ⊆ Rn → R y un punto p ∈ Ao, decimos que f escontinua en p si limx→ p f (x) = f ( p).
Además, f es continua en A, o simplemente continua, si es continua en p para todo p ∈ Ao
.
Corolario. Dados las funciones f : A ⊆ Rn → R y g : A ⊆ Rn → R y el punto p ∈ A talesque f y g son continuas en p. Entonces:
(1). ( f + g) es continua en p
(2). Para todo c ∈R, (c f ) es continua en p(3). ( f g) es continua en p
(4).
f g
está bien definida en un entorno de p y es continua en p si g( p) = 0
Dem. Este enunciado es análogo al presentado en la Proposición 3.1
Observación. Si f : R2 → R es continua, entonces el conjunto
A = {(x, y) ∈R2 : f (x, y) = 0}
es abierto.
Dem. Si p ∈ A, entonces f ( p) = c con |c| = 0. Como f es continua, existe un entorno de pen el cual | f ( p) − c| n0, por lo que concluimos que f (xn) tiendea f ( p) al tender n a infinito.
Definición 3.6. Dados una función f : A ⊆ Rn → Rk (es decir, f = ( f 1, f 2, . . . , f k ) y f (x) es la k -upla f 1(x), f 2(x), . . . , f k (x), con f i : A ⊆ R
n
→ R para todo i ∈ {1 , 2 , . . . , k }) y un punto p ∈ Ao
, decimos que f es con-tinua en p si:
(∀ε ∈R+)(∃δ ∈R+) tal que (x − p < δ con x ∈ A) ⇒ f (x) − f ( p) < ε
Nótese que el término x − p hace referencia a la norma euclı́dea en Rn, mientras que eltérmino f (x) − f ( p) se refiere a la norma euclı́dea en Rk .Además, f es continua en A si es continua en p para todo p ∈ Ao.Esto generaliza la noción de continuidad introducida en la Definición 3.5.
Proposición 3.4. Dados una función f : A ⊆ Rn → Rk y un punto p ∈ Ao, f es continua en p si y sólo si f
i es continua en p para todo i
∈ {1 , 2 , . . . , k
}14
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
16/50
Dem. (⇒) Dado ε ∈ R+, existe δ ∈ R+ tal que si x − p < δ entonces f (x) − f ( p) < ε.Entonces, por lo visto en la Proposición 2.3 tenemos que:
maxi∈{1,2,...,k }
| f i(x) − f i( p)| = f (x) − f ( p)∞ ≤ f (x) − f ( p) < ε
Por lo tanto, cada f i es continua en p.
(⇐) Por lo visto en la Proposición 2.3 tenemos que: f (x) − f ( p) ≤
√ k f (x) − f ( p)∞ =
√ k max
i∈{1,2,...,k }| f i(x) − f i( p)|
Como todas las f i son continuas en p, dado ε ∈ R+ vemos que existe un δi ∈ R+ para cada f i de modo que, si ||x − p|| < δi entonces:
| f i(x) − f i( p)| < ε√ k
⇐⇒ √ k | f i(x) − f i( p)| < ε
Deducimos ası́ que:
f (x) − f ( p) ≤√
k maxi∈{1,2,...,k }
| f i(x) − f i( p)| < ε
Por lo tanto, f es continua en p.
Teorema de Bolzano (o Teorema del Valor Intermedio). Sea
f : [a, b]
→ R una función continua en el intervalo (a, b) con a, b
∈ R, a < b, f (a) < 0
y f (b) > 0 (o bien, f (a) > 0 y f (b) < 0). Entonces existe c ∈ (a, b) tal que f (c) = 0.Dem. Supondremos que f (a) < 0 < f (b) (la demostración del caso inverso es análoga).Consideremos entonces el conjunto A = {x ∈ [a, b] : f (x) < 0}. A = ∅ ya que a ∈ A,y además es acotado (ya que es un subconjunto de [a, b], que es acotado). Entonces, porel axioma de completitud, existe s = sup A. Además, s ∈ (a, b) (esto se debe a que, por lacontinuidad de f , existen entornos de a y b en los que la función conserva el signo, y entonces
cada uno de sus puntos pertenecen a A o son cotas superiores de A, respectivamente)
Ahora bien, f (s) < 0 ya que, si lo fuera, existirı́a un entorno de s que contenga al puntos > s de modo que f (s) < 0, y entonces s no serı́a supremo de A.Además, f (s)
> 0, porque, análogamente, en caso de serlo existirı́a un entorno de s que
contenga al punto s < s de modo que f (s) > 0, y entonces s no serı́a supremo de A.Concluimos entonces que s ∈ (a, b) satisface que f (s) = 0Generalización del Teorema de Bolzano. Sea f : [a, b] →R una función continua en el inter-valo (a, b) con a, b ∈ R, a < b, f (a) < f (b) yc ∈ ( f (a), f (b)) (o bien f (b) < f (a) y c ∈ ( f (b), f (a)). Entonces existe d ∈ (a, b) tal que f (d) = c.
Dem. Supondremos que f (a) < f (b) (la demostración del caso inverso es análoga). Defin-imos entonces g : [a, b] → R de modo que g(x) = f (x) − c. Podemos ver que g(a) = f (a) − c < 0, g(b) = f (b) − c > 0. Entonces, por el Teorema de Bolzano, existe d ∈ (a, b) demodo que g(d) = f (d) − c = 0, por lo que se deduce que f (d) = c.
15
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
17/50
Definición 3.7. Una función f : A ⊆ Rn → Rk se dice acotada si existe M ∈ R+ tal que|| f (x)|| ≤ M para todo x ∈ A, o equivalentemente, si existe r ∈ R+ tal que Im( f ) ⊆ Br(0).
Teorema de Weierstrass. Sea f : A ⊆Rn → Rk una función continua, con A = ∅ compacto,entonces f es acotada y además alcanza máximo y mı́nimo, es decir, existen tanto max Im( f )como min Im( f )
Dem. Supongamos que f no es acotada. Entonces, construimos la sucesión (xn) de elemen-tos de A de modo que | f (xn)| > n para cada n ∈ N, y por lo tanto f (xn) −−−→
n→∞ +∞. Como A es acotado, por el Teorema de Bolzano-Weierstrass existe una subsucesión (xn j ) conver-gente a un punto p, el cual debe pertenecer a A debido a que es un conjunto cerrado (ver
Proposición 2.6). Pero entonces f (xn j ) −−→ j→∞
+∞ y f (xn j ) −−→ j→∞
f ( p), lo cual es absurdo.
Entonces f es acotada.
Como A = Im( f ) es un conjunto acotado y A = ∅, por el axioma de completitud, existes = sup A. Por lo visto en la Proposición 2.2, existe una sucesión (xn) de elementos de Aconvergente a s. Pero A es cerrado, entonces s ∈ A y por lo tanto s = max A.La demostración para el mı́nimo es análoga.
16
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
18/50
4. Derivabilidad y diferenciabilidad
Definición 4.1. Dada una función f : (a, b) →
R, con a, b ∈
Ry a
<
b, y un punto x0 ∈ (a, b),se dice que f es derivable en x0 si existe l ∈ R tal que:
l = limx→x0
f (x) − f (x0)x − x0 = limh→0
f (x0 + h) − f (x0)h
En este caso, decimos que l es la derivada de f en x0 y notamos f (x0) = l .
Además, decimos que f es derivable en un conjunto A ⊆ (a, b) si f es derivable en x paratodo x ∈ A.Una interpretación geométrica del concepto de derivada es el de la pendiente de la recta
tangente al gráfico de f por el punto (x0, f (x0)), cuya ecuación es:
y = f (x0)(x − x0) + f (x0)Lema 4.1. Dada una función f : (a, b) → R, con a, b ∈ R y a < b derivable en un puntox0 ∈ (a, b), entonces f es continua en x0Dem. Consideremos el siguiente lı́mite:
limx→x0
f (x) − f (x0) = limx→x0
f (x) − f (x0)x − x0 (x − x0)
= limx→x0
f (x) − f (x0)x − x0 · limx→x0 x − x0
= f (x0) · 0 = 0Por lo tanto, f (x) tiende a f (x0) al tender x a x0, o sea, f es continua en x0
Lema 4.2. Dada una función f : (a, b) → R, con a, b ∈ R y a < b derivable en un puntox0 ∈ (a, b), si f es creciente, entonces f (x0) ≥ 0 (o, si es decreciente, f (x0) ≤ 0)Dem. Por la definición de derivada, tenemos que:
f (x0) = limx→x0
f (x) − f (x0)x − x0 = limx→x−0
f (x) − f (x0)x − x0
Es fácil ver que el lı́mite lateral es no-negativo, ya que tanto el numerador (por la monotonı́a
de f ) como el denominador son negativos.
La demostración para f decreciente es análoga.
Lema 4.3. Dada una función constante f : (a, b) → R, con a, b ∈ R y a < b se verifica que f (x) = 0 para todo x ∈ (a, b)Dem. Dado x0 ∈ (a, b), calculemos f (x0):
f (x0) = limx→x0
f (x) − f (x0)x − x0 = limx→x0
0
x − x0 = 0
17
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
19/50
Teorema de Rolle. Dada una función f : [a, b] → R, con a, b ∈ R y a < b , continua en [a, b]y derivable en (a, b), si f (a) = f (b), entonces existe un punto c ∈ (a, b) tal que f (c) = 0Dem. Como f es continua y [a, b] es compacto, por el Teorema existen x0, x1 ∈ [a, b] tal que f (x0) = maxIm( f ) y f (x1) = min Im( f ).Supongamos que x0 ∈ (a, b). Ahora bien, como f es derivable en (a, b), tenemos que:
0 ≥ limx→x−0
f (x) − f (x0)x − x0 = f
(x0) = limx→x+0
f (x) − f (x0)x − x0 ≥ 0
Esto se deduce del hecho que f (x0) ≥ f (x) para todo x ∈ [a, b]. Por lo tanto, f (x0) = 0Podemos aplicar el mismo razonamiento a x1. Entonces, falta considerar el caso en el cual
x1 = x2 = a = b, pero esto es trivial, ya que si f (a) es tanto el mı́nimo como el máximo de laimagen, entonces f (x) ≤ f (a) ≤ f (x) para todo x ∈ [a, b], es decir, la función es constante,y, por el Lema 4.3 f (x) = 0 para todo x ∈ (a, b).Teorema de Lagrange. Dada una función f : [a, b] → R, con a, b ∈ R y a < b, continua en[a, b] y derivable en (a, b), entonces existe un punto c ∈ (a, b) tal que:
f (b) − f (a)b − a = f
(c)
Dem. Consideremos la función g : [a, b] →R definida tal que:
g(x) = f (x) − f (b) − f (a)b − a (x − a) − f (a)
Es f ́acil ver que g es continua en [a, b] y derivable en (a, b), y además se verifica que g(a) = g(b) = 0. Entonces, por el Teorema de Rolle, existe c ∈ (a, b) tal que g(c) = 0. Ahora bien:
0 = g (c) = f (c) − f (b) − f (a)b − a =⇒ f
(c) = f (b) − f (a)
b − a
Teorema de Cauchy. Dadas las funciones f : [a, b] → R y g : [a, b] → R, con a, b ∈ Ry a < b, continuas en [a, b] y derivables en (a, b), si se verifica que g(x) = 0 para todox ∈ (a, b), entonces existe un punto c ∈ (a, b) tal que:
f (b) − f (a)
g(b) − g(a) =
f (c)
g(c)Dem. Consideremos la función h : [a, b] →R definida tal que:
h(x) = ( f (x) − f (a))( g(b) − g(a)) − ( g(x) − g(a))( f (b) − f (a))Es f ́acil ver que h es continua en [a, b] y derivable en (a, b), y además se verifica que h(a) =h(b) = 0. Entonces, por el Teorema de Rolle, existe c ∈ (a, b) tal que h(c) = 0. Ahora bien:
0 = g (c) = f (c)( g(b) − g(a)) − g(c)( f (b) − f (a))
=⇒ f (c)( g(b) − g(a)) = g (c)( f (b) − f (a)) =⇒ f (c)
g(c) =
f (b) − f (a) g(b) − g(a)
18
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
20/50
Proposición 4.1. Dada una función f : (a, b) ⊆ R → R con a < b, si f (x) ≥ 0 para todox ∈ (a, b), entonces f es creciente; alternativamente , si f (x) ≤ 0 para todo x ∈ (a, b),entonces f es decreciente. Esta afirmación es el converso de lo demostrado en el Lema 4.2.
Dem. Dados x, y ∈R tales que x < y, por el Teorema de Lagrange existe un punto c ∈ (x, y)tal que:
f ( y) − f (x) y − x = f
(c)
de lo que se deduce que el numerador es positivo, ya que tanto el denominador como el lado
derecho de la ecuación lo son. Consecuentemente, f es creciente.
La demostración es análoga para f con derivada negativa.
Definición 4.2. Dada una función f : A
⊆Rn
→R, con A abierto, p
∈ A e i
∈ {1 , 2 , . . . , n
},
decimos que f es derivable en p respecto de xi si existe l ∈ R tal que:
l = limx→ pi
f ( p1, p2, . . . , pi−1, x, pi+1, . . . , pn−1, pn) − f ( p)x − pi
En este caso, decimos que l es la derivada parcial de f respecto de x i en p y notamos ∂ f ∂xi
( p) = l ,o bien f xi ( p) = l .Además, decimos que f es derivable en un conjunto B ⊆ A respecto de x i si f es derivableen y respecto de xi para todo y ∈ B, o derivable en B si existen todas sus derivadas parcialespara cada punto de B.
Observación. Dada una función f : A ⊆ Rn → R derivable en p ∈ A respecto de xi,definimos g : R →R de modo que:
g(x) = f ( p1, . . . , pi−1, x, pi+1, . . . , pn)
Entonces ∂ f ∂xi
( p) = g ( pi)
Dem. Por la definición de derivada parcial:
∂ f
∂xi( p) = lim
x→ pi f ( p1, . . . , pi−1, x, pi+1, . . . , pn) − f ( p)
x − pi= lim
x→ pi g(x) − g( pi)x − pi = g ( pi)
Observación. Si bien una función de R en R es continua en x si es derivable en x, una
función de Rn en R puede no ser continua en x pese a que existan todas sus derivadas
parciales en x.
Dem. Veamos que la función f : Rn → R definida tal que:
f (x) = 1 si (∃i ∈ {1 , 2 , . . . , n})xi = 00 si (∀i ∈ {1 , 2 , . . . , n})xi = 0
19
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
21/50
es un contraejemplo:
∂ f
∂xi (0̄) = limx→0 f (0 , . . . , x, . . . , 0)
− f (0̄)
x − 0 = limx→00
x − 0 = 0para todo xi, pero claramente f no es continua en 0̄, ya que, en caso de aproximarnos a 0̄ por
la recta definida por los múltiplos del vector (1 , . . . , 1), tenemos que:
limx→0̄
f (x) = 1 = 0 = f (0̄)
dado que ninguna coordenada se anula.
Definición 4.3. Dada una función f : A ⊆ Rn → R, con A abierto, p ∈ A y v ∈ Rn tal quev = 1 (es decir, v es un vector unitario) decimos que el siguiente lı́mite, en caso de existir,es la derivada direccional de f en la direcci´ on de v en el punto p:
limh→0
f ( p + hv) − f ( p)h
En caso de existir, notamos a esta derivada como ∂ f ∂v ( p).
Definición 4.4. Dada una función f : A ⊆ Rn → R, con A abierto, p ∈ A y f derivablerespecto de x e y en p, llamamos gradiente de f en p, y notamos ∇ f ( p), al vector definidocomo:
∇ f ( p) = ( f x1 ( p), f x2 ( p), . . . , f xn ( p))
Definición 4.5. Dada una función f : A ⊆ Rn → R, con A abierto y p ∈ A, decimos que f es diferenciable en p si existen a1, a2, . . . , an ∈ R tal que:
limx→ p
f (x) − f ( p) − a1(x1 − p1) − a2(x2 − p2) − · · · − an(xn − pn)x − p =
0̄
Los términos del numerador que restan son aquellos que definen al (hiper)plano tangente al
gráfico de f en el punto ( p1, p2, . . . , f ( p)), cuya ecuación es:
xn+1 = f ( p) + f x1 ( p)(x1
− p1) + f x2 ( p)(x2
− p2) +
· · ·+ f xn ( p)(xn
− pn)
Además, decimos que f es diferenciable en un conjunto B ⊆ A si f es diferenciable en y paratodo y ∈ B.
Es esencial notar que la diferenciabilidad es una generalización de la derivabilidad, para
llevar el concepto de aproximación lineal a funciones multivariables.
Teorema 4.1. Dada una función diferenciable f : A ⊆R2 → R y p ∈ A, se verifica que:(1). f es continua en p
(2). Existe ∇ f ( p) = (a, b), donde a y b son los coeficientes que determinan al plano tan-gente al gráfico de f en ( p1, p2, f ( p)).
20
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
22/50
(3). Para todo vector unitario v existe ∂ f ∂v ( p) = ∇ f ( p), v
Estos resultados son generalizables a funciones f : A ⊆
Rn
→R
Dem. (1). Consideremos la siguiente expresión:
f (x, y) − f ( p) − a(x − p1) − b( y − p2)(x, y) − p (x, y) − p + a(x − p1) + b( y − p2)
= f (x, y) − f ( p) − a(x − p1) − b( y − p2) + a(x − p1) + b( y − p2) = f (x, y) − f ( p)Ahora bien, es fácil ver que esta expresión tiende a 0 al aproximarnos a p por álgebra
de lı́mites, dado que:
f (x, y)
− f ( p)
− a(x
− p1)
−b( y
− p2)
(x, y) − p −−−−→(x, y)→ p 0por la diferenciabilidad de f . Es fácil ver que el resto de los términos involucrados en
la expresión también tienden a 0.
Por lo tanto, f (x, y) −−−−→(x, y)→ p
f ( p), entonces f es continua en p.
(2). Como f es diferenciable en p, sabemos que:
f (x, y) − f ( p) − a(x − p1) − b( y − p2)(x, y) − p −−−−→(x, y)→ p 0
En particular, si nos acercamos fijando y = p2 el lı́mite sigue siendo el mismo, por loque tenemos:
f (x, p2) − f ( p) − a(x − p1) − b( p2 − p2)(x − p1, p2 − p2) −−−→x→ p1 0
⇐⇒ f (x, p2) − f ( p) − a(x − p1)|x − p1| −−−→x→ p1 0
Ahora bien, reemplacemos a por la expresión f (x, p2)− f ( p)
x− p1 , la cual forma parte de ladefinición de f x:
f (x, p2) − f ( p) − f (x, p2)− f ( p)
x− p1 (x − p1)|x − p1| −−−→x→ p1 0
f (x, p2) − f ( p) − ( f (x, p2) − f ( p))|x − p1| =
0
|x − p1| −−−→x→ p1 0
Por lo tanto, tenemos que f x( p) = a.La demostración es análoga para f y( p).
(3). Como f es diferenciable en p, sabemos que:
f (x, y) − f ( p) − a(x − p1) − b( y − p2)
(x, y)
− p
−−−−→
(x, y)
→ p
0
21
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
23/50
En particular, si nos acercamos por la trayectoria (x, y) = p + hv (es decir, ( p1 +hv1, p2 + hv2)) el lı́mite sigue siendo el mismo, por lo que tenemos:
f ( p + hv) − f ( p) − f x( p)(hv1) − f y( p)(hv2) p + hv − p −−→h→0 0
⇐⇒ f ( p + hv) − f ( p) − h(∇ f ( p), v)|h| · v −−→h→0 0v = 1 ya que v es un vector unitario, y podemos quitar el módulo de h ya que ellı́mite es 0, por lo demostrado en la Proposición 3.3. Entonces:
f ( p + hv) − f ( p)h
− ∇ f ( p), v −−→h→0
0
Por lo tanto:
∂ f ∂v ( p) = ∇ f ( p), v
Teorema 4.2. Dada una función f : A ⊆ Rn → R con A abierto, tal que existen y soncontinuas f x( p) y f y( p) en p ∈ A, entonces f es diferenciable en p.Dem. Si f es diferenciable en p, tenemos que:
f (x, y) + f (x, p2) − f (x, p2) − f ( p) − a(x − p1) − b( y − p2)(x, y) − p −−−−→(x, y)→ p 0
Dado que f x y f y son continuas en p, por el Teorema de Lagrange, existen c1 entre x y p1 y c2
entre y y p2 tales que:
f (x, p2) − f ( p)x − p1 = f x(c1, p2)
f (x, y) − f (x, p2) y − p2 = f y(x, c2)
(dependiendo de la relación de orden entre x y p1, y y p2 puede que el denominador tenga
los términos de la resta invertidos, pero el resultado es idéntico).
Reemplazando en la expresión anterior tenemos:
f y(x, c2)( y − p2) + f x(c1, p2)(x − p1) − f x( p)(x − p1) − f y( p)( y − p2)(x, y) − p
= ( y − p2)( f y(x, c2) − f y( p)) + (x − p1)( f x(c1, p2) − f x( p))
(x, y) − p=
( y − p2)(x, y) − p ( f y(x, c2) − f y( p)) +
(x − p1)(x, y) − p ( f x(c1, p2) − f x( p)) −−−−→(x, y)→ p 0
dado que tanto ( y− p2)(x, y)− p como
(x− p1)(x, y)− p son menores a 1 y tanto ( f y(x, c2) − f y( p)) como
( f x(c1, p2) − f x( p)) tienden a 0.
Por lo tanto, f es diferenciable en p.
22
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
24/50
Proposición 4.2. Dada una función f : A ⊆ Rn → R con A abierto y p ∈ A, diferenciableen p de modo que ∇ f ( p) = 0̄, entonces ∂ f ∂v ( p) alcanza su máximo valor posible cuando setiene:
v = ∇ f ( p)∇ f ( p)
Además, se verifica que:∂ f
∂v( p) ≤ ∇ f ( p)
para cualquier vector unitario v.
Dem. Sabemos que, para cualquier vector unitario v:
∂ f
∂v( p) = ∇ f ( p), v
Ahora bien, por la desigualdad de Cauchy-Schwarz:
∇ f ( p), v ≤ ∇ f ( p) · v = ∇ f ( p)y la igualdad sólo es alcanzada si los vectores son colineales. Dado que v es unitario, a fin de
maximizar la derivada direccional, debemos utilizar un vector unitario colineal al gradiente,
es decir:
v = ∇ f ( p)∇ f ( p)
Definición 4.6. Dada una función f : A ⊆ Rn → Rk , f = ( f 1, f 2, . . . , f k ) con A abierto y p ∈ A, decimos que f es diferenciable en p si existe una transformación lineal T : Rn → Rk talque:
limx→ p
f (x) − f ( p) − T (x − p)x − p = 0̄
Recordamos que una función T : Rn → Rk es una transformación lineal si es aditiva yhomogénea de grado 1, es decir, si verifica que:
(1). T (v1 + v2) = T (v1) + T (v2)
(2). T (λv1) = λT (v1)
para todo v1, v2 ∈ Rn, λ ∈R.En caso de existir, dicha transformación lineal, a la que llamamos diferencial de f en p y nota-
mos D f ( p) ∈ Rn×k , es determinada por la matriz formada por los gradientes de cada f i en p dispuestos como filas, a la cual llamamos matriz jacobiana de f en p y notamos J f ( p). Por lotanto:
T (x) = D f ( p)
x1x2...
xn
=
∂ f 1∂x1
( p) ∂ f 1∂x2 ( p) · · · ∂ f 1
∂xn( p)
∂ f 2∂x1
( p) ∂ f 2∂x2 ( p) · · · ∂ f 2
∂xn( p)
......
. . . ...
∂ f k
∂x1( p) ∂ f k
∂x2( p)
· · · ∂ f k
∂xn( p)
x1x2...
xn
23
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
25/50
=
∇ f 1( p)∇ f 2( p)
.
..∇ f k ( p)
x1x2...
xn
Por lo tanto, decir que f es diferenciable en p es equivalente a decir que cada f i es diferen-
ciable en p. Reescribiendo entonces la definición original, tenemos que f es diferenciable en
p si:
limx→ p
f (x) − f ( p) − D f ( p) (x − p)x − p =
0̄
Esto generaliza la noción de diferenciabilidad introducida en la Definición 4.5.
Proposición 4.3. Si las funciones f : Rn → Rk y g : Rn → Rk son diferenciables, entonceslas funciones f + g y λ f (con λ ∈R) también lo son.Dem. Dado que D f y D g son transformaciones lineales, cumplen con las propiedades de
aditividad y homogeneidad de grado 1, de lo que se deduce que:
(1). D f + g = D f + D g
(2). Dλ f = λD f
Proposición 4.4. Si las funciones f : Rn → Rk y g : Rn → R son diferenciables, entonces lafunción g f también lo es.
Dem. gf es diferenciable si existen y son continuas todas las derivadas parciales de cada g f i;
por lo tanto, mostramos que se puede construir cualquier entrada del diferencial de g f de la
siguiente forma:
(D g f )(i, j) = ∂ g f i
∂x j= g
∂ f i∂x j
+ ∂ g
∂x j f i
Cada una de estas derivadas existe y es continua ya que tanto f como g son diferenciables,
por lo tanto g f es diferenciable. Más aún:
D g f = g D f +∇ g
f 1 f 2...
f k
con D g f ∈ Rn×k
Lema 4.4. Dada una transformación lineal T : Rn → Rk , existe c ∈R+ tal queT (v) < cvpara todo v ∈Rn.
24
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
26/50
Dem. Recordemos que toda transformación lineal está determinada por una matriz, por lo
tanto:
T (v) =
T 1,1 T 1,2 · · · T 1,nT 2,1 T 2,2 · · · T 2,n
......
. . . ...
T k ,1 T k ,2 · · · T k ,n
v1v2...
vn
=
∑
n j=1 T 1, j v j · · · ∑ n j=1 T k , j v j
Es fácil ver que T (v) > T (v), donde v está definido tal que vi = |vi| y T está definidapor la matriz:
T =
M M · · · M M M · · · M
......
. . . ...
M M · · · M
donde M = max
n,k |T n,k |. Basta entonces con ver que T (v) es menor que cv = cv.
Ahora bien:
T (v) = M
n
∑ j=1
v j, · · · ,n
∑ j=1
v j
= M k
n
∑ j=1
v j
2< M
√ k v
Finalmente, concluimos que c > M√
k cumple con lo solicitado.
Lema 4.5. Si f : Rn
→Rk es diferenciable en p, entonces f es continua en p.
Dem. Esto es inmediato ya que si f es diferenciable en p, entonces cada f i es continua en p y
consecuentemente también lo es f .
Lema 4.6. Si f : Rn → Rk es diferenciable en p, entonces existen δ, c ∈ R+ de modo tal quesi 0 < x − p < δ entonces:
f (x) − f ( p)x − p < c
Es decir, dicha expresión es acotada en un cierto entorno de p.
Dem. Dado que f es diferenciable en p, también será continua en ese punto, por lo que, dado
ε > 0, existe δ de modo que, si 0 < x − p < δ entonces f (x) − f ( p) < ε. Basta entoncesprobar que existe c > 0 de modo que ε < cx − p < cδ, pero dicho c existe; en particular,c > εδ cumple lo pedido.
Proposición 4.5 (Regla de la cadena). Si f : A ⊆Rn → Rk y g : Rk → R j son funciones talesque f es diferenciable en p ∈ A y g es diferenciable en f ( p), entonces g ◦ f es diferenciableen p, y además:
D g ◦ f ( p) = D g( f ( p)) D f ( p)
25
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
27/50
Dem. Veamos entonces que:
limx→ p g
◦ f (x)
− g
◦ f ( p)
− D g( f ( p)) D f ( p)(x
− p)
x − p = 0̄
Ahora esta bien, debido a la desigualdad triangular, esa expresión es menor o igual a la
suma de los siguientes términos:
(1). g ◦ f (x) − g ◦ f ( p) − D g( f ( p))( f (x) − f ( p))
x − p(2).
D g( f ( p))( f (x) − f ( p)) − D g( f ( p)) D f ( p) (x − p)
x
− p
Demostraremos entonces que cada uno de estos términos tiende a 0̄.
Para (1), supondremos f (x) = f ( p) (en caso contrario el numerador es 0̄ y consecuente-mente el lı́mite también lo es). Entonces, nuestra expresión es equivalente a:
g ◦ f (x) − g ◦ f ( p) − D g( f ( p))( f (x) − f ( p)) f (x) − f ( p)
f (x) − f ( p)x − p
Ahora bien, sea y = f (x). Dado que f es continua en p por el Lema 4.5, tenemos que
y −−→x
→ p
f ( p), por lo que podemos reescribir el primer término como:
g( y) − g( f ( p)) − D g( f ( p))( y − f ( p)) y − f ( p)
Ya que g es diferenciable en p, este término tiende a 0̄; es obvio que el segundo término es
acotado, debido a lo demostrado en el Lema 4.6.
Para (2), tomamos factor común en el numerador, dejando:
D g( f ( p)) f (x) − f ( p) − D f ( p) (x − p)
x
− p
en donde el primer término es acotado, por el Lema 4.4 (recordando que el diferencial defineuna transformación lineal) y el segundo tiende a 0̄ debido a que f es diferenciable en p.
Queda ası́ demostrado que el lı́mite de la primer expresión es 0̄, y por lo tanto el diferen-
cial propuesto es aquel asociado a g ◦ f .Corolario. Si f : A ⊆ Rn → Rk y g : Rk → R son funciones que cumplen las hipótesis de laproposición anterior, entonces:
∂ g ◦ f ∂x j
(a) =k
∑ m=1
∂ g
∂ ym( f (a))
∂ f m
∂x j(a)
26
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
28/50
En el caso particular en el que n = 1, tenemos entonces que:
( g ◦ f )(a) =k
∑ m=1
∂ g∂ ym ( f (a)) f m(a)
Dem. Por lo visto en la proposición anterior, tenemos que:
D g ◦ f (a) = D g( f (a)) D f (a)
Entonces, cada coordenada de D g ◦ f (a) ∈R1×n tiene la forma:∂ g ◦ f
∂x j(a) =
∂ g
∂ y1( f (a))
∂ f 1∂x j
(a) + · · · + ∂ g∂ ym
( f (a)) ∂ f m∂x j
(a)
=k ∑
m=1
∂ g∂ ym
( f (a)) ∂ f m
∂x j(a)
El caso particular n = 1 es análogo, salvo que, dado que cada f i es una función en unavariable, notamos directamente f i .
Definición 4.7. Dados a, b ∈ Rn con a = b, definimos al segmento que une a con b, notadoSab de modo que:
Sab = {λ(b − a) + a : λ ∈ [0, 1]}Definición 4.8. Decimos que A ⊆Rn es convexo si, para todo a, b ∈ A, el segmento Sab ⊆ A.
Teorema 4.3 (Generalización del Teorema del Valor Medio). Dados una función diferenciable
f : A ⊆ Rn → R con A abierto y convexo, y los puntos a, b ∈ A tales que a = b, existe unpunto c ∈ Sab tal que:
f (b) − f (a) = ∇ f (c), b − a =n
∑ j=1
∂ f
∂x j(c) (b j − a j)
Dem. Definimos la función α : [0, 1] → Sab ⊆ A tal que:
α(λ) = λ(b − a) + a
Resulta entonces que f ◦ α : [0, 1] → R, por lo que, por el Teorema de Lagrange, se verificaque:
( f ◦ α)(1) − ( f ◦ α)(0) = ( f ◦ α)(c)(1 − 0)para algún punto c ∈ [0, 1]. Ahora bien, tenemos que:
( f ◦ α)(1) = f (α(1)) = f ((b − a) + a) = f (b)( f ◦ α)(0) = f (α(0)) = f (0(b − a) + a) = f (a)
Entonces:
f (b)
− f (a) = ( f
◦α)(c)
27
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
29/50
Usando la regla de la cadena, se deduce que:
( f ◦ α)(c) =n
∑ j=1
∂ f
∂x j (α(c)) α j(c) = ∇ f (α(c)), b − a
La última igualdad vale puesto que:
α(c) = (b1 − a1, b2 − a2, . . . , bn − an)
Por lo tanto, α(c) ∈ Sab cumple con lo pedido.
28
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
30/50
5. Derivadas parciales de orden superior y Teorema de Taylor
Definición 5.1. Dada una función f :
Rn
→R
, utilizaremos la siguiente notación:∂
∂x1
∂ f
∂x1
=
∂2 f
∂x21∂
∂x2
∂ f
∂x1
=
∂2 f
∂x2∂x1
En el último caso, llamamos a este tipo de derivadas derivadas parciales cruzadas; a su vez,
se llama derivada de orden n a aquella derivada obtenida tras n derivaciones en variables no
necesariamente iguales.
Definición 5.2. Una función f : Rn
→ R es de clase Ck si existen y son continuas todas las
derivadas parciales de f hasta el orden k inclusive. En este caso, notaremos f ∈ Ck .Teorema 5.1 (Igualdad de derivadas cruzadas). Dada una función diferenciable f : A ⊆R2 → R con A abierto de modo que existen las siguientes derivadas en todo punto de A:
∂ f
∂x, ∂ f
∂ y,
∂2 f
∂ y∂x,
∂2 f
∂x∂ y
Si estas derivadas son continuas en un punto c ∈ A, entonces:∂2 f
∂ y∂x(c) =
∂2 f
∂x∂ y(c)
Corolario. Si f ∈ C2, entonces∂2 f
∂ y∂x(c) =
∂2 f
∂x∂ y(c)
para todo c ∈ A.
Teorema de Taylor en una variable. Dados una función f : I ⊆ R → R, tal que I es unintervalo cerrado y f es n + 1 veces derivable, y un punto a ∈ I , entonces existe c entre a y xtal que:
f (x) = n
∑ j=0
f ( j)(a)
j!
(x
− a) j + f
(n+1)(c)
(n + 1)!
(x
− a)n+1
El polinomio que aparece entre paréntesis es llamado el polinomio de Taylor de f de orden n
centrado en a, y es notado Pn,a(x) o simplemente Pa(x), mientras que el término restante esla cota del error que se produce al aproximar a la función por su desarrollo de Taylor, al
que notaremos r a(x). Si el polinomio de Taylor se halla centrado en el origen, es tambiéndenominado polinomio de Maclaurin.
Dem. Consideraremos a = x (en caso de que a = x es inmediato que c = a = x). Definimosentonces la siguiente función:
g(t) = f (x)−
Pn,t(x)−
k
(n + 1)!(x
−t)n+1
29
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
31/50
donde definiremos k de modo tal que g(a) = 0. Calculemos entonces el valor de k :
0 = g(a) = f (x) − Pn,a(x) − k
(n + 1)! (x − a)n+1
Entonces:
k = ( f (x) − Pn,a(x)) (n + 1)!(x − a)n+1
Ahora bien, se verifica que g(a) = g(x) = 0; entonces, aplicando el Teorema de Rolle,tenemos que existe c entre a y x de modo que g (c) = 0; pero resulta que:
g(t) = − f (t) + f (t) − f (t)(x − t) + f (t)(x − t) + · · · − f (n+1)(t)
n! (x − t)n + k
n!(x − t)n
= − f (n+1)(t)n!
(x − t)n + k n!
(x − t)n
En consecuencia, si g(c) = 0, entonces:
f (n+1)(c)
n! (x − c)n = k
n!(x − c)n ⇐⇒ f (n+1)(c) = k
Finalmente, tenemos que:
f (n+1)(c) = ( f (x) − Pn,a(x)) (n + 1)!(x − a)n+1
y con un simple pasaje de términos llegamos a la expresión que querı́amos demostrar.
Teorema de Taylor en varias variables. Sea f ∈ C3 una función f : A ⊆ R2 → R, con A abierto, p = ( p1, p2) ∈ A. Dados una bola B p(ε) ⊆ A conε > 0 (cuya existencia está garantizada dado que A es abierto) y un punto (x, y) ∈ B p(ε),entonces existe un punto q ∈ S p,(x, y) de modo que:
f (x, y) = f ( p) + ∂ f
∂x( p)(x − p1) + ∂ f
∂ y( p)( y − p2)
+ 1
2! ∂2 f
∂x2 ( p)(x − p1)2 + 2 ∂
2 f
∂x∂ y( p)(x − p1)( y − p2) + ∂
2 f
∂ y2 ( p)( y − p2)2
+ 1
3!
∂3 f
∂x3 (q)(x − p1)3 + 3 ∂
3 f
∂x2∂ y(q)(x − p1)2( y − p2)
+3 ∂3 f
∂x∂ y2 (q)(x − p1)( y − p2)2 + ∂
3 f
∂ y3 (q)( y − p2)3
Éste es el polinomio de Taylor de orden 2 asociado a f centrado en p (junto con su resto);
la noción es fácilmente generalizable a un orden n si disponemos de f ∈ Cn+1. Notaremosr p(x, y) al último término, que representa al resto obtenido por la aproximación por desar-rollo de Taylor, y P p(x, y) al resto del polinomio.
30
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
32/50
Dem. Definamos la función γ : [0, 1] → A de modo tal que:γ(t) = p + t((x, y)
− p)
Sea entonces g = f ◦ γ (o sea, g : [0, 1] → R). Entonces, la expresión del polinomio deMaclaurin asociado a g de orden 2 evaluado en 1 está dada por:
g(1) = g(0) + g(0) + 1
2! g(0) +
1
3! g(c)
Ahora bien, g(1) = f (γ(1)) = f (x, y) y g(0) = f (γ(0)) = f ( p). Calculando las derivadasrestantes, se deduce que la expresión anterior es equivalente a la que queremos demostrar.
El punto q estará dado por γ(c) ∈ S(x, y), p satisfaciendo lo pedido.
Proposición 5.1. Dadas las hipótesis del enunciado del Teorema de Taylor en varias vari-
ables, se verifica que:r p(x, y)
(x, y) − p2 −−−−→(x, y)→ p 0
Dem.
r p(x, y)
(x, y) − p2≤ 1
3!
∂3 f ∂x3 (q)
|x − p1|3(x, y) − p2 + . . .
≤ 13!
∂3 f ∂x3 (q) |x − p1| + . . .Ahora bien, cada sumando de la expresión final tiende a 0, puesto que |x − p1| y | y − p2|tienden a 0 al tender (x, y) a p, y las derivadas parciales son acotadas en un cierto entornode p, por ejemplo B p(
ε2 ) ⊆ B p(ε), dado que dicho entorno es compacto.
Definición 5.3. Dada una función f ∈ C2 tal que f : A ⊆ R2 → R, llamamos matriz hessianade f a la matriz conformada por las derivadas segundas de f , a la cual notamos H f ( p); esdecir:
H f ( p) = ∂
2 f ∂x2
( p) ∂2 f
∂x∂ y ( p)
∂2 f ∂ y∂x ( p)
∂2 f ∂ y2
( p)
La matriz hessiana facilita la escritura del polinomio de Taylor de orden 2, dado que:
P p(x, y) = f ( p) + ∇ f ( p), (x, y) − p + 12!
((x, y) − p) H f ( p) ((x, y) − p)T
El concepto de matriz hessiana es generalizable a funciones deRn aR, en cuyo caso la matriz
pertenecerá a Rn×n.
Observación. Dado que f ∈ C2, las derivadas parciales cruzadas son equivalentes, y por lotanto la matriz hessiana es simétrica.
31
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
33/50
6. Extremos
Definición 6.1. Dados una función f : A ⊆
Rk
→ R
con A abierto y un punto p ∈ A,decimos que p es un m´ aximo local de f si f ( p) ≥ f (x) para todo x ∈ B p(ε) para algún radioε > 0. Si la desigualdad es estricta, lo llamamos m´ aximo local estricto. La definición para
mı́nimos es análoga. Llamamos extremos locales de f a los máximos y mı́nimos locales de f .
Teorema de Fermat. Si un punto p ∈ A es extremo local de una función f : A ⊆ R2 → Rcon A abierto y derivable en p, entonces ∇ f ( p) = (0, 0)Dem. Supongamos sin pérdida de generalidad que p es un máximo local. Entonces, f ( p) ≥ f (x) para todo x ∈ B p(ε) con ε > 0; en particular, f ( p) ≥ f (x1, p2) para todo x1 ∈ ( p1 − ε, p1 + ε), por lo que f x( p) = 0. El razonamientoes análogo para f y( p), y en general, para cualquier derivada direccional, por lo que además,
f es diferenciable en p.
Definición 6.2. Dados una función f : A ⊆ Rn → R con A abierto y un punto p ∈ A,decimos que p es un punto crı́tico de f si ∇ f ( p) = 0̄. Es claro que esto define una condiciónnecesaria para los extremos, pero no suficiente, por lo demostrado por el teorema de Fermat.
Definición 6.3. Si p es un punto crı́tico de f : A ⊆ Rn → R con A abierto, pero no es unextremo de f , lo llamamos punto silla o punto de ensilladura de f .
Proposición 6.1. Toda matriz simétrica es diagonalizable.
Dem. Para la demostración de esta proposición utilizaremos varios conceptos de álgebra lin-
eal. En principio, si A ∈ Rn×n es simétrica, entonces todos sus autovalores λ1, . . . , λn sonreales y existe una base ortonormal de autovectores de A. Recordemos que λ es un auto-
valor de A y x su autovector asociado si x = 0 y AxT = λxT , y un conjunto de vectores esortonormal si todos sus vectores son unitarios y ortogonales entre sı́.
Además, si B = {v1, . . . , vn} es una base ortonormal deRn, se verifica que, para todo x ∈Rn:
x =n
∑ i=1
vixi, vi
Reescribiendo A en función de su matriz de cambio de base para la base ortonormal de
autovectores, tenemos que
xAxT = y
λ1 0. . .
0 λn
yT = n∑
i=1
λi y2i
donde y i = xi, vi. De este modo, la matriz de cambio de base resulta diagonal, y ademástenemos que
xAxT =n
∑ i=1
λixi, vi2
32
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
34/50
Lema 6.1. Dados una función f : A ⊆ R2 → R, con A abierto y f ∈ C2 en A, p ∈ A unpunto crı́tico de f y v ∈ R2 un vector unitario tal que v H f ( p) vT > 0 entonces la función f
v
(t) = f ( p + tv) tiene un mı́nimo local estricto en 0 (y tiene un máximo si la desigualdadse invierte).
Dem. Como p ∈ A y A es abierto, f v está bien definida en un entorno ( p − ε, p + ε). En-tonces, f v : ( p − ε, p + ε) → R y además, podemos ver que f v es la composición f ◦ γv, conγv(t) = p + tv.
Si derivamos f v, obtenemos, por regla de la cadena:
f v(t) = ∇ f ( p + tv), v = ∂ f
∂v(x) ( p + tv)
pues γ
v
(t) = v. Ahora bien, es claro que: f v
(0) = ∇ f ( p), v = (0, 0), v = 0
ya que p es punto crı́tico de f ; por lo tanto, 0 es un punto crı́tico de f v.
Además:
f v
(t) = ( f xx( p + tv)v1 + f xy( p + tv)v2)v1 + ( f yx( p + tv)v1 + f yy( p + tv)v2)v2
= f xx ( p + tv)v21 + 2 f xy( p + tv)v1v2 + f yy( p + tv)v
22
= v H f ( p) vT > 0
Es claro entonces que 0 es un mı́nimo local estricto de f v
. La demostración es análoga paralos máximos.
Teorema 6.1 (Criterio de la matriz hessiana). Sean f : A ⊆ Rn → R con A abierto y f ∈ C3en A, p ∈ A un punto crı́tico de f y
H f ( p) =
a b
b c
Sea entonces d = det( H f ( p)) = ac − b2. Si d > 0, entonces p es un extremo local de f . Enparticular, si a > 0, p es un mı́nimo estricto, y si a < 0, p es un máximo estricto. Ahora bien,
si d<
0 entonces p es un punto silla de f . El criterio no aporta información si d = 0.Dem. Por lo visto en la Proposición 6.1, podemos realizar un cambio de base sobre H f ( p) demodo que:
H f ( p){v1,v2} =
λ1 0
0 λ2
donde v1, v2 son los autovectores de la matriz y λ1, λ2 sus autovalores asociados. Dado que
el determinante y la traza de una matriz son invariantes respecto de un cambio de base,
tenemos además que:
det( H f ( p)) = ac − b2 = λ1λ2 = det
H f ( p){v1,v2}tr( H f ( p)) = a + c = λ1 + λ2 = tr
H f ( p){v1,v2}
33
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
35/50
Demostraremos primero el caso en el que d > 0. En este caso, es claro que λ1 = 0 = λ2 yque λ1 y λ2 tienen el mismo signo (e idénticamente para a y c).
Sea S = {u ∈ R2 : u = 1}. Es claro que S es compacto. Dada la función h : S → Rdefinida como:
h(u) = 1
2u H f ( p) u
T
Notemos que h(u) > 0 para todo u ∈ S porque suponemos que la matriz hessiana es detraza positiva. Finalmente, por el teorema de valores extremos de Weierstrass, h alcanza un
mı́nimo en un punto u0 ∈ S, es decir, h(u) ≥ h(u0) > 0 para todo u ∈ S. Llamaremos β = h(u0) y definimos α =
β2 ; entonces, 0 < α < β.
Dado que f
∈ C3, existe δ > 0 tal que, si 0 <
x
− p
< δ, entonces:
0 ≤ |r2(x)|x − p2 < α 0. Entonces:
v H f ( p) vT = λ1 v2 > 0
v H f ( p) vT = λ2
v
2< 0
Entonces, por lo demostrado en el Lema 6.1, la función f v(t) tiene un mı́nimo en 0, pero f v
(t) tiene un máximo en 0. Por lo tanto, todo entorno de p tiene puntos mayores y menores
a p; consiguientemente, p es un punto silla de f .
Además, el criterio es generalizable a Rn, observando que habrá un extremo en p si todos
los autovalores poseen el mismo signo (sera mı́nimo si todos son positivos, máximo si todos
son negativos); habrá un punto silla si hay algunos autovalores positivos y otros negativos,
y el criterio no brindará información si hay algún autovalor nulo.
34
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
36/50
7. Teoremas de la función inversa y la función implı́cita
Teorema de la función inversa. Dados una función f : A ⊆
Rn
→ R
con A abierto y f ∈ C1 en A y p ∈ A, si D f ( p) es inversible (es decir, J f ( p) admite inversa), entonces existenconjuntos U , V ∈ Rn abiertos tales que p ∈ U , f ( p) ∈ V tales que la restricción f : U → V es
biyectiva. Más aún, su inversa, f −1 : V → U es C1 en V y su diferencial verifica que:
D f −1 ( f (a)) = D f (a)−1
D f −1(b) = D f
f −1(b)−1
con a ∈ U , b ∈ V .
Teorema de la función implı́cita. Dados una función g : A ⊆ R2
→ R con A abierto y g ∈ C1 en A, p ∈ A, c = g( p) y S el conjunto definido tal que:
S = {(x, y) ∈ A : g(x, y) = c}
es decir, S es la curva de nivel de f que contiene a p. Si ∂ g∂ y ( p) = 0, entonces existen ε1, ε2 > 0
y ϕ : B p1 (ε1) → B p2 (ε2) con ϕ ∈ C1 tales que:(1). ϕ( p1) = p2(2). (x, y) ∈ S ⇐⇒ y = ϕ(x) para todo (x, y) ∈ B p1 (ε1) × B p2 (ε2)(3). Si x ∈ B p1 (ε1) entonces:
ϕ(x) = − gx (x, ϕ(x)) g y (x, ϕ(x))
Análogamente, si ∂ g∂x ( p) = 0, entonces existen δ1, δ2 > 0 y ψ : B p2 (δ2) → B p1 (δ1) con ψ ∈ C1
tales que:
(1). ψ( p2) = p1(2). (x, y) ∈ S ⇐⇒ x = ψ( y) para todo (x, y) ∈ B p1 (δ1) × B p2 (δ2)(3). Si y ∈ B p2 (δ2) entonces:
ψ( y) = − g y (ψ( y), y) gx (ψ( y), y)
El teorema es generalizable a funciones con dominio en Rn; por ejemplo, para el caso R3, el
teorema asegura la existencia de una función ϕ tal que ϕ( p1, p2) = p3, g(x, y, z) = g( p) si ysólo si z = ϕ(x, y) para todo (x, y, z) en un entorno de p, y además:
∇ϕ(x, y) =
− gx (x, y, ϕ(x, y)) g z (x, y, ϕ(x, y))
, − g y (x, y, ϕ(x, y)) g z (x, y, ϕ(x, y))
En particular,
∇ϕ( p) =
− gx( p) g z( p)
, − g y( p) g z( p)
35
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
37/50
Dem. El punto (3) se deduce observando que, para todo (x, y) ∈ S, g (x, ϕ(x)) = g(x, y) =c = g( p). Entonces:
0 = g (x, ϕ(x)) − c0 = gx (x, ϕ(x)) + g y (x, ϕ(x)) ϕ
(x)
ϕ(x) = − gx (x, ϕ(x)) g y (x, ϕ(x))
Observación. En el caso presentado en el enunciado del teorema, la recta tangente a la curva
de nivel que contiene a p es perpendicular al gradiente de g en p y está dada por la ecuación
(suponiendo g y( p) = 0):
0 = (x, y) − p, ∇ g( p)0 = (x − p1) gx( p) + ( y − p2) g y( p)
y − p2 = − gx( p) g y( p)
(x − p1)
y − p2 = ϕ( p1) (x − p1)Esto se debe a que la recta tangente al gráfico de ϕ es la misma que la de la curva de nivel,
en un cierto entorno de p.
Además, el plano tangente a una superficie de nivel de una función g : A ⊆ R3 → Rque cumple las hipótesis del teorema de la función implı́cita está dado por la ecuación:
(x, y, z) − p, ∇ g( p) = 0Esto se debe a que, suponiendo g z( p) = 0 en un cierto entorno de un punto p ∈ A, tenemos,por el teorema de la función implı́cita, g(x, y, z) = g( p) si y sólo si z = ψ(x, y) para ciertafunción ψ ∈ C1 en A. Entonces, el plano tangente a S en p es el plano tangente al gráfico deψ en ( p1, p2, ψ( p1, p2)) = p, es decir:
z − p3 = ψx( p1, p2)(x − p1) + ψ y( p1, p2)( y − p2)⇐⇒ 0 = z − p3 − ψx( p1, p2)(x − p1) − ψ y( p1, p2)( y − p2)
= g z( p)( z − p3) + gx( p)(x − p1) + g y( p)( y − p2) g z( p)=
(x, y, z) − p, ∇ g( p) g z( p)
= (x, y, z) − p, ∇ g( p)Teorema de la función implı́cita. Veamos un enunciado alternativo del teorema de la función
implı́cita enfocado a intersecciones de superficies. Sean g1, g2 : A ⊆ R3 → R con A abiertoy g1, g2 ∈ C1 en A, p ∈ A y S la intersección de las superficies de nivel en p de ambasfunciones, es decir:
S = {(x, y, z) ∈ A : g1(x, y, z) = g1( p), g2(x, y, z) = g2( p)}36
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
38/50
Entonces, si:
det g1 y( p) g1 z( p)
g2 y( p) g2 z( p)
= 0
existen ε1, ε2, ε3 > 0 y dos funciones ψ1, ψ2 ∈ C1 de modo que ψ1 : {|x − p1| < ε1} →{| y − p2| < ε2} y ψ2 : {|x − p1| < ε1} → {| z − p3| < ε3} siempre que:
(x, y, z) ∈ {|x − p1| < ε1, | y − p2| < ε2, | z − p3| < ε3} = B
Además, se verifica que:
(1). ψ1( p1) = p2 y ψ2( p1) = p3
(2). (x, y, z) ∈ S ⇐⇒ y = ψ1(x), z = ψ2(x) para todo (x, y, z) ∈ B(3). Si
|x
− p1
|< ε1, entonces:
ψ1(x) = −det
g1x g1 z g2x g2 z
(x,ψ1(x),ψ2(x))
det
g1 y g1 z g2 y g2 z
(x,ψ1(x),ψ2(x))
ψ2(x) = −det
g1 y g1x g2 y g2x
(x,ψ1(x),ψ2(x))
det g1 y g1 z g2 y g2 z(x,ψ1(x),ψ2(x))
Dem. Demostraremos el punto (3). Para abreviar, notaremos α = (x, ψ1(x), ψ2(x)). A partirde (1) y (2), sabemos que:
g1(α) = g1( p)
g2(α) = g2( p)
Entonces, por regla de la cadena: g1x(α) + g1 y(α)ψ
1(α) + g1 z(α)ψ
2(α) = 0
g2x(α) + g2 y(α)ψ1(α) + g2 z(α)ψ
2(α) = 0
Lo cual es equivalente a: g1 y(α)ψ
1(α) + g1 z(α)ψ
2(α) = − g1x(α)
g2 y(α)ψ1(α) + g2 z(α)ψ
2(α) = − g2x(α)
Reescribiendo el sistema en forma matricial: g1 y g1 z g2 y g2 z
(α)
ψ1ψ2
(α)
= −
g1x g2x
(α)
Luego, el resultado se deduce resolviendo el sistema por medio de la regla de Kramer.
37
-
8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)
39/50
8. Extremos restringidos
Multiplicadores de Lagrange. Sean g : A ⊆
R2
→R
, con A abierto, g ∈ C1
en A, c ∈R
y Sla superficie de nivel c de g, es decir, S = {(x, y) ∈ A : g(x, y) = c} y ∇ g(x, y) = 0 para todo(x, y) ∈ S.Además, sean f : A → R, f ∈ C1 en A y p ∈ S tal que p sea un extremo local de f sobre S (notaremos a la restricción de f a S como f |S ), es decir, que exista r > 0 tal que si(x, y) ∈ B p(r) y (x, y) ∈ S, entonces f (x, y) ≥ f ( p) si p es mı́nimo o f (x, y) ≤ f ( p) si p esmáximo.
Entonces, existe λ ∈R tal que ∇ f ( p) = λ∇ g( p)Dem. Supongamos sin pérdida de generalidad que p es un mı́nimo local de f sobre S y que
g y( p) = 0. Entonces, por el teorema de la función implı́cita, existe ϕ ∈ C1 tal que, en unentorno de p, (x, y) ∈ S si y sólo si y = ϕ(x). Además:
ϕ(x) = − gx (x, ϕ(x)) g y (x, ϕ(x))
Pero entonces, por hipótesis, p1 es un mı́nimo local de h(x) = f (x, ϕ(x)), con h : ( p1 −ε1, p1 + ε1). Por lo tanto, h
( p1) = 0. Tenemos entonces, por regla de la cadena:
0 = f x ( p1, ϕ( p1)) + f y ( p1, ϕ( p1)) ϕ( p1)
⇐⇒ f x ( p1, ϕ( p1)) = − f y ( p1, ϕ( p1)) ϕ( p1)⇐⇒ f x ( p1, ϕ( p1)) = f y ( p1, ϕ( p1)) gx ( p1, ϕ( p1))
g y ( p1, ϕ( p1))
⇐⇒ f x ( p1, ϕ( p1)) = f y ( p1, ϕ( p1))
g y ( p1, ϕ( p1)) gx ( p1, ϕ( p1))
Llamemos entonces:
λ = f y ( p1, ϕ( p1))
g y ( p1, ϕ( p1))
Es claro que:
f y ( p1, ϕ( p1)) = λ g y ( p1, ϕ( p1))
Por lo tanto, ∇ f ( p) = λ∇ g( p)
Enunciaremos ahora algunas ge