análisis i (notas de la teórica - 2c 2011)

8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

1/50

Análisis I


2/50

Contenidos

1. R como cuerpo ordenado completo . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Construcción axiomática de R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Supremo, ́ınfimo y el axioma de completitud . . . . . . . . . . . . . . . . . . . 5

Valor absoluto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5Principio arquimediano de N . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2. Lı́mite de sucesiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Sucesiones acotadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Sucesiones monótonas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Subsucesiones y el Teorema de Bolzano-Weierstrass . . . . . . . . . . . . . . . 6

Métricas en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

Lı́mite de sucesiones en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

Nociones de topologı́a en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3. Continuidad y lı́mite de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

Álgebra de lı́mites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Teorema de Bolzano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

Teorema de valores extremos de Weierstrass . . . . . . . . . . . . . . . . . . . 16

4. Derivabilidad y diferenciabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Derivabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Teoremas de valor medio de Rolle, Lagrange y Cauchy . . . . . . . . . . . . . 17

Derivadas parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

Derivadas direccionales y vector gradiente . . . . . . . . . . . . . . . . . . . . 20

Diferenciabilidad y plano tangente . . . . . . . . . . . . . . . . . . . . . . . . . 20

Matriz diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

Regla de la cadena en funciones de Rn a Rk . . . . . . . . . . . . . . . . . . . . 25Generalización del teorema de valor medio . . . . . . . . . . . . . . . . . . . . 27

5. Derivadas parciales de orden superior y Teorema de Taylor . . . . . . . . . . . . 29

Derivadas parciales cruzadas en funciones C2 . . . . . . . . . . . . . . . . . . . 29

Teorema de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

Matriz hessiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

6. Extremos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

Extremos locales y el Teorema de Fermat . . . . . . . . . . . . . . . . . . . . . 32

Criterio de la matriz hessiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

7. Teoremas de la función inversa y la función implı́cita . . . . . . . . . . . . . . . . 35

Teorema de la función inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

1


3/50

Teorema de la función implı́cita . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

8. Extremos restringidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

Multiplicadores de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389. Integración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

Sumas inferiores y superiores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

Propiedades de la integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

Teorema fundamental del cálculo . . . . . . . . . . . . . . . . . . . . . . . . . . 43

Regla de Barrow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

Fórmula de cambio de variable . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

Integrales impropias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

Integración en varias variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

Conjuntos de contenido cero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

Teorema de Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

Criterio de convergencia integral de Cauchy-Maclaurin . . . . . . . . . . . . . 48Cambio de variables en integrales dobles . . . . . . . . . . . . . . . . . . . . . 49

Coordenadas polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

2


4/50

1. R como cuerpo ordenado completo

Definición 1.1. Llamamos conjunto de n´ umeros reales (notado

R) al conjunto que conformaun cuerpo ordenado completo (R, +, ·, 0).Observación 1.1.3. Los axiomas que definen a R implican, para todo a ∈R:

(1). 0a = 0 = a0

(2). (−a) = (−1)a(3). 0 < 1

Dem. Derivamos utilizando los axiomas:

3


5/50

(1).

(∀

a ∈R)a = a

S3⇐⇒ a = 0 + aP3⇐⇒ 1a = 0 + aS3⇐⇒ (0 + 1)a = 0 + aD⇐⇒ 0a + 1a = 0 + aP3⇐⇒ 0a + a = 0 + aS4⇐⇒ 0a + a + (−a) = 0 + a + (−a)S4

⇐⇒ 0a + 0 = 0 + 0

S3⇐⇒ 0a = 0(2).

(∀a ∈R)0a = 0S4⇐⇒ (1 + (−1))a = 0D⇐⇒ 1a + (−1)a = 0P3⇐⇒ a + (−1)a = 0S4

⇐⇒ a + (−1)a + (−a) = 0 + (−a)S1⇐⇒ a + (−a) + (−1)a = 0 + (−a)S4⇐⇒ 0 + (−1)a = 0 + (−a)S3⇐⇒ (−1)a = (−a)

(3). Supongamos 1 < 0. Elegimos a ∈ R tal que a > 0. Entonces, por O4, 1a < 0a P3⇐⇒a < 0a

(1)⇐⇒ a < 0, lo cual es contradictorio.

Definición 1.2. Definimos al conjunto de reales positivos (notados R+) de modo que R+ =

{x ∈R : x > 0}Definición 1.3. Dados a, b ∈ R definimos al intervalo abierto (a, b) como el conjunto (a, b) ={x ∈R : a < x < b} y al intervalo cerrado [a, b] como el conjunto [a, b] = {x ∈ R : a ≤ x ≤ b}Definición 1.4. Dado A ⊆R, decimos que A es acotado superiormente si existe x ∈R tal que x ≥ y para todo y ∈ A. Cualquier x que satisfaga esta condición es llamada cota superior de A.Análogamente, decimos que A es acotado inferiormente si existe x ∈R tal que x ≤ y para todo y ∈ A. Cualquier x que satisfaga esta condición es llamada cota inferior de A.

Proposición 1.1. Todo subconjunto finito de R es acotado inferior y superiormente.

4


6/50

Definición 1.5. Dado A ⊆ R, A = ∅ acotado superiormente, decimos que s ∈ R es elsupremo de A y notamos s = sup A si s es cota superior de A y si, dada otra cota superior s

de A, se cumple que s ≤ s. Si sup A ∈ A lo llamamos m´ aximo y lo notamos max A.Análogamente, decimos que i ∈ R es el ı́nfimo de A y notamos i = inf A si i es cota inferiorde A y si, dada otra cota inferior i de A, se cumple que i ≥ i. Si inf A ∈ A lo llamamosmı́nimo y lo notamos min A.

Proposición 1.2. Dado A ⊆R, A = ∅ acotado superiormente, s = sup A es equivalente a:(1) s es cota superior de A y, para todo s < s, existe as ∈ A tal que s < as ≤ s(2) s es cota superior de A y, para todo ε > 0, existe aε ∈ A tal que s − ε < aε ≤ s

Se pueden demostrar afirmaciones análogas para el ı́nfimo utilizando un argumento simétrico

a la siguiente demostración:

Dem. Si s = sup A entonces s es la menor de las cotas superiores de A, por lo tanto paracualquier s < s existe as ∈ A tal que s < as ≤ s ya que, en caso contrario, s serı́a cotasuperior de A y s no serı́a supremo. (2) es equivalente ya que si s 0tal que s = s + ε (ver Observación 1.1.2).

Axioma de completitud. Para todo A ⊆R, A = ∅ acotado superiormente, existe sup A.Corolario del axioma de completitud. Para todo A ⊆ R, A = ∅ acotado inferiormente,existe inf A.

Dem. Dado A, construimos el conjunto A = {−x : x ∈ A}. Ya que A ⊆ R y A = ∅ , existes = sup A

por el axioma de completitud. Entonces, s

≥ −x para todo x

∈ A, y deducimos

ası́ que s ≤ x para todo x ∈ A, por lo tanto s = inf A.

Definición 1.6. Definimos la función m´ odulo o valor absoluto (notada |x|) tal que:

|x| =

x si x ≥ 0−x si x < 0

Propiedades del módulo. Dados a, x, y ∈R con a > 0 se verifica que:

(1) x ≤ |x| = |− x|(2) x

2

= |x2

| = |x|2

(3) |x| < a ⇐⇒ x ∈ (−a, a)(4) |x| > a ⇐⇒ x ∈ (−∞, −a) ∪ (a, +∞)(5) |x + y| ≤ |x| + | y| (desigualdad triangular)(6) ||x| − | y|| ≤ |x − y|(7) ||x| − | y|| ≤ |x + y|(8) |xy| = |x|| y|

Principio arquimediano de N. Para todo x ∈R existe n ∈N de modo que n > x.Dem. Dado x ∈R, x + 1 ∈ N verifica lo pedido.

5


7/50

2. Lı́mite de sucesiones

Definición 2.1. Llamamos una sucesi´ on de elementos de A a cualquier función f :

N → A. Engeneral, utilizaremos la notación (xn)n∈N para referirnos a una sucesión f de números reales

y notaremos xn a f (n). Además, notamos (xn)n∈N ⊆ B si xn ∈ B para todo n ∈N.

Definición 2.2. Una sucesión (xn)n∈N se dice acotada superiormente si existe x ∈ R tal quex ≥ xn para todo n ∈ N. Análogamente, (xn)n∈N se dice acotada inferiormente si existex ∈ R tal que x ≤ xn para todo n ∈ N. (xn)n∈N se dice acotada si es acotada inferior ysuperiormente.

Definición 2.3. Decimos que una sucesión (xn)n∈N de números reales tiende a x ∈R (o bienx es el lı́mite de (xn)n∈N ) si, para todo ε > 0, existe n0 ∈ N tal que |xn − x| < ε para todon ≥ n0. En este caso notamos limn→∞xn = x, o bien xn −−−→n→∞ x. Una sucesión que tienelı́mite se dice convergente.

Proposición 2.1. Dados A ⊆ R, A = ∅ y acotado superiormente, s = sup A, existe unasucesión (xn)n∈N ⊆ A tal que xn −−−→

n→∞ s.Análogamente, dados A ⊆R, A = ∅ y acotado inferiormente, i = inf A, existe una sucesión(xn)n∈N ⊆ A tal que xn −−−→

n→∞ i.

Dem. Dado s = sup A, para cada n ∈ N elegimos xn ∈ A de modo que s − 1n < xn ≤ s <s + 1n (ver Proposición 1.2). Queda determinada ası́ una sucesión (xn)n∈N ⊆ A en donde severifica que

|xn

− s

| <

1

n

para todo n

∈ N. Consecuentemente, dado ε

∈ R+ basta tomar

n0 ≥ 1ε para que se verifique |xn − s| < ε para cualquier n ≥ n0. Entonces xn −−−→n→∞ s.La demostración es análoga para el ı́nfimo.

Definición 2.4. (xn)n∈N se dice mon´ otona creciente si xn ≤ xn+1 para todo n ∈N. Análogamente,(xn)n∈N se dice mon´ otona decreciente si xn ≥ xn+1 para todo n ∈N.Decimos que la monotonı́a es estricta si xn = xn+1 para todo n ∈N.Proposición 2.2. Si (xn)n∈N es monótona creciente y acotada superiormente, xn −−−→

n→∞ supn∈N{xn}.Análogamente, si (xn)n∈N es monótona decreciente y acotada inferiormente, xn −−−→

n→∞ inf n∈N{xn}.

Dem. Consideremos el conjunto A = {xn : n ∈ N}. Llamaremos s al supremo de A, elcual existe ya que (xn) es acotada. Entonces, dado ε ∈ R+, vemos que existe n0 tal ques − ε


8/50

Dem. Dado que (xn)n∈N es acotada, basta con ver que tiene una subsucesión monótona paraasegurarnos de que también es convergente. Para demostrar esta proposición, primero in-

troduciremos la siguiente definición:

Dada (xn) ⊆ R, decimos que el ı́ndice n es un punto cumbre de la sucesión si para todo p > n se verifica que xn > x p

Consideremos entonces el conjunto A = {n ∈N : n es punto cumbre de (xn)}Supongamos que A es finito. Entonces existe n1 ∈ N tal que para todo n ≥ n1, n no es unpunto cumbre. Por lo tanto, existe n2 ∈ N tal que n2 > n1 y xn1 ≤ xn2 , dado que n1 no espunto cumbre. A su vez, también existe n3 ∈ N tal que n3 > n2 y xn2 ≤ xn3 , dado que n2tampoco es punto cumbre. De este modo, podemos construir una subsucesión estrictamente

creciente de la sucesión original.

Ahora bien, supongamos que A es infinito. Entonces, podemos construir una sucesión cre-

ciente n1 < n2 < n3 < . . . de puntos cumbre de la sucesión. Pero entonces xn1 ≥ xn2 ≥xn3 ≥ . . . dado que cada ı́ndice es un punto cumbre. De este modo, podemos construir unasubsucesión estrictamente decreciente de la sucesión original.

Definición 2.6. Dado un conjunto A, decimos que la función d : A × A → R define unam´ etrica en A si verifica que, para todo x, y, z ∈ A:

(1). d(x, y) ≥ 0

(2). d(x, y) = d( y, x)(3). d(x, y) ≤ d(x, z) + d( z, y)Observación. d(x, y) = |x − y| define una métrica sobre R.Definición 2.7. Llamamos norma euclı́dea a la función · : Rn → R definida como:

x = n∑

j=1

x2 j

La norma euclı́dea es tambı́en notada x2

Observación. La norma euclı́dea verifica que, para todo x ∈Rn

:(1) 0 ≤ x(2) cx = |c| · x para todo c ∈R(3) x ∈R ⇒ x = |x|Definición 2.8. Llamamos norma infinito o norma sup a la función · ∞ : Rn → R definidacomo:

x∞ = max j∈{1,2,...,n}

|x j|Observación. Tanto la norma euclı́dea como la norma infinito definen métricas sobre Rn;

nos referimos a la norma euclı́dea al hacer referencia a distancias en Rn salvo que sea especi-

ficado lo contrario.

7


9/50

Proposición 2.3. Para todo x ∈Rn se cumple que x∞ ≤ x ≤ √

nx∞Dem.

x

∞

≤ x

si y sólo si

|x j

| ≤ x

para todo j

∈ {1 , 2 , . . . , n

}, pero esto es obvio ya

que:

|x j| =

x2 j ≤

x21 + x22 + · · · + x2 j + · · · + x2n = x

Además, como x∞ = max|x j|:

x =

x21 + x22 + · · · + x2n ≤

nx2∞ =

√ nx∞

Definición 2.9. Definimos la bola de centro x ∈ Rn y radio r ∈ R (notada Bx(r) o bien B(x, r))al conjunto definido como:

Bx(r) = { y ∈Rn : d(x, y) < r}Definición 2.10. Un conjunto A ∈Rn se dice acotado si existe M ∈ R tal que ||a|| ≤ M(∀a ∈ A), o, equivalentemente, A ⊆ B M(0) (en general, entendemos como el punto 0 ∈ Rk al punto(0 , . . . , 0)). Una sucesión ( pn)n∈N ⊆ Rn se dice acotada si existe M ∈ R tal que pn ≤ Mpara todo n ∈N.

Definición 2.11. Decimos que una sucesión ( pn)n∈N ⊆ Rn tiende a p ∈ Rn (o bien p es ellı́mite de ( pn)n∈N) si para todo ε > 0 existe n0 ∈ N tal que pn − p < ε, para todo n ≥ n0; o,equivalentemente, si para todo ε > 0 existe n0 ∈ N tal que pn ∈ B p(ε), para todo n ≥ n0.

Esto generaliza la noción de lı́mite introducida en la Definición 2.3, de la que seguiremos

utilizando su notación.

Proposición 2.4. Una sucesión ( pk = ( pk 1 , pk 2 , . . . , pk n ))k ∈N ⊆ Rn converge a un valor l =(l1, l2, . . . , ln) si y sólo si se verifica:

( pk j ) −−→k →∞

l j para todo j ∈ {1 , 2 , . . . , n}

Dem. (⇒) Supongamos que pk −−−→n→∞ l, es decir, para todo ε > 0 existe k 0 ∈ N de modo que

pk − l < ε para cualquier k ≥ k 0. Pero, por lo demostrado en la Proposición 2.3, tenemosque:

max j∈{1,2,...,n}

| pk j − l j|

= pk − l∞ ≤ pk − l < ε

lo cual implica que cada coordenada de la sucesión tiende a su correspondiente coordenada

del lı́mite.

(⇐) Supongamos que pk j tiende a l j para todo j ∈ {1 , 2 , . . . , n}. Dado ε > 0, definimosε = ε√

n. Dado que todas las coordenadas tienden a su correspondiente lı́mite, existe k 0 ∈ N

tal que | pk j − l j| < ε si k ≥ k 0 para todo j ∈ {1 , 2 , . . . , n}. Entonces, tenemos que:

max j∈{1,2,...,n}| pk j − l j| < ε

8


10/50

Y por lo demostrado en la Proposición 2.3:

p

k −l ≤

√ n p

k −l∞ < ε

Por lo tanto, pk −−−→n→∞ l

Proposición 2.5. Si una sucesión de puntos de Rn es convergente, entonces es acotada.

Dem. Llamemos (xn)n∈N a la sucesión y l a su lı́mite. Existe entonces n0 ∈ N tal que |xn −l| < 1 para todo n ≥ n0, por lo que m = l + 1 > xn a partir de n0. Sea A = {xn : n ≤ n0}, essimple ver que A es finito y, por lo demostrado en la Proposición 1.1, acotado. Por lo tanto,

sup ( A ∪ {m}) es cota superior de la sucesión.La demostración es análoga para cotas inferiores.

Definición 2.12. El complemento de un conjunto A ∈ Rn, notado Ac, es el conjunto definidocomo Ac = {x ∈ Rn : x ∈ A}Definición 2.13. Un conjunto A ∈Rn se dice abierto si para todo p ∈ A existe r ∈R+ tal que B p(r) ⊆ A. Además, A se dice cerrado si Ac es abierto.

Proposición 2.6. Un conjunto A ∈ Rn es cerrado si y sólo si toda sucesión de elementos de A converge a un elemento de A.

Dem. (⇒) Supongamos A ∈ Rn cerrado y (xn) ⊆ A tal que xn → p. Si p ∈ A, entonces p ∈ Ac. Ac es abierto por hipótesis, ya que A es cerrado. Por lo tanto, existe r ∈ R+ tal quela bola centrada en p de radio r está totalmente contenida en A

c

. Pero, dado este r , existen0 ∈ N tal que |xn0 − p| < r ya que xn → p. Entonces xn0 ∈ A y xn0 ∈ Ac, lo cual es absurdo.Por lo tanto, p ∈ A.

(⇐) A ∈ Rn es un conjunto tal que toda sucesión de elementos de A converge a un ele-mento de A. Supongamos que A no es cerrado. Entonces, Ac no es abierto, por lo tanto

existe x ∈ Ac tal que toda bola centrada en x contiene elementos de A. Construimos en-tonces la sucesión (xn) tal que xn es un punto de A contenido en la bola centrada en x deradio 1n . Pero entonces xn es una sucesión de elementos de A que converge a x ∈ A, lo cuales absurdo. Por lo tanto, A es cerrado.

Definición 2.14. Dado un conjunto A ∈Rn, definimos los siguientes conjuntos:(1) La frontera de A, notada ∂ A y definida:

∂ A = {x ∈Rn : Bx(r) ∩ A = ∅ y Bx(r) ∩ Ac = ∅ para todo r > 0}

(2) La clausura de A, notada ¯ A y definida ¯ A = A ∪ ∂ A(3) El interior de A, notado Ao y definido:

Ao = {x ∈ A : existe r > 0 tal que Bx(r) ⊆ A)}

Observación. Dado un conjunto A ∈Rn, ¯ A es el menor cerrado que contiene a A, y Ao es elmayor abierto contenido en A.

9


11/50

Definición 2.15. Definimos la bola cerrada de centro x ∈Rn y radio r ∈ R (notada Bx(r) o bienB(x, r)) al conjunto definido como:

Bx(r) = { y ∈Rn : d(x, y) ≤ r}

o equivalentemente, como la clausura de Bx(r)

Definición 2.16. Un conjunto A ∈Rn se dice compacto si es cerrado y acotado.

10


12/50

3. Continuidad y lı́mite de funciones

Definición 3.1. Dada una función f : A → B, la imagen de f , notada Im( f ), es el conjuntodefinido como

Im( f ) = { y ∈ B : existe x ∈ A tal que y = f (x)}Definición 3.2. Dada una función f : A ⊆ Rn → R, el gr´ afico de f , notado gr( f ), es elconjunto definido como

gr( f ) =

(x1, . . . , xn, xn+1) ∈Rn+1 : ( y = (x1, . . . , xn) ∈ A ∧ xn+1 = f ( y))

Definición 3.3. Dados una función f : A ⊆ R2 → R y c ∈R, definimos la curva de nivel de f asociada a c, notada CNc( f ), como el conjunto:

CNc( f ) =

(x1, x2) ∈R2 : f (x1, x2) = cObservación. CNc( f ) = ∅ si y sólo si c ∈ Im( f )Definición 3.4. Dados una función f : A ⊆Rn → R, p ∈ ¯ A y l ∈ R, decimos que f (x) tiendea l cuando x tiende a p, o bien que l es el lı́mite de f (x) al tender x a p si se cumple que:

(∀ε ∈R+)(∃δ ∈R+) tal que (0 < x − p < δ con x ∈ A) ⇒ | f (x) − l| < εEn tal caso, notamos lim

x→ p f (x) = l , o bien f (x) −−→x→ p l.

Proposición 3.1 ( Álgebra de lı́mites). Dados un conjunto A ⊆ Rn, el punto p ∈ ¯ A y lasfunciones f : A →R y g : A →R tales que limx→ p f (x) = l1 y limx→ p g(x) = l2. Entonces:

(1). limx→ p( f + g)(x) = l1 + l2(2). (∀c ∈R)limx→ p(c f )(x) = cl1(3). limx→ p( f g)(x) = l1l2(4). Si l1 = 0, entonces existe δ ∈ R+ tal que, si 0 < ||x − p|| < δ (con

x ∈ A) entonces | f (x)| ≥ |l1|2 > 0. En particular, f (x) = 0 en algún entorno de p.

(5). Si l1

= 0, entonces limx→ p 1 f (x) = 1l1

(6). Si l2 = 0, entonces limx→ p

f g

(x) = l1l2

Dem. (1). Dado ε ∈ R+, definimos ε = ε2 . Dado que f tiende a l1 y g tiende a l2 al acer-carnos a p, existen δ, δ ∈ R+ de modo que:

0 < x − p < δ ⇒ | f (x) − l1| < ε y 0 < x − p < δ ⇒ | g(x) − l2| < ε

Definimos entonces δ = min{δ, δ}. Entonces, si 0 < x − p < δ:| f (x) + g(x) − (l1 + l2)| ≤ | f (x) − l1| + | g(x) − l2| < 2ε = ε

Por lo tanto ( f + g)(x) tiende a l1 + l2 cuando x tiende a p.

11


13/50

(2). Dado ε ∈R+, definimos ε = ε|c| . Dado que f tiende a l1 existe δ ∈R+ de modo que:0 <

x

− p

< δ

⇒ | f (x)

−l1|< ε

Pero entonces:

0 < x − p < δ ⇒ |c f (x) − cl1| = |c| · | f (x) − l1| < εPor lo tanto c f (x) tiende a cl1 cuando x tiende a p.

(3). Tomemos un cierto ε ∈R+. Observemos entonces que:| f (x) g(x) − l1l2| = | f (x) g(x) + f (x)l2 − f (x)l2 − l1l2|

= | f (x)( g(x) − l2) + l2( f (x) − l1)|≤ | f (x)( g(x) − l2)| + |l2( f (x) − l1)|= | f (x)| · | g(x) − l2| + |l2| · | f (x) − l1|

Ahora bien, ya que f (x) es convergente a l1, podemos asegurar que f (x) es acotado enun cierto entorno de p. Para demostrarlo, partimos de que, ya que f (x) tiende a l1 altender x a p, existe δ ∈ R+ tal que:

0 < x − p < δ ⇒ | f (x) − l1| < 1Entonces es f ́acil ver que 0 < | f (x)| < max {|l1 − 1|, |l1 + 1|} = M para nuestraelección de δ.Ahora bien, dado que g(x) tiende a l2 al tender x a p, entonces existe δ ∈ R+ tal que:

0 < x − p < δ ⇒ | g(x) − l2| <ε

2 M

y, consecuentemente:

0 < x − p < min δ, δ ⇒ | f (x)| · | g(x) − l2| ≤ M| g(x) − l2| < ε2

A su vez, dado que f (x) tiende a l1 al tender x a p, entonces existe δ ∈ R+ tal que:

0 < x − p < δ ⇒ | f (x) − l1| < ε2|l2| ⇐⇒ |l2| · | f (x) − l1| <

ε

2

Por lo tanto, definimos δ = min {δ, δ , δ}. Se deduce entonces que, si 0 < ||x − p|| <δ:

| f (x) g(x) − l1l2| ≤ | f (x)| · | g(x) − l2| + |l2| · | f (x) − l1| < ε2

+ ε2

= ε

Finalmente ( f g)(x) tiende a l1l2 cuando x tiende a p.

(4). Dado que f tiende a l1 existe δ ∈R+ de modo que:

0 < x − p < δ ⇒ | f (x) − l1| < |l1|2

Esto se cumple ya que, por hipótesis, l1 = 0. Deducimos entonces que, si 0

|l1

| − |l1|

2

= |l1|

2

> 0

12


14/50

(5). Remarquemos primero que 1 f (x)

está bien definido en un cierto entorno de p por lo

probado en el punto anterior; formalmente, decimos que existe δ ∈ R+ tal que si0 < x − p < δ entonces | f (x)| > |

l1 |2 > 0, y consecuentemente, f (x) = 0.

Ahora bien, dado ε ∈ R+, definimos ε = ε · |l1 |22 . Como f tiende a l1 cuando x tiendea p, existe δ ∈ R+ tal que si 0 0,entonces f (x) > 0 en un entorno de p; formalmente, existe r ∈ R+ tal que f (x) > 0 paratodo x ∈ Br( p).Análogamente, si l < 0, entonces f (x) < 0 en un entorno de p.Dem. Por lo demostrado en la Proposición 3.1, existe r ∈ R+ tal que, si 0 0.Ahora bien, si l > 0, entonces | f (x)| ≥ l2 > 0 para todo x ∈ Br( p), pero f (x) < 0, ya que,si lo fuera, | f (x) − l| > |l| = l y entonces f (x) no tenderı́a a l . Concluimos entonces que f (x) > 0 para todo x ∈ Br( p).La demostración para l < 0 es análoga.

Corolario. Si f (x) ≥ 0 para todo x ∈ A y limx→ p f (x) = l , entonces l ≥ 0Análogamente, si f (x) ≤ 0 para todo x ∈ A y limx→ p f (x) = l , entonces l ≤ 0

Dem. Este enunciado es el contrarrecı́proco de la Proposición 3.2

Proposición 3.3. Dada una función f : A ⊆Rn → R y un punto p ∈ A, se verifica que: f (x) −−→

x→ p 0 ⇐⇒ | f (x)| −−→x→ p 0

Dem. (⇒) Si f tiende a 0 al aproximarse a p, entonces, dado ε ∈R+, existe δ ∈R+ de modoque, si 0 < x − p < δ entonces | f (x) − 0| = || f (x)| − 0| < ε, por lo que | f | también tiendea 0.

(⇐) Si | f | tiende a 0 al aproximarse a p, entonces, dado ε ∈R+, existe δ ∈R+ de modo que,si 0


15/50

Definición 3.5. Dados una función f : A ⊆ Rn → R y un punto p ∈ Ao, decimos que f escontinua en p si limx→ p f (x) = f ( p).

Además, f es continua en A, o simplemente continua, si es continua en p para todo p ∈ Ao

.

Corolario. Dados las funciones f : A ⊆ Rn → R y g : A ⊆ Rn → R y el punto p ∈ A talesque f y g son continuas en p. Entonces:

(1). ( f + g) es continua en p

(2). Para todo c ∈R, (c f ) es continua en p(3). ( f g) es continua en p

(4).

f g

está bien definida en un entorno de p y es continua en p si g( p) = 0

Dem. Este enunciado es análogo al presentado en la Proposición 3.1

Observación. Si f : R2 → R es continua, entonces el conjunto

A = {(x, y) ∈R2 : f (x, y) = 0}

es abierto.

Dem. Si p ∈ A, entonces f ( p) = c con |c| = 0. Como f es continua, existe un entorno de pen el cual | f ( p) − c| n0, por lo que concluimos que f (xn) tiendea f ( p) al tender n a infinito.

Definición 3.6. Dados una función f : A ⊆ Rn → Rk (es decir, f = ( f 1, f 2, . . . , f k ) y f (x) es la k -upla f 1(x), f 2(x), . . . , f k (x), con f i : A ⊆ R

n

→ R para todo i ∈ {1 , 2 , . . . , k }) y un punto p ∈ Ao

, decimos que f es con-tinua en p si:

(∀ε ∈R+)(∃δ ∈R+) tal que (x − p < δ con x ∈ A) ⇒ f (x) − f ( p) < ε

Nótese que el término x − p hace referencia a la norma euclı́dea en Rn, mientras que eltérmino f (x) − f ( p) se refiere a la norma euclı́dea en Rk .Además, f es continua en A si es continua en p para todo p ∈ Ao.Esto generaliza la noción de continuidad introducida en la Definición 3.5.

Proposición 3.4. Dados una función f : A ⊆ Rn → Rk y un punto p ∈ Ao, f es continua en p si y sólo si f

i es continua en p para todo i

∈ {1 , 2 , . . . , k

}14


16/50

Dem. (⇒) Dado ε ∈ R+, existe δ ∈ R+ tal que si x − p < δ entonces f (x) − f ( p) < ε.Entonces, por lo visto en la Proposición 2.3 tenemos que:

maxi∈{1,2,...,k }

| f i(x) − f i( p)| = f (x) − f ( p)∞ ≤ f (x) − f ( p) < ε

Por lo tanto, cada f i es continua en p.

(⇐) Por lo visto en la Proposición 2.3 tenemos que: f (x) − f ( p) ≤

√ k f (x) − f ( p)∞ =

√ k max

i∈{1,2,...,k }| f i(x) − f i( p)|

Como todas las f i son continuas en p, dado ε ∈ R+ vemos que existe un δi ∈ R+ para cada f i de modo que, si ||x − p|| < δi entonces:

| f i(x) − f i( p)| < ε√ k

⇐⇒ √ k | f i(x) − f i( p)| < ε

Deducimos ası́ que:

f (x) − f ( p) ≤√

k maxi∈{1,2,...,k }

| f i(x) − f i( p)| < ε

Por lo tanto, f es continua en p.

Teorema de Bolzano (o Teorema del Valor Intermedio). Sea

f : [a, b]

→ R una función continua en el intervalo (a, b) con a, b

∈ R, a < b, f (a) < 0

y f (b) > 0 (o bien, f (a) > 0 y f (b) < 0). Entonces existe c ∈ (a, b) tal que f (c) = 0.Dem. Supondremos que f (a) < 0 < f (b) (la demostración del caso inverso es análoga).Consideremos entonces el conjunto A = {x ∈ [a, b] : f (x) < 0}. A = ∅ ya que a ∈ A,y además es acotado (ya que es un subconjunto de [a, b], que es acotado). Entonces, porel axioma de completitud, existe s = sup A. Además, s ∈ (a, b) (esto se debe a que, por lacontinuidad de f , existen entornos de a y b en los que la función conserva el signo, y entonces

cada uno de sus puntos pertenecen a A o son cotas superiores de A, respectivamente)

Ahora bien, f (s) < 0 ya que, si lo fuera, existirı́a un entorno de s que contenga al puntos > s de modo que f (s) < 0, y entonces s no serı́a supremo de A.Además, f (s)

> 0, porque, análogamente, en caso de serlo existirı́a un entorno de s que

contenga al punto s < s de modo que f (s) > 0, y entonces s no serı́a supremo de A.Concluimos entonces que s ∈ (a, b) satisface que f (s) = 0Generalización del Teorema de Bolzano. Sea f : [a, b] →R una función continua en el inter-valo (a, b) con a, b ∈ R, a < b, f (a) < f (b) yc ∈ ( f (a), f (b)) (o bien f (b) < f (a) y c ∈ ( f (b), f (a)). Entonces existe d ∈ (a, b) tal que f (d) = c.

Dem. Supondremos que f (a) < f (b) (la demostración del caso inverso es análoga). Defin-imos entonces g : [a, b] → R de modo que g(x) = f (x) − c. Podemos ver que g(a) = f (a) − c < 0, g(b) = f (b) − c > 0. Entonces, por el Teorema de Bolzano, existe d ∈ (a, b) demodo que g(d) = f (d) − c = 0, por lo que se deduce que f (d) = c.

15


17/50

Definición 3.7. Una función f : A ⊆ Rn → Rk se dice acotada si existe M ∈ R+ tal que|| f (x)|| ≤ M para todo x ∈ A, o equivalentemente, si existe r ∈ R+ tal que Im( f ) ⊆ Br(0).

Teorema de Weierstrass. Sea f : A ⊆Rn → Rk una función continua, con A = ∅ compacto,entonces f es acotada y además alcanza máximo y mı́nimo, es decir, existen tanto max Im( f )como min Im( f )

Dem. Supongamos que f no es acotada. Entonces, construimos la sucesión (xn) de elemen-tos de A de modo que | f (xn)| > n para cada n ∈ N, y por lo tanto f (xn) −−−→

n→∞ +∞. Como A es acotado, por el Teorema de Bolzano-Weierstrass existe una subsucesión (xn j ) conver-gente a un punto p, el cual debe pertenecer a A debido a que es un conjunto cerrado (ver

Proposición 2.6). Pero entonces f (xn j ) −−→ j→∞

+∞ y f (xn j ) −−→ j→∞

f ( p), lo cual es absurdo.

Entonces f es acotada.

Como A = Im( f ) es un conjunto acotado y A = ∅, por el axioma de completitud, existes = sup A. Por lo visto en la Proposición 2.2, existe una sucesión (xn) de elementos de Aconvergente a s. Pero A es cerrado, entonces s ∈ A y por lo tanto s = max A.La demostración para el mı́nimo es análoga.

16


18/50

4. Derivabilidad y diferenciabilidad

Definición 4.1. Dada una función f : (a, b) →

R, con a, b ∈

Ry a

<

b, y un punto x0 ∈ (a, b),se dice que f es derivable en x0 si existe l ∈ R tal que:

l = limx→x0

f (x) − f (x0)x − x0 = limh→0

f (x0 + h) − f (x0)h

En este caso, decimos que l es la derivada de f en x0 y notamos f (x0) = l .

Además, decimos que f es derivable en un conjunto A ⊆ (a, b) si f es derivable en x paratodo x ∈ A.Una interpretación geométrica del concepto de derivada es el de la pendiente de la recta

tangente al gráfico de f por el punto (x0, f (x0)), cuya ecuación es:

y = f (x0)(x − x0) + f (x0)Lema 4.1. Dada una función f : (a, b) → R, con a, b ∈ R y a < b derivable en un puntox0 ∈ (a, b), entonces f es continua en x0Dem. Consideremos el siguiente lı́mite:

limx→x0

f (x) − f (x0) = limx→x0

f (x) − f (x0)x − x0 (x − x0)

= limx→x0

f (x) − f (x0)x − x0 · limx→x0 x − x0

= f (x0) · 0 = 0Por lo tanto, f (x) tiende a f (x0) al tender x a x0, o sea, f es continua en x0

Lema 4.2. Dada una función f : (a, b) → R, con a, b ∈ R y a < b derivable en un puntox0 ∈ (a, b), si f es creciente, entonces f (x0) ≥ 0 (o, si es decreciente, f (x0) ≤ 0)Dem. Por la definición de derivada, tenemos que:

f (x0) = limx→x0

f (x) − f (x0)x − x0 = limx→x−0

f (x) − f (x0)x − x0

Es fácil ver que el lı́mite lateral es no-negativo, ya que tanto el numerador (por la monotonı́a

de f ) como el denominador son negativos.

La demostración para f decreciente es análoga.

Lema 4.3. Dada una función constante f : (a, b) → R, con a, b ∈ R y a < b se verifica que f (x) = 0 para todo x ∈ (a, b)Dem. Dado x0 ∈ (a, b), calculemos f (x0):

f (x0) = limx→x0

f (x) − f (x0)x − x0 = limx→x0

0

x − x0 = 0

17


19/50

Teorema de Rolle. Dada una función f : [a, b] → R, con a, b ∈ R y a < b , continua en [a, b]y derivable en (a, b), si f (a) = f (b), entonces existe un punto c ∈ (a, b) tal que f (c) = 0Dem. Como f es continua y [a, b] es compacto, por el Teorema existen x0, x1 ∈ [a, b] tal que f (x0) = maxIm( f ) y f (x1) = min Im( f ).Supongamos que x0 ∈ (a, b). Ahora bien, como f es derivable en (a, b), tenemos que:

0 ≥ limx→x−0

f (x) − f (x0)x − x0 = f

(x0) = limx→x+0

f (x) − f (x0)x − x0 ≥ 0

Esto se deduce del hecho que f (x0) ≥ f (x) para todo x ∈ [a, b]. Por lo tanto, f (x0) = 0Podemos aplicar el mismo razonamiento a x1. Entonces, falta considerar el caso en el cual

x1 = x2 = a = b, pero esto es trivial, ya que si f (a) es tanto el mı́nimo como el máximo de laimagen, entonces f (x) ≤ f (a) ≤ f (x) para todo x ∈ [a, b], es decir, la función es constante,y, por el Lema 4.3 f (x) = 0 para todo x ∈ (a, b).Teorema de Lagrange. Dada una función f : [a, b] → R, con a, b ∈ R y a < b, continua en[a, b] y derivable en (a, b), entonces existe un punto c ∈ (a, b) tal que:

f (b) − f (a)b − a = f

(c)

Dem. Consideremos la función g : [a, b] →R definida tal que:

g(x) = f (x) − f (b) − f (a)b − a (x − a) − f (a)

Es f ́acil ver que g es continua en [a, b] y derivable en (a, b), y además se verifica que g(a) = g(b) = 0. Entonces, por el Teorema de Rolle, existe c ∈ (a, b) tal que g(c) = 0. Ahora bien:

0 = g (c) = f (c) − f (b) − f (a)b − a =⇒ f

(c) = f (b) − f (a)

b − a

Teorema de Cauchy. Dadas las funciones f : [a, b] → R y g : [a, b] → R, con a, b ∈ Ry a < b, continuas en [a, b] y derivables en (a, b), si se verifica que g(x) = 0 para todox ∈ (a, b), entonces existe un punto c ∈ (a, b) tal que:

f (b) − f (a)

g(b) − g(a) =

f (c)

g(c)Dem. Consideremos la función h : [a, b] →R definida tal que:

h(x) = ( f (x) − f (a))( g(b) − g(a)) − ( g(x) − g(a))( f (b) − f (a))Es f ́acil ver que h es continua en [a, b] y derivable en (a, b), y además se verifica que h(a) =h(b) = 0. Entonces, por el Teorema de Rolle, existe c ∈ (a, b) tal que h(c) = 0. Ahora bien:

0 = g (c) = f (c)( g(b) − g(a)) − g(c)( f (b) − f (a))

=⇒ f (c)( g(b) − g(a)) = g (c)( f (b) − f (a)) =⇒ f (c)

g(c) =

f (b) − f (a) g(b) − g(a)

18


20/50

Proposición 4.1. Dada una función f : (a, b) ⊆ R → R con a < b, si f (x) ≥ 0 para todox ∈ (a, b), entonces f es creciente; alternativamente , si f (x) ≤ 0 para todo x ∈ (a, b),entonces f es decreciente. Esta afirmación es el converso de lo demostrado en el Lema 4.2.

Dem. Dados x, y ∈R tales que x < y, por el Teorema de Lagrange existe un punto c ∈ (x, y)tal que:

f ( y) − f (x) y − x = f

(c)

de lo que se deduce que el numerador es positivo, ya que tanto el denominador como el lado

derecho de la ecuación lo son. Consecuentemente, f es creciente.

La demostración es análoga para f con derivada negativa.

Definición 4.2. Dada una función f : A

⊆Rn

→R, con A abierto, p

∈ A e i

∈ {1 , 2 , . . . , n

},

decimos que f es derivable en p respecto de xi si existe l ∈ R tal que:

l = limx→ pi

f ( p1, p2, . . . , pi−1, x, pi+1, . . . , pn−1, pn) − f ( p)x − pi

En este caso, decimos que l es la derivada parcial de f respecto de x i en p y notamos ∂ f ∂xi

( p) = l ,o bien f xi ( p) = l .Además, decimos que f es derivable en un conjunto B ⊆ A respecto de x i si f es derivableen y respecto de xi para todo y ∈ B, o derivable en B si existen todas sus derivadas parcialespara cada punto de B.

Observación. Dada una función f : A ⊆ Rn → R derivable en p ∈ A respecto de xi,definimos g : R →R de modo que:

g(x) = f ( p1, . . . , pi−1, x, pi+1, . . . , pn)

Entonces ∂ f ∂xi

( p) = g ( pi)

Dem. Por la definición de derivada parcial:

∂ f

∂xi( p) = lim

x→ pi f ( p1, . . . , pi−1, x, pi+1, . . . , pn) − f ( p)

x − pi= lim

x→ pi g(x) − g( pi)x − pi = g ( pi)

Observación. Si bien una función de R en R es continua en x si es derivable en x, una

función de Rn en R puede no ser continua en x pese a que existan todas sus derivadas

parciales en x.

Dem. Veamos que la función f : Rn → R definida tal que:

f (x) = 1 si (∃i ∈ {1 , 2 , . . . , n})xi = 00 si (∀i ∈ {1 , 2 , . . . , n})xi = 0

19


21/50

es un contraejemplo:

∂ f

∂xi (0̄) = limx→0 f (0 , . . . , x, . . . , 0)

− f (0̄)

x − 0 = limx→00

x − 0 = 0para todo xi, pero claramente f no es continua en 0̄, ya que, en caso de aproximarnos a 0̄ por

la recta definida por los múltiplos del vector (1 , . . . , 1), tenemos que:

limx→0̄

f (x) = 1 = 0 = f (0̄)

dado que ninguna coordenada se anula.

Definición 4.3. Dada una función f : A ⊆ Rn → R, con A abierto, p ∈ A y v ∈ Rn tal quev = 1 (es decir, v es un vector unitario) decimos que el siguiente lı́mite, en caso de existir,es la derivada direccional de f en la direcci´ on de v en el punto p:

limh→0

f ( p + hv) − f ( p)h

En caso de existir, notamos a esta derivada como ∂ f ∂v ( p).

Definición 4.4. Dada una función f : A ⊆ Rn → R, con A abierto, p ∈ A y f derivablerespecto de x e y en p, llamamos gradiente de f en p, y notamos ∇ f ( p), al vector definidocomo:

∇ f ( p) = ( f x1 ( p), f x2 ( p), . . . , f xn ( p))

Definición 4.5. Dada una función f : A ⊆ Rn → R, con A abierto y p ∈ A, decimos que f es diferenciable en p si existen a1, a2, . . . , an ∈ R tal que:

limx→ p

f (x) − f ( p) − a1(x1 − p1) − a2(x2 − p2) − · · · − an(xn − pn)x − p =

0̄

Los términos del numerador que restan son aquellos que definen al (hiper)plano tangente al

gráfico de f en el punto ( p1, p2, . . . , f ( p)), cuya ecuación es:

xn+1 = f ( p) + f x1 ( p)(x1

− p1) + f x2 ( p)(x2

− p2) +

· · ·+ f xn ( p)(xn

− pn)

Además, decimos que f es diferenciable en un conjunto B ⊆ A si f es diferenciable en y paratodo y ∈ B.

Es esencial notar que la diferenciabilidad es una generalización de la derivabilidad, para

llevar el concepto de aproximación lineal a funciones multivariables.

Teorema 4.1. Dada una función diferenciable f : A ⊆R2 → R y p ∈ A, se verifica que:(1). f es continua en p

(2). Existe ∇ f ( p) = (a, b), donde a y b son los coeficientes que determinan al plano tan-gente al gráfico de f en ( p1, p2, f ( p)).

20


22/50

(3). Para todo vector unitario v existe ∂ f ∂v ( p) = ∇ f ( p), v

Estos resultados son generalizables a funciones f : A ⊆

Rn

→R

Dem. (1). Consideremos la siguiente expresión:

f (x, y) − f ( p) − a(x − p1) − b( y − p2)(x, y) − p (x, y) − p + a(x − p1) + b( y − p2)

= f (x, y) − f ( p) − a(x − p1) − b( y − p2) + a(x − p1) + b( y − p2) = f (x, y) − f ( p)Ahora bien, es fácil ver que esta expresión tiende a 0 al aproximarnos a p por álgebra

de lı́mites, dado que:

f (x, y)

− f ( p)

− a(x

− p1)

−b( y

− p2)

(x, y) − p −−−−→(x, y)→ p 0por la diferenciabilidad de f . Es fácil ver que el resto de los términos involucrados en

la expresión también tienden a 0.

Por lo tanto, f (x, y) −−−−→(x, y)→ p

f ( p), entonces f es continua en p.

(2). Como f es diferenciable en p, sabemos que:

f (x, y) − f ( p) − a(x − p1) − b( y − p2)(x, y) − p −−−−→(x, y)→ p 0

En particular, si nos acercamos fijando y = p2 el lı́mite sigue siendo el mismo, por loque tenemos:

f (x, p2) − f ( p) − a(x − p1) − b( p2 − p2)(x − p1, p2 − p2) −−−→x→ p1 0

⇐⇒ f (x, p2) − f ( p) − a(x − p1)|x − p1| −−−→x→ p1 0

Ahora bien, reemplacemos a por la expresión f (x, p2)− f ( p)

x− p1 , la cual forma parte de ladefinición de f x:

f (x, p2) − f ( p) − f (x, p2)− f ( p)

x− p1 (x − p1)|x − p1| −−−→x→ p1 0

f (x, p2) − f ( p) − ( f (x, p2) − f ( p))|x − p1| =

0

|x − p1| −−−→x→ p1 0

Por lo tanto, tenemos que f x( p) = a.La demostración es análoga para f y( p).

(3). Como f es diferenciable en p, sabemos que:

f (x, y) − f ( p) − a(x − p1) − b( y − p2)

(x, y)

− p

−−−−→

(x, y)

→ p

0

21


23/50

En particular, si nos acercamos por la trayectoria (x, y) = p + hv (es decir, ( p1 +hv1, p2 + hv2)) el lı́mite sigue siendo el mismo, por lo que tenemos:

f ( p + hv) − f ( p) − f x( p)(hv1) − f y( p)(hv2) p + hv − p −−→h→0 0

⇐⇒ f ( p + hv) − f ( p) − h(∇ f ( p), v)|h| · v −−→h→0 0v = 1 ya que v es un vector unitario, y podemos quitar el módulo de h ya que ellı́mite es 0, por lo demostrado en la Proposición 3.3. Entonces:

f ( p + hv) − f ( p)h

− ∇ f ( p), v −−→h→0

0

Por lo tanto:

∂ f ∂v ( p) = ∇ f ( p), v

Teorema 4.2. Dada una función f : A ⊆ Rn → R con A abierto, tal que existen y soncontinuas f x( p) y f y( p) en p ∈ A, entonces f es diferenciable en p.Dem. Si f es diferenciable en p, tenemos que:

f (x, y) + f (x, p2) − f (x, p2) − f ( p) − a(x − p1) − b( y − p2)(x, y) − p −−−−→(x, y)→ p 0

Dado que f x y f y son continuas en p, por el Teorema de Lagrange, existen c1 entre x y p1 y c2

entre y y p2 tales que:

f (x, p2) − f ( p)x − p1 = f x(c1, p2)

f (x, y) − f (x, p2) y − p2 = f y(x, c2)

(dependiendo de la relación de orden entre x y p1, y y p2 puede que el denominador tenga

los términos de la resta invertidos, pero el resultado es idéntico).

Reemplazando en la expresión anterior tenemos:

f y(x, c2)( y − p2) + f x(c1, p2)(x − p1) − f x( p)(x − p1) − f y( p)( y − p2)(x, y) − p

= ( y − p2)( f y(x, c2) − f y( p)) + (x − p1)( f x(c1, p2) − f x( p))

(x, y) − p=

( y − p2)(x, y) − p ( f y(x, c2) − f y( p)) +

(x − p1)(x, y) − p ( f x(c1, p2) − f x( p)) −−−−→(x, y)→ p 0

dado que tanto ( y− p2)(x, y)− p como

(x− p1)(x, y)− p son menores a 1 y tanto ( f y(x, c2) − f y( p)) como

( f x(c1, p2) − f x( p)) tienden a 0.

Por lo tanto, f es diferenciable en p.

22


24/50

Proposición 4.2. Dada una función f : A ⊆ Rn → R con A abierto y p ∈ A, diferenciableen p de modo que ∇ f ( p) = 0̄, entonces ∂ f ∂v ( p) alcanza su máximo valor posible cuando setiene:

v = ∇ f ( p)∇ f ( p)

Además, se verifica que:∂ f

∂v( p) ≤ ∇ f ( p)

para cualquier vector unitario v.

Dem. Sabemos que, para cualquier vector unitario v:

∂ f

∂v( p) = ∇ f ( p), v

Ahora bien, por la desigualdad de Cauchy-Schwarz:

∇ f ( p), v ≤ ∇ f ( p) · v = ∇ f ( p)y la igualdad sólo es alcanzada si los vectores son colineales. Dado que v es unitario, a fin de

maximizar la derivada direccional, debemos utilizar un vector unitario colineal al gradiente,

es decir:

v = ∇ f ( p)∇ f ( p)

Definición 4.6. Dada una función f : A ⊆ Rn → Rk , f = ( f 1, f 2, . . . , f k ) con A abierto y p ∈ A, decimos que f es diferenciable en p si existe una transformación lineal T : Rn → Rk talque:

limx→ p

f (x) − f ( p) − T (x − p)x − p = 0̄

Recordamos que una función T : Rn → Rk es una transformación lineal si es aditiva yhomogénea de grado 1, es decir, si verifica que:

(1). T (v1 + v2) = T (v1) + T (v2)

(2). T (λv1) = λT (v1)

para todo v1, v2 ∈ Rn, λ ∈R.En caso de existir, dicha transformación lineal, a la que llamamos diferencial de f en p y nota-

mos D f ( p) ∈ Rn×k , es determinada por la matriz formada por los gradientes de cada f i en p dispuestos como filas, a la cual llamamos matriz jacobiana de f en p y notamos J f ( p). Por lotanto:

T (x) = D f ( p)

x1x2...

xn

=

∂ f 1∂x1

( p) ∂ f 1∂x2 ( p) · · · ∂ f 1

∂xn( p)

∂ f 2∂x1

( p) ∂ f 2∂x2 ( p) · · · ∂ f 2

∂xn( p)

......

. . . ...

∂ f k

∂x1( p) ∂ f k

∂x2( p)

· · · ∂ f k

∂xn( p)

x1x2...

xn

23


25/50

=

∇ f 1( p)∇ f 2( p)

.

..∇ f k ( p)

x1x2...

xn

Por lo tanto, decir que f es diferenciable en p es equivalente a decir que cada f i es diferen-

ciable en p. Reescribiendo entonces la definición original, tenemos que f es diferenciable en

p si:

limx→ p

f (x) − f ( p) − D f ( p) (x − p)x − p =

0̄

Esto generaliza la noción de diferenciabilidad introducida en la Definición 4.5.

Proposición 4.3. Si las funciones f : Rn → Rk y g : Rn → Rk son diferenciables, entonceslas funciones f + g y λ f (con λ ∈R) también lo son.Dem. Dado que D f y D g son transformaciones lineales, cumplen con las propiedades de

aditividad y homogeneidad de grado 1, de lo que se deduce que:

(1). D f + g = D f + D g

(2). Dλ f = λD f

Proposición 4.4. Si las funciones f : Rn → Rk y g : Rn → R son diferenciables, entonces lafunción g f también lo es.

Dem. gf es diferenciable si existen y son continuas todas las derivadas parciales de cada g f i;

por lo tanto, mostramos que se puede construir cualquier entrada del diferencial de g f de la

siguiente forma:

(D g f )(i, j) = ∂ g f i

∂x j= g

∂ f i∂x j

+ ∂ g

∂x j f i

Cada una de estas derivadas existe y es continua ya que tanto f como g son diferenciables,

por lo tanto g f es diferenciable. Más aún:

D g f = g D f +∇ g

f 1 f 2...

f k

con D g f ∈ Rn×k

Lema 4.4. Dada una transformación lineal T : Rn → Rk , existe c ∈R+ tal queT (v) < cvpara todo v ∈Rn.

24


26/50

Dem. Recordemos que toda transformación lineal está determinada por una matriz, por lo

tanto:

T (v) =

T 1,1 T 1,2 · · · T 1,nT 2,1 T 2,2 · · · T 2,n

......

. . . ...

T k ,1 T k ,2 · · · T k ,n

v1v2...

vn

=

∑

n j=1 T 1, j v j · · · ∑ n j=1 T k , j v j

Es fácil ver que T (v) > T (v), donde v está definido tal que vi = |vi| y T está definidapor la matriz:

T =

M M · · · M M M · · · M

......

. . . ...

M M · · · M

donde M = max

n,k |T n,k |. Basta entonces con ver que T (v) es menor que cv = cv.

Ahora bien:

T (v) = M

n

∑ j=1

v j, · · · ,n

∑ j=1

v j

= M k

n

∑ j=1

v j

2< M

√ k v

Finalmente, concluimos que c > M√

k cumple con lo solicitado.

Lema 4.5. Si f : Rn

→Rk es diferenciable en p, entonces f es continua en p.

Dem. Esto es inmediato ya que si f es diferenciable en p, entonces cada f i es continua en p y

consecuentemente también lo es f .

Lema 4.6. Si f : Rn → Rk es diferenciable en p, entonces existen δ, c ∈ R+ de modo tal quesi 0 < x − p < δ entonces:

f (x) − f ( p)x − p < c

Es decir, dicha expresión es acotada en un cierto entorno de p.

Dem. Dado que f es diferenciable en p, también será continua en ese punto, por lo que, dado

ε > 0, existe δ de modo que, si 0 < x − p < δ entonces f (x) − f ( p) < ε. Basta entoncesprobar que existe c > 0 de modo que ε < cx − p < cδ, pero dicho c existe; en particular,c > εδ cumple lo pedido.

Proposición 4.5 (Regla de la cadena). Si f : A ⊆Rn → Rk y g : Rk → R j son funciones talesque f es diferenciable en p ∈ A y g es diferenciable en f ( p), entonces g ◦ f es diferenciableen p, y además:

D g ◦ f ( p) = D g( f ( p)) D f ( p)

25


27/50

Dem. Veamos entonces que:

limx→ p g

◦ f (x)

− g

◦ f ( p)

− D g( f ( p)) D f ( p)(x

− p)

x − p = 0̄

Ahora esta bien, debido a la desigualdad triangular, esa expresión es menor o igual a la

suma de los siguientes términos:

(1). g ◦ f (x) − g ◦ f ( p) − D g( f ( p))( f (x) − f ( p))

x − p(2).

D g( f ( p))( f (x) − f ( p)) − D g( f ( p)) D f ( p) (x − p)

x

− p

Demostraremos entonces que cada uno de estos términos tiende a 0̄.

Para (1), supondremos f (x) = f ( p) (en caso contrario el numerador es 0̄ y consecuente-mente el lı́mite también lo es). Entonces, nuestra expresión es equivalente a:

g ◦ f (x) − g ◦ f ( p) − D g( f ( p))( f (x) − f ( p)) f (x) − f ( p)

f (x) − f ( p)x − p

Ahora bien, sea y = f (x). Dado que f es continua en p por el Lema 4.5, tenemos que

y −−→x

→ p

f ( p), por lo que podemos reescribir el primer término como:

g( y) − g( f ( p)) − D g( f ( p))( y − f ( p)) y − f ( p)

Ya que g es diferenciable en p, este término tiende a 0̄; es obvio que el segundo término es

acotado, debido a lo demostrado en el Lema 4.6.

Para (2), tomamos factor común en el numerador, dejando:

D g( f ( p)) f (x) − f ( p) − D f ( p) (x − p)

x

− p

en donde el primer término es acotado, por el Lema 4.4 (recordando que el diferencial defineuna transformación lineal) y el segundo tiende a 0̄ debido a que f es diferenciable en p.

Queda ası́ demostrado que el lı́mite de la primer expresión es 0̄, y por lo tanto el diferen-

cial propuesto es aquel asociado a g ◦ f .Corolario. Si f : A ⊆ Rn → Rk y g : Rk → R son funciones que cumplen las hipótesis de laproposición anterior, entonces:

∂ g ◦ f ∂x j

(a) =k

∑ m=1

∂ g

∂ ym( f (a))

∂ f m

∂x j(a)

26


28/50

En el caso particular en el que n = 1, tenemos entonces que:

( g ◦ f )(a) =k

∑ m=1

∂ g∂ ym ( f (a)) f m(a)

Dem. Por lo visto en la proposición anterior, tenemos que:

D g ◦ f (a) = D g( f (a)) D f (a)

Entonces, cada coordenada de D g ◦ f (a) ∈R1×n tiene la forma:∂ g ◦ f

∂x j(a) =

∂ g

∂ y1( f (a))

∂ f 1∂x j

(a) + · · · + ∂ g∂ ym

( f (a)) ∂ f m∂x j

(a)

=k ∑

m=1

∂ g∂ ym

( f (a)) ∂ f m

∂x j(a)

El caso particular n = 1 es análogo, salvo que, dado que cada f i es una función en unavariable, notamos directamente f i .

Definición 4.7. Dados a, b ∈ Rn con a = b, definimos al segmento que une a con b, notadoSab de modo que:

Sab = {λ(b − a) + a : λ ∈ [0, 1]}Definición 4.8. Decimos que A ⊆Rn es convexo si, para todo a, b ∈ A, el segmento Sab ⊆ A.

Teorema 4.3 (Generalización del Teorema del Valor Medio). Dados una función diferenciable

f : A ⊆ Rn → R con A abierto y convexo, y los puntos a, b ∈ A tales que a = b, existe unpunto c ∈ Sab tal que:

f (b) − f (a) = ∇ f (c), b − a =n

∑ j=1

∂ f

∂x j(c) (b j − a j)

Dem. Definimos la función α : [0, 1] → Sab ⊆ A tal que:

α(λ) = λ(b − a) + a

Resulta entonces que f ◦ α : [0, 1] → R, por lo que, por el Teorema de Lagrange, se verificaque:

( f ◦ α)(1) − ( f ◦ α)(0) = ( f ◦ α)(c)(1 − 0)para algún punto c ∈ [0, 1]. Ahora bien, tenemos que:

( f ◦ α)(1) = f (α(1)) = f ((b − a) + a) = f (b)( f ◦ α)(0) = f (α(0)) = f (0(b − a) + a) = f (a)

Entonces:

f (b)

− f (a) = ( f

◦α)(c)

27


29/50

Usando la regla de la cadena, se deduce que:

( f ◦ α)(c) =n

∑ j=1

∂ f

∂x j (α(c)) α j(c) = ∇ f (α(c)), b − a

La última igualdad vale puesto que:

α(c) = (b1 − a1, b2 − a2, . . . , bn − an)

Por lo tanto, α(c) ∈ Sab cumple con lo pedido.

28


30/50

5. Derivadas parciales de orden superior y Teorema de Taylor

Definición 5.1. Dada una función f :

Rn

→R

, utilizaremos la siguiente notación:∂

∂x1

∂ f

∂x1

=

∂2 f

∂x21∂

∂x2

∂ f

∂x1

=

∂2 f

∂x2∂x1

En el último caso, llamamos a este tipo de derivadas derivadas parciales cruzadas; a su vez,

se llama derivada de orden n a aquella derivada obtenida tras n derivaciones en variables no

necesariamente iguales.

Definición 5.2. Una función f : Rn

→ R es de clase Ck si existen y son continuas todas las

derivadas parciales de f hasta el orden k inclusive. En este caso, notaremos f ∈ Ck .Teorema 5.1 (Igualdad de derivadas cruzadas). Dada una función diferenciable f : A ⊆R2 → R con A abierto de modo que existen las siguientes derivadas en todo punto de A:

∂ f

∂x, ∂ f

∂ y,

∂2 f

∂ y∂x,

∂2 f

∂x∂ y

Si estas derivadas son continuas en un punto c ∈ A, entonces:∂2 f

∂ y∂x(c) =

∂2 f

∂x∂ y(c)

Corolario. Si f ∈ C2, entonces∂2 f

∂ y∂x(c) =

∂2 f

∂x∂ y(c)

para todo c ∈ A.

Teorema de Taylor en una variable. Dados una función f : I ⊆ R → R, tal que I es unintervalo cerrado y f es n + 1 veces derivable, y un punto a ∈ I , entonces existe c entre a y xtal que:

f (x) = n

∑ j=0

f ( j)(a)

j!

(x

− a) j + f

(n+1)(c)

(n + 1)!

(x

− a)n+1

El polinomio que aparece entre paréntesis es llamado el polinomio de Taylor de f de orden n

centrado en a, y es notado Pn,a(x) o simplemente Pa(x), mientras que el término restante esla cota del error que se produce al aproximar a la función por su desarrollo de Taylor, al

que notaremos r a(x). Si el polinomio de Taylor se halla centrado en el origen, es tambiéndenominado polinomio de Maclaurin.

Dem. Consideraremos a = x (en caso de que a = x es inmediato que c = a = x). Definimosentonces la siguiente función:

g(t) = f (x)−

Pn,t(x)−

k

(n + 1)!(x

−t)n+1

29


31/50

donde definiremos k de modo tal que g(a) = 0. Calculemos entonces el valor de k :

0 = g(a) = f (x) − Pn,a(x) − k

(n + 1)! (x − a)n+1

Entonces:

k = ( f (x) − Pn,a(x)) (n + 1)!(x − a)n+1

Ahora bien, se verifica que g(a) = g(x) = 0; entonces, aplicando el Teorema de Rolle,tenemos que existe c entre a y x de modo que g (c) = 0; pero resulta que:

g(t) = − f (t) + f (t) − f (t)(x − t) + f (t)(x − t) + · · · − f (n+1)(t)

n! (x − t)n + k

n!(x − t)n

= − f (n+1)(t)n!

(x − t)n + k n!

(x − t)n

En consecuencia, si g(c) = 0, entonces:

f (n+1)(c)

n! (x − c)n = k

n!(x − c)n ⇐⇒ f (n+1)(c) = k

Finalmente, tenemos que:

f (n+1)(c) = ( f (x) − Pn,a(x)) (n + 1)!(x − a)n+1

y con un simple pasaje de términos llegamos a la expresión que querı́amos demostrar.

Teorema de Taylor en varias variables. Sea f ∈ C3 una función f : A ⊆ R2 → R, con A abierto, p = ( p1, p2) ∈ A. Dados una bola B p(ε) ⊆ A conε > 0 (cuya existencia está garantizada dado que A es abierto) y un punto (x, y) ∈ B p(ε),entonces existe un punto q ∈ S p,(x, y) de modo que:

f (x, y) = f ( p) + ∂ f

∂x( p)(x − p1) + ∂ f

∂ y( p)( y − p2)

+ 1

2! ∂2 f

∂x2 ( p)(x − p1)2 + 2 ∂

2 f

∂x∂ y( p)(x − p1)( y − p2) + ∂

2 f

∂ y2 ( p)( y − p2)2

+ 1

3!

∂3 f

∂x3 (q)(x − p1)3 + 3 ∂

3 f

∂x2∂ y(q)(x − p1)2( y − p2)

+3 ∂3 f

∂x∂ y2 (q)(x − p1)( y − p2)2 + ∂

3 f

∂ y3 (q)( y − p2)3

Éste es el polinomio de Taylor de orden 2 asociado a f centrado en p (junto con su resto);

la noción es fácilmente generalizable a un orden n si disponemos de f ∈ Cn+1. Notaremosr p(x, y) al último término, que representa al resto obtenido por la aproximación por desar-rollo de Taylor, y P p(x, y) al resto del polinomio.

30


32/50

Dem. Definamos la función γ : [0, 1] → A de modo tal que:γ(t) = p + t((x, y)

− p)

Sea entonces g = f ◦ γ (o sea, g : [0, 1] → R). Entonces, la expresión del polinomio deMaclaurin asociado a g de orden 2 evaluado en 1 está dada por:

g(1) = g(0) + g(0) + 1

2! g(0) +

1

3! g(c)

Ahora bien, g(1) = f (γ(1)) = f (x, y) y g(0) = f (γ(0)) = f ( p). Calculando las derivadasrestantes, se deduce que la expresión anterior es equivalente a la que queremos demostrar.

El punto q estará dado por γ(c) ∈ S(x, y), p satisfaciendo lo pedido.

Proposición 5.1. Dadas las hipótesis del enunciado del Teorema de Taylor en varias vari-

ables, se verifica que:r p(x, y)

(x, y) − p2 −−−−→(x, y)→ p 0

Dem.

r p(x, y)

(x, y) − p2≤ 1

3!

∂3 f ∂x3 (q)

|x − p1|3(x, y) − p2 + . . .

≤ 13!

∂3 f ∂x3 (q) |x − p1| + . . .Ahora bien, cada sumando de la expresión final tiende a 0, puesto que |x − p1| y | y − p2|tienden a 0 al tender (x, y) a p, y las derivadas parciales son acotadas en un cierto entornode p, por ejemplo B p(

ε2 ) ⊆ B p(ε), dado que dicho entorno es compacto.

Definición 5.3. Dada una función f ∈ C2 tal que f : A ⊆ R2 → R, llamamos matriz hessianade f a la matriz conformada por las derivadas segundas de f , a la cual notamos H f ( p); esdecir:

H f ( p) = ∂

2 f ∂x2

( p) ∂2 f

∂x∂ y ( p)

∂2 f ∂ y∂x ( p)

∂2 f ∂ y2

( p)

La matriz hessiana facilita la escritura del polinomio de Taylor de orden 2, dado que:

P p(x, y) = f ( p) + ∇ f ( p), (x, y) − p + 12!

((x, y) − p) H f ( p) ((x, y) − p)T

El concepto de matriz hessiana es generalizable a funciones deRn aR, en cuyo caso la matriz

pertenecerá a Rn×n.

Observación. Dado que f ∈ C2, las derivadas parciales cruzadas son equivalentes, y por lotanto la matriz hessiana es simétrica.

31


33/50

6. Extremos

Definición 6.1. Dados una función f : A ⊆

Rk

→ R

con A abierto y un punto p ∈ A,decimos que p es un m´ aximo local de f si f ( p) ≥ f (x) para todo x ∈ B p(ε) para algún radioε > 0. Si la desigualdad es estricta, lo llamamos m´ aximo local estricto. La definición para

mı́nimos es análoga. Llamamos extremos locales de f a los máximos y mı́nimos locales de f .

Teorema de Fermat. Si un punto p ∈ A es extremo local de una función f : A ⊆ R2 → Rcon A abierto y derivable en p, entonces ∇ f ( p) = (0, 0)Dem. Supongamos sin pérdida de generalidad que p es un máximo local. Entonces, f ( p) ≥ f (x) para todo x ∈ B p(ε) con ε > 0; en particular, f ( p) ≥ f (x1, p2) para todo x1 ∈ ( p1 − ε, p1 + ε), por lo que f x( p) = 0. El razonamientoes análogo para f y( p), y en general, para cualquier derivada direccional, por lo que además,

f es diferenciable en p.

Definición 6.2. Dados una función f : A ⊆ Rn → R con A abierto y un punto p ∈ A,decimos que p es un punto crı́tico de f si ∇ f ( p) = 0̄. Es claro que esto define una condiciónnecesaria para los extremos, pero no suficiente, por lo demostrado por el teorema de Fermat.

Definición 6.3. Si p es un punto crı́tico de f : A ⊆ Rn → R con A abierto, pero no es unextremo de f , lo llamamos punto silla o punto de ensilladura de f .

Proposición 6.1. Toda matriz simétrica es diagonalizable.

Dem. Para la demostración de esta proposición utilizaremos varios conceptos de álgebra lin-

eal. En principio, si A ∈ Rn×n es simétrica, entonces todos sus autovalores λ1, . . . , λn sonreales y existe una base ortonormal de autovectores de A. Recordemos que λ es un auto-

valor de A y x su autovector asociado si x = 0 y AxT = λxT , y un conjunto de vectores esortonormal si todos sus vectores son unitarios y ortogonales entre sı́.

Además, si B = {v1, . . . , vn} es una base ortonormal deRn, se verifica que, para todo x ∈Rn:

x =n

∑ i=1

vixi, vi

Reescribiendo A en función de su matriz de cambio de base para la base ortonormal de

autovectores, tenemos que

xAxT = y

λ1 0. . .

0 λn

yT = n∑

i=1

λi y2i

donde y i = xi, vi. De este modo, la matriz de cambio de base resulta diagonal, y ademástenemos que

xAxT =n

∑ i=1

λixi, vi2

32


34/50

Lema 6.1. Dados una función f : A ⊆ R2 → R, con A abierto y f ∈ C2 en A, p ∈ A unpunto crı́tico de f y v ∈ R2 un vector unitario tal que v H f ( p) vT > 0 entonces la función f

v

(t) = f ( p + tv) tiene un mı́nimo local estricto en 0 (y tiene un máximo si la desigualdadse invierte).

Dem. Como p ∈ A y A es abierto, f v está bien definida en un entorno ( p − ε, p + ε). En-tonces, f v : ( p − ε, p + ε) → R y además, podemos ver que f v es la composición f ◦ γv, conγv(t) = p + tv.

Si derivamos f v, obtenemos, por regla de la cadena:

f v(t) = ∇ f ( p + tv), v = ∂ f

∂v(x) ( p + tv)

pues γ

v

(t) = v. Ahora bien, es claro que: f v

(0) = ∇ f ( p), v = (0, 0), v = 0

ya que p es punto crı́tico de f ; por lo tanto, 0 es un punto crı́tico de f v.

Además:

f v

(t) = ( f xx( p + tv)v1 + f xy( p + tv)v2)v1 + ( f yx( p + tv)v1 + f yy( p + tv)v2)v2

= f xx ( p + tv)v21 + 2 f xy( p + tv)v1v2 + f yy( p + tv)v

22

= v H f ( p) vT > 0

Es claro entonces que 0 es un mı́nimo local estricto de f v

. La demostración es análoga paralos máximos.

Teorema 6.1 (Criterio de la matriz hessiana). Sean f : A ⊆ Rn → R con A abierto y f ∈ C3en A, p ∈ A un punto crı́tico de f y

H f ( p) =

a b

b c

Sea entonces d = det( H f ( p)) = ac − b2. Si d > 0, entonces p es un extremo local de f . Enparticular, si a > 0, p es un mı́nimo estricto, y si a < 0, p es un máximo estricto. Ahora bien,

si d<

0 entonces p es un punto silla de f . El criterio no aporta información si d = 0.Dem. Por lo visto en la Proposición 6.1, podemos realizar un cambio de base sobre H f ( p) demodo que:

H f ( p){v1,v2} =

λ1 0

0 λ2

donde v1, v2 son los autovectores de la matriz y λ1, λ2 sus autovalores asociados. Dado que

el determinante y la traza de una matriz son invariantes respecto de un cambio de base,

tenemos además que:

det( H f ( p)) = ac − b2 = λ1λ2 = det

H f ( p){v1,v2}tr( H f ( p)) = a + c = λ1 + λ2 = tr

H f ( p){v1,v2}

33


35/50

Demostraremos primero el caso en el que d > 0. En este caso, es claro que λ1 = 0 = λ2 yque λ1 y λ2 tienen el mismo signo (e idénticamente para a y c).

Sea S = {u ∈ R2 : u = 1}. Es claro que S es compacto. Dada la función h : S → Rdefinida como:

h(u) = 1

2u H f ( p) u

T

Notemos que h(u) > 0 para todo u ∈ S porque suponemos que la matriz hessiana es detraza positiva. Finalmente, por el teorema de valores extremos de Weierstrass, h alcanza un

mı́nimo en un punto u0 ∈ S, es decir, h(u) ≥ h(u0) > 0 para todo u ∈ S. Llamaremos β = h(u0) y definimos α =

β2 ; entonces, 0 < α < β.

Dado que f

∈ C3, existe δ > 0 tal que, si 0 <

x

− p

< δ, entonces:

0 ≤ |r2(x)|x − p2 < α 0. Entonces:

v H f ( p) vT = λ1 v2 > 0

v H f ( p) vT = λ2

v

2< 0

Entonces, por lo demostrado en el Lema 6.1, la función f v(t) tiene un mı́nimo en 0, pero f v

(t) tiene un máximo en 0. Por lo tanto, todo entorno de p tiene puntos mayores y menores

a p; consiguientemente, p es un punto silla de f .

Además, el criterio es generalizable a Rn, observando que habrá un extremo en p si todos

los autovalores poseen el mismo signo (sera mı́nimo si todos son positivos, máximo si todos

son negativos); habrá un punto silla si hay algunos autovalores positivos y otros negativos,

y el criterio no brindará información si hay algún autovalor nulo.

34


36/50

7. Teoremas de la función inversa y la función implı́cita

Teorema de la función inversa. Dados una función f : A ⊆

Rn

→ R

con A abierto y f ∈ C1 en A y p ∈ A, si D f ( p) es inversible (es decir, J f ( p) admite inversa), entonces existenconjuntos U , V ∈ Rn abiertos tales que p ∈ U , f ( p) ∈ V tales que la restricción f : U → V es

biyectiva. Más aún, su inversa, f −1 : V → U es C1 en V y su diferencial verifica que:

D f −1 ( f (a)) = D f (a)−1

D f −1(b) = D f

f −1(b)−1

con a ∈ U , b ∈ V .

Teorema de la función implı́cita. Dados una función g : A ⊆ R2

→ R con A abierto y g ∈ C1 en A, p ∈ A, c = g( p) y S el conjunto definido tal que:

S = {(x, y) ∈ A : g(x, y) = c}

es decir, S es la curva de nivel de f que contiene a p. Si ∂ g∂ y ( p) = 0, entonces existen ε1, ε2 > 0

y ϕ : B p1 (ε1) → B p2 (ε2) con ϕ ∈ C1 tales que:(1). ϕ( p1) = p2(2). (x, y) ∈ S ⇐⇒ y = ϕ(x) para todo (x, y) ∈ B p1 (ε1) × B p2 (ε2)(3). Si x ∈ B p1 (ε1) entonces:

ϕ(x) = − gx (x, ϕ(x)) g y (x, ϕ(x))

Análogamente, si ∂ g∂x ( p) = 0, entonces existen δ1, δ2 > 0 y ψ : B p2 (δ2) → B p1 (δ1) con ψ ∈ C1

tales que:

(1). ψ( p2) = p1(2). (x, y) ∈ S ⇐⇒ x = ψ( y) para todo (x, y) ∈ B p1 (δ1) × B p2 (δ2)(3). Si y ∈ B p2 (δ2) entonces:

ψ( y) = − g y (ψ( y), y) gx (ψ( y), y)

El teorema es generalizable a funciones con dominio en Rn; por ejemplo, para el caso R3, el

teorema asegura la existencia de una función ϕ tal que ϕ( p1, p2) = p3, g(x, y, z) = g( p) si ysólo si z = ϕ(x, y) para todo (x, y, z) en un entorno de p, y además:

∇ϕ(x, y) =

− gx (x, y, ϕ(x, y)) g z (x, y, ϕ(x, y))

, − g y (x, y, ϕ(x, y)) g z (x, y, ϕ(x, y))

En particular,

∇ϕ( p) =

− gx( p) g z( p)

, − g y( p) g z( p)

35


37/50

Dem. El punto (3) se deduce observando que, para todo (x, y) ∈ S, g (x, ϕ(x)) = g(x, y) =c = g( p). Entonces:

0 = g (x, ϕ(x)) − c0 = gx (x, ϕ(x)) + g y (x, ϕ(x)) ϕ

(x)

ϕ(x) = − gx (x, ϕ(x)) g y (x, ϕ(x))

Observación. En el caso presentado en el enunciado del teorema, la recta tangente a la curva

de nivel que contiene a p es perpendicular al gradiente de g en p y está dada por la ecuación

(suponiendo g y( p) = 0):

0 = (x, y) − p, ∇ g( p)0 = (x − p1) gx( p) + ( y − p2) g y( p)

y − p2 = − gx( p) g y( p)

(x − p1)

y − p2 = ϕ( p1) (x − p1)Esto se debe a que la recta tangente al gráfico de ϕ es la misma que la de la curva de nivel,

en un cierto entorno de p.

Además, el plano tangente a una superficie de nivel de una función g : A ⊆ R3 → Rque cumple las hipótesis del teorema de la función implı́cita está dado por la ecuación:

(x, y, z) − p, ∇ g( p) = 0Esto se debe a que, suponiendo g z( p) = 0 en un cierto entorno de un punto p ∈ A, tenemos,por el teorema de la función implı́cita, g(x, y, z) = g( p) si y sólo si z = ψ(x, y) para ciertafunción ψ ∈ C1 en A. Entonces, el plano tangente a S en p es el plano tangente al gráfico deψ en ( p1, p2, ψ( p1, p2)) = p, es decir:

z − p3 = ψx( p1, p2)(x − p1) + ψ y( p1, p2)( y − p2)⇐⇒ 0 = z − p3 − ψx( p1, p2)(x − p1) − ψ y( p1, p2)( y − p2)

= g z( p)( z − p3) + gx( p)(x − p1) + g y( p)( y − p2) g z( p)=

(x, y, z) − p, ∇ g( p) g z( p)

= (x, y, z) − p, ∇ g( p)Teorema de la función implı́cita. Veamos un enunciado alternativo del teorema de la función

implı́cita enfocado a intersecciones de superficies. Sean g1, g2 : A ⊆ R3 → R con A abiertoy g1, g2 ∈ C1 en A, p ∈ A y S la intersección de las superficies de nivel en p de ambasfunciones, es decir:

S = {(x, y, z) ∈ A : g1(x, y, z) = g1( p), g2(x, y, z) = g2( p)}36


38/50

Entonces, si:

det g1 y( p) g1 z( p)

g2 y( p) g2 z( p)

= 0

existen ε1, ε2, ε3 > 0 y dos funciones ψ1, ψ2 ∈ C1 de modo que ψ1 : {|x − p1| < ε1} →{| y − p2| < ε2} y ψ2 : {|x − p1| < ε1} → {| z − p3| < ε3} siempre que:

(x, y, z) ∈ {|x − p1| < ε1, | y − p2| < ε2, | z − p3| < ε3} = B

Además, se verifica que:

(1). ψ1( p1) = p2 y ψ2( p1) = p3

(2). (x, y, z) ∈ S ⇐⇒ y = ψ1(x), z = ψ2(x) para todo (x, y, z) ∈ B(3). Si

|x

− p1

|< ε1, entonces:

ψ1(x) = −det

g1x g1 z g2x g2 z

(x,ψ1(x),ψ2(x))

det

g1 y g1 z g2 y g2 z

(x,ψ1(x),ψ2(x))

ψ2(x) = −det

g1 y g1x g2 y g2x

(x,ψ1(x),ψ2(x))

det g1 y g1 z g2 y g2 z(x,ψ1(x),ψ2(x))

Dem. Demostraremos el punto (3). Para abreviar, notaremos α = (x, ψ1(x), ψ2(x)). A partirde (1) y (2), sabemos que:

g1(α) = g1( p)

g2(α) = g2( p)

Entonces, por regla de la cadena: g1x(α) + g1 y(α)ψ

1(α) + g1 z(α)ψ

2(α) = 0

g2x(α) + g2 y(α)ψ1(α) + g2 z(α)ψ

2(α) = 0

Lo cual es equivalente a: g1 y(α)ψ

1(α) + g1 z(α)ψ

2(α) = − g1x(α)

g2 y(α)ψ1(α) + g2 z(α)ψ

2(α) = − g2x(α)

Reescribiendo el sistema en forma matricial: g1 y g1 z g2 y g2 z

(α)

ψ1ψ2

(α)

= −

g1x g2x

(α)

Luego, el resultado se deduce resolviendo el sistema por medio de la regla de Kramer.

37


39/50

8. Extremos restringidos

Multiplicadores de Lagrange. Sean g : A ⊆

R2

→R

, con A abierto, g ∈ C1

en A, c ∈R

y Sla superficie de nivel c de g, es decir, S = {(x, y) ∈ A : g(x, y) = c} y ∇ g(x, y) = 0 para todo(x, y) ∈ S.Además, sean f : A → R, f ∈ C1 en A y p ∈ S tal que p sea un extremo local de f sobre S (notaremos a la restricción de f a S como f |S ), es decir, que exista r > 0 tal que si(x, y) ∈ B p(r) y (x, y) ∈ S, entonces f (x, y) ≥ f ( p) si p es mı́nimo o f (x, y) ≤ f ( p) si p esmáximo.

Entonces, existe λ ∈R tal que ∇ f ( p) = λ∇ g( p)Dem. Supongamos sin pérdida de generalidad que p es un mı́nimo local de f sobre S y que

g y( p) = 0. Entonces, por el teorema de la función implı́cita, existe ϕ ∈ C1 tal que, en unentorno de p, (x, y) ∈ S si y sólo si y = ϕ(x). Además:

ϕ(x) = − gx (x, ϕ(x)) g y (x, ϕ(x))

Pero entonces, por hipótesis, p1 es un mı́nimo local de h(x) = f (x, ϕ(x)), con h : ( p1 −ε1, p1 + ε1). Por lo tanto, h

( p1) = 0. Tenemos entonces, por regla de la cadena:

0 = f x ( p1, ϕ( p1)) + f y ( p1, ϕ( p1)) ϕ( p1)

⇐⇒ f x ( p1, ϕ( p1)) = − f y ( p1, ϕ( p1)) ϕ( p1)⇐⇒ f x ( p1, ϕ( p1)) = f y ( p1, ϕ( p1)) gx ( p1, ϕ( p1))

g y ( p1, ϕ( p1))

⇐⇒ f x ( p1, ϕ( p1)) = f y ( p1, ϕ( p1))

g y ( p1, ϕ( p1)) gx ( p1, ϕ( p1))

Llamemos entonces:

λ = f y ( p1, ϕ( p1))

g y ( p1, ϕ( p1))

Es claro que:

f y ( p1, ϕ( p1)) = λ g y ( p1, ϕ( p1))

Por lo tanto, ∇ f ( p) = λ∇ g( p)

Enunciaremos ahora algunas ge

análisis i (notas de la teórica - 2c 2011)

Documents