análisis i (notas de la teórica - 2c 2011)

Upload: fabian-j-fainstein

Post on 08-Jul-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    1/50

    Análisis I

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    2/50

    Contenidos

    1. R como cuerpo ordenado completo . . . . . . . . . . . . . . . . . . . . . . . . . . 3

    Construcción axiomática de R   . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

    Supremo, ́ınfimo y el axioma de completitud . . . . . . . . . . . . . . . . . . . 5

    Valor absoluto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5Principio arquimediano de N   . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

    2. Lı́mite de sucesiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

    Sucesiones acotadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

    Sucesiones monótonas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

    Subsucesiones y el Teorema de Bolzano-Weierstrass . . . . . . . . . . . . . . . 6

    Métricas en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

    Lı́mite de sucesiones en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

    Nociones de topologı́a en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

    3. Continuidad y lı́mite de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

    Álgebra de lı́mites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

    Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

    Teorema de Bolzano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

    Teorema de valores extremos de Weierstrass . . . . . . . . . . . . . . . . . . . 16

    4. Derivabilidad y diferenciabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    Derivabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    Teoremas de valor medio de Rolle, Lagrange y Cauchy . . . . . . . . . . . . . 17

    Derivadas parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

    Derivadas direccionales y vector gradiente . . . . . . . . . . . . . . . . . . . . 20

    Diferenciabilidad y plano tangente . . . . . . . . . . . . . . . . . . . . . . . . . 20

    Matriz diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

    Regla de la cadena en funciones de Rn a Rk  . . . . . . . . . . . . . . . . . . . . 25Generalización del teorema de valor medio . . . . . . . . . . . . . . . . . . . . 27

    5. Derivadas parciales de orden superior y Teorema de Taylor . . . . . . . . . . . . 29

    Derivadas parciales cruzadas en funciones C2 . . . . . . . . . . . . . . . . . . . 29

    Teorema de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

    Matriz hessiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

    6. Extremos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

    Extremos locales y el Teorema de Fermat . . . . . . . . . . . . . . . . . . . . . 32

    Criterio de la matriz hessiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    7. Teoremas de la función inversa y la función implı́cita . . . . . . . . . . . . . . . . 35

    Teorema de la función inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    1

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    3/50

    Teorema de la función implı́cita . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    8. Extremos restringidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

    Multiplicadores de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389. Integración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    Sumas inferiores y superiores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    Propiedades de la integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

    Teorema fundamental del cálculo . . . . . . . . . . . . . . . . . . . . . . . . . . 43

    Regla de Barrow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

    Fórmula de cambio de variable . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

    Integrales impropias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

    Integración en varias variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

    Conjuntos de contenido cero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

    Teorema de Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

    Criterio de convergencia integral de Cauchy-Maclaurin . . . . . . . . . . . . . 48Cambio de variables en integrales dobles . . . . . . . . . . . . . . . . . . . . . 49

    Coordenadas polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

    2

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    4/50

    1. R como cuerpo ordenado completo

    Definición 1.1.  Llamamos conjunto de n´ umeros reales  (notado

     R) al conjunto que conformaun cuerpo ordenado completo  (R, +, ·, 0).Observación 1.1.3.  Los axiomas que definen a R implican, para todo a ∈R:

    (1). 0a =  0  =  a0

    (2).   (−a) = (−1)a(3). 0 < 1

    Dem.  Derivamos utilizando los axiomas:

    3

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    5/50

    (1).

    (∀

    a ∈R)a =  a

    S3⇐⇒ a  =  0 + aP3⇐⇒ 1a =  0 + aS3⇐⇒ (0 + 1)a =  0 + aD⇐⇒ 0a + 1a =  0 + aP3⇐⇒ 0a + a =  0 + aS4⇐⇒ 0a + a + (−a) = 0 + a + (−a)S4

    ⇐⇒ 0a + 0 =  0 + 0

    S3⇐⇒ 0a =  0(2).

    (∀a ∈R)0a =  0S4⇐⇒ (1 + (−1))a =  0D⇐⇒ 1a + (−1)a =  0P3⇐⇒ a + (−1)a =  0S4

    ⇐⇒ a + (−1)a + (−a) = 0 + (−a)S1⇐⇒ a + (−a) + (−1)a =  0 + (−a)S4⇐⇒ 0 + (−1)a =  0 + (−a)S3⇐⇒ (−1)a = (−a)

    (3). Supongamos 1  <  0. Elegimos  a ∈  R tal que a  >  0. Entonces, por O4, 1a  <  0a   P3⇐⇒a < 0a

      (1)⇐⇒   a < 0, lo cual es contradictorio.

    Definición 1.2.  Definimos al conjunto de  reales positivos  (notados R+) de modo que R+ =

    {x ∈R :  x > 0}Definición 1.3.   Dados a, b ∈ R definimos al intervalo abierto (a, b) como el conjunto (a, b) ={x ∈R :  a < x < b} y al intervalo cerrado [a, b] como el conjunto [a, b] = {x ∈ R :  a ≤ x ≤ b}Definición 1.4. Dado A ⊆R, decimos que A es acotado superiormente si existe x ∈R tal que x ≥ y para todo y ∈ A. Cualquier x  que satisfaga esta condición es llamada cota superior de A.Análogamente, decimos que A es acotado inferiormente si existe x ∈R tal que x ≤ y  para todo y ∈ A. Cualquier x  que satisfaga esta condición es llamada cota inferior de A.

    Proposición 1.1.  Todo subconjunto finito de R es acotado inferior y superiormente.

    4

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    6/50

    Definición 1.5.   Dado   A ⊆   R, A  =   ∅  acotado superiormente, decimos que   s ∈   R  es elsupremo de A y notamos s  =  sup  A si  s  es cota superior de  A y si, dada otra cota superior  s

    de A, se cumple que s ≤ s. Si sup A ∈ A lo llamamos m´ aximo y lo notamos max A.Análogamente, decimos que i ∈  R es el  ı́nfimo de A y notamos i  =   inf  A si  i  es cota inferiorde  A  y si, dada otra cota inferior  i  de  A, se cumple que  i ≥   i. Si inf  A ∈   A  lo llamamosmı́nimo y lo notamos min A.

    Proposición 1.2.   Dado A ⊆R, A = ∅ acotado superiormente, s  =  sup A es equivalente a:(1) s es cota superior de  A  y, para todo s  < s, existe as ∈  A tal que s  < as ≤ s(2) s es cota superior de  A  y, para todo ε > 0, existe aε ∈ A tal que s − ε < aε ≤ s

    Se pueden demostrar afirmaciones análogas para el ı́nfimo utilizando un argumento simétrico

    a la siguiente demostración:

    Dem.   Si s   =   sup A  entonces  s  es la menor de las cotas superiores de  A, por lo tanto paracualquier  s   <   s  existe  as ∈   A tal que s   <   as ≤   s  ya que, en caso contrario,  s   serı́a cotasuperior de  A  y  s  no serı́a supremo. (2) es equivalente ya que si  s   0tal que s  =  s  + ε (ver Observación 1.1.2).

    Axioma de completitud.  Para todo A ⊆R, A = ∅ acotado superiormente, existe sup A.Corolario del axioma de completitud.   Para todo   A ⊆   R, A =   ∅   acotado inferiormente,existe inf  A.

    Dem.   Dado A, construimos el conjunto A  = {−x :  x ∈ A}. Ya que A ⊆ R y A = ∅ , existes  =  sup  A

     por el axioma de completitud. Entonces,  s

     ≥ −x para todo x

     ∈ A, y deducimos

    ası́ que s ≤ x  para todo x ∈ A, por lo tanto s  =  inf  A.

    Definición 1.6.  Definimos la función m´ odulo o valor absoluto (notada |x|) tal que:

    |x| =

    x   si x ≥ 0−x   si x < 0

    Propiedades del módulo.   Dados a, x, y ∈R con a > 0 se verifica que:

    (1) x ≤ |x| = |− x|(2) x

    2

    = |x2

    | = |x|2

    (3) |x| < a  ⇐⇒   x ∈ (−a, a)(4) |x| > a  ⇐⇒   x ∈ (−∞, −a) ∪ (a, +∞)(5) |x + y| ≤ |x| + | y|   (desigualdad triangular)(6) ||x| − | y|| ≤ |x − y|(7) ||x| − | y|| ≤ |x + y|(8) |xy| = |x|| y|

    Principio arquimediano de N.  Para todo x ∈R existe n ∈N de modo que n > x.Dem.   Dado x ∈R, x + 1 ∈ N verifica lo pedido.

    5

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    7/50

    2. Lı́mite de sucesiones

    Definición 2.1. Llamamos una sucesi´ on de elementos de A a cualquier función   f   :

    N → A. Engeneral, utilizaremos la notación (xn)n∈N para referirnos a una sucesión   f  de números reales

    y notaremos xn a   f (n). Además, notamos (xn)n∈N ⊆ B  si xn ∈ B  para todo n ∈N.

    Definición 2.2.   Una sucesión  (xn)n∈N  se dice  acotada superiormente  si existe  x ∈  R  tal quex ≥   xn  para todo  n ∈   N. Análogamente,   (xn)n∈N   se dice   acotada inferiormente  si existex ∈   R   tal que  x ≤   xn  para todo  n ∈  N.   (xn)n∈N  se dice  acotada  si es acotada inferior ysuperiormente.

    Definición 2.3.   Decimos que una sucesión (xn)n∈N de números reales tiende a x ∈R (o bienx es el lı́mite de (xn)n∈N  ) si, para todo  ε   >  0, existe  n0 ∈  N tal que |xn − x|   <   ε para todon ≥   n0. En este caso notamos limn→∞xn   =   x, o bien  xn −−−→n→∞ x. Una sucesión que tienelı́mite se dice convergente.

    Proposición 2.1.   Dados  A ⊆   R, A =   ∅   y acotado superiormente,  s   =   sup A, existe unasucesión (xn)n∈N ⊆ A tal que xn −−−→

    n→∞ s.Análogamente, dados A ⊆R, A = ∅ y acotado inferiormente, i  =  inf  A, existe una sucesión(xn)n∈N ⊆ A tal que xn −−−→

    n→∞ i.

    Dem.   Dado s  =  sup A, para cada n ∈  N elegimos xn ∈   A de modo que s −   1n   <  xn ≤  s  <s +   1n  (ver Proposición 1.2). Queda determinada ası́ una sucesión (xn)n∈N ⊆  A en donde severifica que

     |xn

     − s

    |  <

      1

    n

     para todo  n

     ∈ N. Consecuentemente, dado  ε

     ∈ R+  basta tomar

    n0 ≥   1ε  para que se verifique |xn − s| < ε para cualquier n ≥ n0. Entonces xn −−−→n→∞ s.La demostración es análoga para el ı́nfimo.

    Definición 2.4. (xn)n∈N se dice mon´ otona creciente si xn ≤ xn+1 para todo n ∈N. Análogamente,(xn)n∈N se dice mon´ otona decreciente si xn ≥ xn+1 para todo n ∈N.Decimos que la monotonı́a es estricta si xn = xn+1 para todo n ∈N.Proposición 2.2. Si (xn)n∈N es monótona creciente y acotada superiormente, xn −−−→

    n→∞ supn∈N{xn}.Análogamente, si (xn)n∈N es monótona decreciente y acotada inferiormente, xn −−−→

    n→∞ inf n∈N{xn}.

    Dem.   Consideremos el conjunto   A   = {xn   :   n ∈  N}. Llamaremos  s  al supremo de   A, elcual existe ya que  (xn)   es acotada. Entonces, dado  ε ∈   R+, vemos que existe  n0   tal ques − ε

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    8/50

    Dem.  Dado que (xn)n∈N es acotada, basta con ver que tiene una subsucesión monótona paraasegurarnos de que también es convergente. Para demostrar esta proposición, primero in-

    troduciremos la siguiente definición:

    Dada  (xn) ⊆   R, decimos que el ı́ndice  n  es un  punto cumbre  de la sucesión si para todo p > n se verifica que  xn  > x p

    Consideremos entonces el conjunto  A  = {n ∈N :  n  es punto cumbre de (xn)}Supongamos que  A es finito. Entonces existe  n1 ∈  N tal que para todo n ≥  n1, n  no es unpunto cumbre. Por lo tanto, existe  n2 ∈  N tal que  n2   >  n1  y  xn1 ≤  xn2 , dado que  n1  no espunto cumbre. A su vez, también existe n3 ∈  N tal que  n3   >  n2  y  xn2 ≤   xn3 , dado que n2tampoco es punto cumbre. De este modo, podemos construir una subsucesión estrictamente

    creciente de la sucesión original.

    Ahora bien, supongamos que  A  es infinito. Entonces, podemos construir una sucesión cre-

    ciente  n1   <   n2   <   n3   <   . . . de puntos cumbre de la sucesión. Pero entonces xn1 ≥   xn2 ≥xn3 ≥  . . . dado que cada ı́ndice es un punto cumbre. De este modo, podemos construir unasubsucesión estrictamente decreciente de la sucesión original.

    Definición 2.6.  Dado un conjunto  A, decimos que la función  d   :   A × A  →  R  define unam´ etrica en A si verifica que, para todo x, y, z ∈ A:

    (1).   d(x, y) ≥ 0

    (2).   d(x, y) = d( y, x)(3).   d(x, y) ≤ d(x, z) + d( z, y)Observación.   d(x, y) = |x − y| define una métrica sobre R.Definición 2.7.   Llamamos norma euclı́dea a la función  ·  : Rn → R definida como:

    x =  n∑ 

     j=1

    x2 j

    La norma euclı́dea es tambı́en notada x2

    Observación.   La norma euclı́dea verifica que, para todo  x ∈Rn

    :(1) 0 ≤ x(2) cx = |c| · x para todo c ∈R(3) x ∈R ⇒ x = |x|Definición 2.8.   Llamamos norma infinito o  norma sup a la función  · ∞   :  Rn →  R definidacomo:

    x∞ =   max j∈{1,2,...,n}

    |x j|Observación.  Tanto la norma euclı́dea como la norma infinito definen métricas sobre  Rn;

    nos referimos a la norma euclı́dea al hacer referencia a distancias en Rn salvo que sea especi-

    ficado lo contrario.

    7

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    9/50

    Proposición 2.3.  Para todo x ∈Rn se cumple que x∞ ≤ x ≤ √ 

    nx∞Dem.

     x

     ≤ x

     si y sólo si

     |x j

    | ≤ x

     para todo   j

     ∈ {1 , 2 , . . . , n

    }, pero esto es obvio ya

    que:

    |x j| = 

    x2 j ≤ 

    x21 + x22 + · · · + x2 j  + · · · + x2n = x

    Además, como x∞  =  max|x j|:

    x = 

    x21 + x22 + · · · + x2n ≤

     nx2∞ =

    √ nx∞

    Definición 2.9.  Definimos la bola de centro x ∈ Rn  y radio r ∈ R (notada Bx(r) o bien B(x, r))al conjunto definido como:

    Bx(r) = { y ∈Rn : d(x, y) < r}Definición 2.10.  Un conjunto A ∈Rn se dice acotado si existe  M ∈ R tal que ||a|| ≤ M(∀a ∈ A), o, equivalentemente, A ⊆ B M(0) (en general, entendemos como el punto 0 ∈ Rk  al punto(0 , . . . , 0)). Una sucesión ( pn)n∈N ⊆  Rn se dice acotada si existe  M ∈  R tal que  pn ≤   Mpara todo n ∈N.

    Definición 2.11.  Decimos que una sucesión  ( pn)n∈N ⊆  Rn tiende a p ∈  Rn (o bien  p es ellı́mite de ( pn)n∈N) si para todo ε > 0 existe n0 ∈ N tal que  pn − p < ε, para todo n ≥ n0; o,equivalentemente, si para todo ε > 0 existe n0 ∈ N tal que pn ∈ B p(ε), para todo n ≥ n0.

    Esto generaliza la noción de lı́mite introducida en la Definición 2.3, de la que seguiremos

    utilizando su notación.

    Proposición 2.4.   Una sucesión ( pk  = ( pk 1 , pk 2 , . . . , pk n ))k ∈N ⊆  Rn converge a un valor  l   =(l1, l2, . . . , ln) si y sólo si se verifica:

    ( pk  j ) −−→k →∞

    l j para todo j ∈ {1 , 2 , . . . , n}

    Dem.   (⇒) Supongamos que  pk  −−−→n→∞ l, es decir, para todo ε > 0 existe k 0 ∈ N de modo que

     pk  − l  <  ε para cualquier k  ≥ k 0. Pero, por lo demostrado en la Proposición 2.3, tenemosque:

    max j∈{1,2,...,n}

    | pk  j − l j|

     =  pk  − l∞ ≤  pk  − l < ε

    lo cual implica que cada coordenada de la sucesión tiende a su correspondiente coordenada

    del lı́mite.

    (⇐) Supongamos que   pk  j   tiende a   l j  para todo   j ∈ {1 , 2 , . . . , n}. Dado  ε   >   0, definimosε  =   ε√ 

    n. Dado que todas las coordenadas tienden a su correspondiente lı́mite, existe k 0 ∈ N

    tal que | pk  j − l j| < ε si  k  ≥ k 0 para todo j ∈ {1 , 2 , . . . , n}. Entonces, tenemos que:

    max j∈{1,2,...,n}| pk  j − l j| < ε

    8

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    10/50

    Y por lo demostrado en la Proposición 2.3:

     p

    k  −l ≤

    √ n p

    k  −l∞  < ε

    Por lo tanto, pk  −−−→n→∞ l

    Proposición 2.5.  Si una sucesión de puntos de Rn es convergente, entonces es acotada.

    Dem.   Llamemos (xn)n∈N  a la sucesión y l  a su lı́mite. Existe entonces  n0 ∈  N tal que |xn −l| < 1 para todo n ≥ n0, por lo que m  =  l  + 1 > xn a partir de n0. Sea A  = {xn   :  n ≤ n0}, essimple ver que  A  es finito y, por lo demostrado en la Proposición 1.1, acotado. Por lo tanto,

    sup ( A ∪ {m}) es cota superior de la sucesión.La demostración es análoga para cotas inferiores.

    Definición 2.12.   El complemento de un conjunto  A ∈  Rn, notado  Ac, es el conjunto definidocomo Ac = {x ∈ Rn :  x ∈  A}Definición 2.13. Un conjunto A ∈Rn se dice abierto si para todo p ∈ A existe r ∈R+ tal que B p(r) ⊆ A. Además, A  se dice cerrado si  Ac es abierto.

    Proposición 2.6.  Un conjunto  A ∈  Rn es cerrado si y sólo si toda sucesión de elementos de A converge a un elemento de  A.

    Dem.   (⇒) Supongamos  A ∈  Rn cerrado y (xn) ⊆   A  tal que  xn →   p. Si  p ∈   A, entonces p ∈  Ac.   Ac es abierto por hipótesis, ya que A  es cerrado. Por lo tanto, existe r ∈  R+ tal quela bola centrada en  p de radio r  está totalmente contenida en  A

    c

    . Pero, dado este r , existen0 ∈ N tal que |xn0 − p| < r ya que xn → p. Entonces xn0 ∈  A y xn0 ∈  Ac, lo cual es absurdo.Por lo tanto, p ∈ A.

    (⇐)   A ∈   Rn es un conjunto tal que toda sucesión de elementos de   A  converge a un ele-mento de  A. Supongamos que   A   no es cerrado. Entonces,   Ac no es abierto, por lo tanto

    existe  x ∈   Ac tal que toda bola centrada en  x  contiene elementos de  A. Construimos en-tonces la sucesión  (xn)  tal que  xn  es un punto de  A  contenido en la bola centrada en  x  deradio   1n . Pero entonces xn es una sucesión de elementos de  A  que converge a x ∈  A, lo cuales absurdo. Por lo tanto,  A  es cerrado.

    Definición 2.14.  Dado un conjunto A ∈Rn, definimos los siguientes conjuntos:(1) La frontera de  A, notada ∂ A y definida:

    ∂ A = {x ∈Rn : Bx(r) ∩ A = ∅ y Bx(r) ∩ Ac = ∅ para todo r > 0}

    (2) La clausura de  A, notada   ¯ A y definida   ¯ A =  A ∪ ∂ A(3) El interior de  A, notado Ao y definido:

     Ao = {x ∈ A : existe r > 0 tal que Bx(r) ⊆ A)}

    Observación.  Dado un conjunto A ∈Rn,   ¯ A es el menor cerrado que contiene a A, y  Ao es elmayor abierto contenido en A.

    9

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    11/50

    Definición 2.15.  Definimos la bola cerrada de centro x ∈Rn  y radio r ∈ R (notada Bx(r) o bienB(x, r)) al conjunto definido como:

    Bx(r) = { y ∈Rn : d(x, y) ≤ r}

    o equivalentemente, como la clausura de Bx(r)

    Definición 2.16.  Un conjunto  A ∈Rn se dice compacto si es cerrado y acotado.

    10

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    12/50

    3. Continuidad y lı́mite de funciones

    Definición 3.1.  Dada una función   f   :   A →   B, la imagen de   f , notada Im( f ), es el conjuntodefinido como

    Im( f ) = { y ∈ B   : existe x ∈ A tal que y  =   f (x)}Definición 3.2.  Dada una función   f   :   A ⊆   Rn →   R, el  gr´ afico  de   f , notado gr( f ), es elconjunto definido como

    gr( f ) =

    (x1, . . . , xn, xn+1) ∈Rn+1 : ( y = (x1, . . . , xn) ∈ A ∧ xn+1  =   f ( y))

    Definición 3.3.  Dados una función   f   :  A ⊆ R2 → R y c ∈R, definimos la curva de nivel de f asociada a c, notada CNc( f ), como el conjunto:

    CNc( f ) =

    (x1, x2) ∈R2 :   f (x1, x2) = cObservación.   CNc( f ) = ∅ si y sólo si c ∈ Im( f )Definición 3.4.  Dados una función   f   :  A ⊆Rn → R, p ∈   ¯ A y l ∈ R, decimos que   f (x) tiendea l cuando x tiende a p, o bien que l es el lı́mite de f (x) al tender x a p si se cumple que:

    (∀ε ∈R+)(∃δ ∈R+) tal que (0 < x − p < δ con x ∈ A) ⇒ | f (x) − l| < εEn tal caso, notamos lim

    x→ p  f (x) = l , o bien   f (x) −−→x→ p l.

    Proposición 3.1  ( Álgebra de lı́mites).  Dados un conjunto   A ⊆   Rn, el punto   p ∈   ¯ A  y lasfunciones   f   :  A →R y g  :  A →R tales que limx→ p   f (x) = l1 y limx→ p g(x) = l2. Entonces:

    (1). limx→ p( f  + g)(x) = l1 + l2(2).   (∀c ∈R)limx→ p(c f )(x) = cl1(3). limx→ p( f g)(x) = l1l2(4). Si   l1   =   0, entonces existe   δ   ∈   R+ tal que, si 0   <   ||x −   p||   <   δ   (con

    x  ∈   A) entonces | f (x)| ≥   |l1|2   >   0. En particular,   f (x) =   0 en algún entorno de p.

    (5). Si l1

     = 0, entonces limx→ p 1 f  (x) =   1l1

    (6). Si l2 = 0, entonces limx→ p

     f  g

    (x) =   l1l2

    Dem.   (1). Dado ε ∈  R+, definimos ε   =   ε2 . Dado que   f  tiende a  l1  y g tiende a  l2  al acer-carnos a  p, existen δ, δ ∈ R+ de modo que:

    0 < x − p < δ ⇒ | f (x) − l1| < ε y 0 < x − p < δ ⇒ | g(x) − l2| < ε

    Definimos entonces δ  =  min{δ, δ}. Entonces, si 0 < x − p < δ:| f (x) + g(x) − (l1 + l2)| ≤ | f (x) − l1| + | g(x) − l2| < 2ε  = ε

    Por lo tanto ( f  + g)(x) tiende a l1 + l2 cuando x  tiende a  p.

    11

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    13/50

    (2). Dado ε ∈R+, definimos ε  =   ε|c| . Dado que   f  tiende a l1 existe δ ∈R+ de modo que:0 <

    x

    − p

    < δ

     ⇒ | f (x)

    −l1|< ε

    Pero entonces:

    0 < x − p < δ ⇒ |c f (x) − cl1| = |c| · | f (x) − l1| < εPor lo tanto c f (x) tiende a cl1 cuando x  tiende a  p.

    (3). Tomemos un cierto ε ∈R+. Observemos entonces que:| f (x) g(x) − l1l2| = | f (x) g(x) +   f (x)l2 −   f (x)l2 − l1l2|

    = | f (x)( g(x) − l2) + l2( f (x) − l1)|≤ | f (x)( g(x) − l2)| + |l2( f (x) − l1)|= | f (x)| · | g(x) − l2| + |l2| · | f (x) − l1|

    Ahora bien, ya que   f (x) es convergente a l1, podemos asegurar que   f (x) es acotado enun cierto entorno de  p. Para demostrarlo, partimos de que, ya que   f (x) tiende a l1  altender x  a  p, existe δ ∈ R+ tal que:

    0 < x − p < δ ⇒ | f (x) − l1| < 1Entonces es f ́acil ver que 0   <   | f (x)|   <   max {|l1 − 1|, |l1 + 1|}   =   M  para nuestraelección de δ.Ahora bien, dado que g(x) tiende a l2 al tender x  a  p, entonces existe δ ∈ R+ tal que:

    0 < x − p < δ ⇒ | g(x) − l2| <ε

    2 M

    y, consecuentemente:

    0 < x − p < min δ, δ ⇒ | f (x)| · | g(x) − l2| ≤ M| g(x) − l2| < ε2

    A su vez, dado que   f (x) tiende a l1 al tender x  a  p, entonces existe δ ∈ R+ tal que:

    0 < x − p < δ ⇒ | f (x) − l1| < ε2|l2|  ⇐⇒ |l2| · | f (x) − l1| <

    ε

    2

    Por lo tanto, definimos δ  =  min {δ, δ , δ}. Se deduce entonces que, si 0 < ||x − p|| <δ:

    | f (x) g(x) − l1l2| ≤ | f (x)| · | g(x) − l2| + |l2| · | f (x) − l1| < ε2

     +   ε2

      = ε

    Finalmente ( f g)(x) tiende a l1l2 cuando x  tiende a  p.

    (4). Dado que   f  tiende a l1 existe δ ∈R+ de modo que:

    0 < x − p < δ ⇒ | f (x) − l1| < |l1|2

    Esto se cumple ya que, por hipótesis,   l1 =  0. Deducimos entonces que, si 0  

    |l1

    | − |l1|

    2

      = |l1|

    2

      > 0

    12

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    14/50

    (5). Remarquemos primero que   1 f (x)

      está bien definido en un cierto entorno de   p  por lo

    probado en el punto anterior; formalmente, decimos que existe   δ  ∈   R+ tal que si0 < x − p < δ entonces | f (x)| >  |

    l1 |2   > 0, y consecuentemente,   f (x) = 0.

    Ahora bien, dado ε ∈  R+, definimos ε  =  ε · |l1 |22   . Como   f   tiende a l1  cuando x  tiendea  p, existe  δ  ∈  R+ tal que si 0     0,entonces   f (x)   >  0 en un entorno de  p; formalmente, existe r ∈  R+ tal que   f (x)   >  0 paratodo x ∈ Br( p).Análogamente, si l  < 0, entonces   f (x) < 0 en un entorno de  p.Dem.  Por lo demostrado en la Proposición 3.1, existe  r ∈  R+ tal que, si 0   0.Ahora bien, si l   >  0, entonces | f (x)| ≥   l2   >  0 para todo  x ∈  Br( p), pero   f (x) <  0, ya que,si lo fuera, | f (x) − l|   > |l|   =   l  y entonces   f (x)  no tenderı́a a  l . Concluimos entonces que f (x) > 0 para todo x ∈ Br( p).La demostración para l  < 0 es análoga.

    Corolario.   Si   f (x) ≥ 0 para todo x ∈ A y limx→ p   f (x) = l , entonces l ≥ 0Análogamente, si   f (x) ≤ 0 para todo x ∈ A y limx→ p   f (x) = l , entonces l ≤ 0

    Dem.   Este enunciado es el contrarrecı́proco de la Proposición 3.2

    Proposición 3.3.  Dada una función   f   :  A ⊆Rn → R y un punto p ∈ A, se verifica que: f (x) −−→

    x→ p 0 ⇐⇒ | f (x)| −−→x→ p 0

    Dem.   (⇒) Si   f  tiende a 0 al aproximarse a p, entonces, dado ε ∈R+, existe δ ∈R+ de modoque, si 0 < x − p < δ entonces | f (x) − 0| = || f (x)| − 0| < ε, por lo que | f | también tiendea 0.

    (⇐) Si | f | tiende a 0 al aproximarse a  p, entonces, dado ε ∈R+, existe δ ∈R+ de modo que,si 0  

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    15/50

    Definición 3.5.  Dados una función   f   :  A ⊆  Rn →  R y un punto  p ∈   Ao, decimos que   f   escontinua en p si limx→ p   f (x) =   f ( p).

    Además,   f  es continua en A, o simplemente continua, si es continua en p  para todo p ∈ Ao

    .

    Corolario.  Dados las funciones   f   :  A ⊆ Rn →  R y g  :  A ⊆ Rn →  R y el punto  p ∈  A talesque   f  y g son continuas en  p. Entonces:

    (1).   ( f  + g) es continua en p

    (2). Para todo c ∈R, (c f ) es continua en p(3).   ( f g) es continua en p

    (4).

     f  g

    está bien definida en un entorno de  p  y es continua en p  si  g( p) = 0

    Dem.   Este enunciado es análogo al presentado en la Proposición 3.1

    Observación.   Si   f   : R2 → R es continua, entonces el conjunto

     A = {(x, y) ∈R2 :   f (x, y) = 0}

    es abierto.

    Dem.   Si p ∈   A, entonces   f ( p) =  c con |c| =  0. Como   f   es continua, existe un entorno de pen el cual | f ( p) − c| n0, por lo que concluimos que   f (xn) tiendea   f ( p) al tender n a infinito.

    Definición 3.6.   Dados una función   f    :   A   ⊆   Rn →   Rk  (es decir, f    = ( f 1, f 2, . . . , f k )   y   f (x)   es la   k -upla  f 1(x), f 2(x), . . . , f k (x), con f i   :   A ⊆  R

    n

    →  R  para todo   i ∈ {1 , 2 , . . . , k }) y un punto  p ∈   Ao

    , decimos que   f   es con-tinua en p si:

    (∀ε ∈R+)(∃δ ∈R+) tal que (x − p < δ con  x ∈ A) ⇒  f (x) −   f ( p) < ε

    Nótese que el término x − p hace referencia a la norma euclı́dea en  Rn, mientras que eltérmino  f (x) −   f ( p) se refiere a la norma euclı́dea en Rk .Además,   f  es continua en A si es continua en  p  para todo  p ∈ Ao.Esto generaliza la noción de continuidad introducida en la Definición 3.5.

    Proposición 3.4.  Dados una función   f   :  A ⊆ Rn → Rk  y un punto p ∈ Ao,   f  es continua en p si y sólo si   f 

    i es continua en  p  para todo i

     ∈ {1 , 2 , . . . , k 

    }14

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    16/50

    Dem.   (⇒) Dado ε ∈  R+, existe δ ∈  R+ tal que si x − p  <  δ entonces  f (x) −   f ( p)  <   ε.Entonces, por lo visto en la Proposición 2.3 tenemos que:

    maxi∈{1,2,...,k }

    | f i(x) −   f i( p)| =  f (x) −   f ( p)∞ ≤  f (x) −   f ( p) < ε

    Por lo tanto, cada   f i es continua en  p.

    (⇐) Por lo visto en la Proposición 2.3 tenemos que: f (x) −  f ( p) ≤

    √ k  f (x) −   f ( p)∞ =

    √ k    max

    i∈{1,2,...,k }| f i(x) −   f i( p)|

    Como todas las   f i son continuas en  p, dado ε ∈  R+ vemos que existe un  δi ∈  R+ para cada f i de modo que, si ||x − p|| < δi entonces:

    | f i(x) −   f i( p)| < ε√ k 

    ⇐⇒ √ k | f i(x) −   f i( p)| < ε

    Deducimos ası́ que:

     f (x) −   f ( p) ≤√ 

    k    maxi∈{1,2,...,k }

    | f i(x) −   f i( p)| < ε

    Por lo tanto,   f  es continua en  p.

    Teorema de Bolzano (o Teorema del Valor Intermedio).   Sea

     f   :   [a, b]

     →  R  una función continua en el intervalo  (a, b)  con  a, b

     ∈  R,   a   <   b,   f (a)   <   0

    y   f (b) > 0 (o bien,   f (a) > 0 y   f (b) < 0). Entonces existe c ∈ (a, b) tal que   f (c) = 0.Dem.   Supondremos que   f (a)   <   0   <   f (b)   (la demostración del caso inverso es análoga).Consideremos entonces el conjunto  A   = {x ∈   [a, b]   :   f (x)   <   0}.   A =   ∅  ya que  a ∈   A,y además es acotado (ya que es un subconjunto de   [a, b], que es acotado). Entonces, porel axioma de completitud, existe  s  =   sup A. Además,  s ∈   (a, b) (esto se debe a que, por lacontinuidad de f , existen entornos de a y b en los que la función conserva el signo, y entonces

    cada uno de sus puntos pertenecen a A  o son cotas superiores de  A, respectivamente)

    Ahora bien,   f (s) <  0 ya que, si lo fuera, existirı́a un entorno de  s  que contenga al puntos  > s de modo que   f (s) < 0, y entonces s no serı́a supremo de  A.Además,   f (s)

     >  0, porque, análogamente, en caso de serlo existirı́a un entorno de  s  que

    contenga al punto s  < s de modo que   f (s) > 0, y entonces s no serı́a supremo de  A.Concluimos entonces que s ∈ (a, b) satisface que   f (s) = 0Generalización del Teorema de Bolzano. Sea f   : [a, b] →R una función continua en el inter-valo   (a, b)   con   a, b   ∈   R,   a   <   b,   f (a)   <   f (b)   yc ∈   ( f (a), f (b))  (o bien   f (b)   <   f (a)  y  c ∈   ( f (b), f (a)). Entonces existe d ∈   (a, b)  tal que f (d) = c.

    Dem.  Supondremos que   f (a)  <   f (b) (la demostración del caso inverso es análoga). Defin-imos entonces  g   :   [a, b] →   R  de modo que  g(x) =   f (x) − c. Podemos ver que  g(a) = f (a) − c < 0, g(b) =   f (b) − c > 0. Entonces, por el Teorema de Bolzano, existe  d ∈ (a, b) demodo que g(d) =   f (d) − c =  0, por lo que se deduce que   f (d) = c.

    15

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    17/50

    Definición 3.7.  Una función   f   :   A ⊆   Rn →  Rk  se dice  acotada  si existe  M ∈  R+ tal que|| f (x)|| ≤ M para todo x ∈ A, o equivalentemente, si existe r ∈ R+ tal que Im( f ) ⊆ Br(0).

    Teorema de Weierstrass.   Sea   f   :  A ⊆Rn → Rk  una función continua, con A = ∅ compacto,entonces   f  es acotada y además alcanza máximo y mı́nimo, es decir, existen tanto max Im( f )como min Im( f )

    Dem.  Supongamos que   f   no es acotada. Entonces, construimos la sucesión (xn) de elemen-tos de  A  de modo que | f (xn)|  > n para cada n ∈  N, y por lo tanto   f (xn) −−−→

    n→∞ +∞. Como A  es acotado, por el Teorema de Bolzano-Weierstrass existe una subsucesión (xn j ) conver-gente a un punto  p, el cual debe pertenecer a  A  debido a que es un conjunto cerrado (ver

    Proposición 2.6). Pero entonces   f (xn j ) −−→ j→∞

    +∞  y   f (xn j ) −−→ j→∞

     f ( p), lo cual es absurdo.

    Entonces   f  es acotada.

    Como  A   =   Im( f )  es un conjunto acotado y  A =  ∅, por el axioma de completitud, existes   =   sup A. Por lo visto en la Proposición 2.2, existe una sucesión (xn) de elementos de  Aconvergente a s. Pero A  es cerrado, entonces s ∈ A y por lo tanto s  =  max  A.La demostración para el mı́nimo es análoga.

    16

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    18/50

    4. Derivabilidad y diferenciabilidad

    Definición 4.1. Dada una función   f   : (a, b) →

    R, con a, b ∈

    Ry a

    <

    b, y un punto x0 ∈ (a, b),se dice que   f  es derivable en x0 si existe l ∈ R tal que:

    l =   limx→x0

     f (x) −   f (x0)x − x0 = limh→0

     f (x0 + h) −   f (x0)h

    En este caso, decimos que l  es la derivada de f en x0 y notamos   f (x0) = l .

    Además, decimos que   f  es derivable en un conjunto  A ⊆   (a, b) si   f  es derivable en x  paratodo x ∈ A.Una interpretación geométrica del concepto de derivada es el de la pendiente de la recta

    tangente al gráfico de   f  por el punto (x0, f (x0)), cuya ecuación es:

     y =   f (x0)(x − x0) +   f (x0)Lema 4.1.  Dada una función   f   :   (a, b) →  R, con  a, b ∈  R  y  a   <   b  derivable en un puntox0 ∈ (a, b), entonces   f  es continua en x0Dem.   Consideremos el siguiente lı́mite:

    limx→x0

     f (x) −   f (x0) =   limx→x0

     f (x) −   f (x0)x − x0 (x − x0)

    =   limx→x0

     f (x) −   f (x0)x − x0 ·   limx→x0 x − x0

    =   f (x0) · 0 =  0Por lo tanto,   f (x) tiende a   f (x0) al tender x  a  x0, o sea,   f  es continua en x0

    Lema 4.2.  Dada una función   f   :   (a, b) →  R, con  a, b ∈  R  y  a   <   b  derivable en un puntox0 ∈ (a, b), si   f  es creciente, entonces   f (x0) ≥ 0 (o, si es decreciente,   f (x0) ≤ 0)Dem.  Por la definición de derivada, tenemos que:

     f (x0) =   limx→x0

     f (x) −   f (x0)x − x0 =   limx→x−0

     f (x) −  f (x0)x − x0

    Es fácil ver que el lı́mite lateral es no-negativo, ya que tanto el numerador (por la monotonı́a

    de   f ) como el denominador son negativos.

    La demostración para   f  decreciente es análoga.

    Lema 4.3.  Dada una función constante   f   :  (a, b) →  R, con a, b ∈  R y  a  <  b se verifica que f (x) = 0 para todo x ∈ (a, b)Dem.   Dado x0 ∈ (a, b), calculemos   f (x0):

     f (x0) =   limx→x0

     f (x) −   f (x0)x − x0 =   limx→x0

    0

    x − x0 = 0

    17

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    19/50

    Teorema de Rolle.  Dada una función   f   :  [a, b] → R, con a, b ∈  R y a  <  b , continua en [a, b]y derivable en (a, b), si   f (a) =   f (b), entonces existe un punto c ∈ (a, b) tal que   f (c) = 0Dem.   Como   f  es continua y [a, b] es compacto, por el Teorema existen x0, x1 ∈  [a, b] tal que f (x0) = maxIm( f ) y   f (x1) = min Im( f ).Supongamos que x0 ∈ (a, b). Ahora bien, como   f  es derivable en (a, b), tenemos que:

    0 ≥   limx→x−0

     f (x) −  f (x0)x − x0 =   f 

    (x0) =   limx→x+0

     f (x) −   f (x0)x − x0 ≥ 0

    Esto se deduce del hecho que   f (x0) ≥  f (x) para todo x ∈ [a, b]. Por lo tanto,   f (x0) = 0Podemos aplicar el mismo razonamiento a  x1. Entonces, falta considerar el caso en el cual

    x1 = x2 = a  =  b, pero esto es trivial, ya que si   f (a) es tanto el mı́nimo como el máximo de laimagen, entonces   f (x) ≤   f (a) ≤   f (x) para todo  x ∈   [a, b], es decir, la función es constante,y, por el Lema 4.3   f (x) = 0 para todo x ∈ (a, b).Teorema de Lagrange.  Dada una función   f   :   [a, b] →  R, con a, b ∈  R y a  <  b, continua en[a, b] y derivable en (a, b), entonces existe un punto c ∈ (a, b) tal que:

     f (b) −   f (a)b − a   =   f 

    (c)

    Dem.  Consideremos la función g  :  [a, b] →R definida tal que:

     g(x) =   f (x) −   f (b) −   f (a)b − a   (x − a) −  f (a)

    Es f ́acil ver que  g  es continua en  [a, b] y derivable en (a, b), y además se verifica que g(a) = g(b) = 0. Entonces, por el Teorema de Rolle, existe  c ∈ (a, b) tal que g(c) = 0. Ahora bien:

    0 =  g (c) =   f (c) −   f (b) −   f (a)b − a   =⇒   f 

    (c) =  f (b) −   f (a)

    b − a

    Teorema de Cauchy.  Dadas las funciones   f   :   [a, b] →   R  y  g   :   [a, b] →   R, con  a, b ∈   Ry   a   <   b, continuas en   [a, b]  y derivables en  (a, b), si se verifica que  g(x) =  0 para todox ∈ (a, b), entonces existe un punto c ∈ (a, b) tal que:

     f (b) −   f (a)

     g(b) − g(a)  =

      f (c)

     g(c)Dem.  Consideremos la función h  :  [a, b] →R definida tal que:

    h(x) = ( f (x) −   f (a))( g(b) − g(a)) − ( g(x) − g(a))( f (b) −  f (a))Es f ́acil ver que h  es continua en [a, b] y derivable en (a, b), y además se verifica que h(a) =h(b) = 0. Entonces, por el Teorema de Rolle, existe  c ∈ (a, b) tal que h(c) = 0. Ahora bien:

    0 =  g (c) =   f (c)( g(b) − g(a)) − g(c)( f (b) −   f (a))

    =⇒   f (c)( g(b) − g(a)) = g (c)( f (b) −   f (a)) =⇒   f (c)

     g(c)  =

      f (b) −   f (a) g(b) − g(a)

    18

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    20/50

    Proposición 4.1.  Dada una función   f   :   (a, b) ⊆  R →  R con a   <  b, si   f (x) ≥  0 para todox ∈   (a, b), entonces   f  es creciente; alternativamente , si   f (x) ≤  0 para todo  x ∈   (a, b),entonces   f  es decreciente. Esta afirmación es el converso de lo demostrado en el Lema 4.2.

    Dem.   Dados x, y ∈R tales que x <  y, por el Teorema de Lagrange existe un punto c ∈ (x, y)tal que:

     f ( y) −  f (x) y − x   =   f 

    (c)

    de lo que se deduce que el numerador es positivo, ya que tanto el denominador como el lado

    derecho de la ecuación lo son. Consecuentemente,   f  es creciente.

    La demostración es análoga para   f  con derivada negativa.

    Definición 4.2.  Dada una función   f   :  A

     ⊆Rn

    →R, con A  abierto, p

     ∈ A e i

     ∈ {1 , 2 , . . . , n

    },

    decimos que   f  es derivable en p respecto de xi si existe l ∈ R tal que:

    l =   limx→ pi

     f ( p1, p2, . . . , pi−1, x, pi+1, . . . , pn−1, pn) −   f ( p)x − pi

    En este caso, decimos que l  es la derivada parcial de f respecto de x i en p y notamos  ∂ f ∂xi

    ( p) = l ,o bien   f xi ( p) = l .Además, decimos que   f   es derivable en un conjunto B ⊆  A respecto de x i  si   f  es derivableen y respecto de xi para todo y ∈ B, o derivable en B  si existen todas sus derivadas parcialespara cada punto de B.

    Observación.   Dada una función   f   :   A ⊆   Rn →   R  derivable en   p ∈   A   respecto de  xi,definimos g  : R →R de modo que:

     g(x) =   f ( p1, . . . , pi−1, x, pi+1, . . . , pn)

    Entonces  ∂ f ∂xi

    ( p) = g ( pi)

    Dem.  Por la definición de derivada parcial:

    ∂ f 

    ∂xi( p) =   lim

    x→ pi f ( p1, . . . , pi−1, x, pi+1, . . . , pn) −   f ( p)

    x − pi=   lim

    x→ pi  g(x) − g( pi)x − pi = g ( pi)

    Observación.  Si bien una función de  R  en  R   es continua en  x   si es derivable en   x, una

    función de  Rn en  R   puede no ser continua en   x   pese a que existan todas sus derivadas

    parciales en x.

    Dem.  Veamos que la función   f   : Rn → R definida tal que:

     f (x) =   1 si (∃i ∈ {1 , 2 , . . . , n})xi = 00 si (∀i ∈ {1 , 2 , . . . , n})xi = 0

    19

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    21/50

    es un contraejemplo:

    ∂ f 

    ∂xi (0̄) = limx→0 f (0 , . . . , x, . . . , 0)

    −  f (0̄)

    x − 0   = limx→00

    x − 0  = 0para todo xi, pero claramente   f  no es continua en 0̄, ya que, en caso de aproximarnos a 0̄ por

    la recta definida por los múltiplos del vector (1 , . . . , 1), tenemos que:

    limx→0̄

     f (x) = 1 = 0  =   f (0̄)

    dado que ninguna coordenada se anula.

    Definición 4.3.  Dada una función   f   :  A ⊆  Rn →  R, con  A  abierto,  p ∈  A y  v ∈  Rn tal quev =  1 (es decir, v  es un vector unitario) decimos que el siguiente lı́mite, en caso de existir,es la derivada direccional de f en la direcci´ on de v en el punto p:

    limh→0

     f ( p + hv) −  f ( p)h

    En caso de existir, notamos a esta derivada como  ∂ f ∂v ( p).

    Definición 4.4.  Dada una función   f   :   A ⊆  Rn →  R, con  A  abierto,   p ∈   A  y   f   derivablerespecto de  x  e  y  en  p, llamamos gradiente de f en p, y notamos ∇ f ( p), al vector definidocomo:

    ∇ f ( p) = ( f x1 ( p), f x2 ( p), . . . , f xn ( p))

    Definición 4.5.  Dada una función   f   :  A ⊆  Rn →  R, con  A  abierto y  p ∈  A, decimos que   f es diferenciable en p si existen a1, a2, . . . , an ∈ R tal que:

    limx→ p

     f (x) −   f ( p) − a1(x1 − p1) − a2(x2 − p2) − · · · − an(xn − pn)x − p   =

     0̄

    Los términos del numerador que restan son aquellos que definen al (hiper)plano tangente al

    gráfico de   f  en el punto ( p1, p2, . . . , f ( p)), cuya ecuación es:

    xn+1  =   f ( p) +   f x1 ( p)(x1

     − p1) +  f x2 ( p)(x2

     − p2) +

    · · ·+  f xn ( p)(xn

     − pn)

    Además, decimos que   f  es diferenciable en un conjunto B ⊆ A si   f  es diferenciable en y paratodo y ∈ B.

    Es esencial notar que la diferenciabilidad es una generalización de la derivabilidad, para

    llevar el concepto de aproximación lineal a funciones multivariables.

    Teorema 4.1.  Dada una función diferenciable   f   :  A ⊆R2 → R y p ∈ A, se verifica que:(1).   f  es continua en  p

    (2). Existe ∇ f ( p) = (a, b), donde  a  y  b  son los coeficientes que determinan al plano tan-gente al gráfico de   f  en ( p1, p2, f ( p)).

    20

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    22/50

    (3). Para todo vector unitario v existe  ∂ f ∂v ( p) = ∇ f ( p), v

    Estos resultados son generalizables a funciones   f   :  A ⊆

    Rn

    →R

    Dem.   (1). Consideremos la siguiente expresión:

     f (x, y) −   f ( p) − a(x − p1) − b( y − p2)(x, y) − p   (x, y) − p + a(x − p1) + b( y − p2)

    =   f (x, y) −   f ( p) − a(x − p1) − b( y − p2) + a(x − p1) + b( y − p2) =   f (x, y) −  f ( p)Ahora bien, es fácil ver que esta expresión tiende a 0 al aproximarnos a  p por álgebra

    de lı́mites, dado que:

     f (x, y)

    −  f ( p)

    − a(x

    − p1)

    −b( y

    − p2)

    (x, y) − p   −−−−→(x, y)→ p 0por la diferenciabilidad de   f . Es fácil ver que el resto de los términos involucrados en

    la expresión también tienden a 0.

    Por lo tanto,   f (x, y) −−−−→(x, y)→ p

     f ( p), entonces   f  es continua en p.

    (2). Como   f  es diferenciable en  p, sabemos que:

     f (x, y) −   f ( p) − a(x − p1) − b( y − p2)(x, y) − p   −−−−→(x, y)→ p 0

    En particular, si nos acercamos fijando  y  =   p2  el lı́mite sigue siendo el mismo, por loque tenemos:

     f (x, p2) −   f ( p) − a(x − p1) − b( p2 − p2)(x − p1, p2 − p2)   −−−→x→ p1 0

    ⇐⇒   f (x, p2) −   f ( p) − a(x − p1)|x − p1|   −−−→x→ p1 0

    Ahora bien, reemplacemos   a  por la expresión   f (x, p2)− f ( p)

    x− p1 , la cual forma parte de ladefinición de   f x:

     f (x, p2) −   f ( p) −  f (x, p2)− f ( p)

    x− p1 (x − p1)|x − p1|   −−−→x→ p1 0

     f (x, p2) −   f ( p) − ( f (x, p2) −   f ( p))|x − p1|   =

      0

    |x − p1| −−−→x→ p1 0

    Por lo tanto, tenemos que   f x( p) = a.La demostración es análoga para   f  y( p).

    (3). Como   f  es diferenciable en  p, sabemos que:

     f (x, y) −   f ( p) − a(x − p1) − b( y − p2)

    (x, y)

    − p

      −−−−→

    (x, y)

    → p

    0

    21

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    23/50

    En particular, si nos acercamos por la trayectoria   (x, y) =   p +  hv   (es decir,   ( p1 +hv1, p2 + hv2)) el lı́mite sigue siendo el mismo, por lo que tenemos:

     f ( p + hv) −   f ( p) −   f x( p)(hv1) −   f  y( p)(hv2) p + hv − p   −−→h→0 0

    ⇐⇒   f ( p + hv) −   f ( p) − h(∇ f ( p), v)|h| · v   −−→h→0 0v   =  1 ya que  v  es un vector unitario, y podemos quitar el módulo de  h  ya que ellı́mite es 0, por lo demostrado en la Proposición 3.3. Entonces:

     f ( p + hv) −  f ( p)h

      − ∇ f ( p), v −−→h→0

    0

    Por lo tanto:

    ∂ f ∂v ( p) = ∇ f ( p), v

    Teorema 4.2.   Dada una función   f   :   A ⊆   Rn →   R   con   A   abierto, tal que existen y soncontinuas   f x( p) y   f  y( p) en  p ∈ A, entonces   f  es diferenciable en  p.Dem.   Si   f  es diferenciable en  p, tenemos que:

     f (x, y) +   f (x, p2) −   f (x, p2) −   f ( p) − a(x − p1) − b( y − p2)(x, y) − p   −−−−→(x, y)→ p 0

    Dado que   f x y   f  y son continuas en p, por el Teorema de Lagrange, existen c1 entre x y  p1 y c2

    entre y y  p2 tales que:

     f (x, p2) −  f ( p)x − p1 =   f x(c1, p2)

     f (x, y) −  f (x, p2) y − p2 =   f  y(x, c2)

    (dependiendo de la relación de orden entre  x  y  p1, y  y  p2 puede que el denominador tenga

    los términos de la resta invertidos, pero el resultado es idéntico).

    Reemplazando en la expresión anterior tenemos:

     f  y(x, c2)( y − p2) +  f x(c1, p2)(x − p1) −   f x( p)(x − p1) −   f  y( p)( y − p2)(x, y) − p

    =  ( y − p2)( f  y(x, c2) −  f  y( p)) + (x − p1)( f x(c1, p2) −   f x( p))

    (x, y) − p=

      ( y − p2)(x, y) − p ( f  y(x, c2) −   f  y( p)) +

      (x − p1)(x, y) − p ( f x(c1, p2) −   f x( p)) −−−−→(x, y)→ p 0

    dado que tanto  ( y− p2)(x, y)− p   como

      (x− p1)(x, y)− p  son menores a 1 y tanto  ( f  y(x, c2) −   f  y( p))  como

    ( f x(c1, p2) −  f x( p)) tienden a 0.

    Por lo tanto,   f  es diferenciable en  p.

    22

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    24/50

    Proposición 4.2.  Dada una función   f   :   A ⊆  Rn →  R con  A abierto y  p ∈   A, diferenciableen  p de modo que ∇ f ( p) =  0̄, entonces   ∂ f ∂v ( p) alcanza su máximo valor posible cuando setiene:

    v =  ∇ f ( p)∇ f ( p)

    Además, se verifica que:∂ f 

    ∂v( p) ≤ ∇ f ( p)

    para cualquier vector unitario v.

    Dem.  Sabemos que, para cualquier vector unitario v:

    ∂ f 

    ∂v( p) = ∇ f ( p), v

    Ahora bien, por la desigualdad de Cauchy-Schwarz:

    ∇ f ( p), v ≤ ∇ f ( p) · v = ∇ f ( p)y la igualdad sólo es alcanzada si los vectores son colineales. Dado que v es unitario, a fin de

    maximizar la derivada direccional, debemos utilizar un vector unitario colineal al gradiente,

    es decir:

    v =  ∇ f ( p)∇ f ( p)

    Definición 4.6.  Dada una función   f   :   A ⊆  Rn →  Rk ,   f   = ( f 1, f 2, . . . , f k )  con  A  abierto y p ∈ A, decimos que   f  es diferenciable en p si existe una transformación lineal T  : Rn → Rk  talque:

    limx→ p

     f (x) −   f ( p) − T (x − p)x − p   =  0̄

    Recordamos que una función  T   :   Rn →   Rk  es una transformación lineal si es aditiva yhomogénea de grado 1, es decir, si verifica que:

    (1).   T (v1 + v2) = T (v1) + T (v2)

    (2).   T (λv1) = λT (v1)

    para todo v1, v2 ∈ Rn, λ ∈R.En caso de existir, dicha transformación lineal, a la que llamamos diferencial de f en p y nota-

    mos D f  ( p) ∈  Rn×k , es determinada por la matriz formada por los gradientes de cada   f i  en p dispuestos como filas, a la cual llamamos matriz jacobiana de f en p y notamos J  f  ( p). Por lotanto:

    T (x) = D f  ( p)

    x1x2...

    xn

    =

    ∂ f 1∂x1

    ( p)   ∂ f 1∂x2 ( p)   · · ·  ∂ f 1

    ∂xn( p)

    ∂ f 2∂x1

    ( p)   ∂ f 2∂x2 ( p)   · · ·  ∂ f 2

    ∂xn( p)

    ......

      . . .  ...

    ∂ f k 

    ∂x1( p)   ∂ f k 

    ∂x2( p)

      · · ·  ∂ f k 

    ∂xn( p)

    x1x2...

    xn

    23

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    25/50

    =

    ∇ f 1( p)∇ f 2( p)

    .

    ..∇ f k ( p)

    x1x2...

    xn

    Por lo tanto, decir que   f  es diferenciable en  p es equivalente a decir que cada   f i  es diferen-

    ciable en p. Reescribiendo entonces la definición original, tenemos que   f  es diferenciable en

     p si:

    limx→ p

     f (x) −   f ( p) − D f  ( p) (x − p)x − p   =

     0̄

    Esto generaliza la noción de diferenciabilidad introducida en la Definición 4.5.

    Proposición 4.3.  Si las funciones   f   :  Rn →  Rk  y g   :  Rn →  Rk  son diferenciables, entonceslas funciones   f  + g y λ f   (con λ ∈R) también lo son.Dem.   Dado que  D f   y  D g  son transformaciones lineales, cumplen con las propiedades de

    aditividad y homogeneidad de grado 1, de lo que se deduce que:

    (1).   D f + g  = D f  + D g

    (2).   Dλ f   = λD f 

    Proposición 4.4.  Si las funciones   f   :  Rn →  Rk  y g  :  Rn →  R son diferenciables, entonces lafunción g f   también lo es.

    Dem. gf  es diferenciable si existen y son continuas todas las derivadas parciales de cada  g f i;

    por lo tanto, mostramos que se puede construir cualquier entrada del diferencial de  g f  de la

    siguiente forma:

    (D g f  )(i, j)  =  ∂ g f i

    ∂x j= g

    ∂ f i∂x j

    +  ∂ g

    ∂x j f i

    Cada una de estas derivadas existe y es continua ya que tanto   f   como g  son diferenciables,

    por lo tanto g f  es diferenciable. Más aún:

    D g f   = g D f  +∇ g

     f 1 f 2...

     f k 

    con D g f  ∈ Rn×k 

    Lema 4.4.   Dada una transformación lineal T  : Rn → Rk , existe c ∈R+ tal queT (v) < cvpara todo v ∈Rn.

    24

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    26/50

    Dem.  Recordemos que toda transformación lineal está determinada por una matriz, por lo

    tanto:

    T (v) =

    T 1,1   T 1,2   · · ·   T 1,nT 2,1   T 2,2   · · ·   T 2,n

    ......

      . . .  ...

    T k ,1   T k ,2   · · ·   T k ,n

    v1v2...

    vn

    =

    ∑ 

    n j=1 T 1, j v j   · · ·   ∑ n j=1 T k , j v j

    Es fácil ver que T (v) > T (v), donde v está definido tal que vi  = |vi| y T  está definidapor la matriz:

    T   =

     M M   · · ·   M M M   · · ·   M

    ......

      . . .  ...

     M M   · · ·   M

    donde  M   =   max

    n,k |T n,k |. Basta entonces con ver que T (v)  es menor que  cv   =   cv.

    Ahora bien:

    T (v) = M

      n

    ∑  j=1

    v j, · · ·   ,n

    ∑  j=1

    v j

    =  M k 

      n

    ∑  j=1

    v j

    2<  M

    √ k v

    Finalmente, concluimos que c >  M√ 

    k  cumple con lo solicitado.

    Lema 4.5.   Si   f   : Rn

    →Rk  es diferenciable en p, entonces   f  es continua en p.

    Dem.  Esto es inmediato ya que si   f  es diferenciable en  p, entonces cada   f i es continua en p  y

    consecuentemente también lo es   f .

    Lema 4.6.   Si   f   :  Rn →  Rk  es diferenciable en p, entonces existen δ, c ∈ R+ de modo tal quesi 0 < x − p < δ entonces:

     f (x) −   f ( p)x − p   < c

    Es decir, dicha expresión es acotada en un cierto entorno de  p.

    Dem.  Dado que   f  es diferenciable en p, también será continua en ese punto, por lo que, dado

    ε > 0, existe δ de modo que, si 0 < x − p < δ entonces  f (x) −   f ( p) < ε. Basta entoncesprobar que existe c  >  0 de modo que ε  <  cx − p  <  cδ, pero dicho c  existe; en particular,c >   εδ  cumple lo pedido.

    Proposición 4.5 (Regla de la cadena).   Si   f   :  A ⊆Rn → Rk  y g  : Rk  → R j son funciones talesque   f  es diferenciable en  p ∈  A y  g  es diferenciable en   f ( p), entonces g ◦   f  es diferenciableen p, y además:

    D g ◦ f  ( p) = D g( f ( p)) D f  ( p)

    25

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    27/50

    Dem.  Veamos entonces que:

    limx→ p g

    ◦  f (x)

    − g

    ◦ f ( p)

    − D g( f ( p)) D f  ( p)(x

    − p)

    x − p   =  0̄

    Ahora esta bien, debido a la desigualdad triangular, esa expresión es menor o igual a la

    suma de los siguientes términos:

    (1). g ◦   f (x) − g ◦  f ( p) − D g( f ( p))( f (x) −   f ( p))

    x − p(2).

    D g( f ( p))( f (x) −   f ( p)) − D g( f ( p)) D f  ( p) (x − p)

    x

    − p

    Demostraremos entonces que cada uno de estos términos tiende a 0̄.

    Para (1), supondremos   f (x) =   f ( p)  (en caso contrario el numerador es  0̄ y consecuente-mente el lı́mite también lo es). Entonces, nuestra expresión es equivalente a:

     g ◦   f (x) − g ◦   f ( p) − D g( f ( p))( f (x) −   f ( p)) f (x) −   f ( p)

     f (x) −   f ( p)x − p

    Ahora bien, sea  y   =   f (x). Dado que   f   es continua en   p  por el Lema 4.5, tenemos que

     y −−→x

    → p

     f ( p), por lo que podemos reescribir el primer término como:

     g( y) − g( f ( p)) − D g( f ( p))( y −   f ( p)) y −   f ( p)

    Ya que  g  es diferenciable en  p, este término tiende a 0̄; es obvio que el segundo término es

    acotado, debido a lo demostrado en el Lema 4.6.

    Para (2), tomamos factor común en el numerador, dejando:

    D g( f ( p)) f (x) −   f ( p) − D f  ( p) (x − p)

    x

    − p

    en donde el primer término es acotado, por el Lema 4.4 (recordando que el diferencial defineuna transformación lineal) y el segundo tiende a 0̄ debido a que   f  es diferenciable en  p.

    Queda ası́ demostrado que el lı́mite de la primer expresión es  0̄, y por lo tanto el diferen-

    cial propuesto es aquel asociado a g ◦   f .Corolario.   Si   f   :  A ⊆ Rn → Rk  y g  : Rk  → R son funciones que cumplen las hipótesis de laproposición anterior, entonces:

    ∂ g ◦   f ∂x j

    (a) =k 

    ∑ m=1

    ∂ g

    ∂ ym( f (a))

     ∂ f m

    ∂x j(a)

    26

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    28/50

    En el caso particular en el que n  =  1, tenemos entonces que:

    ( g ◦   f )(a) =k 

    ∑ m=1

    ∂ g∂ ym ( f (a))  f m(a)

    Dem.  Por lo visto en la proposición anterior, tenemos que:

    D g ◦ f  (a) = D g( f (a)) D f  (a)

    Entonces, cada coordenada de D g ◦ f  (a) ∈R1×n tiene la forma:∂ g ◦   f 

    ∂x j(a) =

      ∂ g

    ∂ y1( f (a))

     ∂ f 1∂x j

    (a) + · · · +   ∂ g∂ ym

    ( f (a)) ∂ f m∂x j

    (a)

    =k ∑ 

    m=1

    ∂ g∂ ym

    ( f (a))  ∂ f m

    ∂x j(a)

    El caso particular  n   =   1 es análogo, salvo que, dado que cada   f i  es una función en unavariable, notamos directamente   f i .

    Definición 4.7.   Dados  a, b ∈  Rn con  a =  b, definimos al  segmento que une  a  con  b, notadoSab  de modo que:

    Sab  = {λ(b − a) + a :  λ ∈ [0, 1]}Definición 4.8.  Decimos que  A ⊆Rn es convexo si, para todo a, b ∈ A, el segmento Sab ⊆ A.

    Teorema 4.3 (Generalización del Teorema del Valor Medio).  Dados una función diferenciable

     f   :   A ⊆  Rn →  R con  A abierto y convexo, y los puntos a, b ∈   A tales que  a =  b, existe unpunto c ∈ Sab  tal que:

     f (b) −   f (a) = ∇ f (c), b − a =n

    ∑  j=1

    ∂ f 

    ∂x j(c) (b j − a j)

    Dem.  Definimos la función α  :  [0, 1] → Sab ⊆ A tal que:

    α(λ) = λ(b − a) + a

    Resulta entonces que   f  ◦ α   :  [0, 1] →  R, por lo que, por el Teorema de Lagrange, se verificaque:

    ( f  ◦ α)(1) − ( f  ◦ α)(0) = ( f  ◦ α)(c)(1 − 0)para algún punto c ∈ [0, 1]. Ahora bien, tenemos que:

    ( f  ◦ α)(1) =   f (α(1)) =   f ((b − a) + a) =   f (b)( f  ◦ α)(0) =   f (α(0)) =   f (0(b − a) + a) =   f (a)

    Entonces:

     f (b)

    −  f (a) = ( f 

     ◦α)(c)

    27

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    29/50

    Usando la regla de la cadena, se deduce que:

    ( f  ◦ α)(c) =n

    ∑  j=1

    ∂ f 

    ∂x j (α(c)) α j(c) = ∇ f (α(c)), b − a

    La última igualdad vale puesto que:

    α(c) = (b1 − a1, b2 − a2, . . . , bn − an)

    Por lo tanto, α(c) ∈ Sab cumple con lo pedido.

    28

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    30/50

    5. Derivadas parciales de orden superior y Teorema de Taylor

    Definición 5.1. Dada una función   f   :

    Rn

    →R

    , utilizaremos la siguiente notación:∂

    ∂x1

     ∂ f 

    ∂x1

     =

     ∂2 f 

    ∂x21∂

    ∂x2

     ∂ f 

    ∂x1

     =

      ∂2 f 

    ∂x2∂x1

    En el último caso, llamamos a este tipo de derivadas  derivadas parciales cruzadas; a su vez,

    se llama derivada de orden n a aquella derivada obtenida tras  n  derivaciones en variables no

    necesariamente iguales.

    Definición 5.2.   Una función   f   :  Rn

    → R es de clase Ck  si existen y son continuas todas las

    derivadas parciales de   f  hasta el orden k  inclusive. En este caso, notaremos   f  ∈  Ck .Teorema 5.1  (Igualdad de derivadas cruzadas).  Dada una función diferenciable   f   :   A ⊆R2 → R con A  abierto de modo que existen las siguientes derivadas en todo punto de A:

    ∂ f 

    ∂x,  ∂ f 

    ∂ y,

      ∂2 f 

    ∂ y∂x,

      ∂2 f 

    ∂x∂ y

    Si estas derivadas son continuas en un punto c ∈ A, entonces:∂2 f 

    ∂ y∂x(c) =

      ∂2 f 

    ∂x∂ y(c)

    Corolario.   Si   f  ∈  C2, entonces∂2 f 

    ∂ y∂x(c) =

      ∂2 f 

    ∂x∂ y(c)

    para todo c ∈ A.

    Teorema de Taylor en una variable.  Dados una función   f   :   I  ⊆  R →  R, tal que   I  es unintervalo cerrado y   f  es n + 1 veces derivable, y un punto  a ∈ I , entonces existe c entre a  y xtal que:

     f (x) =   n

    ∑  j=0

     f ( j)(a)

     j!

      (x

    − a) j +   f 

    (n+1)(c)

    (n + 1)!

     (x

    − a)n+1

    El polinomio que aparece entre paréntesis es llamado el  polinomio de Taylor de f de orden n

    centrado en a, y es notado  Pn,a(x) o simplemente  Pa(x), mientras que el término restante esla cota del error que se produce al aproximar a la función por su desarrollo de Taylor, al

    que notaremos r a(x). Si el polinomio de Taylor se halla centrado en el origen, es tambiéndenominado polinomio de Maclaurin.

    Dem.   Consideraremos a =  x  (en caso de que a  =  x  es inmediato que  c  =  a =  x). Definimosentonces la siguiente función:

     g(t) =   f (x)−

     Pn,t(x)−

      k 

    (n + 1)!(x

    −t)n+1

    29

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    31/50

    donde definiremos k  de modo tal que  g(a) = 0. Calculemos entonces el valor de k :

    0 =  g(a) =   f (x) − Pn,a(x) −  k 

    (n + 1)! (x − a)n+1

    Entonces:

    k  = ( f (x) − Pn,a(x))   (n + 1)!(x − a)n+1

    Ahora bien, se verifica que   g(a) =   g(x) =   0; entonces, aplicando el Teorema de Rolle,tenemos que existe c entre a  y x  de modo que g (c) = 0; pero resulta que:

     g(t) = − f (t) +  f (t) −   f (t)(x − t) +   f (t)(x − t) + · · · −   f (n+1)(t)

    n!  (x − t)n +   k 

    n!(x − t)n

    = − f (n+1)(t)n!

      (x − t)n +   k n!

    (x − t)n

    En consecuencia, si g(c) = 0, entonces:

     f (n+1)(c)

    n!  (x − c)n =   k 

    n!(x − c)n ⇐⇒   f (n+1)(c) = k 

    Finalmente, tenemos que:

     f (n+1)(c) = ( f (x) − Pn,a(x))   (n + 1)!(x − a)n+1

    y con un simple pasaje de términos llegamos a la expresión que querı́amos demostrar.

    Teorema de Taylor en varias variables.   Sea   f    ∈   C3 una función f   :   A ⊆   R2 →   R, con   A  abierto,   p   = ( p1, p2) ∈   A. Dados una bola   B p(ε) ⊆   A   conε   >  0 (cuya existencia está garantizada dado que  A  es abierto) y un punto  (x, y) ∈   B p(ε),entonces existe un punto q ∈ S p,(x, y) de modo que:

     f (x, y) =   f ( p) + ∂ f 

    ∂x( p)(x − p1) + ∂ f 

    ∂ y( p)( y − p2)

    +  1

    2! ∂2 f 

    ∂x2 ( p)(x − p1)2 + 2   ∂

    2 f 

    ∂x∂ y( p)(x − p1)( y − p2) + ∂

    2 f 

    ∂ y2 ( p)( y − p2)2

    +  1

    3!

    ∂3 f 

    ∂x3 (q)(x − p1)3 + 3   ∂

    3 f 

    ∂x2∂ y(q)(x − p1)2( y − p2)

    +3  ∂3 f 

    ∂x∂ y2 (q)(x − p1)( y − p2)2 + ∂

    3 f 

    ∂ y3 (q)( y − p2)3

    Éste es el polinomio de Taylor de orden 2 asociado a   f   centrado en  p  (junto con su resto);

    la noción es fácilmente generalizable a un orden  n  si disponemos de   f  ∈  Cn+1. Notaremosr p(x, y) al  último término, que representa al resto obtenido por la aproximación por desar-rollo de Taylor, y  P p(x, y) al resto del polinomio.

    30

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    32/50

    Dem.  Definamos la función γ  :  [0, 1] → A de modo tal que:γ(t) =  p + t((x, y)

    − p)

    Sea entonces  g   =   f  ◦ γ   (o sea,   g   :   [0, 1] →   R). Entonces, la expresión del polinomio deMaclaurin asociado a g  de orden 2 evaluado en 1 está dada por:

     g(1) =  g(0) + g(0) +  1

    2! g(0) +

      1

    3! g(c)

    Ahora bien,  g(1) =   f (γ(1)) =   f (x, y) y  g(0) =   f (γ(0)) =   f ( p). Calculando las derivadasrestantes, se deduce que la expresión anterior es equivalente a la que queremos demostrar.

    El punto q estará dado por γ(c) ∈ S(x, y), p satisfaciendo lo pedido.

    Proposición 5.1.  Dadas las hipótesis del enunciado del Teorema de Taylor en varias vari-

    ables, se verifica que:r p(x, y)

    (x, y) − p2 −−−−→(x, y)→ p 0

    Dem.

    r p(x, y)

    (x, y) − p2≤   1

    3!

    ∂3 f ∂x3 (q)

    |x − p1|3(x, y) − p2   + . . .

    ≤   13!

    ∂3 f ∂x3 (q) |x − p1| + . . .Ahora bien, cada sumando de la expresión final tiende a 0, puesto que |x − p1|  y | y − p2|tienden a 0 al tender  (x, y) a  p, y las derivadas parciales son acotadas en un cierto entornode p, por ejemplo B p(

     ε2 ) ⊆ B p(ε), dado que dicho entorno es compacto.

    Definición 5.3.  Dada una función   f  ∈  C2 tal que   f   :  A ⊆ R2 → R, llamamos matriz hessianade   f  a la matriz conformada por las derivadas segundas de   f , a la cual notamos  H  f  ( p); esdecir:

     H  f  ( p) = ∂

    2 f ∂x2

     ( p)   ∂2 f 

    ∂x∂ y ( p)

    ∂2 f ∂ y∂x ( p)

      ∂2 f ∂ y2

     ( p)

    La matriz hessiana facilita la escritura del polinomio de Taylor de orden 2, dado que:

    P p(x, y) =   f ( p) + ∇ f ( p), (x, y) − p +   12!

    ((x, y) − p) H  f  ( p) ((x, y) − p)T 

    El concepto de matriz hessiana es generalizable a funciones deRn aR, en cuyo caso la matriz

    pertenecerá a Rn×n.

    Observación.  Dado que   f  ∈  C2, las derivadas parciales cruzadas son equivalentes, y por lotanto la matriz hessiana es simétrica.

    31

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    33/50

    6. Extremos

    Definición 6.1. Dados una función   f   :   A ⊆

      Rk 

    →  R

     con   A  abierto y un punto   p ∈   A,decimos que  p es un m´ aximo local de f   si   f ( p) ≥   f (x) para todo x ∈  B p(ε) para algún radioε   >   0. Si la desigualdad es estricta, lo llamamos m´ aximo local estricto. La definición para

    mı́nimos es análoga. Llamamos extremos locales de f  a los máximos y mı́nimos locales de   f .

    Teorema de Fermat.  Si un punto  p ∈   A es extremo local de una función   f   :   A ⊆  R2 →  Rcon A  abierto y derivable en  p, entonces ∇ f ( p) = (0, 0)Dem.  Supongamos sin pérdida de generalidad que  p  es un máximo local. Entonces,   f ( p) ≥ f (x)   para todo   x   ∈   B p(ε)   con   ε   >   0; en particular, f ( p) ≥   f (x1, p2)  para todo  x1 ∈   ( p1 − ε, p1 +  ε), por lo que   f x( p) =  0. El razonamientoes análogo para   f  y( p), y en general, para cualquier derivada direccional, por lo que además,

     f  es diferenciable en  p.

    Definición 6.2.  Dados una función   f   :   A ⊆   Rn →   R   con  A  abierto y un punto   p ∈   A,decimos que  p  es un punto crı́tico de f   si ∇ f ( p) =  0̄. Es claro que esto define una condiciónnecesaria para los extremos, pero no suficiente, por lo demostrado por el teorema de Fermat.

    Definición 6.3.   Si  p  es un punto crı́tico de   f   :   A ⊆  Rn →  R con  A abierto, pero no es unextremo de   f , lo llamamos punto silla o punto de ensilladura de   f .

    Proposición 6.1.  Toda matriz simétrica es diagonalizable.

    Dem.   Para la demostración de esta proposición utilizaremos varios conceptos de álgebra lin-

    eal. En principio, si  A ∈  Rn×n es simétrica, entonces todos sus autovalores λ1, . . . , λn  sonreales y existe una base ortonormal de autovectores de  A. Recordemos que λ  es un auto-

    valor de  A y  x  su autovector asociado si  x =  0 y  AxT  =  λxT , y un conjunto de vectores esortonormal si todos sus vectores son unitarios y ortogonales entre sı́.

    Además, si B  = {v1, . . . , vn} es una base ortonormal deRn, se verifica que, para todo x ∈Rn:

    x =n

    ∑ i=1

    vixi, vi

    Reescribiendo   A  en función de su matriz de cambio de base para la base ortonormal de

    autovectores, tenemos que

    xAxT  = y

    λ1   0. . .

    0   λn

     yT  = n∑ 

    i=1

    λi y2i

    donde y i   = xi, vi. De este modo, la matriz de cambio de base resulta diagonal, y ademástenemos que

    xAxT  =n

    ∑ i=1

    λixi, vi2

    32

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    34/50

    Lema 6.1.   Dados una función   f   :   A ⊆  R2 →  R, con  A  abierto y   f  ∈   C2 en  A,   p ∈   A  unpunto crı́tico de   f   y v ∈  R2 un vector unitario tal que  v H  f  ( p) vT  >  0 entonces la función f 

    v

    (t) =   f ( p + tv) tiene un mı́nimo local estricto en 0 (y tiene un máximo si la desigualdadse invierte).

    Dem.   Como  p ∈   A  y  A  es abierto,   f v está bien definida en un entorno  ( p − ε, p + ε). En-tonces,   f v :  ( p − ε, p + ε) → R y además, podemos ver que   f v es la composición   f  ◦ γv, conγv(t) =  p + tv.

    Si derivamos   f v, obtenemos, por regla de la cadena:

     f v(t) = ∇ f ( p + tv), v =  ∂ f 

    ∂v(x) ( p + tv)

    pues γ

    v

    (t) = v. Ahora bien, es claro que: f v

    (0) = ∇ f ( p), v = (0, 0), v =  0

    ya que  p  es punto crı́tico de   f ; por lo tanto, 0 es un punto crı́tico de   f v.

    Además:

     f v

    (t) = ( f xx( p + tv)v1 +   f xy( p + tv)v2)v1 + ( f  yx( p + tv)v1 +   f  yy( p + tv)v2)v2

    =   f xx ( p + tv)v21 + 2 f xy( p + tv)v1v2 +   f  yy( p + tv)v

    22

    = v H  f  ( p) vT > 0

    Es claro entonces que 0 es un mı́nimo local estricto de   f v

    . La demostración es análoga paralos máximos.

    Teorema 6.1 (Criterio de la matriz hessiana).   Sean   f   :  A ⊆  Rn →  R con  A  abierto y   f  ∈  C3en A,  p ∈ A un punto crı́tico de   f  y

     H  f  ( p) =

    a b

    b c

    Sea entonces d  =  det( H  f  ( p)) =   ac − b2. Si d  >  0, entonces  p es un extremo local de   f . Enparticular, si a > 0, p  es un mı́nimo estricto, y si a < 0,  p  es un máximo estricto. Ahora bien,

    si d<

    0 entonces p  es un punto silla de   f . El criterio no aporta información si d  =  0.Dem.   Por lo visto en la Proposición 6.1, podemos realizar un cambio de base sobre  H  f  ( p) demodo que:

     H  f  ( p){v1,v2}  =

    λ1   0

    0   λ2

    donde v1, v2 son los autovectores de la matriz y  λ1, λ2 sus autovalores asociados. Dado que

    el determinante y la traza de una matriz son invariantes respecto de un cambio de base,

    tenemos además que:

    det( H  f  ( p)) = ac − b2 = λ1λ2  =  det

     H  f  ( p){v1,v2}tr( H  f  ( p)) = a + c =  λ1 + λ2 = tr

     H  f  ( p){v1,v2}

    33

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    35/50

    Demostraremos primero el caso en el que  d  >  0. En este caso, es claro que  λ1 =  0 =  λ2  yque λ1 y  λ2 tienen el mismo signo (e idénticamente para a  y c).

    Sea  S   = {u ∈  R2 : u   =   1}. Es claro que S  es compacto. Dada la función  h   :   S →  Rdefinida como:

    h(u) = 1

    2u H  f  ( p) u

    Notemos que  h(u)   >  0 para todo  u ∈   S  porque suponemos que la matriz hessiana es detraza positiva. Finalmente, por el teorema de valores extremos de Weierstrass,  h  alcanza un

    mı́nimo en un punto  u0 ∈   S, es decir,  h(u) ≥   h(u0)   >  0 para todo  u ∈   S. Llamaremos β =  h(u0) y definimos α  =

      β2 ; entonces, 0 < α <  β.

    Dado que   f 

     ∈ C3, existe δ > 0 tal que, si 0 <

    x

    − p

    < δ, entonces:

    0 ≤   |r2(x)|x − p2   < α 0. Entonces:

    v H  f  ( p) vT  = λ1 v2 > 0

    v H  f  ( p) vT  = λ2

    v

    2< 0

    Entonces, por lo demostrado en el Lema 6.1, la función   f v(t)  tiene un mı́nimo en 0, pero f v

    (t) tiene un máximo en 0. Por lo tanto, todo entorno de  p tiene puntos mayores y menores

    a p; consiguientemente, p  es un punto silla de   f .

    Además, el criterio es generalizable a  Rn, observando que habrá un extremo en  p  si todos

    los autovalores poseen el mismo signo (sera mı́nimo si todos son positivos, máximo si todos

    son negativos); habrá un punto silla si hay algunos autovalores positivos y otros negativos,

    y el criterio no brindará información si hay algún autovalor nulo.

    34

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    36/50

    7. Teoremas de la función inversa y la función implı́cita

    Teorema de la función inversa. Dados una función   f   :   A ⊆

      Rn

    →  R

      con   A  abierto y f  ∈  C1 en A  y  p ∈ A, si  D f  ( p) es inversible (es decir,  J  f  ( p) admite inversa), entonces existenconjuntos U , V  ∈ Rn abiertos tales que  p ∈ U ,   f ( p) ∈ V  tales que la restricción   f   : U  → V  es

     biyectiva. Más aún, su inversa,   f −1 : V  → U  es C1 en V  y su diferencial verifica que:

    D f −1 ( f (a)) =  D f  (a)−1

    D f −1(b) = D f 

     f −1(b)−1

    con a ∈ U , b ∈ V .

    Teorema de la función implı́cita.  Dados una función  g   :   A ⊆   R2

    →   R  con  A  abierto y g ∈ C1 en A,  p ∈ A, c  =  g( p) y S el conjunto definido tal que:

    S = {(x, y) ∈ A :  g(x, y) = c}

    es decir, S es la curva de nivel de   f  que contiene a  p. Si  ∂ g∂ y ( p) = 0, entonces existen ε1, ε2  > 0

    y ϕ  :  B p1 (ε1) → B p2 (ε2) con  ϕ ∈ C1 tales que:(1).   ϕ( p1) =  p2(2).   (x, y) ∈ S  ⇐⇒   y =  ϕ(x) para todo (x, y) ∈ B p1 (ε1) × B p2 (ε2)(3). Si x ∈ B p1 (ε1) entonces:

    ϕ(x) = − gx (x, ϕ(x)) g y (x, ϕ(x))

    Análogamente, si  ∂ g∂x ( p) = 0, entonces existen  δ1, δ2  > 0 y ψ  :  B p2 (δ2) → B p1 (δ1) con  ψ ∈ C1

    tales que:

    (1).   ψ( p2) =  p1(2).   (x, y) ∈ S  ⇐⇒   x =  ψ( y) para todo (x, y) ∈ B p1 (δ1) × B p2 (δ2)(3). Si y ∈ B p2 (δ2) entonces:

    ψ( y) = − g y (ψ( y), y) gx (ψ( y), y)

    El teorema es generalizable a funciones con dominio en Rn; por ejemplo, para el caso R3, el

    teorema asegura la existencia de una función  ϕ  tal que  ϕ( p1, p2) =  p3, g(x, y, z) =  g( p) si ysólo si z  =  ϕ(x, y) para todo (x, y, z) en un entorno de p, y además:

    ∇ϕ(x, y) =

    − gx (x, y, ϕ(x, y)) g z (x, y, ϕ(x, y))

    , − g y (x, y, ϕ(x, y)) g z (x, y, ϕ(x, y))

    En particular,

    ∇ϕ( p) =

    − gx( p) g z( p)

    , − g y( p) g z( p)

    35

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    37/50

    Dem.  El punto (3) se deduce observando que, para todo (x, y) ∈  S,  g (x, ϕ(x)) =  g(x, y) =c =  g( p). Entonces:

    0 =  g (x, ϕ(x)) − c0 =  gx (x, ϕ(x)) + g y (x, ϕ(x)) ϕ

    (x)

    ϕ(x) = − gx (x, ϕ(x)) g y (x, ϕ(x))

    Observación.  En el caso presentado en el enunciado del teorema, la recta tangente a la curva

    de nivel que contiene a p  es perpendicular al gradiente de  g en p  y está dada por la ecuación

    (suponiendo g y( p) = 0):

    0 = (x, y) − p, ∇ g( p)0 = (x − p1) gx( p) + ( y − p2) g y( p)

     y − p2 = − gx( p) g y( p)

    (x − p1)

     y − p2 =  ϕ( p1) (x − p1)Esto se debe a que la recta tangente al gráfico de  ϕ  es la misma que la de la curva de nivel,

    en un cierto entorno de  p.

    Además, el plano tangente a una superficie de nivel de una función   g   :   A ⊆   R3 →   Rque cumple las hipótesis del teorema de la función implı́cita está dado por la ecuación:

    (x, y, z) − p, ∇ g( p) =  0Esto se debe a que, suponiendo g z( p) = 0 en un cierto entorno de un punto  p ∈ A, tenemos,por el teorema de la función implı́cita,  g(x, y, z) =   g( p)  si y sólo si z   =   ψ(x, y)  para ciertafunción ψ ∈ C1 en A. Entonces, el plano tangente a S  en  p  es el plano tangente al gráfico deψ en ( p1, p2, ψ( p1, p2)) =  p, es decir:

     z − p3 = ψx( p1, p2)(x − p1) + ψ y( p1, p2)( y − p2)⇐⇒   0 =  z − p3 − ψx( p1, p2)(x − p1) − ψ y( p1, p2)( y − p2)

    =   g z( p)( z − p3) + gx( p)(x − p1) + g y( p)( y − p2) g z( p)=

     (x, y, z) − p, ∇ g( p) g z( p)

    = (x, y, z) − p, ∇ g( p)Teorema de la función implı́cita.  Veamos un enunciado alternativo del teorema de la función

    implı́cita enfocado a intersecciones de superficies. Sean g1, g2   :  A ⊆  R3 →  R con  A  abiertoy  g1, g2 ∈   C1 en   A,   p ∈   A  y  S  la intersección de las superficies de nivel en   p  de ambasfunciones, es decir:

    S = {(x, y, z) ∈ A  :  g1(x, y, z) = g1( p),  g2(x, y, z) = g2( p)}36

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    38/50

    Entonces, si:

    det g1 y( p)   g1 z( p)

     g2 y( p)   g2 z( p) 

    = 0

    existen   ε1, ε2, ε3   >  0 y dos funciones  ψ1, ψ2  ∈   C1 de modo que  ψ1   : {|x − p1| < ε1} →{| y − p2| < ε2} y ψ2  : {|x − p1| < ε1} → {| z − p3| < ε3} siempre que:

    (x, y, z) ∈ {|x − p1| < ε1, | y − p2| < ε2, | z − p3| < ε3} =  B

    Además, se verifica que:

    (1).   ψ1( p1) =  p2 y  ψ2( p1) =  p3

    (2).   (x, y, z) ∈ S  ⇐⇒   y =  ψ1(x), z  =  ψ2(x) para todo (x, y, z) ∈ B(3). Si

     |x

    − p1

    |< ε1, entonces:

    ψ1(x) = −det

     g1x   g1 z g2x   g2 z

    (x,ψ1(x),ψ2(x))

    det

     g1 y   g1 z g2 y   g2 z

    (x,ψ1(x),ψ2(x))

    ψ2(x) = −det

     g1 y   g1x g2 y   g2x

    (x,ψ1(x),ψ2(x))

    det g1 y   g1 z g2 y   g2 z(x,ψ1(x),ψ2(x))

    Dem.  Demostraremos el punto (3). Para abreviar, notaremos α  = (x, ψ1(x), ψ2(x)). A partirde (1) y (2), sabemos que:

     g1(α) = g1( p)

     g2(α) = g2( p)

    Entonces, por regla de la cadena: g1x(α) + g1 y(α)ψ

    1(α) + g1 z(α)ψ

    2(α) = 0

     g2x(α) + g2 y(α)ψ1(α) + g2 z(α)ψ

    2(α) = 0

    Lo cual es equivalente a: g1 y(α)ψ

    1(α) + g1 z(α)ψ

    2(α) = − g1x(α)

     g2 y(α)ψ1(α) + g2 z(α)ψ

    2(α) = − g2x(α)

    Reescribiendo el sistema en forma matricial: g1 y   g1 z g2 y   g2 z

    (α)

    ψ1ψ2

    (α)

    = −

     g1x g2x

    (α)

    Luego, el resultado se deduce resolviendo el sistema por medio de la regla de Kramer.

    37

  • 8/19/2019 Análisis I (Notas de La Teórica - 2C 2011)

    39/50

    8. Extremos restringidos

    Multiplicadores de Lagrange.  Sean g  :  A ⊆

    R2

    →R

    , con A  abierto, g ∈ C1

    en A, c ∈R

    y Sla superficie de nivel c de g, es decir, S = {(x, y) ∈ A :  g(x, y) = c} y ∇ g(x, y) = 0 para todo(x, y) ∈ S.Además, sean   f   :   A →   R,   f   ∈   C1 en   A  y   p ∈   S   tal que   p  sea un extremo local de   f sobre S  (notaremos a la restricción de   f   a S  como   f  |S ), es decir, que exista r   >  0 tal que si(x, y) ∈  B p(r) y  (x, y) ∈  S, entonces   f (x, y) ≥   f ( p) si  p es mı́nimo o   f (x, y) ≤   f ( p) si  p esmáximo.

    Entonces, existe λ ∈R tal que ∇ f ( p) = λ∇ g( p)Dem.  Supongamos sin pérdida de generalidad que  p  es un mı́nimo local de   f  sobre S  y que

     g y( p) =  0. Entonces, por el teorema de la función implı́cita, existe  ϕ ∈   C1 tal que, en unentorno de p, (x, y) ∈ S  si y sólo si y  =  ϕ(x). Además:

    ϕ(x) = − gx (x, ϕ(x)) g y (x, ϕ(x))

    Pero entonces, por hipótesis,   p1  es un mı́nimo local de  h(x) =   f  (x, ϕ(x)), con  h   :   ( p1 −ε1, p1 + ε1). Por lo tanto, h

    ( p1) = 0. Tenemos entonces, por regla de la cadena:

    0 = f x ( p1, ϕ( p1)) +   f  y ( p1, ϕ( p1)) ϕ( p1)

    ⇐⇒   f x ( p1, ϕ( p1)) = − f  y ( p1, ϕ( p1)) ϕ( p1)⇐⇒   f x ( p1, ϕ( p1)) =   f  y ( p1, ϕ( p1)) gx ( p1, ϕ( p1))

     g y ( p1, ϕ( p1))

    ⇐⇒   f x ( p1, ϕ( p1)) =  f  y ( p1, ϕ( p1))

     g y ( p1, ϕ( p1)) gx ( p1, ϕ( p1))

    Llamemos entonces:

    λ =  f  y ( p1, ϕ( p1))

     g y ( p1, ϕ( p1))

    Es claro que:

     f  y ( p1, ϕ( p1)) =  λ g y ( p1, ϕ( p1))

    Por lo tanto, ∇ f ( p) = λ∇ g( p)

    Enunciaremos ahora algunas ge