convexas completo
TRANSCRIPT
REPUBLICA DE VENEZUELA
UNIVERSIDAD NACIONAL ABIERTA
CENTRO LOCAL ZULIA
FUNCIONES CONVEXAS
TRABAJO ESPECIAL DE GRADO PARA OPTAR AL TITULO DE LICENCIADO EN
MATEMÁTICA MENCION ANÁLISIS NUMÉRICO.
Realizado por :
Hernan Rafael Romero
C.I. : 5.803.158
MARACAIBO, DICIEMBRE DE 1.998
ii
APROBACIÓN DE LOS TUTORES
En nuestra condición de tutores del Trabajo de Grado presentado por el ciudadano
Hernan Rafael Romero para optar al Titulo de Licenciado en Matemática , Mención Análisis
Numérico , consideramos que dicho trabajo reúne los requisitos y méritos suficientes para
ser sometido a la presentación pública y evaluación por parte del jurado examinador que se
designe.
En la ciudad de Maracaibo, a los días del mes de de
1.999.
Prof. Jose Luis Flores MSc. Sergio Rivas
C.I. : C.I. :
iii
Trabajo de Grado aprobado en nombre de la muy ilustre Universidad Nacional
Abierta por el siguiente Jurado, a los días del mes de de 1.999.
Prof. Prof.
C.I. : C.I. :
Prof. Prof.
C.I. : C.I. :
iv
REPUBLICA DE VENEZUELA
UNIVERSIDAD NACIONAL ABIERTA
CENTRO LOCAL ZULIA
FUNCIONES CONVEXAS
TRABAJO ESPECIAL DE GRADO PARA OPTAR AL TITULO DE LICENCIADO EN
MATEMÁTICA MENCION ANÁLISIS NUMÉRICO.
Realizado por :
Hernan Rafael Romero
C.I. : 5.803.158
MARACAIBO, DICIEMBRE DE 1.998
v
DEDICATORIA A la memoria de mi
padre a los quince años
de su muerte.
A la verdad objetiva y
no utópica.
vi
AGRADECIMIENTO
A Dios todopoderoso por sobre todas las cosas, por darme la inteligencia y sabiduría
necesarias para poder hacer el trabajo.
A toda mi familia por estimularme a seguir adelante.
A mis hermanos en general y muy especialmente a Nelson por su ayuda, a Iris y a
Magaly por haber hecho la transcripción al computador del trabajo.
A mis tutores los profesores Sergio Rivas y José Luis Flores quienes con su
experiencia, conocimientos, preocupada atención y excelente trato, supieron orientar éste
Trabajo Especial de Grado.
vii
RESUMEN
Romero, Hernan R. “Funciones Convexas”. Universidad Nacional Abierta. Centro Local
Zulia. Maracaibo. Diciembre. 1.998.
En la literatura castellana la Bibliografía sobre Funciones Convexas es muy escasa,
por no decir inexistente. Son muy pocos los libros de texto que tratan el tema no obstante la
gran importancia que tienen las Funciones Convexas en la Matemática, tanto pura como
aplicada. Se plantea así la necesidad de realizar un trabajo de investigación sobre las
Funciones Convexas que luego pueda ser útil como material de referencia en el desarrollo de
otras investigaciones.
Se utilizó como metodología de trabajo la investigación documental y consistió ésta
esencialmente en la recopilación de información de distintos materiales bibliográficos
aparecidos principalmente en lengua inglesa.
El resultado final es un trabajo escrito en el cual se desarrollan y amplían algunos de
los aspectos tratados en las fuentes originales y aunque no contiene nada nuevo puede
considerarse como un modesto aporte al estudio de las Funciones Convexas debido al
enfoque y tratamiento del tema y a que algunas demostraciones son de carácter original.
viii
INDICE GENERAL
Pág.
INTRODUCCION............................................................................................................. 1
CAPITULO I
Funciones Convexas Sobre IR............................................................................................. 3
1.1. Definición y Propiedades Básicas.................................... .....................................3
1.2. Continuidad y Diferenciabilidad...........................................................................15
1.3. Caracterización de las Funciones Convexas.........................................................26
1.4. Operaciones con Funciones Convexas.................................................................38
1.5. Funciones de Young y Funciones Convexas.........................................................50
1.6. Desigualdades Clásicas........................................................................................53
1.7. Funciones log-convexas.......................................................................................68
1.8. Funciones Aditivas y Funciones mid convexas.....................................................73
CAPITULO II
Funciones Convexas Sobre IRn .........................................................................................83
2.1. Definición y Propiedades Básicas.........................................................................83
2.2. Hiperplanos y Propiedades Fundamentales de los Conjuntos Convexos................92
2.3. Continuidad de Funciones Convexas....................................................................96
2.4. Diferenciabilidad de Funciones..........................................................................107
2.5. Diferenciabilidad de Funciones Convexas..........................................................115
2.6. Caracterización de las Funciones Convexas.......................................................137
2.7. Extremos de Funciones Convexas......................................................................147
CAPITULO III
Funciones Convexas Sobre Espacios Vectoriales Normados............................................153
3.1. Definición y Propiedades Básicas.......................................................................153
ix
3.2. Continuidad de Funciones Convexas..................................................................155
3.3. Diferenciabilidad en Espacios Vectoriales Normados.........................................160
3.4. Caracterización de las Funciones Convexas.......................................................171
BIBLIOGRAFIA.............................................................................................................178
1
INTRODUCCION
El estudio de las funciones convexas es de fundamental importancia en varios
campos de la Matemática, tanto pura como aplicada, pues ellas son requisito casi
indispensable para abordar estudios en campos tales como la teoría de la
optimización, la programación lineal y no lineal, la programación convexa, y además
aportan un tratamiento unificado para demostrar algunas de las desigualdades clásicas
de la Matemática, como por ejemplo, la desigualdad de la Media Geométrica - Media
Aritmética, la desigualdad de Hölder, la desigualdad de Cauchy-Schawrz y otras.
El objetivo central de ésta investigación es el estudio de las Funciones
Convexas a valores reales definidas sobre subconjuntos convexos de un espacio
vectorial.
El tratamiento del tema se desarrolla en tres capítulos.
En el primer capítulo se hace un estudio de las Funciones Convexas a valores
reales definidas sobre intervalos de la recta real y se tratan aspectos tales como la
continuidad y la diferenciabilidad, caracterización de las Funciones Convexas a partir
de propiedades de sus derivadas, operaciones que preservan la convexidad de las
funciones, desigualdades clásicas, funciones log-convexas y propiedades,
concluyendo el capítulo con un pequeño estudio sobre las funciones aditivas y
funciones mid convexas.
En el segundo capítulo se estudian las Funciones Convexas a valores reales
definidas sobre subconjuntos convexos de IRn y se consideran las propiedades
básicas de estas funciones, la continuidad, la diferenciabilidad, la caracterización de
las Funciones Convexas a partir de sus propiedades de diferenciabilidad para
finalmente concluir el capítulo con el estudio de las propiedades de los extremos de
Funciones Convexas.
En el tercer y último capítulo se desarrollan las Funciones Convexas a valores
reales definidas sobre subconjuntos convexos de un espacio vectorial normado cuya
2
dimensión puede ser finita o infinita, se analizan sus propiedades básicas y las
condiciones bajo las cuales dichas funciones son continuas, concluyéndose el capítulo
con la caracterización de las Funciones Convexas a partir de propiedades de su
primera y de su segunda derivada.
3
Capítulo I
Funciones Convexas Sobre IR Históricamente, el estudio de las funciones convexas f I: ⊂ IR→ IR , donde
I es un intervalo, se inicia con el trabajo de J. L. W. Jensen [10]. Realmente Jensen
llamó convexas a las funciones que ahora se conocen como midconvexas o convexas
en el punto medio, las cuales son definidas en la sección 8 de este capítulo. Iniciamos
el presente trabajo con el estudio de las funciones convexas f I: → IR, donde I es un
intervalo, ya que la teoría de estas es más fácil de asimilar y muchas de sus
propiedades se generalizan sin mayor dificultad.
1.1. Definición y Propiedades Básicas. Iniciamos esta sección con la definición de función convexa que será utilizada
a lo largo de todo el capítulo para luego presentar un conjunto de propiedades de
carácter básico relacionadas con estas funciones.
Definición 1.1.1 : (Función Convexa). Sean I ⊂ IR un intervalo y f I: → IR una
función. Se dice que f es convexa sí y sólo si
( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1 (1.1)
para todo x, y ∈ I y λ ∈ [0, 1].
Si la desigualdad es estricta cuando x ≠ y, y λ ∈ (0, 1), se dice que f es
estrictamente convexa.
Obsérvese que para x y= = =, λ λ0 1 o siempre se cumple la igualdad.
4
Si se invierte la desigualdad en (1.1) se dice que f es cóncava. La función es
estrictamente cóncava si la desigualdad es estricta cuando x y≠ y λ ∈( , )0 1 .
Geométricamente, la definición de una función convexa f significa que para
cualesquiera dos puntos ( ) ( )x f x y f y Gra f, ( ) , , ( ) ∈ , donde Gra f es el gráfico de f ,
la cuerda que los une nunca está por debajo de la gráfica de la función, como
demostramos a continuación.
Sean x y I x y, , ,∈ < y considérese la ecuación de la recta que pasa por los
puntos ( ) ( )x f x y f y, ( ) , , ( ) , es decir
( )r tf y f x
y xt y f y t( )
( ) ( )( ) ,= −
−− + ∈ IR..
Si ( ) ( )z x y= + − ∈λ λ λ1 0 1, , , entonces
( )( ) ( )( )
( )( ) ( )
( )
r z r x yf y f x
y xx y y f y
f y f x
y xx y f y f x f y f y
f x f y
( )( ) ( )
( )
( ) ( )( ) ( ) ( ) ( )
( ) ( ).
= + − = −−
+ − − +
= −−
− + = − +
= + −
λ λ λ λ
λ λ
λ λ
1 1
1
Es decir ( )r z f x f y( ) ( ) ( )= + −λ λ1 , y así el punto ( )z r z, ( ) está sobre el segmento
de recta que une los puntos ( ) ( )x f x y f y, ( ) , , ( ) .
Además, como f es una función convexa se verifica
( ) ( )( ) ( )f z f x y f x f y r z= + − ≤ + − =λ λ λ λ1 1( ) ( ) ( )
5
y por lo tanto f z r z( ) ( )≤ para todo [ ]z x y∈ , , de donde se concluye que el segmento
de recta que une los puntos ( ) ( )x f x y f y, ( ) , , ( ) nunca está por debajo de la gráfica
de la función. Gráficamente :
Figura 1.1
Análogamente, la interpretación geométrica de función cóncava establece que
si f I: → IR es una función cóncava entonces la cuerda que une los puntos
( ) ( )x f x y f y Gra f, ( ) , , ( ) ∈ nunca está por arriba de la gráfica de f . Gráficamente :
Figura 1.2
Por otra parte, si se multiplica la desigualdad (1.1) por −1 se obtiene
( )( ) ( )− + − ≥ − − −f x y f x f yλ λ λ λ1 1( ) ( )
Es decir
6
( ) ( )( ) ( )( ) ( )( )( )− + − ≥ − + − −f x y f x f yλ λ λ λ1 1
para todo [ ]x y I, ,∈ ∈ y λ 0 1 .
Esto permite deducir que f es convexa si y sólo si − f es cóncava.
Ahora podemos plantearnos la pregunta : ¿Cómo debe ser la gráfica de una
función que sea a la vez cóncava y convexa ?. La respuesta es : una función que es a
la vez cóncava y convexa es afín, es decir existen constantes m b, ∈IR , tales que
f x mx b x I( ) ,= + ∈ .
Demostración : Supóngase que f I: → IR es una función simultáneamente cóncava y
convexa, es decir
( )( ) ( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − = + −1 1 1 2, ..
para todo [ ]x y I, , , .∈ ∈λ 0 1
Se probará que f es una función afín en el intervalo [ ] ( )x y x y, .<
En efecto, si se verifica la igualdad (1.2) se tiene que para todo
[ ]x y I, ,∈ ∈ y λ 0 1 se cumple
( )( ) ( )f y x y f y f x f y+ − = + −λ λ( ) ( ) ( ) ,
entonces si ( )x y z y x yz y
x y≠ = + − = −
− y tenemos λ λ y por lo tanto
( ) [ ]f zf x f y
x yz y f y z x y( )
( ) ( )( ), ,= −
−− + ∈ .
Esta última expresión indica que f es una función afín en el intervalo [ ]x y, .
7
Recíprocamente, si f I: → IR es una función afín, entonces existen constantes
m b, ∈IR , tales que f x mx b( ) = + . Luego, si [ ]λ ∈ 0 1, y x y I, ∈ resulta
( )( ) ( )( )( ) ( )
( ) ( )( )( ) ( ) ( )
f x y m x y b
m x m y b b
mx b my b
f x f y
λ λ λ λ
λ λ λ λ
λ λ
λ λ
+ − = + − +
= + − + + −
= + + − +
= + −
1 1
1 1
1
1 .
y en consecuencia f es cóncava y convexa. Además, se concluye que
( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − = + −1 1 , [ ]λ ∈ ∈0 1, , ,x y I , si y solo si f es afín
sobre I.
Es de hacer notar que si f I: → IR es una función convexa y alcanza un
mínimo en x Io ∈ entonces − f (cóncava) alcanza un máximo en dicho punto. Este
tipo de consideraciones hace inferir que el estudio de las funciones convexas permite
sacar conclusiones acerca de las funciones cóncavas.
Ejemplos de funciones convexas son :
1. ( )f x x= sobre I = IR ;
2. g x x( ) = 2 sobre I = IR ;
3. ( )h xx
= 1 sobre ( )0, .∞
Probemos que f y g son funciones convexas. En efecto sean x y, ∈IR y
[ ]λ ∈ 0 1, ,entonces :
( )( ) ( )
( )
( )( )
1 1 1
1
1
1
)
( ) ( )
f x y x y
x y
x y
f x f y
λ λ λ λ
λ λ
λ λ
λ λ
+ − = + −
≤ + −
= + −
= + −
(desigualdad triangular)
8
( )( ) ( )
( )( ) ( )( ) ( )( ) ( )( )
( ) ( )( )
2
2
2 0 0
2 2 2 2
) ( ) ( ) ( )g g y x y g y g x g y
y x y y x y
x y y x y x y x y
y x y x y x y
x y x y
es convexa
y
⇔ + − ≤ + −
⇔ + − − ≤ −
⇔ − + − ≤ − +
⇔ + − ≤ + ≠ − >
⇔ − ≤ −
λ λ
λ λ
λ λ λ
λ λ
λ
y esto último es cierto porque ( ]λ ∈ − >0 1 0, . y x y
3) Veamos ahora que h es convexa. En efecto, sean ( ) [ ]x y, , , ,∈ ∞ ∈0 0 1λ ,
entonces
( )( ) ( )
( ) ( )
h x y h x h y
x y x y
λ λ λ λ
λ λλ λ
+ − ≤ + −
⇔+ −
≤ + −
1 1
1
1
11
1
( ) ( )
( ) ( ) ( )⇔ ≤ + − + − + −xy y x y y x x y yλ λ λ λ λ λ1
( ) ( )
( ) ( )[ ]⇔ ≤ + − + + − − − +
⇔ ≤ + + − + +
xy xy y y x xy xy x xy xy
xy x y x xy y
λ λ λ λ λ λ λ λ
λ λ λ λ λ λ
2 2 2 2 2 2
2 2 2 2 20 2 2
( ) ( )
( ) ( ) ( )
( )
( )
⇔ ≤ + + − + + ≠
⇔ ≤ − + − + −
⇔ ≤ − + + − >
⇔ ≤ −
0 2 2 0
0 2 1 1 1
0 2 1 0
0
2 2 2 2
2 2
2 2
2
λ λ λ λ
λ λ λ
λ
xy x y x xy y
xy x y
xy x y
x y ,
lo cual es cierto, y por lo tanto h es convexa.
9
Comentario : como la relación (1.1) de la definición 1.1.1 siempre se cumple cuando
x=y, se puede suponer que x≠y, y sin pérdida de generalidad que x>y. Esto fue lo que
hicimos para demostrar que g es convexa. Análogamente se puede suponer λ≠0 y
λ≠1.
A continuación se verán otras formas equivalentes de definir las funciones
convexas.
Considerando [ ]λ ∈ 0 1, y haciendo α λ β λ= = −, 1 en la definición 1.1.1,
obtenemos que f I: → IR es una función convexa si y sólo si
( )f x y f x f yα β α β+ ≤ +( ) ( )
para todo [ ]x y I, , , ,∈ ∈ y tales que + = 1.α β α β0 1
Además, para todo x y I p q p q, , , , ,∈ ≥ + >0 0 la desigualdad anterior es
equivalente a
fpx qy
p q
pf x qf y
p q
++
≤ +
+( ) ( )
ya que se puede hacer α β=+
=+
p
p q
q
p q, verificándose que
[ ] + = 1 con α β α β, , ,∈ 0 1 y entonces
fpx qy
p qf
p
p qx
q
p qy
p
p qf x
q
p qf y
pf x qf y
p q
++
=
++
+
≤+
++
= ++
( ) ( )( ) ( )
A continuación se presenta la desigualdad de Jensen, la cual es una
generalización de la desigualdad (1.1).
10
Teorema 1.1.1 : (Desigualdad de Jensen). Sean I ⊂ IR un intervalo y f I: → IR una
función. Entonces f es convexa sí y sólo si
f x f xi ii
n
i ii
nα α
= =∑ ∑
≤
1 1
13( ) ( . )
para todo x I i ni i n∈ ≥ = + + =, , , , , .α α α0 1 11K K tales que
Demostración : La condición necesaria se prueba por inducción. Para n=2 la relación
(1.3) es la desigualdad que define la convexidad de la función f. Supóngase que la
desigualdad (1.3) es cierta para n-1 sumandos (n>2), se probará que también es cierta
para n. Sin pérdida de generalidad se puede suponer que α αn n< − >1 1 0, luego y
entonces
( )
( )
f x f x x x
fx x
x
i ii
n
n n n n
nn n
nn n
α α α α
α α αα
α
=− −
− −
∑
= + + +
= − + +−
+
11 1 1 1
1 1 1 111
K
K
( )= −−
+ +−
+
−
−f x x xnn
n
nn n n1
1 11
11
1α αα
αα
αK
( )
( )
( )
≤ −−
+ +−
+
= −−
+
≤ −−
+
= + =
−−
=
−
=
−
=
−
=
∑
∑
∑ ∑
11 1
11
11
11
11
1
1
1
1
1
1
1
α αα
αα
α
α αα
α
αα
αα
α α α
nn
n
nn n n
ni
ni
i
n
n n
ni
ni
i
n
n n
i i n ni
n
i ii
n
f x x f x
f x f x
f x f x
f x f x f x
K ( ) ( )
( )
( ) ( ) (
( ) ( ) ( )
por convexidad
por hipotesis inductiva)
11
Lo anterior implica que f x f xi ii
n
i ii
nα α
= =∑ ∑
≤
1 1
( ) , como se quería demostrar.
Comentario : En la demostración el punto α
αα
α1
11
11 1−+ +
−−
−n
n
nnx xK está en el
intervalo I por ser combinación convexa de elementos de I (ver [8], pp. 66-67).
Además, la prueba del recíproco es inmediata porque la desigualdad (1.3) es válida
para todo n≥1 tal que n∈IN y en particular para n=2, que es precisamente la
desigualdad que define la convexidad.
De este teorema se deriva inmediatamente el corolario siguiente.
Corolario 1.1.1 : Sean I ⊂ IR un intervalo y f I: → IR una función. Entonces, f es
convexa si y sólo si
f
x f xi ii
n
ii
n
i ii
n
ii
n
β
β
β
β
=
=
=
=
∑
∑
∑
∑
≤1
1
1
1
14
( )
( . )
para todo x I i ni i ii
n∈ ≥ = >
=∑, , , , , .β β0 1 0
1
K tales que
Demostración : Se obtiene inmediatamente del teorema anterior haciendo
α β
βi
i
jj
n=
=∑
1
, para todo i n= 1, , .K
El lema que sigue se usará luego en la demostración del teorema 1.2.2.
Lema 1.1.1 : Sean I ⊂ IR un intervalo y f I: → IR una función. Entonces, f es
convexa sí y sólo si
12
f z f x
z x
f y f x
y x
f y f z
y z
( ) ( ) ( ) ( ) ( ) ( )−−
≤ −−
≤ −−
para todo x y z I x z y, , .∈ < < tal que
Demostración : Para probar la primera desigualdad, consideremos
( ) ( )z x y x= + − ∈λ λ, ,0 1 , luego λ = −−
z x
y x. Dado que f es convexa se verifica
( )f z f x f y f x( ) ( ) ( ) ( )≤ + −λ ,
de donde
( )f z f xz x
y xf y f x( ) ( ) ( ) ( )− ≤ −
−−
y en consecuencia
f z f x
z x
f y f x
y x
( ) ( ) ( ) ( )−−
≤ −−
que es la primera desigualdad.
Sea ahora ( )z y x y= + −λ , entonces ( )λ = −−
∈z y
x y0 1, y de la convexidad de la
función f se tiene
( )f z f y f x f y( ) ( ) ( ) ( )≤ + −λ
de donde se obtiene inmediatamente
( )f z f y
z y
f x f y
x yz y
( ) ( ) ( ) ( )−−
≥ −−
− < 0
13
que es precisamente la segunda desigualdad. Recíprocamente, supóngase que f
verifica las desigualdades del lema con [ ]x z y< < ∈; , y sea λ 0 1 tal que
( )z x y x= + −λ . Obsérvese que λ = −−
z x
y x. Por la primera desigualdad
f z f x
z x
f y f x
y x
( ) ( ) ( ) ( )−−
≤ −−
,
luego
( )f z f xz x
y xf y f x( ) ( ) ( ) ( )≤ + −
−
−
es decir
( )( ) ( )f x y x f x f y f x+ − ≤ + −λ λ( ) ( ) ( )
para todo [ ]x y I, , ,∈ ∈ y λ 0 1 y por lo tanto f es una función convexa.
Comentario : Respecto a la figura 1.3, el lema expresa lo siguiente :
Pendiente de AB ≤ Pendiente de AC ≤Pendiente de BC
Figura 1.3
La proposición que sigue es otra propiedad de las funciones convexas.
14
Proposición 1.1.1 : Sean I ⊂ IR un intervalo y f I: → IR una función. Entonces, f
es convexa sí y sólo si para todo x z y I, , ∈ tal que x z y< < las siguientes
desigualdades son equivalentes :
( ) ( ) ( )1
1
1
1
0)
( )
( )
( )
( ) ( ) ( )
x f x
z f z
y f y
y z f x x y f z z x f y= − + − + − ≥
( )( ) ( )( ) ( )( )2 0)( ) ( ) ( )f x
x z x y
f z
z y z x
f y
y x y z− −+
− −+
− −≥
Demostración : Se probará primero la condición necesaria. Sean x z y I, , ∈ tales que
x z y< < , entonces ( )z x yy z
y x
z x
y x= + ∈ + = = −
−= −
−α β α β α β α β con y , , , , .0 1 1
Como f es convexa se cumple ( )f x y f x f yα β α β+ ≤ +( ) ( ) , es decir
f zy z
y xf x
z x
y xf y( ) ( ) ( ) ( . )≤ −
−+ −
−15
Pero esto es cierto si y sólo si ( ) ( ) ( )y x f z y z f x z x f y− ≤ − + −( ) ( ) ( ) y esta
desigualdad es equivalente a
( ) ( ) ( )y z f x x y f z z x f y− + − + − ≥( ) ( ) ( ) 0
que es precisamente la relación 1).
Ahora bien, esta desigualdad es cierta si y sólo si
( )( ) ( )( ) ( )( )f x
x y z x
f z
y z z x
f y
y z x y
( ) ( ) ( )
− −+
− −+
− −≤ 0
ya que ( )( )( )y z x y z x− − − < 0. Pero esto es cierto si y sólo si
15
( )( ) ( )( ) ( )( )f x
x z x y
f z
z y z x
f y
y x y z
( ) ( ) ( )
− −+
− −+
− −≥ 0,
que es la relación 2).
Queda así probado que si f es una función convexa entonces las desigualdades
1) y 2) son equivalentes.
Recíprocamente, como para cualesquiera x z y I, , ∈ tales que x z y< < las
desigualdades 1) y 2) se pueden escribir en la forma dada por la relación (1.5), se
concluye que f es convexa.
1.2. Continuidad y Diferenciabilidad. En esta sección se estudiarán las propiedades de continuidad y
diferenciabilidad de las funciones convexas. La sección se inicia con una proposición
que expresa que toda función convexa definida en un intervalo cerrado y acotado es
acotada.
Proposición 1.2.1 : (ver [17], Cap. 1, p. 3). Si [ ]f a b: , → IR es una función
convexa, entonces es acotada.
Demostración : Sea { }M max f a f b= ( ), ( ) . Considérese [ ]z a b∈ , , luego
existe [ ]λ ∈ 0 1, tal que ( )z a b= + −λ λ1 y como f es una función convexa se tiene
( )( ) ( )
( )
f z f a b f a f b
M M M
( ) ( ) ( )
.
= + − ≤ + −
≤ + − =
λ λ λ λ
λ λ
1 1
1
Es decir f es acotada superiormente.
16
Para ver que f es acotada inferiormente tomemos t ∈IR de tal forma que los
puntos
xa b
t ya b
t= + − = + +2 2
,
estén en [ ]a b, . Entonces
fa b
fa b
ta b
t
fa b
t fa b
t
+
= + +
+ + −
≤ + +
+ + −
2
1
2 2
1
2 2
1
2 2
1
2 2,
de donde
fa b
t fa b
fa b
t
fa b
M m
+ +
≥ +
− + −
≥ +
− =
22
2 2
22
Como cualquier punto de [ ]a b, se puede escribir en la forma a b
t+ +2
, para
algún t debidamente seleccionado, se deduce que f es acotada inferiormente.
En conclusión, para todo [ ]z a b∈ , se verifica que
m f z M≤ ≤( )
donde { }M max f a f b= ( ), ( ) y m fa b
M= +
−2
2 y por lo tanto f es acotada.
Comentario : Es indispensable que el intervalo en que está definida la función sea
cerrado y acotado ya que en caso contrario puede suceder que la función no sea
acotada. Como ejemplos de esto se tienen las funciones ( ]f : ,0 1 → IR definida por
17
f x x( ) = −1 y [ )g: ,0 ∞ → IR definida por g x x( ) = 2 , que son convexas pero no son
acotadas superiormente.
A continuación se introduce la definición de función de Lipschitz para luego
demostrar que toda función convexa f I: → IR es Lipschitz en cualquier intervalo
[ ]a b, contenido en el interior de I.
Definición 1.2.1 : Se dice que una función [ ]f a b: , → IR satisface la condición de
Lipschitz (o es Lipschitz) si para todo [ ]x y a b, ,∈ existe una constante k tal que
f y f x k y x( ) ( )− ≤ − .
La constante k se denomina constante de Lipschitzidad.
El siguiente teorema expresa que toda función f I: ⊂ IR→ IR convexa, donde I
es un intervalo, satisface una condición de Lipschitz en cualquier intervalo cerrado
contenido en el interior de I.
Teorema 1.2.1 : (ver [8], teorema 2, p. 26). Sean I ⊂ IR un intervalo y f I: → IR
una función convexa. Entonces f satisface una condición de Lipschitz en cualquier
intervalo cerrado [ ]a b I, ⊂ o
y, por lo tanto, f es continua en el interior de I.
Demostración : Sea ε > 0 tal que a b− +ε ε y están en I, y sean m y M las cotas
inferior y superior de f en el intervalo [ ]a b− +ε ε, . Sean [ ]x y a b, ,∈ , con x y≠ .
Como ( )11
y xy x
−− = , resulta que ( ) [ ]z y
y xy x a b= +
−− ∈ − +ε ε ε, . Luego,
18
yy x
y xz
y xx=
−+ −
++ −ε
εε
. En consecuencia, si tomamos ( )λε
=−
+ −∈
y x
y x0,1 ,
resulta que ( )y z x= + −λ λ1 y como f es convexa se tiene que
( ) [ ]f y f z f x f z f x f x( ) ( ) ( ) ( ) ( ) ( )≤ + − = − +λ λ λ1 .
Por lo tanto
( ) ( )f y f x M my x
M m k y x( ) ( )− ≤ − <−
− = −λε
,
donde ( )k M m= − / ε . Como esto es cierto para [ ]x y a b, ,∈ , x y≠ , se deduce que
f y f x k y x( ) ( )− < − y así f es Lipschitz en cualquier intervalo [ ]a b I, ⊂ o
. De la
arbitrariedad del intervalo[ ]a b, se concluye que f es continua en el interior de I.
Comentario : El teorema que se acaba de demostrar establece que toda función
f I: → IR convexa, es continua en el interior del intervalo I. Pero no se aclara la
situación en los puntos extremos del intervalo I. Con el fin de aclarar esto,
considérese la función [ ]g: ,− →1 1 IR definida por
[ )g x
x si x
si x( )
,=
∈ −
=
2 1 1
2 1
Esta función es convexa, continua en x = −1 y discontinua en x = 1.
En este ejemplo se puede observar que si f I: → IR es una función convexa,
no se puede decir nada sobre la continuidad de f en los extremos del intervalo I. Sin
embargo, el número de discontinuidades que puede tener una función convexa nunca
excede de dos ya que en el interior de su dominio es continua.
19
Antes de dar un corolario que se deriva del teorema 1.2.1 consideremos la
siguiente definición.
Definición 1.2.2 : Una función f I: → IR es absolutamente continua sobre I, si para
cada ε > 0 , existe δ > 0 tal que, para toda colección de intervalos abiertos
( )a b Ii i, ⊂ , disjuntos dos a dos, se tiene que
( )f b f a b ai ii
n
i ii
n( ) ( ) ,− < − <
= =∑ ∑
1 1
ε δ cuando .
Corolario 1.2.1 : Si I es un intervalo en IR y f I: → IR es una función convexa,
entonces f es absolutamente continua sobre cualquier intervalo [ ]a b I, ⊂ o
.
Demostración : Sea ( ){ }a b i ni i, : , ,= 1K una colección de intervalos abiertos
disjuntos dos a dos, contenidos en [ ]a b I, ⊂ o
. Por el teorema 1.2.1 se tiene que f es
Lipschitz sobre el intervalo cerrado [ ]a b, , esto es ; existe una constante k, tal que si
[ ]x y a b, ,∈ entonces f x f y k x y( ) ( )− ≤ − . Sea ε > 0 y considérese un δ > 0 tal
que
b ai ii
n− <
=∑
1
δ .
Entonces
f b f a k b a k b a ki ii
n
i ii
n
i ii
n( ) ( )− ≤ − = − <
= = =∑ ∑ ∑
1 1 1
δ .
Por lo tanto, f b f ai ii
n( ) ( )− <
=∑
1
ε si consideramos 0 < <δ εk
y en consecuencia
toda función convexa f I: → IR es absolutamente continua en Iο
.
20
En lo que sigue de esta sección se tratará la diferenciabilidad de funciones
convexas. Recuérdese que si f I: → IR es una función, donde I es un intervalo en IR,
la derivada (lateral) izquierda de f en el punto x I∈ está definida por
f x limf y f x
y xy x−
↑= −
−' ( )
( ) ( )
donde y x↑ quiere decir y x y x→ <, y se supone que x no es el extremo izquierdo
de I y además y I∈ . Similarmente la derivada (lateral) derecha de f en x se define
como :
f x limf y f x
y xy x+
↓= −
−' ( )
( ) ( )
donde y x↓ quiere decir y x y x→ >, y suponemos que x no es el extremo derecho
de I e y I∈ .
El siguiente teorema establece que las derivadas laterales de una función
convexa existen, son monótonas y crecientes.
Teorema 1.2.2 : (ver [17], Cap. 1, teorema B, p. 5). Si I es un intervalo en IR y
f I: → IR es una función convexa (estrictamente convexa), entonces las derivadas
laterales f f−′
+ y ' existen, son crecientes (estrictamente crecientes) en
I f x f x o
y − +≤' '( ) ( ) , para todo x I∈ o
.
Demostración : Considérense cuatro puntos w x y z I, , , ∈ o
tales que w x y z< < < y
sean
21
( ) ( ) ( ) ( )A w f w B x f x C y f y D z f z= = = =, ( ) , , ( ) , , ( ) , ( ) y (ver figura 1.4).
Figura 1.4
Aplicando el lema 1.1.1 primero a los puntos A, B, C y luego a los puntos B,
C, D se tiene :
Pendiente de AB≤Pendiente de AC≤Pendiente de BC
≤Pendiente de BD≤Pendiente de CD
con desigualdades estrictas si f es estrictamente convexa. Esto equivale a las
siguientes desigualdades :
f w f x
w x
f w f y
w y
f x f y
x y
f x f z
x z
f y f z
y zA
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )( )
−−
≤ −−
≤ −−
≤ −−
≤ −−
De la segunda desigualdad de (A) se obtiene que
f w f y
w yw w y B
( ) ( )( ) ( )
−−
< es creciente en
De las desigualdades segunda, tercera y cuarta se tiene
f w f y
w y
f y f z
y z
( ) ( ) ( ) ( ),
−−
≤ −−
22
es decir
f w f y
w y
( ) ( )−−
está acotado superiormente por f y f z
y zC
( ) ( )( )
−−
para cualquier z y> .
De (B) y (C) resulta que limf w f y
w yw y↑
−−
( ) ( ) existe y
limf w f y
w y
f w f y
w yw y w y↑ <
−−
= −−
( ) ( )sup
( ) ( ).
Por lo tanto, si y I∈ o
, existe la derivada lateral f y−' ( ) .
De manera similar, se comprueba que existe derivada lateral f x+' ( ) , para todo
x I∈ o
y
f x limf x f z
x z
f x f z
x zz x z x+
↓ >= −
−= −
−' ( )
( ) ( )inf
( ) ( )
Además de las cuatro desigualdades de (A) se obtiene que
f x f x f y f y− + − +≤ ≤ ≤' ' ' '( ) ( ) ( ) ( )
y por lo tanto
a f x f x) ( ) ( ),' '− +≤ para todox I∈
o,
b f f) ,' '− + son funciones crecientes.
Comentario : Considérense los tres puntos w x y I, , ∈ o
tales que w x y< < . Como
la función derivada lateral f+' es monótona, existe el límite de f x+
' ( ) cuando x w↓ .
23
Además de la desigualdad
f xf y f x
y x+ ≤ −−
' ( )( ) ( )
y de la continuidad de f se obtiene
lim f x limf y f x
y x
f y f w
y wx w x w↓+
↓≤ −
−= −
−' ( )
( ) ( ) ( ) ( ).
Si se hace y w↓ se tiene que
lim f x limf y f w
y wf w
x w y w↓+
↓+≤ −
−=' '( )
( ) ( )( ) .
Esto implica que
lim f x f wx w↓
+ +≤' '( ) ( ) ( . )16
Por otra parte, como w x< , la monotonía de f+' implica que f w f x+ +≤' '( ) ( ) y por lo
tanto
f w lim f xx w
+↓
+≤' '( ) ( ) ( . )17
De (1.6) y (1.7) se deduce que
lim f x f wx w↓
+ +=' '( ) ( ) ( . )18 .
Supóngase ahora que los tres puntos x y w I, , ∈ o
son tales que y x w< < .
Dado que la función f+' es monótona creciente se verifica
f y f x
y xf x
( ) ( )( )'−
−≤ +
24
y de la continuidad de f se tiene
limf y f x
y xlim f x
x w x w↑ ↑+
−−
≤( ) ( )( )'
es decir
f y f w
y wlim f xx w
( ) ( )( )'−
−≤
↑+
Si ahora se hace que y w↑ , se obtiene
limf y f w
y wlim f x
y w x w↑ ↑+
−−
≤( ) ( )( )' ,
es decir
f w lim f xx w
−↑
+≤' '( ) ( ) ( . )19
Además, como x w< , la monotonía de las derivadas laterales implica que
f x f w+ −≤' '( ) ( ) y en consecuencia
lim f x f wx w↑
+ −≤' '( ) ( ) ( . )110
De (1.9) y (1.10) se obtiene que
lim f x f wx w↑
+ −=' '( ) ( ) ( . )111
En resumen se tiene que
lim f x f wx w↓
+ +=' '( ) ( ) ( . )18
25
y
lim f x f wx w↑
+ −=' '( ) ( ) ( . )111
con lo que concluye este comentario.
Las desigualdades (1.8) y (1.11) permiten demostrar el teorema siguiente
Teorema 1.2.3 : (ver [17], Cap. 1, teorema C, p.7). Si f I: → IR es una función
convexa sobre el intervalo abierto I, el conjunto E formado por los puntos en los
cuales f ' no existe, es numerable, y además f ' es continua en I E\ .
Demostración : Como f w f w− +≤' '( ) ( ) , de (1.8) y (1.11) resulta
f w lim f x lim f x f wx w x w
−↑
+↓
+ += ≤ =' ' ' '( ) ( ) ( ) ( ) .
Luego, f w f w− +=' '( ) ( ) en aquellos puntos w tales que ( ) ( )lim f x lim f xx w x w↑
+↓
+=' ' , es
decir, los puntos donde la función monótona f+' es continua. Como f+
' es creciente,
el conjunto de puntos donde f+' es discontinua es un conjunto numerable (Ver [8],
p.35) y así, si f es convexa, entonces es derivable salvo un conjunto numerable E y
además f ' es continua salvo este conjunto E
Comentario : Como en los puntos donde existe la derivada de f se tiene que
f x f x f x− += =' ' '( ) ( ) ( ) y además esto se cumple para todos los puntos del dominio de
la función f si esta es diferenciable, se deduce teniendo en cuenta que las derivadas
laterales de cualquier función convexa son crecientes que : si f I: → IR es una
función convexa y diferenciable sobre el intervalo abierto I, entonces la derivada de f
es creciente en I.
26
1.3. Caracterización de las Funciones Convexas En las aplicaciones resulta muy útil poder reconocer las funciones convexas
por propiedades de sus derivadas. En esta sección se darán varias de estas
propiedades, la primera de las cuales se fundamenta en el teorema 1.2.2.
Teorema 1.3.1 : ( ver [8], teorema 5, p. 29 ). Sean I ⊂ IR un intervalo abierto y
f I: → IR una función diferenciable sobre I . Entonces f es convexa (estrictamente
convexa) si y sólo si la derivada f ' es creciente (estrictamente creciente) sobre I .
Demostración : Si f es convexa, el teorema 1.2.2 demuestra que f ' es creciente en I.
Recíprocamente, supongamos que f ' es creciente y sean x y z I, , ∈ tales que
x z y< < . Por el teorema del valor medio existen ( )ξ ∈ x z, y ( )η ∈ z y, tales que
( ) ( )ff z f x
z xy f
f y f z
y z' '( ) ( ) ( ) ( )ξ η= −
−= −
−.
Como f ' es creciente se verifica
( ) ( ) ( )f f' 'ξ η ξ η≤ <
es decir
f z f x
z x
f y f z
y z
( ) ( ) ( ) ( )−−
≤ −−
de donde
( )( ) ( )( )y z f z f x z x f y f z− − ≤ − −( ) ( ) ( ) ( )
lo cual es equivalente a
( ) ( ) ( )y x f z y z f x z x f y− ≤ − + −( ) ( ) ( )
27
Dividiendo por y x− > 0, tenemos
f zy z
y xf x
z x
y xf y( ) ( ) ( )≤ −
−+ −
−
Haciendo
α β= −−
= −−
y z
y xy
z x
y x
se cumple que
( )z x y= + ∈ + =α β α β α β con y , ,0 1 1
y además
( )f x y f x f yα β α β+ ≤ +( ) ( )
para todo x y I, ∈ . Por lo tanto f es convexa.
Corolario 1.3.1 : Sean I ⊂ IR un intervalo abierto y f I: → IR una función que tiene
segunda derivada f x''( ) , para todo x I∈ . Entonces f es convexa si y sólo si,
f x''( ) ≥ 0, para todo x I∈ .
Demostración : Si f es una función convexa entonces la derivada f ' es creciente y,
por consiguiente, la segunda derivada f '' es no negativa (f x''( ) ≥ 0, para todo
x I∈ ). Recíprocamente, si f x''( ) ≥ 0, para todo x I∈ , entonces f ' es creciente y,
por el teorema 1.3.1, f es convexa.
28
Corolario 1.3.2 : Sean I ⊂ IR un intervalo abierto y f I: → IR una función que tiene
segunda derivada f x''( ) , para todo x I∈ . Si f x''( ) > 0, para todo x I∈ , entonces f
es estrictamente convexa.
Demostración : Si f x''( ) > 0, para todo x I∈ , entonces f ' es estrictamente
creciente y por lo tanto f es estrictamente convexa.
El recíproco del corolario 1.3.2 no es cierto, es decir : una función f puede ser
estrictamente convexa y sin embargo no verificarse que f x''( ) > 0 para todo x I∈ .
Por ejemplo, la función ( )f : ,− →1 1 IR definida por f x x( ) = 4 es estrictamente
convexa pero la segunda derivada f x x''( ) = 12 2 se anula en x = 0.
Como ejemplos de aplicación de lo visto en esta sección tenemos los siguientes :
1) La función f : IR→ IR definida por f x ex( ) = es estrictamente convexa ya que
f x ex' ( ) = es estrictamente creciente ; o también porque f x ex''( ) = > 0, para
todo x ∈ IR .
2) g: IR→ IR definida por g x x( ) = 2 es estrictamente convexa porque g x x' ( ) = 2 es
estrictamente creciente, o bien ( )g x x' ' ,= > ∈2 0 IR.
3) ( )h: ,0 ∞ → IR definida por h x x( ) = −1 es estrictamente convexa porque
h x x''( ) = >−2 03 , para todo ( )x ∈ ∞0, .
29
4) ( )r: ,0 ∞ → IR definida por r x x pp( ) ,= > 1, es estrictamente convexa ya que
r x pxp' ( ) = −1 es estrictamente creciente ; o también porque
r x p p xp''( ) ( )= − >−1 02 para todo ( )x ∈ ∞0, .
5) ( )s: ,0 ∞ → IR definida por s x x( ) = es cóncava porque ( )( )− = −s x x es
convexa ya que ( ) ( )− = >−s x x'' 1
403 2 , para todo ( )x ∈ ∞0, .
6) ( )t: ,0 ∞ → IR definida por t x Ln x( ) = es cóncava porque ( )( )− = −t x Ln x es
convexa ya que ( ) ( )− = >t xx
'' 10
2, para todo ( )x ∈ ∞0, .
30
El próximo teorema presenta una forma de reconocer las funciones convexas
como integrales de funciones crecientes.
Teorema 1.3.2 : (ver [8], teorema 6, p. 30). Una función ( )f a b: , → IR es convexa
(estrictamente convexa) si y sólo si existe una función creciente (estrictamente
creciente) ( )g a b: , → IR y un punto ( )c a b∈ , , tales que para todo ( )x a b∈ ,
f x f c g t dtc
x
( ) ( ) ( ) ( . )− = ∫ 112
Demostración : Supóngase que la relación (1.12) es cierta con g creciente y sean
α β, números positivos tales que α β+ = 1. Entonces, para todo ( )x y a b, ,∈ tales
que x y< , se tienex x y y< + <α β . Luego :
( ) ( )α β α β α β α β α βf x f y f x y f x f y f x y( ) ( ) ( ) ( ) ( )+ − + = + − + +
( )( ) ( )( )= − + − + −β α β α α βf y f x y f x y f x( ) ( )
( )= −+
+
∫ ∫β αα β
α βg t dt g t dt
x y
y
x
x y
( ) ( ) Por (1.12)
( ) ( )≥ + − ++
+
∫ ∫β α β α α βα β
α βg x y dt g x y dt A
x y
y
x
x y
( )
( ) ( )( ) ( )( )= + − + − + + −β α β α β α α β α βg x y y x y g x y x y x
( ) ( )( ) ( )( )= + − + − + −g x y y x y x y xα β β α β α α β
( ) ( ) ( )( )= + − + − + +g x y y x y x y xα β β β α β α α β α
( ) ( )( )( )= + + − + +g x y x y x yα β α β α β α β
( ) ( )( )= + + − + =g x y x y x yα β α β α β 0
31
Esto implica que
( )α β α βf x f y f x y B( ) ( ) ( )+ − + ≥ 0
para todo α β α β, [ , ],∈ + =0 1 1, y ( )x y a b, ,∈ . Por lo tanto f es convexa. Además,
como g es una función creciente se verifican
( )( )
x t x y g t g x y
x y t y g x y g t
< < + ⇒ ≤ +
+ < < ⇒ + ≤
α β α β
α β α β
( )
( )
y si g es estrictamente creciente estas desigualdades son estrictas, y por lo tanto la
desigualdad (A) es estricta, de donde la desigualdad (B) también es estricta y así la
función f es estrictamente creciente.
Recíprocamente, supóngase que f es una función convexa (estrictamente
convexa). Por el teorema 1.2.2. se sabe que la derivada lateral f+' existe y es
creciente (estrictamente creciente). Consideremos una partición
{ }∏ = = < < < =c x x x xo n1 L del intervalo [ ]c x, . Como x xk k− <1 para todo
1≤ ≤k n, se tiene de acuerdo con el lema 1.1.1 y el teorema 1.2.2 que
( )f xf x f x
x xf xk
k k
k kk+ −
−
−+≤ −
−≤' '( ) ( )
( )11
1
de donde se obtiene
( ) ( )f x x x f x f x f x x xk k k k k k k k+ − − − + −− ≤ − ≤ −' '( ) ( ) ( ) ( )1 1 1 1
Sumando sobre k, se tiene
( ) ( )f x x x f x f x f x x xk k kk
n
n ok
n
k k k+ − −=
+=
−− ≤ − ≤ −∑ ∑' '( ) ( ) ( ) ( )1 11 1
1
32
Las dos sumas de estas ultimas desigualdades son las sumas de Riemann de la función
f+' asociadas a la partición Π y verifican las desigualdades independientemente de la
partición del intervalo [ ]c x, que se considere. Como la función f+' es creciente,
entonces es Riemann-integrable y al tomar el supremo de la suma de la izquierda y el
ínfimo de la suma de la derecha sobre todas las particiones se obtiene por definición
de integral de Riemann que
f t dt f x f c f t dtc
x
c
x
+ +∫ ∫≤ − ≤' '( ) ( ) ( ) ( )
es decir
f x f c f t dtc
x
( ) ( ) ( )'− = +∫
y así se puede tomar g t f t( ) ( )'= + . La función f−' también se puede usar en lugar de
f+' ya que ambas funciones son crecientes (estrictamente crecientes) cuando f es
convexa (estrictamente convexa).
Comentario : El teorema 1.3.2 permite dar otra demostración del teorema 1.3.1. En
efecto, si f es convexa (estrictamente convexa) y diferenciable, entonces por el
teorema 1.2.2 la derivada f ' es creciente (estrictamente creciente). Además el
teorema fundamental del cálculo asegura que
f x f c f t dtc
x
( ) ( ) ( ) ( . )'− = ∫ 113
para cualquier ( )c a b∈ , .
33
Recíprocamente, si la derivada f ' es creciente (estrictamente creciente) y existe en
todos los puntos del dominio de la función f, entonces de acuerdo con la relación
(1.13) y de la aplicación del teorema 1.3.2 con g t f t( ) ( )'= para todo ( )t a b∈ , , se
concluye que f es convexa (estrictamente convexa).
Para algunos de los ejemplos que se dieron como aplicación del teorema 1.3.1, la
aplicación del teorema 1.3.2 y la relación (1.12) lleva a las siguientes expresiones :
e e e dt c xx c t
c
x
− = ∈∫ , , IR
x c tdt c xc
x2 2 2− = ∈∫ , , IR
( )1 1 10
2x c tdt c x
c
x
− = − ∈ ∞∫ , , ,
Antes de demostrar el próximo teorema se dará la definición siguiente.
Definición 1.3.1 : Sean I ⊂ IR un intervalo y f I: → IR una función. Se dice que f
tiene soporte en x Io ∈ si existe un número m∈ IR tal que la función afín
( )A x f x m x xo o( ) ( )= + − verifica que A x f x( ) ( )≤ para todo x I∈ . La función A se
conoce como la función (o recta) de soporte de f en xo .
Si observamos una función convexa como la de la figura 1.5, podremos notar
que en cada punto del interior de su dominio tiene soporte.
34
Figura 1.5
El próximo teorema provee una demostración de este hecho.
Teorema 1.3.3 : (ver [8], teorema 7, p. 32). Una función ( )f a b: , → IR es convexa,
si y sólo si existe al menos una recta de soporte para cada ( )x a bo ∈ , .
Demostración : Supongamos que f es convexa, entonces para cada ( )x a bo ∈ ,
podemos escoger [ ]m f x f xo o∈ − +' '( ), ( ) . Si ( )x a b∈ , es tal que x xo < , entonces
f x m f xf x f x
x xo oo
o− +≤ ≤ ≤ −
−' '( ) ( )
( ) ( )
de donde
( )f x f x m x xo o( ) ( )− ≥ − .
Por otra parte, si x xo< se verifica
f x f x
x xf x m f xo
oo o
( ) ( )( ) ( )' '−
−≤ ≤ ≤− +
y como x xo− < 0 resulta :
35
( )f x f x m x xo o( ) ( )− ≥ − .
En cualquier caso se cumple que
( )f x f x m x x A xo o( ) ( ) ( )≥ + − =
y así A es una recta de soporte de f en xo .
Supongamos ahora que f tiene una recta de soporte en cada punto de ( )a b, y sean
( )x y a b, ,∈ . Si ( ) [ ]x x yo = + − ∈λ λ λ1 0 1, , , sea ( )A x f x m x xo o( ) ( )= + − la recta
de soporte f en xo , entonces
( )( ) ( )( )( ) ( )
f x y f x A x A x y
A x A y f x f y
o oλ λ λ λ
λ λ λ λ
+ − = = = + −
= + − ≤ + −
1 1
1 1
( ) ( )
( ) ( ) ( ) ( )
Es decir :
( )( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1( ) ( )
para todo ( )x y a b, ,∈ y [ ]λ ∈ 0 1, . Por lo tanto f es convexa.
Comentario : La primera parte de la demostración de este teorema se puede hacer
también de la siguiente manera : Si f es convexa y [ ]m f x f xo o∈ − +' '( ), ( ) se tiene
que para ( )x x x a bo < ∈, , , y para todo ( )t x xo∈ , se verifica
f x m f x f t f xo o− + + −≤ ≤ ≤ ≤' ' ' '( ) ( ) ( ) ( ) .
Luego, aplicando el teorema 1.3.2 :
36
( )f x f x f t dt mdt m x xox
x
x
x
o
o o
( ) ( ) ( )'− = ≥ = −+∫ ∫ .
Por otra parte, en el caso x xo< se tiene que para todo ( )t x xo∈ , se verifica
f x f t f x m f xo o+ + − +≤ ≤ ≤ ≤' ' ' '( ) ( ) ( ) ( )
y aplicando el teorema 1.3.2 se obtiene
( )f x f x f t dt mdt m x xox
x
x
x
o
o o
( ) ( ) ( )'− = ≤ = −+∫ ∫
es decir
( )f x f x m x xo o( ) ( )− ≤ −
y luego :
( )f x f x m x xo o( ) ( )− ≥ − .
En cualquier caso se verifica
( )f x f x m x xo o( ) ( )≥ + − .
El teorema que sigue, el último de esta sección, expresa que si una función
convexa f I: ⊂ IR→ IR tiene derivada en el punto x Io ∈ , entonces la recta de soporte
de f en xo , tiene como pendiente el valor de la derivada en este punto.
Teorema 1.3.4 : (ver [8], teorema 8, p. 33). Sea ( )f a b: , → IR una función
convexa. Entonces la función f tiene derivada en xo , si y sólo si la recta de soporte
37
de f en xo es única, y en este caso ( )A x f x f x x xo o o( ) ( ) ( )'= + − es la recta de
soporte.
Demostración : En el comentario del teorema 1.3.3 se observó que para cada
[ ]m f x f xo o∈ − +' '( ), ( ) hay una recta de soporte de f en xo . Supóngase ahora que la
recta de soporte de f en xo es única, entonces el valor de la pendiente m es único y
se tiene f x f xo o− +=' '( ) ( ) y por lo tanto f tiene derivada en xo .
Recíprocamente, supóngase que f xo' ( ) existe. Para cualquier recta de soporte
( )A x f x m x xo o( ) ( )= + − , se tiene f x A x( ) ( )≥ , para todo ( )x a b∈ , . Por lo tanto, si
( )x y a b, ,∈ se verifica :
( )( )
f x f x m x x
f y f x m y x
o o
o o
( ) ( ) ( . )
( ) ( ) ( . )
≥ + −
≥ + −
114
115
Si x x yo< < , de la relación (1.14) se obtiene
f x f x
x xmo
o
( ) ( )−−
≤
ya que x xo− < 0 ; y de (1.15)
f y f x
y xmo
o
( ) ( )−−
≥ .
Estas dos últimas desigualdades son equivalentes a :
f x f x
x xm
f y f x
y xo
o
o
o
( ) ( ) ( ) ( )−−
≤ ≤ −−
Tomando límites se tiene que
38
limf x f x
x xm lim
f y f x
y xx x
o
o y x
o
oo o↑ ↓
−−
≤ ≤ −−
( ) ( ) ( ) ( )
es decir
f x m f xo o− +≤ ≤' '( ) ( ) .
Esto último implica que : si f tiene derivada en xo , entonces m es única y por lo
tanto la recta de soporte de f en xo es única, y es la recta tangente a la gráfica de f
en el punto ( )( )x f xo o, .
1.4. Operaciones con Funciones Convexas En la sección 1.3 vimos formas de identificar las funciones convexas a partir
de propiedades de sus derivadas. En esta sección se verán otras formas de reconocer
estas funciones a partir de operaciones que preserven la convexidad. Por ejemplo, será
posible reconocer que la función f : ( , )0 ∞ → IR definida por f t t t( ) = +−1 3 es
convexa porque es una suma de funciones convexas y como veremos la suma de
funciones es una operación que preserva convexidad.
El siguiente teorema establece que la suma de funciones convexas y el
producto de una constante no negativa por una función convexa son funciones
convexas.
Teorema 1.4.1 : (ver [ 8 ], Teorema 9, p. 37 ). Sea I ⊂ IR un intervalo. Si f I: → IR
y g I: → IR son funciones convexas y α ≥ 0, entonces f g+ y α f son funciones
convexas sobre I.
Demostración : Sean x y I, ∈ y λ ∈[ , ].0 1 Entonces
39
( )f g+ ( ( ) ) ( ( ) ) ( ( ) )λ λ λ λ λ λx y f x y g x y+ − = + − + + −1 1 1≤ + − + + −λ λ λ λf x f y g x g y( ) ( ) ( ) ( ) ( ) ( )1 1= + + − +λ λ( ( ) ( ) ) ( ) ( ( ) ( ) )f x g x f y g y1
= + + − +λ λ( ) ( ) ( ) ( ) ( ).f g x f g y1
Es decir
( ) ( ( ) ) ( ) ( ) ( ) ( ) ( )f g x y f g x f g y+ + − ≤ + + − +λ λ λ λ1 1
y por lo tanto f + g es convexa.
También se tiene
( ) ( ( ) ) ( ( ) )α λ λ α λ λf x y f x y+ − = + −1 1
≤ + −
= + −
α λ λ
λα λ α
( ( ) ( ) ( ) )
( ) ( ) ( )
f x f y
f x f y
1
1
= + −λ α λ α( ) ( ) ( ) ( ) ( )f x f y1
y por consiguiente α f es convexa.
Ejemplos :
1) Si f : IR→ IR y g : IR→ IR son las funciones definidas por f(x) = x y g(x) = x2
entonces ( ) ( )f g x x+ = + x2, para todo x ∈IR , es convexa porque f y g lo
son.
2) Como la función h : (0,∞ →) IR definida por h( )x = x−1 es convexa tenemos que
la función ( ) ( )3 3 1h x x= − definida sobre ( , )0 ∞ también es convexa.
40
Corolario 1.4.1 : Sean Ι ⊂ IR un intervalo y { }fn n IN∈ una sucesión de funciones
f In : → IR convexas. Si la serie f xnn
( )=
∞∑
1
converge a f x( ) para cada x I∈ ,
entonces f es una función convexa sobreI .
Demostración : Sea{ }gn n IN∈ la sucesión de funcionesgn : Ι → IR definidas como
sigue :
1) g x f x1 1( ) ( ),= para todo x I∈ ;
2) g x f x f x2 1 2( ) ( ) ( ),= + para todox I∈ ;
3) g x f x f x f x x Im m( ) ( ) ( ) ( ) , .= + + + ∈1 2 L
Entonces
f x f x lim g xn
nn
n( ) ( ) ( ) ,= ==
∞
→∞∑
1
para todo x I∈ .
Luego, para todo [ ]λ ∈ 0 1, y x y I, ∈ se verifica :
f x y lim g x yn
n( ( ) ) ( ( ) )λ λ λ λ+ − = + −→∞
1 1
≤ + −→∞lim g x g y
nn n( ( ) ( ) ( ) )λ λ1
= + −→∞ →∞
λ λlim g x lim g yn
nn
n( ) ( ) ( )1
= + −λ λf x f y( ) ( ) ( )1
lo cual implica que f fnn
==
∞∑
1
es convexa.
41
Comentario : Se ha usado el hecho que gn es una función convexa, es decir, que la
suma de cualquier número finito de funciones convexas es una función convexa. Esto
se prueba por inducción usando el teorema 1.4.1.
En el teorema siguiente se presentan las condiciones que deben verificar dos
funciones para que su composición sea una función convexa o cóncava.
Teorema 1.4.2 : Sea I ⊂ IR un intervalo y sean f I: → IR y g f I: ( ) → IR
funciones. Entonces :
1) Si f es convexa y g es convexa y creciente, entonces g fo es convexa.
2) Si f es cóncava y g es convexa y decreciente, entonces g fo es convexa.
3) Si f es cóncava y g es cóncava y creciente, entonces g fo es cóncava.
4) Si f es convexa y g es cóncava y decreciente, entonces g fo es cóncava.
Demostración : Sean x y I, ∈ y λ ∈[ , ].0 1 Entonces :
1) ( ) ( ( ) ) ( ( ( ) )g f x y g f x yo λ λ λ λ+ − = + −1 1
≤ + −g f x f y( ( ) ( ) ( ) )λ λ1 ( f convexa y g creciente)
≤ + −λ λg f x g f y( ( ) ) ( ) ( ( ) )1 (ya que g es convexa)
= + −λ λ( ) ( ) ( ) ( )( )g f x g f yo o1
2) ( )( ( ) ) ( ( ( ) ) )g f x y g f x yo λ λ λ λ+ − = + −1 1
≤ + −g f x f y( ( ) ( ) ( ) )λ λ1 ( f cóncava y g decreciente)
≤ + −λ λg f x g f y( ( ) ) ( ) ( ( ) )1 (porque g es convexa)
= + −λ λ( )( ) ( ) ( )( )g f x g f yo o1
3) ( )( ( ) ) ( ( ( ) ) )g f x y g f x yo λ λ λ λ+ − = + −1 1
≥ + −g f x f y( ( ) ( ) ( ) )λ λ1 ( f cóncava y g creciente).
42
≥ + −λ λg f x g f y( ( ) ) ( ) ( ( ) )1 (ya que g es cóncava)
= λ λ( )( ) ( ) ( ) ( )g f x g f yo o+ −1
4) ( )( ( ) ) ( ( ( ) ) )g f x y g f x yo λ λ λ λ+ − = + −1 1
≥ + −g f x f y( ( ) ( ) ( ) )λ λ1 ( f convexa y g decreciente)
≥ + −λ λg f x g f y( ( )) ( ) ( ( ) )1 (porque g es cóncava)
= + −λ λ( )( ) ( )( ) ( ).g f x g f yo o1
Ejemplos :
1) Si ( )f : ,0 ∞ → IR y g: ( , )0 ∞ → IR son las funciones definidas por f x x( ) = −1 y
g x x( ) = 3 entonces ( )( )g f x xo = −3 es convexa sobre ( , )0 ∞ porque f es
convexa y g es convexa y creciente.
2) Como las funciones f : ( , )0 ∞ → IR y g: ( , )0 ∞ → IR definidas por f x x( ) = y
g x x( ) = −1 son tales que f es cóncava y g es convexa y decreciente se concluye
que la función ( )( )g f x xo = − 12 es convexa sobre ( , ).0 ∞
3) Si f : ( , )0 ∞ → IR y g: ( , )0 ∞ → IR son las funciones definidas por f x x( ) = y
g x Ln x( ) = entonces ( )( )g f x Ln xo = es cóncava sobre ( , )0 ∞ pues f es
cóncava y g cóncava y creciente.
En el próximo teorema se exhiben las condiciones bajo las cuales el producto
de funciones es una función convexa.
43
Teorema 1.4.3 : (ver [ 8 ], Teorema 11, p. 38 ). Sea I ⊂ IR un intervalo y sean
f I: → IR y g I: → IR funciones no negativas, crecientes (decrecientes) y convexas,
entonces la función h f g= ⋅ también tiene estas tres propiedades.
Demostración : Si f y g son crecientes y no negativas, se tiene que para
cualesquiera x y I, ∈ tales que x < y se verifica
0 ≤ ≤f x f y( ) ( ) y 0 ≤ ≤g x g y( ) ( ). .
Entonces
0 ≤ = ≤ =h x f x g x f y g y h y( ) ( ) ( ) ( ) ( ) ( )
y por lo tanto h es creciente y no negativa.
Para el caso en que f y g son decrecientes se procede de manera análoga.
Para demostrar la convexidad se usa el hecho que si x < y se verifica
( ( ) ( ) ) ( ( ) ( ) )f x f y g y g x− − ≤ 0
es decir
f x g y f y g x f x g x f y g y( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ).+ ≤ +
Usando esta desigualdad se ve que para todo [ ]λ ∈ 0 1, y x y I, ∈ se cumple :
h x y f x y g x y( ( ) ) ( ( ) ) ( ( ) )λ λ λ λ λ λ+ − = + − + −1 1 1
44
≤ + − + −
= + − + + −
≤ + − + + −
+
= + +
( ( ) ( ) ( ) )( ( ) ( ) ( ) )
( ) ( ) ( ) ( ( ) ( ) ( ) ( ) ) ( ) ( ) ( )
( ) ( ) ( )( ( ) ( ) ( ) ( ) ) ( ) ( ) ( ) ( )
( ) ( )
( ) ( ) ( ) ( ) ( )
λ λ λ λ
λ λ λ λ
λ λ λ λ
λ
λ λ λ
f x f y g x g y
f x g x f x g y f y g x f y g y
f x g x f x g x f y g y f y g y f y g y
f y g y
f x g x f x g x f y g
1 1
1 1
1 2
2 2
2
2
2 ( ) ( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( )
( ) ( ) ( ).
y f x g x f y g y f y g y
f y g y f y g y
f x g x f y g y f y g y
f x g x f y g y
h x h y
− − +
− +
= + −
= + −
= + −
λ λ
λ λ
λ λ
λ λ
λ λ
2 2
22
1
1
Esto implica que
h x y h x h y( ( ) ) ( ) ( ) ( )λ λ λ λ+ − ≤ + −1 1
y por lo tanto h f g= • es convexa.
En el teorema siguiente se establece bajo qué condición el supremo de una
familia arbitraria de funciones convexas es una función convexa.
Teorema 1.4.4 : (ver [ 8 ], Teorema 12, p.38 ). Sea { fα } una familia arbitraria de
funciones convexas definidas sobre el intervalo I, y sea f x Sup f x( ) ( )= α . Si
J= { : ( ) }x I f x∈ < ∞ es un conjunto no vacío, entonces J es un intervalo y f es una
función convexa sobre J.
Demostración : Si λ ∈[ , ]0 1 y x y J, ∈ (es decir f x( ) < ∞ y f y( ) ),< ∞ entonces
f x y( ( ) )λ λ+ − =1 Sup f x yα λ λ( ( ) )+ −1
≤ + −
≤ + −
= + − < ∞
Sup f x f y
Sup f x Sup f y
f x f y
( ( ) ( ) ( ) )
( ) ( ) ( )
( ) ( ) ( ) .
λ λ
λ λ
λ λ
α α
α α
1
1
1
45
Esto prueba que f es convexa sobre J y además que si x y J, ∈ entonces
f x y( ( ) ) ,λ λ+ − < ∞1 lo cual significa que λ λx y J+ − ∈( )1 y por lo tanto J es un
intervalo.
A continuación veremos que el límite de una sucesión de funciones convexas ,
que converge puntualmente a una función finita, es una función convexa.
Teorema 1.4.5 : ( ver [ 8 ], Teorema 13, p. 38 ). Sean I ⊂ IR un intervalo y
{ fn } n IN∈ una sucesión de funciones f In: → IR convexas que converge
puntualmente a una función finita f sobre I. Entonces f es convexa y además la
convergencia es uniforme en cualquier subintervalo de Io
.
Demostración : Sean λ ∈[ , ]0 1 y x y I, ,∈ entonces
f x y lim f x yn
n( ( ) ) ( ( ) )λ λ λ λ+ − = + −→∞
1 1
≤ + −
= + −
→∞lim f x f y
f x f y
nn n( ( ) ( ) ( ) )
( ) ( ) ( )
λ λ
λ λ
1
1
y por lo tanto f es convexa.
Sean a b c I, , ∈o
tales que a < c < b y definamos
α β γ= = =Sup f a Sup f b f cn
nn
nn
n( ) , ( ) , inf ( ).
Consideremos además las funciones afines L, M y N tales que
L a L b M c M b N a N c( ) , ( ) ; ( ) , ( ) ; ( ) , ( ) .= = = = = =α β γ β α γ
46
Se mostrará que la sucesión está uniformemente acotada por estas funciones afines, en
el intervalo [ a, b ].
Sea x a b∈[ , ], entonces existe λ ∈[ , ]0 1 tal que x a b= + −λ λ( ) .1 Para cualquier
n∈IN se verifica
f x f a b f a f bn n n n( ) ( ( ) ) ( ) ( ) ( )= + − ≤ + −λ λ λ λ1 1
≤ + − = + −
= + − =
λα λ β λ λ
λ λ
( ) ( ) ( ) ( )
( ( ) ) ( )
1 1
1
L a L b
L a b L x
Por otra parte, si x a c∈( , ) entonces c x b∈( , ) y existe λ ∈( , )0 1 tal que
c x b= + −λ λ( ) ,1 de donde
( )x c b= + − ≠1 11 0λ λ λ, ( ).
Luego
M c f c f x bn n( ) ( ) ( ( ) )= ≤ = + −γ λ λ1
≤ + − ≤ + −
= + −
λ λ λ λ β
λ λ
f x f b f x
f x M b
n n n
n
( ) ( ) ( ) ( ) ( )
( ) ( ) ( ).
1 1
1
Es decir
M c f x M bn( ) ( ) ( ) ( )≤ + −λ λ1
de donde
f x M c M bn ( ) ( ) ( )≥ + −
11
1
λ λ
= + −
=M c b M x
11
1
λ λ( ).
47
Además, si x c b∈( , ) entonces c a x∈( , ) y para algún λ ∈( , )0 1 se verifica
c a x= − +( ) ,1 λ λ de donde
x c a= + −
≠1
11
0λ λ
λ, ( ).
Luego
N c f c f a xn n( ) ( ) ( ( ) )= ≤ = − +γ λ λ1
≤ − +
≤ − +
= − +
( ) ( ) ( )
( ) ( )
( ) ( ) ( ).
1
1
1
λ λ
λ α λ
λ λ
f a f x
f x
N a f x
n n
n
n
Es decir
N c N a f xn( ) ( ) ( ) ( )≤ − +1 λ λ
de donde
f x N c N an( ) ( ) ( )≥ + −
11
1
λ λ
= + −
=N c a N x
11
1
λ λ( ) .
Como fn es convexa entonces es Lipschitz en cualquier subintervalo [ , ]a b I⊂o
y
por lo tanto existe una constante k tal que
f x f y k x yn n( ) ( )− ≤ −
para todo x y a b, [ , ].∈
Además, como las cotas que se han obtenido para fn son independientes de n, la
demostración del teorema 1.2.1 permite deducir que se puede escoger k independiente
de n.
48
Sea E a b⊂ [ , ] un subconjunto finito tal que cualquier punto de [ a, b ] se encuentra a
una distancia menor que ε
3k de algún punto de E, donde ε > 0 es arbitrario.
Como E es un conjunto finito y la sucesión de funciones { }fn converge puntualmente
a la función f, se tiene que para todo z E∈ , la sucesión de números reales
{ }f zn ( ) n IN∈ converge al número real f ( )z y dado que toda sucesión convergente de
números reales es una sucesión de Cauchy se deduce que existe nο ∈IN tal que si
m n n, ≥ ο entonces
f z f zn m( ) ( ) .− ≤ ε3
Por lo tanto, si x a b∈[ , ], existe z ∈ E con z xk
− < ε3
y en consecuencia, si
m, n ≥ nο se verifica :
f x f x f x f z f z f z f z f xn m n n n m m m( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )− ≤ − + − + −
≤ − + + −
< + + =
k x z k z x
kk
kk
ε
ε ε ε ε
3
3 3 3,
y como esta es la condición de Cauchy para convergencia uniforme en [ a , b ], queda
demostrado el teorema.
En el teorema que sigue y con el cual finaliza esta sección, se dan condiciones
para que la inversa de una función sea cóncava o convexa.
49
Teorema 1.4.6 : Sean I ⊂ IR un intervalo abierto y f I: → IR una función
estrictamente monótona. Sea f f I I− →1: ( ) la función inversa de f . Entonces :
1) Si f es convexa y creciente, entonces f −1 es cóncava ;
2) Si f es convexa y decreciente, entonces f −1 es convexa ;
3) Si f es cóncava y creciente, entonces f −1 es convexa ;
4) Si f es cóncava y decreciente, entonces f −1 es cóncava.
Demostración : Sean x y f I, ( )∈ y λ ∈[ , ]0 1 . Si u= −f x1( ) y v= −f y1( ) ,
entonces :
1) Como f es convexa se verifica
f u v f u f v( ( ) ) ( ) ( ) ( )λ λ λ λ+ − ≤ + −1 1
= + −λ λx y( )1 ,
y por ser f −1 creciente, se tiene
( ) ( )f f u v f x y− −+ − ≤ + −1 11 1( ( ) ) ( )λ λ λ λ
luego
λ λ λ λu v f x y+ − ≤ + −−( ) ( ( ) )1 11
es decir
λ λ λ λf x f y f x y− − −+ − ≤ + −1 1 11 1( ) ( ) ( ) ( ( ) )
y en consecuencia f −1 es cóncava.
2) De la convexidad de f
f u v x y( ( ) ) ( )λ λ λ λ+ − ≤ + −1 1 ,
y como f −1 es decreciente, se verifica
50
(f f u v f x y− −+ − ≥ + −1 11 1( ( ) ) ( ( ) )λ λ λ λ
luego
λ λ λ λu v f x y+ − ≥ + −−( ) ( ( ) )1 11
es decir
λ λ λ λf x f y f x y− − −+ − ≥ + −1 1 11 1( ) ( ) ( ) ( ( ) )
y por lo tanto f −1 es convexa.
De manera análoga se demuestran 3) y 4).
Por ejemplo, como la función f : IR→ IR definida por f ( )x = ex es convexa y
creciente, su inversa f − ∞ →1 0:( , ) IR definida por f x Ln x− =1( ) es cóncava.
Además, por ser la función g : IR→ IR definida por g( )x = e x− convexa y decreciente,
su inversa g− ∞1 0: ( , )→ IR definida por g x Ln x− = −1( ) es convexa.
1.5. Funciones de Young y Funciones Convexas.
Esta sección se inicia con la definición de ϕ − función o función de Young.
Veremos que toda función f : [ , ) [ , )0 0∞ → ∞ convexa que se anula sólo en t = 0 es
una ϕ − función. Se tiene la siguiente definición.
Definición 1.5.1 : (ϕ − función). Una ϕ − función es una función ϕ:[ , ) [ , )0 0∞ → ∞
que verifica las siguientes condiciones :
a) ϕ es continua en [ 0,∞ ) ;
b) ϕ ( )t = 0 sólo para t =0 ;
51
c) ϕ es creciente ;
d) ϕ ( )t → ∞ cuando t → ∞ .
A continuación se introduce como lema un resultado que se usará en la demostración
de la proposición 1.5.1.
Lema 1.5.1 : Sea f : [ , ) [ , )0 0∞ → ∞ una función convexa tal que ( )f 0 0= .
Entonces se verifica :
1) f t f t( ) ( )λ λ≤ si λ ∈[ ,0 1 ] ;
2) f t f t( ) ( )λ λ≥ si λ ≥ 1.
Demostración :
1) Sea λ ∈[ , ]0 1 . Como f es convexa y f(0)=0 se tiene que
f t f t f t f( ) ( ( ) ) ( ) ( ) ( )λ λ λ λ λ= + − ≤ + −1 0 1 0 = λf t( ).
2) Sea λ ≥ 1, luego 1
0 1λ
∈[ , ] y por 1) se cumple :
f t f t f t( ) ( ) ( )=
≤1 1
λλ
λλ .
De donde
f t f t( ) ( )λ λ≥ .
El lema 1.5.1 permite demostrar la proposición principal de esta sección, la
cual presentamos a continuación.
Proposición 1.5.1 : Sea f : [ , ) [ , )0 0∞ → ∞ una función convexa tal que f(t)=0 sólo
para t=0. Entonces f es una ϕ − función.
Demostración :
a) f es continua en [ 0,∞ ).
52
Por el teorema 1.2.1 se sabe que f es continua en el intervalo ( 0,∞ ).
Sólo se tiene que probar la continuidad en el extremo t=0 del intervalo. Sea ε > 0
dado y consideremos δ ∈ ( 0, 1 ). Si 0 ≤ <t δ se tiene
f t f f t f t f t t f f( ) ( ) ( ) ( ) ( ) ( ) ( )− = = = ⋅ ≤ <0 1 1 1δ
Por lo tanto, para que se verifique f t f( ) ( )− <0 ε basta que se cumpla
δ εf ( )1 < y esto es cierto con sólo tomar 0< <
δ εmin
f ( ),
11 .
b) ( )f t = 0 sólo para t=0.
Se verifica por hipótesis.
c) f es creciente.
Como el rango de f está contenido en el intervalo [ 0,∞ ) se tiene que si 0 < t
entonces 0 0= ≤f f t( ) ( ) . Sean ahora t t1 2 0, [ , )∈ ∞ tales que 0 1 2< <t t . Luego,
existe λ > 0 tal que λ t t1 2= .
Además λ > 1 por ser ( )t t t t1 2 2 1< =λ / . Entonces
f t f t f t f t( ) ( ) ( ) ( )2 1 1 1= ≥ >λ λ .
Es decir t t f t f t1 2 1 2< ⇒ <( ) ( ) y por lo tanto f es creciente.
d) lim f tt→∞
= ∞( ) .
Como f es convexa y f(0)=0, se tiene por el lema 1.5.1 que, para todo t > 1 se
verifica f t t f( ) ( )≥ 1 . Tomando límites cuando t → ∞ a ambos lados de esta
desigualdad se obtiene que f t( ) → ∞ .
Finalizamos esta sección con la siguiente proposición.
53
Proposición 1.5.2 : Sea f : [ , ) [ , )0 0∞ → ∞ una función convexa tal que ( )f 0 0= .
Entonces la función h : ( , ) [ , )0 0∞ → ∞ definida por h tf t
t( )
( )= es creciente.
Demostración : Sean x y, ( , )∈ ∞0 tales que x < y. Entonces existe λ ∈( , )0 1 tal
que λ λy x x y= =( / ) . Luego :
( )( )h x h y h y
f y
y( ) ( ) ( ( ) )= = + − =
+ −λ λ λ
λ λλ
1 01 0
( )≤+ −
= = =λ λ
λλ
λf y f
y
f y
y
f y
yh y
( ) ( ) ( ) ( )( )
1 0.
Es decir, x y h x h y< ⇒ ≤( ) ( ) y por lo tanto h es creciente.
1.6. Desigualdades Clásicas.
Las desigualdades desempeñan un papel importante en análisis, matemáticas
aplicadas, estadística, etc. La teoría de funciones convexas aporta un tratamiento
unificado de algunas de las desigualdades importantes en matemáticas.
En esta sección se verán algunas de las desigualdades clásicas de la
matemática y las mismas se han tomado casi en su totalidad de [17], Cap. 6, pp. 189-
192. Por ejemplo, la desigualdad de la media geométrica - media aritmética (M G -
M A) en su forma conocida es
( ) ( )/x x xn
x x xnn
n1 21
1 21⋅ ≤ + + +K L (1.16 )
para todo xi ≥ 0 y n entero positivo.
A continuación se presenta una forma más general de la desigualdad (1.16 ).
54
Proposición 1.6.1 : (Desigualdad MG-MA). Sean x i ni i, , , , ,α = 1L números reales
tales que, x yi i ii
n≥ > =
=∑0 0 1
1
, α α , entonces
x x x x x xn n nn
1 2 1 1 2 21 2α α α α α αL L≤ + + + (1.17 )
Demostración : Sí xi = 0 para algún i la desigualdad se cumple. Supóngase entonces
que xi > 0 para todo i n∈{ , , , }1 2 K . Por lo tanto se puede escribir
y Ln x x ei i iyi= =( ).
Entonces
x x x yi i i i i ii iα α α α= = =exp ( ) exp ( ) exp ( )Ln Ln .
Como et es una función convexa se puede aplicar la desigualdad de Jensen (teorema
1.1.1) y escribir
Π Πi
n
ii
n
i i i ii
nx y yi
= = == =
∑
1 1 1
α α αexp( ) exp ≤ ===∑∑α αi i i ii
n
i
ny xexp( )
11
lo cual implica que
Πi
n
i i ii
nx xi
= =≤ ∑
1 1
α α
Comentario : En el caso especial donde n=2,
p p q> = = + =1 1 1 11 2 1 2, / , / ( )α α α α se tiene que
x xp
xq
xp q11
21
1 21 1/ / .≤ +
Si ahora se hace x xp1 = y x yq
2 = se obtiene la desigualdad fundamental
55
x yp
xq
yp q⋅ ≤ +1 1 ( 1.18 )
La relación ( 1.18 ) permite demostrar la siguiente desigualdad.
Proposición 1.6.2 : ( Desigualdad de Hölder). Sean x y i ni i, , , , ,= 1 K números
reales tales que, x y pi i≥ ≥ >0 0 1, ; y 1 1 1/ /p q+ = . Entonces
x y x yi ii
n
ip
i
n p
iq
i
n q
= = =∑ ∑ ∑≤
1 1
1
1
1/ /
( 1.19 )
En particular se tiene la desigualdad de Cauchy-Schawrz :
x y x yi ii
n
ii
n
ii
n
= = =∑ ∑ ∑≤
1
2
1
1 22
1
1 2/ /
( 1.20 )
Demostración : Sin pérdida de generalidad se puede suponer que alguno de los xi y
alguno de los yi son mayores que cero. En este caso u xip
i
n p
=
=∑
1
1/
y
v yiq
i
n q
=
=∑
1
1/
son números positivos. Usando la desigualdad (1.18) con
x x u y y vi i= =/ , / , se obtiene
x
u
y
v p
x
u q
y
vi i i
pi
q
⋅ ≤
+
1 1
Sumando se tiene
x
u
y
v p
x
u q
y
vi
i
ni
i
nip
pi
niq
q= = =∑ ∑ ∑⋅ ≤ +
1 1 1
1 1
56
es decir
x y
uv p
x
u q
y
v p q
i ii
n
ip
i
n
p
iq
i
n
q= = =∑ ∑ ∑
≤ + = ⋅ + ⋅ =1 1 11 1 11
11 1
de donde x y u vi ii
n≤ ⋅
=∑
1
, lo cual equivale a
x y x yi i ip
i
n
i
n p
iq
i
n q
≤
== =∑∑ ∑
11
1
1
1/ /
Usando la desigualdad de Hölder se demuestra la siguiente desigualdad.
Proposición 1.6.3 : (Desigualdad de Minkowski). Sean x y i ni i, , , , ,= 1K números
reales tales que, x yi i≥ ≥0 0, y p ≥ 1, entonces
( )x y x yi ip
i
n p
ip
i
n p
ip
i
n p
+
≤
+
= = =
∑ ∑ ∑1
1
1
1
1
1/ / /
(1.21)
Demostración : Cuando p = 1 se tiene la igualdad. Si p > 1, se puede escoger q > 1
tal que 1 1 1/ / ,p q+ = de donde ( )p q p− =1 . Además, sin pérdida generalidad se
puede suponer que x yi i+ > 0 para todo i n= 1, ,K . Si ahora se escribe
( ) ( ) ( )x y x x y y x yi ip
i
n
i i ip
i
n
i i ip
i
n+ = + + +
=
−
=
−
=∑ ∑ ∑
1
1
1
1
1
y se aplica la desigualdad de Hölder al miembro derecho de esta igualdad, se tiene
57
( ) ( )
( )
( )
x y x x y
y x y
x y x y
i ip
i
n
ip
i
n p
i ip q
i
n q
ip
i
n p
i ip q
i
n q
i ip
i
n q
ip
i
n p
ip
i
n p
+ ≤
+
+
+
= +
+
= =
−
=
=
−
=
= = =
∑ ∑ ∑
∑ ∑
∑ ∑ ∑
1 1
11
1
1
1
11
1
1
1
1
1
1
1
1
/( )
/
/( )
/
/ / /
Dividiendo por ( )x yi ip
i
n q
+
=
∑1
1/
queda :
( )x y x yi ip
i
n qip
i
n p
ip
i
n p
+
≤
+
=
−
= =∑ ∑ ∑
1
11
1
1
1
1/ /
y como 1 1 1− =/ /q p , esto es equivalente a la relación (1.21).
A continuación se tiene la siguiente proposición.
Proposición 1.6.4 : Sean x y i ki i, , , , ,= 1 K números reales tales que, x yi i≥ ≥0 0, ;
y sea k un entero positivo. Entonces
( )Π Π Πi
k
i i
k
i
k
i
k
i
k
i
k
x y x y= = =
+
≥
+
1
1
1
1
1
1/ / /
(1.22)
Demostración : Sin pérdida de generalidad se puede suponer que x yi i+ > 0 para
todo i k= 1, ,K . Entonces
58
( ) ( ) ( )
Π Π
Π
Π
Π
Π
Π
Π Π
i
k
i
k
i
k
i
k
i
k
i i
ki
k
i
i
k
i i
k
i
k
i
i
k
i i
k
i
ki
i i
k
i
ki
i i
k
i
i ii
k
x y
x y
x
x y
y
x y
x
x y
y
x y
k
x
x y k
y
= =
=
=
=
=
=
= =
=
+
+
=+
++
=+
+
+
≤+
+∑
1
1
1
1
1
11
1
1
1
1
1
1
1
1
1
1
1 1
/ /
/
/ /
/ /
i
i ii
k
x y+=
=∑
1
1
Para la última desigualdad se ha usado la desigualdad MG-MA en su forma simple, es
decir la relación (1.16). Se tiene entonces que
( )
Π Π
Π
i
k
i
k
i
k
i
k
i
k
i i
k
x y
x y
= =
=
+
+
≤1
1
1
1
1
11
/ /
/
lo cual es equivalente a (122).
Seguidamente presentamos una generalización de la desigualdad (1.22).
Proposición 1.6.5 : Sean x y i ki i i, , , , ,α = 1 K números reales, tales que
x yi i≥ ≥0 0, y αi > 0 con αii
k
=∑ =
1
1. Entonces
( )Π Π Πi
k
ii
k
ii
k
i ix y x yi i i
= = =+ ≤ +
1 1 1
α α α (1.23).
Demostración : Sin pérdida de generalidad supóngase que x yi i+ > 0 para todo
i k= 1, , .K Entonces
59
( ) ( ) ( )
( ) ( )
Π Π
Π
Π
Π
Π
Π
Π Π
Π Π
i
k
ii
k
i
i
k
i i
i
k
i
i
k
i i
i
k
i
i
k
i i
i
ki
i i i
ki
i i
i
ki
i i i
ki
i i
ii
ki
i ii
i
ki
i i
x y
x y
x
x y
y
x y
x
x y
y
x y
x
x y
y
x y
x
x y
y
x y
i i
i
i
i
i
i
i
i
i
i
i i
= =
=
=
=
=
=
= =
= =
= =
+
+=
++
+
=+
++
=+
+
+
≤+
++∑ ∑
1 1
1
1
1
1
1
1 1
1 1
1 1
α α
α
α
α
α
α
α
α
α
α
α α
α α ( )Por
x
x y
y
x y
x
x y
y
x y
ii
i ii
i
i ii
k
ii
ki
i i
i
i ii
i
k
( . ) .117
1 1
1
1 1
=+
++
=+
++
= ⋅ =
=
= =
∑
∑ ∑
α α
α α
Esto implica que
( )
Π Π
Π
i
k
ii
k
i
i
k
i i
x y
x y
i i
i
= =
=
+
+≤1 1
1
1
α α
α,
lo cual es equivalente a (1.23).
Como caso particular de la desigualdad (1.23) se tiene que si
x x y y1 2 1 2, , , , ,α β son números positivos con α β+ = 1 entonces
( ) ( )x x y y x y x y1 2 1 2 1 1 2 2α β α β α β+ ≤ + + (1.24)
Esta desigualdad la usaremos en la sección 1.7 para demostrar que la suma de
funciones log-convexas es una función log-convexa.
60
A continuación se presenta la desigualdad de Hölder para integrales y su caso
particular la desigualdad de Cauchy-Schawrz que también será usada en la sección 1.7
con el fin de probar que la función Gamma es log-convexa.
Proposición 1.6.6 : (Desigualdad de Hölder para integrales). Sean
f g a b, : ( , ) → IR funciones no negativas y los números reales p > 1 y q > 1 tales que
1 1 1/ /p q+ = . Si las funciones f p y gq son integrables, entonces f g⋅ es
integrable y se verifica la desigualdad
( ) ( ) ( ) ( )f t g t dt f t dt g t dta
bp
a
b p
q
a
b q
∫ ∫ ∫≤
1 1/ /
(1.25)
En particular se tiene para p=q=2 la desigualdad de Cauchy-Schawrz :
( ) ( ) ( ) ( )f t g t dt f t dt g t dta
b
a
b
a
b
≤
∫ ∫ ∫
2
1 2
2
1 2/ /
(1.26).
Demostración : Sean
( )f f t dtpp
a
b p
=
∫
1/
y ( )g g t dtqq
a
b q
=
∫
1/
.
Si f p = 0 ó g q = 0, entonces la desigualdad
( ) ( )0 ≤ ≤∫ f t g t dt f gp qa
b
es cierta ya que f ó g son nulas, excepto posiblemente en un conjunto de medida de
Lebesgue nula. Supóngase que f p > 0 y g q > 0.
Si en la desigualdad (1.18) se hace
61
( )x
f t
f p
= e( )
yg t
g q
= ,
se verifica que
( ) ( ) ( ) ( )f t
f
g t
g p
f t
f q
g t
gp q
p
pp
q
≤ +1 1
para todo t a b∈( , ) , excepto posiblemente para t a b∈{ , } que es un conjunto de
medida de Lebesgue nula.
Como f p y gq son integrables por hipótesis, por la monotonía de la integral se tiene
( ) ( ) ( ) ( )f t g t dt
f g p
f t dt
f q
g t dt
g
p
f
f q
g
g p q
a
b
p q
p
a
b
pp
q
a
b
pp
pp
∫ ∫ ∫≤ +
= + = + =
1 1
1 1 1 11
De donde
( ) ( )f t g t dt f gp qa
b
≤∫
es decir
( ) ( ) ( ) ( )f t g t dt f t dt g t dta
bp
a
b p
q
a
b q
∫ ∫ ∫≤
1 1/ /
.
62
Comentario : Se ha supuesto que f y g están definidas en un intervalo abierto (a, b)
para no descartar las posibilidades a = −∞ o b = +∞ . Sin embargo, si el intervalo es
cerrado también son válidos los argumentos anteriores. Sólo se requiere que f y g
sean no negativas y f p y gq sean integrables.
La desigualdad de la proposición siguiente se obtiene a partir de la
desigualdad (1.4) del corolario 1.1.1.
Proposición 1.6.7 : Sean f a b: ( , ) → IR una función convexa y ϕ: [ , ]c d → IR una
función Riemann-integrable con a t b< <ϕ( ) para todo t c d∈[ , ] . Si α: [ , ]c d → IR
es una función no negativa tal que α( )t dtc
d
=∫ 1 y α ϕ es integrable sobre el intervalo
[ , ]c d , entonces
( ) ( ) ( ) ( )( )f t t dt t f t dtc
d
c
d
α ϕ α ϕ∫ ∫
≤ . (1.27)
Demostración : Dado un número n∈IN arbitrario hágase ∆ td c
n= −
y sea
t c t t i tiο ο= = +, ∆ para todo i n= 1, ,K una partición del intervalo [c, d]. De
acuerdo con la relación (1.4) se verifica
( )f
t t
t
t f t
t
i ii
n
ii
n
i ii
n
ii
n
α ϕ
α
α ϕ
α
( ) ( )
( )
( ) ( )
( )
=
=
=
=
∑
∑
∑
∑
≤1
1
1
1
lo cual es equivalente a
63
( )f
t t t
t t
t f t t
t t
i ii
n
ii
n
i ii
n
ii
n
α ϕ
α
α ϕ
α
( ) ( )
( )
( ) ( )
( )
∆
∆
∆
∆
=
=
=
=
∑
∑
∑
∑
≤1
1
1
1
Tomando límites cuando ( )n t→ ∞ →∆ 0 se tiene
( )lim f
t t t
t t
lim
t f t t
t tn
i ii
n
ii
n n
i ii
n
ii
n→∞=
=
→∞=
=
∑
∑
∑
∑
≤α ϕ
α
α ϕ
α
( ) ( )
( )
( ) ( )
( )
∆
∆
∆
∆
1
1
1
1
Como f es continua se cumple
( )f lim
t t t
t t
lim t f t t
lim t tn
i ii
n
ii
n
ni i
i
n
ni
i
n→∞=
=
→∞ =
→∞ =
∑
∑
∑
∑
≤α ϕ
α
α ϕ
α
( ) ( )
( )
( ) ( )
( )
∆
∆
∆
∆
1
1
1
1
y por definición de integral de Riemann se obtiene
( )f
t t dt
t dt
t f t dt
t dt
c
d
c
dc
d
c
d
α ϕ
α
α ϕ
α
( ) ( )
( )
( ) ( )
( )
∫
∫
∫
∫
≤
es decir
( )f t t dt t f t dtc
d
c
d
α ϕ α ϕ( ) ( ) ( ) ( )∫ ∫
≤
64
Por ejemplo, si f : ( , )0 ∞ → IR es la función definida por f x x pp( ) ,= ≥ 1 y
ϕ: [ , ]c d → IR es positiva entonces ( )α ϕ α ϕ( ) ( ) ( ) ( )t t dt t t dtc
d pp
c
d
∫ ∫
≤ .
Comentario : La desigualdad (1.27) se conoce como “desigualdad de Jensen para
integrales”. La hemos obtenido suponiendo que
α( ) .t dtc
d
=∫ 1
Sin embargo, si la integral no vale 1, se tiene el resultado más general :
( )f
t t dt
t dt
t f t dt
t dt
c
d
c
dc
d
c
d
α ϕ
α
α ϕ
α
( ) ( )
( )
( ) ( )
( )
∫
∫
∫
∫
≤ .
Antes de concluir esta sección con la demostración de la desigualdad de
Young consideremos una ϕ − función g estrictamente creciente. En este caso la
función inversa g−1 existe y tiene las mismas propiedades que g. Si se define
f x g s ds f y g t dtx y
( ) ( ) , ( ) ( )*= =∫ ∫−
0
1
0
entonces, por el teorema 1.3.2, ambas funciones son estrictamente convexas. La
función f * recibe el nombre de función conjugada de f. Obsérvese que
f f( ) ( )*0 0 0= = .
Estas consideraciones nos permiten introducir la siguiente proposición.
65
Proposición 1.6.8 : (Desigualdad de Young). Sea g: [ , ) [ , )0 0∞ → ∞ una
ϕ − función estrictamente creciente. Entonces si
f x g s dsx
( ) ( )= ∫0
, para todo x ∈ ∞[ , )0
y
f y g t dty
* ( ) ( )= −∫
1
0
para todo y ∈ ∞[ , )0 ,
donde g−1 es la función inversa de g, se tiene que cualesquiera sean a b, [ , )∈ ∞0 , se
cumple que
0 ≤ ≤ +ab f a f b( ) ( )* (1.28)
y la igualdad vale, si y solamente si b g a= ( ) .
La desigualdad (1.28) es llamada desigualdad de Young.
Demostración : Sea a ∈ ∞[ , )0 . Si a=0 no hay nada que demostrar. Supóngase que
a ≠ 0, entonces a g a( ) es el área de un rectángulo de “base” el número a y altura el
número g a( ) , luego se verifica
( )
a g a g s ds g t dt
f a f g a
g aa
( ) ( ) ( )
( ) ( ) .
( )
*
= +
= +
−∫∫
1
00
Es decir
( )a g a f a f g a( ) ( ) ( )*= + (1.29)
Esta relación se ilustra en la siguiente figura.
66
Figura 1.6
Escojamos b o∈ ∞[ , ) y supongamos que b g a≠ ( ) . Se demostrará que
ab g s ds g t dtba
< + −∫∫ ( ) ( ) .1
00
Supongamos primero que g a b( ) < . Como g−1 es estrictamente creciente en el
intervalo [ , )0 ∞ , se tiene que si g a t b( ) < < entonces a g t g b< <− −1 1( ) ( ) . De la
propiedad de monotonía de la integral de Riemann se deduce que :
( )a b g a g t dtg a
b
− < −∫( ) ( ) .( )
1
De esta desigualdad y de la relación (1.29) se obtiene
67
( )ab ag a a b g a
g s ds g t g t dt
g s ds g t dt
f a f b
g a
bg aa
ba
= + −
< + +
= +
= +
− −
−
∫∫∫
∫∫
( ) ( )
( ) ( ) ( )
( ) ( )
( ) ( ).
( )
( )
*
1 1
00
1
00
Es decir
ab f a f b< +( ) ( ).*
Para concluir, supongamos que b g a< ( ) . En este caso se tiene que
b t g a g t a< < ⇒ <−( ) ( )1 .
Por lo tanto
( )g t dt a g a bb
g a− < −∫1( ) ( )
( )
Usando esta desigualdad y la relación (1.29) se tiene
68
( )ab ag a a g a b
g s ds g t dt g t dt
g s ds g t dt g t dt
g s ds g t dt f a f b
a g a
b
g a
g a
bg aa
ba
= − −
< + −
= + +
= + = +
∫ ∫ ∫
∫∫∫
∫∫
− −
− −
−
( ) ( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( ) ( ).
( ) ( )
( )
( )
*
0
1
0
1
1 1
00
1
00
Es decir
ab f a f b< +( ) ( ).*
1.7. Funciones log- convexas.
El contenido de esta sección lo hemos tomado casi en su totalidad de [8], pp.
53-54, a excepción de la parte relacionada con la función Gamma que fue tomada de
[4], pp. 560-561.
Una función f I: ⊂ IR→ IR, donde I es un intervalo, es log-convexa si es
positiva y Ln f es convexa sobre I.
Esta definición nos lleva a la siguiente proposición.
Proposición 1.7.1 : Sean I ⊂ IR un intervalo y f I: → IR una función. Entonces f es
log-convexa si y sólo si f es positiva y
( ) ( ) ( )f x y f x f yα β α β+ ≤ ,
para todo x y I, , ,∈ >α β 0 y α β+ = 1.
69
Demostración : Supongamos que f es log-convexa, entonces Ln f es convexa y se
verifica que
( ) ( ) ( )
( ) ( )
( ) ( )
Ln f x y Ln f x Ln f y
Ln f x Ln f y
Ln f x f y
α β α β
α β
α β
+ ≤ +
= +
=
para todo x y I, , ,∈ >α β 0 y α β+ = 1.
Como la función Ln es creciente se tiene que
( ) ( ) ( )f x y f x f yα β α β+ ≤ (1.30)
para todo x y I, , ,∈ >α β 0 y α β+ = 1.
Recíprocamente, supongamos que la desigualdad (1.30) es cierta para todo
x y I, , , [ , ], ,∈ ∈ + =α β α β0 1 1 y que además f es positiva. Entonces
( ) ( ) ( )( ) ( )
Ln f x y Ln f x f y
Ln f x Ln f y
α β
α β
α β+ ≤
= +
lo cual implica que Ln f es una función convexa y por lo tanto f es log-convexa.
La siguiente proposición establece que toda función log-convexa es convexa.
Proposición 1.7.2 : Sean I ⊂ IR un intervalo y f I: → IR una función log-convexa.
Entonces f es convexa.
70
Demostración : Supongamos que f es log-convexa. Entonces está definido ( )Ln f x
para todo x I∈ y se tiene ( ) ( )( ) ( )( )f x Ln f x goh x= =exp , donde ( )g x ex= y
( ) ( )h x Ln f x= .
Como f es log-convexa se verifica que h Ln f= es convexa y dado que g es
convexa y además estrictamente creciente, se concluye aplicando el teorema 1.4.2
(parte 1) que f goh= es convexa.
La siguiente proposición expresa que la suma y el producto de funciones log-
convexas es log-convexa.
Proposición 1.7.3 : Sean I ⊂ IR un intervalo y f I: → IR , g I: → IR funciones log-
convexas. Entonces f g⋅ y f+g son log-convexas.
Demostración : Supongamos que f y g son funciones log-convexas. Entonces f y g
son positivas y se verifica que
Ln f g Ln f Ln g⋅ = +
es una función convexa por ser la suma de dos funciones convexas y, por tanto, el
producto f g⋅ es log-convexo.
Verifiquemos ahora que la suma de funciones log-convexas es una función log-
convexa.
En efecto, como f y g son funciones log-convexas se tiene que f+g es positiva. Sean
α β, > 0 tales que α β+ = 1 y x y I, ∈ , entonces
71
( )
( ) ( )
( ) ( )
f g x y f x y g x y
f x f y g x g y porque f y g son convexas
f x g x f y g y por
f g x f g y
+ + = + + +
≤ + −
≤ + +
= + +
( ) ( ) ( )
( ) ( ) ( ) ( ) ( log )
( ) ( ) ( ) ( ) ( . )
( ) ( ).
α β α β α β
α β α β
α β
α β
124
Es decir
( ) ( ) ( )f g x y f g x f g y+ + ≤ + +( ) ( ) ( )α β α β
para todo x y I, , ,∈ >α β 0 tales que α β+ = 1. Luego, aplicando la proposición
1.7.1 se concluye que f + g es log - convexa.
Seguidamente se presenta una proposición que establece que si el límite de
una sucesión de funciones log-convexas existe y es positivo entonces también es una
función log-convexa.
Proposición 1.7.4 : Sean I ⊂ IR un intervalo y { }fn n IN∈ una sucesión de funciones
f In: → IR log-convexas para cada n∈IN . Si lim fn
n existe y es positivo entonces es
una función log-convexa.
Demostración : Sea f x lim f xn
n( ) ( )=→∞
para cada x I∈ . Como cada fn , n∈IN , es
log-convexa se tiene que fn es positiva y dado que la función Ln es continua en
( )0, + ∞ se verifica que
( )lim Ln f x Ln lim f x Ln f xn
nn
n→∞ →∞
=
=( ) ( ) ( ).
Por lo tanto, tenemos que :
72
( )Ln f Ln lim f lim Ln fn
nn
n=
=
y del hecho que Ln fn es una función convexa se tiene que Ln f es el límite de una
sucesión de funciones convexas y, por el teorema 1.4.5, concluimos que Ln f es
convexa, es decir que f es log-convexa.
Para finalizar esta sección consideremos la función Γ (Gamma) definida para
todo x>0 por la integral impropia
Γ( ) .x e t dtt x= − −∞
∫1
0
Demostraremos a continuación que la función Γ es log-convexa en ( , ).0 + ∞ Para
demostrarlo sólo necesitamos probar que LnΓ es convexa, es decir :
d Ln
dx
2
2
2
20
Γ Γ Γ ΓΓ
=−
≥" '
(1.31)
En efecto
Γ
Γ
' ( ) ( )
"( ) ( )
xx
e t dt
e t Ln t dt
x e t Ln t dt
t x
t x
t x
=
=
=
∞− −
− −∞
− −∞
∫
∫
∫
∂∂
0
1
1
0
1 2
0
Aplicando ahora la desigualdad de Chauchy-Schawrz para las integrales (desigualdad
(1.26) ) tenemos que :
73
( )
Γ
Γ Γ
'
".
/ /
/ /
2 1
0
2
2 1
0
2 1
2
2 12
2 12
00
1 1 2
00
=
=
≤
=
=
− −∞
− −∞
− −
− − − −∞∞
− − − −∞∞
∫
∫
∫∫
∫∫
e t Lnt dt
e t e t Lnt dt
e t dt e t Lnt dt
e t dt e t Lnt dt
t x
t x t x
t x t x
t x t x
Esto implica que
Γ Γ Γ" '− ≥2 0
y por consiguiente la desigualdad (1.31) es cierta, y así LnΓ es convexa, es decir Γ
es log-convexa.
1.8. Funciones Aditivas y Funciones mid convexas.
En esta sección presentaremos las definiciones de función aditiva y función
mid convexa. Veremos también que si f : IR→ IR es una función aditiva y además
continua entonces es lineal y demostraremos que toda función mid convexa y
continua es convexa.
Lo expuesto aquí ha sido tomado casi completamente de [11], Capítulos 5 y 7,
exceptuando la parte relacionada con el teorema 1.8.3 que se encuentra en [8], p. 49.
Empezamos con la definición de función aditiva.
74
Definición 1.8.1 : (Función aditiva)(1). Una función f : IR→ IR se dice aditiva si
satisface la ecuación de Cauchy
f x y f x f y( ) ( ) ( )+ = + (1.32)
para todo x y, ∈IR..
Pasamos entonces a las siguientes proposiciones.
Proposición 1.8.1 : Sea f : IR→ IR una función aditiva. Entonces
f x f xii
n
ii
n
= =∑ ∑
=
1 1
( ) (1.33)
para cada n∈IN y para cualesquiera x xn1, ,K ∈IR.
Demostración : Si n=2 tenemos la igualdad (1.32) que es la definición de función
aditiva.
Supongamos que la igualdad (1.33) es cierta para n − 1 sumandos y probemos que
también es cierta para n. En efecto :
( )
( )
f x f x x
f x f x f es aditiva
f x f x
f x f x f x
ii
n
ii
n
n
ii
n
n
i ni
n
i ii
n
ii
n
i
n
= =
−
=
−
=
−
= ==
∑ ∑
∑
∑
∑ ∑∑
=
+
=
+
= +
= ⇒
=
1 1
1
1
1
1
1
1 11
( )
( ) ( )
( ) .
Proposición 1.8.2 : Sean f1: IR→ IR y f2: IR→ IR funciones aditivas. Entonces, para
cada a b, ∈IR la función f af bf= +1 2 es aditiva.
Demostración : Sean x y, ∈IR , entonces
(1) Esta definición también es válida para funciones f : IR n → IR
75
( )
( ) ( )( ) ( )
( )
f x y af x y bf x y
a f x f y b f x f y
af x bf x af y bf y
f x f y f x y f x f y
+ = + + +
= + + +
= + + +
= + ⇒ + = +
1 2
1 1 2 2
1 2 1 2
( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( ) ( ).
El teorema siguiente nos caracteriza las soluciones de la ecuación de Cauchy.
Teorema 1.8.1 : Sea f :IR→ IR una función que satisface la ecuación de Cauchy.
Entonces,
f x f x( ) ( )λ λ=
para todo x ∈IR y λ ∈Q.
Demostración : Para x=y=0 tenemos según (1.32) que
f f f f( ) ( ) ( ) ( )0 0 0 0 0= + = +
es decir
f f f( ) ( ) ( )0 0 0= −
de donde
f ( )0 0= (1.34)
Por otra parte
( ) ( )( ) ( ) ( )0 0= = − = + − = + −f f x x f x x f x f x( ) ,
lo cual es equivalente a
f x f x( ) ( )− = − (1.35)
para todo x ∈ IR y, por lo tanto, f es una función impar.
Hagamos ahora en (1.33) x x xn1 = = =L , entonces tenemos que
76
( )f x f x f x f xii
n
ii
n
i
n
i
n
= = = =∑ ∑ ∑ ∑
= ⇒
=
1 1 1 1
( )
y por lo tanto
f nx nf x( ) ( )= (1.36)
Ahora bien, si λ ∈Z se tiene para λ ≥ 0 que
f x f x( ) ( )λ λ=
y si λ < 0, como − >λ 0 se verifica
( ) ( )( )( ) ( )
( )( ) ( )
f x f x f x
f x f x
λ λ λ
λ λ
= − − = − −
= − − = .
En cualquier caso, si λ ∈Z entonces
( )f x f xλ λ= ( ).
Dado que para cualquier λ ∈Q existen k ∈Z y m∈IN tales que λ = k m/ tenemos
que kx m x= ( )λ y por consiguiente
( ) ( )( ) ( )kf x f kx f m x mf x( ) = = =λ λ
de donde
( ) ( ) ( )f xk
mf x f xλ λ= =
para todo x ∈IR y λ ∈Q.
En el siguiente teorema probamos que toda solución de la ecuación de Cauchy
es lineal cuando la función además de aditiva es continua.
Teorema 1.8.2 : Sea f : IR→ IR una función aditiva y continua. Entonces
77
f x f x( ) ( )= 1
para todo x ∈IR..
Demostración : Sea x ∈IR y consideremos una sucesión { }λn tal que lim xn
n→∞
=λ , y
λn ∈Q para cada n ∈ IN. Entonces
( ) ( ) ( )f f fn n nλ λ λ= ⋅ =1 1 .
Tomando límite cuando n → ∞ y usando la continuidad de f, tenemos
( ) ( )
( )
f x f lim lim f
lim f f lim
f x
nn
nn
nn
nn
=
=
= =
=
→∞ →∞
→∞ →∞
λ λ
λ λ1 1
1
( )
( ) .
Es decir f x f x( ) ( )= 1 para todo x ∈IR..
A continuación presentamos la definición de función mid-convexa o convexa
en el punto medio, llamadas también Jensen-convexas.
Definición 1.8.2 : (Función mid convexa). Sea I ⊂ IR un intervalo. Una función
f I: → IR se dice mid convexa (o convexa en el punto medio) si y sólo si satisface la
desigualdad
fx y f x f y+
≤ +
2 2
( ) ( )(1.37)
para todo x y I, ∈ . Si la desigualdad es estricta para x y≠ , f es llamada
estrictamente mid convexa.
Obsérvese que de acuerdo con la definición , toda función convexa es también
mid convexa. El recíproco en general no es cierto , sin embargo veremos que bajo
condiciones bastante generales, ambas definiciones son equivalentes.
78
En primer lugar tenemos que si f : IR→ IR es una función aditiva entonces
( )fx y
f x yf x f y+
= + = +
2
1
2 2
( ) ( )
es decir, cualquier función aditiva es mid convexa.
Continuamos con el siguiente teorema.
Teorema 1.8.3 : Sean I ⊂ IR un intervalo y f I: → IR una función mid convexa.
Entonces
( ) ( )( )fx x
n nf x f xn
n1
11+ +
≤ + +L
L (1.38)
para todo entero positivo n y cualesquiera x I i ni ∈ =, , , .1K
Demostración : Si n=2 la desigualdad (1.38) es la definición de función mid
convexa. Supongamos que la relación es cierta para n m= 2 y demostremos que
también es cierta para n m= +2 1. En efecto, sean
x x x xm i
im i
i
m
m
m
' , " ,= == = +∑ ∑
+
1
2
1
21
2
2 1
2 1
entonces
fx x
nf
x xnm
m1 1 21
1
2
+ +
=
+ +
+
+L L
= +
+
=+
= +∑ ∑
+
f x xm i
im i
i
m
m
m
1
2
1
211
2
12 1
2 1
= +
= = +∑ ∑
+
f x xm i
im i
i
m
m
m
1
2
1
2
1
21
2
2 1
2 1
79
( )
( ) ( )
( ) ( )
( ) ( )( )
= +
= +
≤+
=
+
≤+
=+
=
= = +
= = +
= = ++
=
∑ ∑
∑ ∑
∑ ∑∑
+
+
+
f x x fx x
f x f xf es mid convexa
f x f x
f x f x
Hipotesis inductiva
f x f x
nf x
m ii
m ii
m ii
m ii
ii
ii
m ii
n
m
m
m
m
m
m
m
m
m
1
2 2
2
1
2
1
2
2
1
2
1
2
2
2
1
1
2
2 1
2
1
2
2 1
2
1
2
2 1
2
11
1
1
1
' "' "
' "( )
( )
,
lo cual implica que sí n m= 2 para algún m∈IN se verifica
( )fn
xn
f xii
n
ii
n1 1
1 1= =∑ ∑
≤ .
Supongamos ahora que n no es de esta forma, es decir n ∈IN es arbitrario (n>2), y
sea m∈IN tal que n m< 2 . Definiendo
yx x
nn= + +1 L
tenemos
( ) ( )y
x x n ynm
m=
+ + + −1 2
2
L=
+= +=∑∑ x yi
i ni
n
m
m
1
2
1
2,
80
es decir
y x ym i
i ni
n m
= +
= +=∑∑
1
2 1
2
1
y por la primera parte de la demostración tenemos que
( ) ( )
( ) ( ) ( )
f y f x y
f x f y
f x n f y
m ii ni
n
m ii ni
n
m im
i
n
m
m
( )
.
= +
≤ +
= + −
= +=
= +=
=
∑∑
∑∑
∑
1
2
1
2
1
22
1
2
1
1
2
1
1
Es decir
( ) ( ) ( ) ( )2 21
mi
m
i
nf y f x f y n f y≤ + −
=∑ ,
de donde
( ) ( )n f y f xii
n≤
=∑
1
y por consiguiente
( ) ( )f
x x
n
f x f x
nn n1 1+ +
≤
+ +L L,
con lo cual concluye la demostración.
Estamos en condiciones de demostrar el siguiente teorema.
81
Teorema 1.8.4 : Sean I ⊂ IR un intervalo y f I: → IR una función mid convexa.
Entonces
( )( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1 ( ) (1.39)
para todo x y I, ∈ y λ ∈QI[ , ].0 1
Demostración : Sea λ = k n/ donde { }k n∈ 0 1 2, , , ,K y n ∈IN, es decir
λ ∈QI[ , ]0 1 . De acuerdo con la desigualdad (1.38) se tiene que para todo x y I, ∈
se verifica
( )
( ) ( ) ( ) ( ) ( )
fk
nx
k
ny f
kx n k y
n
k f x n k f y
n
k
nf x
k
nf y
+ −
=
+ −
≤+ −
= + −
1
1
lo cual implica que
( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1 ,
para todo x y I, ∈ y λ ∈Q [ ]I 0 1, .
Finalizamos este capitulo con el siguiente teorema, el cual establece que toda
función mid convexa y continua es convexa.
Teorema 1.8.5 : Sean I ⊂ IR un intervalo y f I: → IR una función mid convexa y
continua. Entonces f es convexa.
Demostración : Sean x y I, ∈ y [ ]λ ∈ 0 1, . Sea { }λn una sucesión de números
racionales pertenecientes al intervalo cerrado [0, 1] (λn ∈Q [ ]I 0 1, ,n ∈IN ) que
converge a λ λ λlimn
n→∞
=
.
82
Entonces, por el teorema anterior, tenemos que
( )( ) ( )f x y f x f yn n n nλ λ λ λ+ − ≤ + −1 1( ) ( ).
Utilizando esto y el hecho que f es continua se obtiene
( )( ) ( )( )
( )( )
( ) ( ) ( )( )
( ) ( )
f x y f lim x y
lim f x y
lim f x f y
f x f y
nn n
nn n
nn n
λ λ λ λ
λ λ
λ λ
λ λ
+ − = + −
= + −
≤ + −
= + −
→∞
→∞
→∞
1 1
1
1
1( ) .
Es decir
( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1
para todo x y I, ∈ y [ ]λ ∈ 0 1, .
83
Capítulo II
Funciones Convexas Sobre IR n En el capítulo 1 tratamos funciones convexas definidas sobre un intervalo de
la recta real. En este capítulo consideraremos funciones convexas f D: ⊂ IRn→ IR
donde D es un conjunto convexo no vacío. Utilizaremos algunas propiedades de los
conjuntos convexos, las cuales el lector puede encontrar en [1], [5], [8], [15] o [17].
Las funciones convexas sobre subconjuntos convexos de IRn desempeñan un
papel muy importante en la teoría de la optimización, principalmente en la
programación lineal y la programación convexa. Por otra parte, cualquiera que se
interese en el estudio de la programación no lineal debe dominar primero la teoría
referente a estas funciones. De aquí la importancia de este capítulo que sirve de base
para el estudio mencionado.
2.1. Definición y Propiedades Básicas. Los conceptos de conjunto convexo y función convexa están estrechamente
relacionados. Para destacar la relación que existe entre las propiedades analíticas y las
propiedades geométricas de la gráfica de una función convexa, empezaremos por
presentar la definición analítica de función convexa y luego veremos una definición
geométrica equivalente a la analítica.
A continuación se presenta la definición analítica de función convexa la cual
viene expresada por la desigualdad de Jensen.
Definición 2.1.1. (Función convexa). Sean D ⊂ IRn un conjunto convexo y
f D: → IR una función. Se dice que f es convexa si y sólo si
84
( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1 (2.1)
para todo λ ∈ ∈[ , ] ; , .0 1 x y D
Comentarios : La desigualdad (2.1) se conoce con el nombre de desigualdad de
Jensen. En la definición se requiere que el dominio D de la función f sea un conjunto
convexo porque esto garantiza que para cualesquiera x y D, , [ , ],∈ ∈λ 0 1 f está
definida en el punto ( )λ λx y+ −1 .
De manera similar al caso de funciones f I: ⊂ IR → IR, donde I es un
intervalo, se demuestra que si D es un subconjunto convexo de IRn , una función
f D: ⊂ IRn→ IR es convexa si y sólo si
( )f x f xi ii
n
i ii
nα α
= =∑ ∑
≤
1 1
para todo x D i ni ∈ =, , , ;1K y αi ≥ 0 tales que αii
n=
=∑ 1
1
.
Los detalles de la demostración se encuentran en el teorema 1.1.1.
Algunos ejemplos de funciones convexas son :
1) f x x D( ) ,= = IRn ;
2) f r s r s D( , ) ,= + =2 2 IR2 ;
3) f r s r s D( , ) exp ( ) ,= + =2 2 IR2 ;
4) f x x x xn n( , , ) ,1 1K L= + +α α
85
si ( )α ≥ > =1 0 1, , , .x i ni K
La demostración de que las funciones dadas en 1), 2) y 4) son convexas se hace
directamente usando la desigualdad de Jensen expresada en la definición 2.1.1. En 1)
se aplica la desigualdad triangular ; en 2) se utiliza el hecho de que la función
g : IR→ IR definida por ( )g t t= 2 es convexa ; y en 4) nos apoyamos en que la
función ( )h : ,0 ∞ → IR definida por ( )h t t= α , con α ≥ 1, es convexa. Finalmente,
para demostrar que la función dada en 3) es convexa, se usa el criterio de la matriz
Hessiana, el cual exponemos en el teorema 2.6.2. El lector interesado en los detalles
de la demostraciones puede consultar [8], pp. 135 y 137.
Ahora definiremos un conjunto de gran interés cuando se estudian las
funciones convexas porqué a través del mismo podemos dar un tratamiento
geométrico a las funciones convexas.
Definición 2.1.2 : (Epígrafo). Sean D ⊂ IRn un conjunto no vacío y f D: → IR una
función. El epígrafo de f (epí f) es el conjunto
epí ( ){f x D= ∈ ×, α IR ( ) }: .f x ≤ α
Geométricamente, en los casos D ⊂ IR y D ⊂ IR2 ( )n y n= =1 2 el conjunto
epí f consiste en todos los puntos de la gráfica de f y en los puntos que están por
encima de dicha gráfica. En la figura 2.1 se puede observar el conjunto epí f para el
caso de una función f a b:[ , ] → IR .
86
Figura 2.1
Sí [ ]f a b: , → IR es una función convexa se tiene que epí f es un conjunto
convexo (ver figura 2.2).
Figura 2.2
Esta afirmación la exponemos en la siguiente proposición.
epí f
epí f
87
Proposición 2.1.1 : Sean D ⊂ IRn un conjunto convexo y f D: → IR una función.
Entonces f es convexa si y sólo si epí f es un conjunto convexo.
Demostración : Supongamos que f es convexa y sean ( ) ( )x y, , ,α β ∈ epí f ,
entonces ( )f x ≤ α y ( )f y ≤ β . Si [ ]λ ∈ 0 1, , tenemos
( )( ) ( ) ( ) ( )
( )
f x y f x f yλ λ λ λ
λ α λ β
+ − ≤ + −
≤ + −
1 1
1 ,
luego
( ) ( )( )λ λ λ α λ βx y+ − + − ∈1 1, epí f ,
es decir
( ) ( )( )λ α λ βx y, ,+ − ∈1 epí f
y en consecuencia epí f es un conjunto convexo.
Recíprocamente, supongamos que epí f es un conjunto convexo. Sean
x y D, .∈ Como ( )( )x f x, ∈epí f y ( )( )y f y, ∈ epí f , se verifica para todo
[ ]λ ∈ 0 1, que
( )( ) ( ) ( )( )λ λx f x y f y, ,+ − ∈1 epí f ,
es decir ( ) ( ) ( ) ( )( )λ λ λ λx y f x f y+ − + − ∈1 1, epí f y por lo tanto
( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1
de donde resulta que f es convexa.
A continuación presentamos la definición de aplicación afín para funciones a
valores reales definidas sobre IRn, para luego demostrar que toda función afín f es
tal que f y − f son convexas.
88
Definición 2.1.3 : (Aplicación afín). Se dice que una función A: IRn→ IR es una
aplicación afín sí existen una transformación lineal T: IRn→ IR y una constante
b ∈IR tales que
( ) ( )A x T x b x= + ∈, IRn.
La siguiente proposición establece que una función f es afín si y sólo si f y − f son
convexas.
Proposición 2.1.2 : (ver [1], pp. 124-125). Si f : IRn→ IR es una función, entonces
f es afín si y sólo si
( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − = + −1 1 (2.2)
para todo [ ]λ ∈ ∈0 1, ; ,x y IRn.
Demostración : Supongamos que f es una aplicación afín. Entonces existen una
transformación lineal T : IRn→ IR y una constante b ∈IR , tales que
( ) ( )f x T x b x= + ∈, IRn.
En consecuencia, para todo [ ]λ ∈ ∈0 1, ; ,x y IRn, se verifica :
( )( ) ( )( )( ) ( ) ( ) ( )
( )( ) ( ) ( )( )( ) ( ) ( )
f x y T x y b
T x T y b b
T x b T y b
f x f y
λ λ λ λ
λ λ λ λ
λ λ
λ λ
+ − = + − +
= + − + + −
= + + − +
= + −
1 1
1 1
1
1 ,
es decir
( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − = + −1 1
89
y por lo tanto f y − f son convexas.
Recíprocamente, supongamos que para todo [ ]λ ∈ ∈0 1, ; ,x y IRn , se verifica
la igualdad (2.2) y sea T : IRn→ IR la función definida por
( ) ( ) ( )T x f x f x= − ∈0 , IRn.
Para demostrar que f es una aplicación afín basta probar que T es lineal.
En primer lugar demostremos que ( ) ( )T x T xλ λ= para todo λ ∈IR, x ∈IRn en varios
pasos.
a) ( ) ( )T x T xλ λ= , si [ ]λ ∈ ∈0 1, , x IRn.
Sean [ ]λ ∈ 0 1, y x ∈IRn, entonces
( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( )( ) ( )
T x f x f f x f f x f f
f x f f x f T x
λ λ λ λ λ λ
λ λ λ λ
= − = + − − = + − −
= − = − =
0 1 0 0 1 0 0
0 0 .
b) ( ) ( )T x T xλ λ= , si λ > ∈1, x IRn.
Sean x ∈IRn y λ > 1 , luego ( )1 0 1λ ∈ , y por a) tenemos :
( ) ( )( ) ( )T x T x T x= =1 1λ λλ λ
de donde
( ) ( )T x T x xλ λ= ∈, IRn, .λ > 1
c) ( ) ( )T x T x x− = − ∈, IRn.
90
( ) ( )( ) ( )( ) ( ) ( ) ( ) ( )
( ) ( )( ) ( ) ( )( ) ( ) ( )
0 0 0 0
0 0
12
12
12
12
12
12
12
12
12
12
= = + − = + − − = + − −
= − + − − = + −
T T x x f x x f f x f x f
f x f f x f T x T x .
Es decir ( ) ( )T x T x+ − = 0 , de donde ( ) ( )T x T x− = − .
d) ( ) ( )T x T xλ λ= , si λ < ∈0, x IRn.
Sean x ∈IRn y λ < 0, entonces − >λ 0 y de a), b) y c) tenemos
( ) ( )( ) ( ) ( )( ) ( )T x T x T x T x T xλ λ λ λ λ= − − = − − = − − = .
En consecuencia,
( ) ( )T x T xλ λ λ= ∈, IR, x ∈IRn.
Para concluir probaremos que
( ) ( ) ( )T x y T x T y x y+ = + ∈, , IRn.
Efectivamente, sean x y, ∈IRn , entonces
( ) ( )( ) ( ) ( ) ( )( )( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )( )
( ) ( )
T x y T x y T x y f x y f
f x f y f f x f f y f
T x T y
+ = + = + = + −
= + − = − + −
= +
2 2 2 0
2 0 0 0
12
12
12
12
12
12
12
12
.
Concluimos así que T es lineal y por lo tanto f es una aplicación afín.
El siguiente lema será útil en la demostración de la proposición 2.1.3.
Lema 2.1.1 : Sean D ⊂ IRn un conjunto convexo, x D∈ int e y ∈IRn .
Entonces {J = ∈λ IR }: x y D+ ∈λ es un intervalo que contiene al 0 ∈. IR .
91
Demostración : Para demostrar que J es un intervalo basta probar que es un conjunto
convexo. Sean α β, ∈ J y [ ]µ ∈ 0 1, . Luego, x y D x y D+ ∈ + ∈α β, y como
D es convexo se verifica
( ) ( )( )µ α µ βx y x y D+ + − + ∈1 ,
es decir ( )( )x y D+ + − ∈µ α µ β1 , de donde ( )µ α µ β+ − ∈1 J y así J es un
subconjunto convexo de IR (un intervalo). Finalmente, como x y x D+ = ∈0 se
concluye que 0 ∈ J.
La siguiente proposición expresa una propiedad básica de las funciones
convexas que consiste en que la restricción de una función convexa a cualquier
segmento de recta contenido en su dominio también es una función convexa.
Proposición 2.1.3 : Sean D ⊂ IRn un conjunto convexo, f D: → IR una función
convexa, x D y∈ ∈int , IRn y {J = ∈λ IR }: .x y D+ ∈λ Entonces, la función
g J: → IR definida por ( ) ( )g f x yλ λ= + es convexa.
Demostración : Sean α β, ∈ J y [ ]µ ∈ 0 1, . Entonces
( )x y D x y D J+ ∈ + ∈ + − ∈α β µ α µ β, , 1 y por la convexidad de f se tiene
( ) ( ) ( ) ( ) ( ) ( )
( ) ( )( )( )( )( )( )
( )( )
µ α µ β µ α µ β
µ α µ β
µ α µ β
µ α µ β
g g f x y f x y
f x y x y
f x y
g
+ − = + + − +
≥ + + − +
= + + −
= + −
1 1
1
1
1 .
Es decir ( )( ) ( ) ( ) ( )g g gµ α µ β µ α µ β+ − ≤ + −1 1 para todo [ ]α β µ, , , ,∈ ∈J 0 1 y
por lo tanto g es convexa.
92
2.2. Hiperplanos y Propiedades Fundamentales de los
Conjuntos Convexos.
Debido a que este trabajo trata sólo de la teoría de funciones convexas y
presupone conocidas nociones tales como las de hiperplano en IRn , semiespacios
asociados, semiespacio de soporte, hiperplano de soporte, etc., así como también la
teoría concerniente a los conjuntos convexos ; en esta sección nos limitaremos a
definir estos conceptos y exponer sin demostración los teoremas fundamentales
relacionados con los conjuntos convexos, remitiendo al lector interesado en las
demostraciones a la bibliografía correspondiente.
Empezamos presentando un conjunto de definiciones.
Definición 2.2.1 : (Hiperplano). Sea H ⊂ IRn. Se dice que H es un hiperplano si y
sólo si existen un vector b ∈IRn, no nulo, y un número real α , tales que
{H x= ∈IR }n x b: ; .= α
Definición 2.2.2 : (Semiespacios asociados a un hiperplano). Dado un hiperplano
{H x= ∈IR }n x b: ; = α de IRn, a los conjuntos
{H x+ = ∈IR }n x b: ; ≥ α y {H x− = ∈IR }n x b: ; ≤ α
se les denomina semiespacios asociados al hiperplano H.
93
Definición 2.2.3 : (Semiespacio de soporte). Sea A ⊂ IRn un conjunto convexo. Un
semiespacio de soporte de A es un semiespacio cerrado que contiene a A y tiene al
menos un punto de A en su frontera.
Definición 2.2.4 : (Hipérplano de soporte). Sea A ⊂ IRn un conjunto convexo. Un
hiperplano de soporte de A es un hiperplano que es la frontera de un semiespacio de
soporte de A, es decir, es un hiperplano que intercepta la clausura de A y no tiene
puntos en común con int A.
Simbólicamente, los hiperplanos de soporte de A son aquellos que se pueden
representar de la forma :
{H x= ∈IR }n x b b: ; ,= ∈α IR
donde x b; ,≤ α para todo x A∈ y x b; ,= α para al menos un x A∈ ,
donde A es la clausura de A.
Definición 2.2.5: (Cápsula convexa). Sea M ⊂ IRn. Se denomina cápsula convexa
de M y se denota conv(M), a la intersección de todos los subconjuntos convexos de
IRn que contienen a M.
También podemos decir que conv (M) es el menor (en el sentido de inclusión)
conjunto convexo que contiene a M.
Si M es un conjunto convexo entonces conv (M)=M.
Definición 2.2.6 : (Simplex). Se llama simplex de dimensión m o también
m− simplex a la cápsula convexa de un conjunto de puntos p p pm0 1, , ,K ∈IRn
94
afinmente libres. Se denota conv{ }p pm0, , .K Los puntos p pm0, ,K se llaman
vértices.
Comentario : El lector que ignore la definición de conjunto afinmente libre puede
consultar [15], Tomo I, p. 58. Sin embargo, esto lo podemos ilustrar, en el caso de
IR3, diciendo que el conjunto de cuatro puntos { }p p p p0 1 2 3, , , ⊂ IR3 es
afinmente libre sí estos puntos no están todos contenidos en un plano y que el
conjunto de tres puntos { }p p p0 1 2, , ⊂ IR3 es afinmente libre sí estos tres puntos
no están contenidos todos en una recta.
Ejemplos de simplex de IR3 son :
1) Si m= 0 y p0 ∈ IR3, el 0− simplex conv{ }p0 es un punto.
2) Si m= 1 y { }p p0 1, ⊂ IR30 1, ,p p≠ el 1− simplex conv{ }p p0 1, es el
segmento de recta de extremos p0 y p1.
3) Si m= 2 y los puntos p p p0 1 2, , ∈IR3 son afinmente libres, el 2 − simplex
conv{ }p p p0 1 2, , es el triángulo de vértices p p p0 1 2, , , incluido su interior.
4) Si m= 3 y el conjunto { }p p p p0 1 2 3, , , ⊂ IR3 es afinmente libre, el
3− simplex conv{ }p p p p0 1 2 3, , , es el tetraedro de vértices
p p p p0 1 2 3, , , , incluido su interior.
El conjunto de teoremas que presentamos a continuación nos serán de utilidad
más adelante. Empezamos con el teorema de Caratheodory y su corolario dado como
un comentario.
95
Teorema 2.2.1 : (Teorema de Caratheodory). Sea M un subconjunto no vacío de
IRn. Entonces la cápsula convexa de M es el conjunto de todas las combinaciones
convexas de a lo sumo n + 1 puntos de M. En otras palabras, p∈conv{M} si y sólo si
existen n + 1 puntos (no necesariamente distintos dos a dos) p p p Mn0 1, , ,K ∈
tales que p pi ii
n=
=∑α
0
, donde αi ≥ 0 para todo i n= 0, ,K y αii
n=
=∑ 1
0
.
Demostración : ver [1], p. 43 ; [8], p. 88 o [15], Tomo II, p. 178.
Comentario : En el caso de un m− simplex S de un conjunto de puntos,
p p pm0 1, , ,K ∈ IRn afinmente libre, se tiene que
{ }
[ ]
S conv p p p
p R p p i m
m
ni i i i
i
m
i
m
=
= ∈ = ∈ = =
==∑∑
0 1
00
0 1 0 1
, , ,
: , , , , , ; .
K
Kα α α
(Ver [11], p. 115).
Teorema 2.2.2 : Sea G ⊂ IRn un conjunto abierto no vacío. Entonces para cada
x G∈ existe un simplex n − dimensional S G⊂ tal que x S∈ int .
Demostración : ver [11], p. 116.
Teorema 2.2.3 : Sea A ⊂ IRn un conjunto convexo tal que int .A ≠ ∅ Entonces el
conjunto int A es convexo.
Demostración : ver [11], p. 117 o [17], p. 77.
Comentario : De acuerdo con la proposición 2.1.1, si D ⊂ IRn es un conjunto
convexo y f D: → IR es una función convexa entonces epíf es un conjunto
convexo y aplicando el teorema 2.2.3 concluimos que int (epí f ) es un conjunto
convexo.
96
Teorema 2.2.4 : Sea A ⊂ IRn un conjunto convexo. Entonces por cada punto de la
frontera de A pasa un hiperplano de soporte de A.
Demostración : ver [11], p. 119 o [17], p. 84.
2.3. Continuidad de Funciones Convexas.
Análogamente al caso de funciones f I: ⊂ IR→ IR , donde I es un intervalo, la
propiedad de convexidad es una condición de regularidad bastante fuerte para las
funciones f D: ⊂ IRn→ IR , donde D es un conjunto convexo.
En esta sección se verá que la convexidad es suficiente para garantizar
continuidad. Más explícitamente, veremos que toda función convexa f D: ⊂ IRn→ IR,
donde D es un conjunto convexo, es continua en el interior de D.
Pasamos entonces a la siguiente proposición, la cual será útil para demostrar
que toda función convexa definida sobre un subconjunto convexo de IRn es continua
en el interior de su dominio.
Proposición 2.3.1 : Sean D ⊂ IRn un conjunto convexo y abierto, f D: → IR una
función convexa, x Do ∈ y {D x xo− = ∈IR }nox x D: + ∈ . Entonces las
funciones ( )g g D xo1 2, : − → IR definidas por
( ) ( ) ( )g x f x x g x f x x f xo o o1 2( ) , ( )= + = + −
verifican las siguientes propiedades :
1) g g1 2, son funciones convexas ;
97
2) f es acotada superiormente en una vecindad de xo, si y sólo si, g1 es acotada
superiormente en una vecindad de 0 ∈IRn ;
3) f es acotada superiormente en una vecindad de xo , si y sólo si, g2 es acotada
superiormente en una vecindad de 0 ∈IRn ;
4) f es continua en xo, si y sólo si, g1 es continua en 0 ;
5) f es continua en xo, si y sólo si, g2 es continua 0 .
Demostración :
1) Sean x y D xo, ∈ − y [ ]λ ∈ 0 1, . Entonces :
( ) ( ) ( ) ( ) ( ) ( )
( ) ( )( )( ) ( )
( )( ) ( )( )
λ λ λ λ
λ λ
λ λ λ λ
g x g y f x x f y x
f x x y x f es convexa
f x y x g x y
o o
o o
o
1 1
1
1 1
1
1 1
+ − = + + − +
≥ + + − +
= + − + = + − .
Es decir
( )( ) ( ) ( ) ( )g x y g x g y1 1 11 1λ λ λ λ+ − ≤ + − .
Análogamente
( ) ( ) ( ) ( ) ( )( ) ( ) ( ) ( )( )( ) ( ) ( ) ( )
( ) ( )( )( ) ( )
( )( ) ( )
( )( )
λ λ λ λ
λ λ
λ λ
λ λ
λ λ
g x g y f x x f x f y x f x
f x x f y x f x
f x x y x f x
f x y x f x
g x y
o o o o
o o o
o o o
o o
2 2
2
1 1
1
1
1
1
+ − = + − + − + −
= + + − + −
≥ + + − + −
= + − + −
= + −
Es decir
98
( )( ) ( ) ( ) ( )g x y g x g y2 2 21 1λ λ λ λ+ − ≤ + −
Por lo tanto, g1 y g2 son convexas.
2) Supongamos que f es acotada superiormente en una vecindad de xo, entonces
existen γ > 0 y M ∈IR tales que si x D∈ y ( ) ( )x B x B xo o∈ = +, ,γ γ0
se verifica ( )f x M≤ .
Luego
( ) ( )f x x x M x D B xo o o− + ≤ ∈, ,I γ .
Como ( ) ( )y x x D x Bo o= − ∈ − I 0, γ se tiene que
( ) ( ) ( ) ( )g y f y x M y B D xo o1 0= + ≤ ∈ −, , γ I
y en consecuencia g1 es acotada superiormente en una vecindad del cero.
Recíprocamente, supongamos que g1 es acotada superiormente en una
vecindad del cero, entonces existen γ > 0 y M ∈IR tales que si
x D xo∈ − y ( ) ( )x B B x xo o∈ = −0, , ,γ γ se verifica ( )g x M1 ≤ . Es decir
( )f x x Mo+ ≤ , para todo ( ) ( )x D x Bo∈ − I 0, γ
y dado que ( )y x x D B xo o= + ∈ I , γ se tiene que
( )f y M≤ , para todo ( )y B x Do∈ , γ I
y por lo tanto, f es acotada superiormente en una vecindad de xo .
3) Como ( ) ( ) ( )g x g x f xo2 1= − , para todo x D xo∈ − , es decir, g2 difiere de
g1 tan sólo en una constante, se tiene que g2 es acotada superiormente en una
vecindad de 0 ∈IRn si y sólo sig1 es acotada superiormente en una vecindad de
99
cero y por la parte 2) esto es equivalente a que f es acotada superiormente en una
vecindad de xo, con lo cual concluye la demostración.
4) Supongamos que f es continua en xo . Luego, dado ε > 0 existe δ > 0 tal que si
x D∈ y ( ) ( )x B x B xo o∈ = +, ,δ δ0 entonces ( ) ( )f x f xo− < ε , es decir
( ) ( ) ( )f x x x f x x D B xo o o o− + − < ∈ε δ, ,I .
Como ( ) ( )y x x D x Bo o= − ∈ − I 0,δ se deduce que dado ε > 0, existe δ > 0 tal
que si ( ) ( )y B D xo∈ −0,δ I entonces
( ) ( )f y x f xo o+ − < ε
lo cual es equivalente a
( ) ( )g y g1 1 0− < ε
y en consecuencia g1 es continua en 0 ∈IRn.
Recíprocamente, supongamos que g1 es continua en cero. Luego, dado ε > 0
existe δ > 0 tal que tal que si x D xo∈ − y ( ) ( )x B B x xo o∈ = −0, ,δ δ
entonces ( ) ( )g x g1 1 0− < ε , es decir
( ) ( ) ( ) ( )f x x f x x D x Bo o o+ − < ∈ −ε δ, ,I 0 .
Como ( )y x x D B xo o= + ∈ I , δ se tiene que dado ε > 0 existe δ > 0 tal que si
( )y B x Do∈ , δ I entonces
( ) ( )f y f xo− < ε
y por lo tanto f es continua en xo.
100
5) Dado que ( ) ( ) ( )g x g x f xo2 1= − para todo x D xo∈ − , se ve inmediatamente que
g2 es continua en 0 ∈IRn si y sólo si g1 es continua en cero y como esto ultimo
es por 4) equivalente a que f es continua en xo queda demostrada la proposición.
La proposición siguiente establece que una función convexa acotada
superiormente en el interior de su dominio es continua en el interior del mismo.
Proposición 2.3.2 : (ver [1], pp. 77-78). Sean D ⊂ IRn un conjunto convexo,
f D: → IR una función convexa y x Do ∈ int . Si f es acotada superiormente en una
vecindad de xo, entonces f es continua en xo .
Demostración : De acuerdo con la proposición 2.3.1, para demostrar que f es
continua en el punto xo, basta probar la continuidad en cero, de la función convexa
( )g D xo: − → IR, definida por ( ) ( ) ( )g x f x x f xo o= + − .
Por otra parte, dado que f es acotada superiormente en una vecindad de xo , se tiene
que g es acotada superiormente en una vecindad de cero y como ( )0 ∈ −int ,D xo
existen números reales M > 0 y γ > 0, tales que ( ) ( )B D xo0, γ ⊂ − , y
( )g x M≤ , para todo ( )x B∈ 0, γ .
Sea ε > 0, tal que εM
< 1. Consideremos ( ) ( )x B B D xM o∈ ⊂ ⊂ −0 0, ,ε γ γ ,
entonces tomando x xM1 = ε tenemos que ( )x B1 0∈ , γ pues
x xM MM1 = < =ε εε γ γ . Como g es convexa con ( )g 0 0= y además x x
M= ε
1 se
verifica
101
( ) ( ) ( )( )( ) ( ) ( )
( ) ( )( )
g x g x g x
g x g
g x M porque x B
M M M
M M
M M
= = + −
≤ + −
= ≤ ⋅ = ∈
ε ε ε
ε ε
ε ε ε γ
1 1
1
1 1
1 0
1 0
0,
Es decir :
( ) ( ) ( )g x x B D x AM o≤ ∈ ⊂ −ε γε, ,0 .
Además
( )− = − ∈M x x Bε γ1 0, y ( )0 = + −+ +M
M MMx xε
εε ε .
Por lo tanto
( ) ( )( )( ) ( )( )
0 0= = + −
≤ + −
≤ +
+ +
+ +
+ +
g g x x
g x g x
g x M
MM M
M
MM M
M
MM M
εε
ε ε
εε
ε ε
εε
ε .
Es decir
( )MM M
g x M+ ++ ≥εε
ε 0
de donde
( ) ( ) ( )g x x B D x BM o≥ − ∈ ⊂ −ε γε, , .0
De ( )A y ( )B se tiene que
( ) ( )− ≤ ≤ ∈ ⊂ −ε ε γεg x x B D xM
, , .0 0
En consecuencia, dado ε > 0 existe γ > 0 tal que si ( )x B D xM
∈ ⊂ −ε γ0 0, ,
entonces
102
( ) ( ) ( ) ( )g x g x g x g= − = − ≤0 0 ε ,
es decir, g es continua en 0 ∈IRn, de donde se concluye, por la proposición 2.3.1, que
f es continua en xo.
El siguiente lema lo utilizaremos luego en la demostración del teorema 2.3.1.
Lema 2.3.1 : Sean ( )x x x Bn1 2 0, , , , ,K ∈ γ tales que x x xn1 2, , ,K formen una base
de IRn, y sea
G x i ni i ii
n
i
n
i= < > =
==∑∑λ λ λ: , , , , ,1 0 1 2
11
K .
Entonces G es un conjunto abierto y ( )B G0, .γ I ≠ ∅ Además, si z G∈ entonces
( ) ( )B G z0, γ I − es una vecindad abierta de cero.
Demostración : Para demostrar que el conjunto
G x x i ni i ii
n
i
n
i i ii
n= <
> =
== =∑∑ ∑λ λ α α: : , , ,1 0 1
11 1
I K
es abierto, basta probar que su complemento
G x x para a un i nci i i
i
n
i
n
i i ii
n= ≥
≤ =
== =∑∑ ∑λ λ α α: : , lg , ,1 0 1
11 1
U K es cerrado.
En efecto, sea { }zm m IN∈ una sucesión de puntos de Gc que converge a un punto
z ∈IRn . Entonces, para cada m∈IN existen números reales λmi i n, , , ,= 1K tales
que :
z xm mi ii
n=
=∑λ
1
y λmii
n≥
=∑ 1
1
,
103
o existen números reales αmi i n, , , ,= 1K tales que
z xm mi ii
n=
=∑α
1
con αmi para a un i n≤ =0 1, lg , ,K .
Como la sucesión { }zm m IN∈ es convergente, existen números reales λ λ1, ,K n tales
que { }λmi m IN∈ converge a λi , para cada i n= 1, , ;K o existen números reales
α α1, , ,K n tales que la sucesión { }αmi m IN∈ converge a αi i n, , , .= 1K Luego,
tomando el límite cuando m→ ∞, obtenemos
z xi ii
n=
=∑λ ,
1
con λ λim
mii
n
i
nlim= ≥→∞ ==∑∑ 1
11
o
z xi ii
n=
=∑α ,
1
con αi para a un i n≤ =0 1, lg , , .K
En consecuencia, z Gc∈ y por lo tanto Gc es cerrado y así G es abierto.
Por otra parte, sean λi ni n= =+
11
1, , , ;K entonces
λi ni
nn
ni
n= = <+
=+
=∑∑ 1
11
11
1 y λi i n> =0 1, , ,K . Luego
( )x x G Ai ii
n= ∈
=∑λ
1
y además
x x x x xn i
i
n
n i n ii
n
i
n
n i nn
ni
n
i
n= ≤ = = ≤ = <+
=+ +
==+ + +
==∑ ∑∑ ∑∑1
11
11
11
11
11
11 1
11
γ γ γ.
Es decir :
104
( ) ( )x B B∈ 0, .γ
De las relaciones ( )A y ( )B se deduce que
( )x B G∈ ≠ ∅0, .γ I
Además, sí z G∈ entonces ( )0 ∈ −G z y G z− es un conjunto abierto pues es una
traslación del conjunto G el cual es abierto ; de donde se concluye que
( ) ( )B G z0, γ I − es una vecindad abierta de 0 ∈IRn.
Ahora estamos en condiciones de demostrar el teorema fundamental de esta
sección, el cual establece que toda función convexa definida sobre un subconjunto
convexo de IRn es continua en el interior de su dominio.
Teorema 2.3.1 : Sean D ⊂ IRn un conjunto convexo y f D: → IR una función
convexa. Entonces f es continua en int D .
105
Demostración : (Esta demostración se tomó con ciertas modificaciones de [1], pp.
78-79).
Sea x Do ∈ int , para demostrar que la función f es continua en xo, basta probar la
continuidad en 0 ∈IRn de la función convexa ( )g D xo: − → IR, definida por :
( ) ( )g x f x xo= + .
Como ( )0 ∈ −int ,D xo existe γ > 0, tal que ( )B D xo0, γ ⊂ − . Sean
( )x x Bn1 0, , ,K ∈ γ tales que x xn1 , ,K , formen una base de IRn y consideremos
G x i ni i i ii
n
i
n= < > =
==∑∑λ λ λ: , , , ,1 0 1
11
K .
Por el lema anterior ( )G BI 0, .γ ≠ ∅ Fijemos ( )z G B∈ I 0, γ . Entonces
( )− ∈ ⊂ −z B D xo0, γ y por el lema 2.3.1, ( ) ( )B G z0, γ I − es una vecindad abierta
de 0.
Sea ( ) ( )x B G z∈ −0, γ I , entonces existen números reales positivos λ λ1, ,K n tales
que λii
n<
=∑ 1
1
, y
x x zi ii
n=
−
=∑λ
1
.
Luego
( ) ( )x x z zi i ii
n
i
n= − + −
−
==∑∑λ λ1
11
.
Como g es convexa, se tiene
106
( ) ( ) ( )g x g x z g zi i ii
n
i
n≤ − + −
−
==∑∑λ λ1
11
.
Tomando
( ) ( ){ }M m a x g z g x z i ni= − − =, : , ,1K
se tiene que
( )g x M≤ , para todo ( ) ( )x B G z∈ −0, γ I
y por lo tanto, g es acotada superiormente en una vecindad del cero y en
consecuencia, por la proposición 2.3.1, f es acotada superiormente en una vecindad
de xo . Finalmente, aplicando la proposición 2.3.2, se concluye que f es continua en
xo . Dado que xo es un punto arbitrario de int D esto equivale a decir que f es
continua en int D .
A continuación presentamos otra forma de demostrar el teorema 2.3.1 :
Sea x D∈ int . Luego, por el teorema 2.2.2 existe un simplex n − dimensional
S D⊂ int tal que x S∈ int .
Sea z S∈ , entonces por el corolario del teorema 2.2.1 existen n + 1 puntos
x x Do n, ,K ∈ afinmente libres tales que z xi ii
n=
=∑λ ,
0
donde
[ ]λi i n∈ =0 1 0, , , , ,K y λii
n=
=∑ 1
0
.
Como f es convexa, se verifica que
( ) ( )f z f x f xi ii
n
i ii
n=
≤
= =∑ ∑λ λ
0 0
.
Tomando
107
( ){ }M m a x f x i ni= =: , ,0 K
se tiene
( )f z M≤ , para todo z S∈ .
Por lo tanto, f es acotada superiormente en una vecindad de x D∈ int y aplicando la
proposición 2.3.2 se concluye que f es continua en int .D
Comentario : El teorema 2.3.1 expresa que toda función convexa definida sobre un
subconjunto convexo de IRn es continua en el interior de su dominio pero no se
aclara la situación en la frontera del mismo. Con el fin de aclarar esta situación
consideremos el conjunto
( ){D x y= ∈, IR }2 2 2 1: x y+ ≤
y la función f D: → IR definida por :
( )( )( )
f x yx y si x y D
si x y fr D,
, int
,=
+ ∈
∈
2 2
2
La gráfica de esta función se asemeja a un paraboloide de revolución y su epígrafo es
un conjunto convexo de donde se concluye que f es convexa. Sin embargo, la
función es discontinua en la frontera de su dominio. De todo esto se desprende que
una función convexa puede ser discontinua en la frontera de su dominio pero siempre
es continua en el interior del mismo.
2.4. Diferenciabilidad de Funciones.
En esta sección presentaremos algunos resultados de carácter general
relacionados con el concepto de diferenciabilidad de funciones de varias variables. Se
darán las definiciones de diferencial fuerte, diferencial débil, subgradiente, etc.
108
Empezamos con la definición de diferencial fuerte.
Definición 2.4.1 : (Diferencial fuerte o diferencial Fréchet). Sean D ⊂ IRn un
conjunto abierto y f D: → IRm una función. Se dice que f es diferenciable en un
punto dado x Do ∈ cuando existe una transformación lineal Lxo: IRn→ IRm tal que
( ) ( ) ( ) ( ) ( )f x h f x L h x ho o x oo+ − = + ε , .2 3
con
( )ε x h
ho ,
→ ∈0 IRm cuando h → 0.
La expresión ( )L hxo∈IRm para todo h ∈IRn y se denomina diferencial
fuerte (o diferencial Fréchet) de la aplicación f en el punto xo. La transformación
lineal Lxo se llama derivada, más precisamente, derivada fuerte de la función f en el
punto xo.
Obsérvese que de (2.3) se obtiene
( ) ( ) ( ) ( )f x h f x L h
h
x h
ho o xo o+ − −
=ε ,
.
Esto nos permite deducir que f es diferenciable en el punto xo, si existe una
transformación lineal Lxo: IRn→ IRm, tal que
( ) ( ) ( )limh
f x h f x L h
ho o xo
→
+ − −= ∈
00 IRm.
En el caso m= 1 tenemos que Lxo: IRn→ IR es un funcional lineal y por lo
tanto para todo x ∈IRn existe un x* ∈IRn fijo tal que ( )L x x xxo= * ; .
109
A continuación presentamos otra definición de diferenciabilidad.
Definición 2.4.2 : (Diferencial débil o diferencial de Gato). Sean D ⊂ IRn un
conjunto abierto y f D: → IRm una función. Se llama diferencial débil, o
diferencial de Gato, de la función f en el punto x D∈ al límite (siempre que
exista)
( ) ( ) ( )f x y lim
f x y f x' ; =→
+ −
λ
λλ0
.
La diferencial débil ( )f x y' ; puede no ser lineal respecto a y . Sí esta linealidad se
verifica, entonces la función lx : IRn→ IRm definida por
( ) ( )l y f x yx = ' ;
es un operador lineal, este operador se llama derivada débil (o derivada de Gato).
Consideremos los limites laterales
( ) ( ) ( )f x y lim
f x y f x−
↑
+ −=' ;λ
λλ0
y ( ) ( ) ( )f x y lim
f x y f x+
↓
+ −=' ;λ
λλ0
.
( )λ λ λ λ λ λ↑ → < ↓ → >0 0 0 0 0 0significa mientras que significa: , , , .
Obsérvese que si ( )f x y+' ; existe y es una función lineal de “y” entonces
( ) ( ) ( ) ( )( ) ( ) ( )( ) ( )
( ) ( ) ( )
f x y lim lim lim
f x y f x y f x y
f x y f x f x y f x f x y f x−
↑
+ −
↓
+ − −− ↓
+ − −
+ +
= = = −
= − − = =
'
' '
;
; ; ' ; .
λ
λλ λ
λλ λ
λλ0 0 0
110
Es decir, si ( )f x y+' ; existe para cada y ∈IRn y es una función lineal de “y ”
entonces existe el limite ( )f x y' ; para todo y ∈IRn y depende linealmente de “y ”.
Cabe destacar también que el límite ( )f x y' ; , cuando existe, es denominado por
muchos autores, derivada direccional de la función f en el punto x según la dirección
del vector y .
En otro orden de ideas, sean D ⊂ IRn un conjunto abierto, f D: → IRm una
función diferenciable Fréchet en un punto x D∈ fijo e y ∈IRn arbitrario. Entonces
existe un número real γ > 0 tal que x y D+ ∈λ , cada vez que λ γ< . Por ser f
diferenciable Fréchet en el punto x, tenemos que existe una transformación lineal
Lx : IRn→ IRm tal que :
( ) ( ) ( ) ( ) ( )f x y f x L y x yx+ − = +λ λ ε λ; .2 4
donde
( )limy
x y
yλ
ε λλ→
= ∈0
0;
IRm.
Dividiendo la igualdad (2.4) por λ ≠ 0 y teniendo en cuenta que Lx es lineal,
tenemos
( ) ( ) ( ) ( ) ( )f x y f xx
x yL y
+ −= +
λλ
ε λλ;
.2 5 .
Como
( ) ( )lim lim y
x y x y
yλ
ε λλ λ
λλ
ε λλ→ →
= =0 0
0; ;
nos queda, al tomar el limite en la igualdad (2.5) cuando λ → 0 , que
( ) ( )f x y L yx' ; =
111
y por lo tanto ( )f x y' ; es una función lineal de “y ”, y en consecuencia la
diferenciabilidad fuerte implica la diferenciabilidad débil y ambas diferenciales son
iguales.
El recíproco en general no es cierto, en otras palabras, la diferenciabilidad
débil no implica la diferenciabilidad fuerte. Por ejemplo, consideremos la función
f : IR2→ IR ( )m= 1 definida por
( )( ) ( )
( ) ( )f x x
x x si x x
si x x
x xx x
1 21 2 1 2
1 2
13
2
14
22 0 0
0 0 0
,, , , ;
, , , .
=+ + ≠
=
+
Esta función es continua en todo el plano, incluido el punto ( )0 0, . Tiene diferencial
débil en el punto ( )0 0, , ya que para todo ( )y y y= ∈1 2, IR ( ){ }2 0 0− , se verifica que
( ) ( ) ( ) ( )f y lim lim lim y y y y
f y f f y y yy y
' ; .00
0 0
0 01 2 1 2
4
1
3
24
1
4 2
2
2= = = + +
= +
→
+ −
→ → +λ
λλ λ
λλ λ
λλ λ
Es decir ( )f y y y' ;0 1 2= + y así ( )f ' ;0 ⋅ es lineal.
Sin embargo, tomando
( ) ( ) ( ) ( )ω 0 0 0 0 1
3
2
1
4
2
2, ' ; ,y f y f f yy y
y y= + − − =
+
y aproximándonos a 0 ∈IR2 a lo largo de la parábola y y2 12= , y1 0> , tendremos
( )lim limy
y
y y
y
y y y→ ↓ += = ≠
0
0
0 212
1
15
1
4
1
2
2
20
ω ,.
Por lo tanto, ( )f y' ;0 no es la diferencial fuerte de f y así f no es diferenciable
Fréchet.
112
Para la teoría que nos interesa desarrollar es suficiente la diferenciabilidad
débil y por lo tanto esta es la que utilizaremos en gran parte de lo que resta del
capítulo, en el sentido en que la definimos a continuación.
Definición 2.4.3 : (Diferenciabilidad). Sean D ⊂ IRn un conjunto abierto y
f D: → IR una función. Se dice que f es diferenciable en un punto x D∈ si y sólo si
para cada y ∈IRn existe el límite
( ) ( ) ( ) ( )f x y limf x y f x
+↓
+ −=' ; .
λ
λλ0
2 6
y ( )f x y+' ; es una función lineal de y.
Para concluir esta parte, consideremos D ⊂ IRn un conjunto abierto y
f D: → IR una función diferenciable en el punto x D∈ (en el sentido que acabamos
de definir). Entonces, sí { }e en1 , ,K es la base canónica de IRn , tenemos que
( ) ( ) ( )f x e limi
f x e f xi' ; .=→
+ −
λ
λλ0
Este número usualmente se denomina derivada parcial de f y se denota ( )∂∂
fei
x o
( )∂∂
fxi
x y por ser ( )f x' ; ⋅ lineal se cumple que si y y ei ii
n=
=∑
1
, entonces
( ) ( ) ( )
( ) ( )
f x y f x y e f x y e y f x e
y x f x y
i ii
n
i i i ii
n
i
n
ifx
i
n
i
' ; ' ; ' ; ' ;
; .
=
= =
= = ∇
= ==
=
∑ ∑∑
∑
1 11
1
∂∂
113
Es decir
( ) ( )f x y f x y' ; ;= ∇
o equivalentemente
( ) ( ) ( )f x y f x y+ = ∇' ; ; . ,2 7
donde ( ) ( ) ( )∇ =
f x x x
fx
fxn
∂∂
∂∂1
, ,K .
A continuación presentamos las definiciones de subgradiente y subdiferencial
las cuales nos serán muy útiles para desarrollar lo que sigue del capítulo.
Definición 2.4.4 : (Subgradiente y subdiferencial). Sean D ⊂ IRn un conjunto
abierto y f D: → IR una función. Cualquier vector x* ∈IRn, tal que
( ) ( ) ( )f z f x x z x z D≥ + − ∈* ; , .2 8
es llamado subgradiente de f en x. El conjunto de todos los subgradientes de f en x
se denomina subdiferencial de f en x y se denota por ( )∂ f x , es decir :
( ) {∂ f x x= ∈* IR ( ) ( ) }n f z f x x z x para todo z D: ;*− ≥ − ∈
Por ejemplo, para la función valor absoluto, definida por ( )f x x= para todo
x ∈IR, se tiene que ( ) [ ]∂ f 0 1 1= − , .
En efecto, supongamos que f es subdiferenciable en el cero, esto es
( )∂ f 0 ≠ ∅ , luego existe ( )x f* ∈ ⊂∂ 0 IR tal que :
( ) ( ) ( )f z f x z para todo z− ≥ ⋅ − ∈0 0* , IR,
es decir
114
z x z para todo z≥ ⋅ ∈* , IR.
Si z > 0, entonces xz
z* ≤ = 1, lo cual significa que ( ]x* , .∈ −∞ 1
Si z < 0 , entonces xz
z* ,≥ = −1 es decir [ )x* , .∈ − + ∞1
Si z = 0, entonces x* puede tomar cualquier valor ( *x ∈IR) .
De las tres ultimas relaciones obtenemos que [ ]x* ,∈ −1 1 .
Por lo tanto, sí ( )x f* ∈∂ 0 entonces [ ]x* ,∈ −1 1 , de donde ( ) [ ]∂ f 0 1 1⊂ − , .
Analicemos la inclusión en el otro sentido : Sea [ ]x* ,∈ −1 1 . En consecuencia, sí
z > 0, entonces z
zx= ≥1 * , de donde ( )z x z− ≥ ⋅ −0 0* , es decir
( ) ( ) ( )f z f x z− ≥ ⋅ −0 0* , sí z > 0.
Si z < 0, entonces z
zx= − ≤1 * , de donde ( )z x z− ≥ ⋅ −0 0* , esto es
( ) ( ) ( )f z f x z− ≥ ⋅ −0 0* , sí z < 0.
Si z = 0, es evidente que se cumple
( )z x z− ≥ ⋅ −0 0* .
En consecuencia
( ) ( ) ( )f z f x z para todo z− ≥ ⋅ − ∈0 0* IR,
lo cual implica que ( )x f* .∈∂ 0
Hemos demostrado que si [ ]x* ,∈ −1 1 entonces ( )x f* ,∈∂ 0 es decir que
[ ] ( )− ⊂1 1 0, .∂ f
115
De todo lo anterior se concluye que
( ) [ ]∂ f 0 1 1= − , .
El lector interesado en más ejemplos de subdiferenciales puede consultar [1], pp. 87-
104.
2.5. Diferenciabilidad de Funciones Convexas.
En esta sección presentamos algunos resultados concernientes a la
diferenciabilidad de funciones convexas a valores reales definidas sobre subconjuntos
convexos y abiertos de IRn . El principal teorema de esta sección establece que si
D ⊂ IRn es un conjunto convexo y abierto, f D: → IR una función convexa y x un
punto de D, entonces f es diferenciable en x si y sólo si existen todas las derivadas
parciales de f en x.
Empezamos entonces con la siguiente definición.
Definición 2.5.1 : (Función positivamente homogénea). Sea f : IRn→ IR una
función. Se dice que f es positivamente homogénea si ( )f 0 0= y para todo x ∈IRn
y todo número real no negativo α , se tiene que
( ) ( )f x f xα α= .
A continuación presentamos un conjunto de lemas, los cuales serán útiles para
demostrar los teoremas 2.5.1 y 2.5.2. Cabe destacar también que lo que sigue de esta
sección se tomó de [11], Cap. VII, pp. 165-172.
116
Lema 2.5.1 : Sean D ⊂ IRn un conjunto convexo y abierto, f D: → IR una función
convexa, x D y∈ ∈, IRn y {J = ∈λ IR }: x y D+ ∈λ . Entonces la función
g J: → IR definida por
( ) ( ) ( )g f x y f xλ λ= + −
es convexa.
Demostración : Sean α β, ∈ J y [ ]µ ∈ 0 1, . Entonces
x y D x y D+ ∈ + ∈α β, y como f es convexa se verifica
( ) ( ) ( ) ( ) ( )[ ] ( ) ( ) ( )[ ]( ) ( ) ( ) ( )
( ) ( )( )( ) ( )
( )( )( ) ( )
( )( )
µ α µ β µ α µ β
µ α µ β
µ α µ β
µ α µ β
µ α µ β
g g f x y f x f x y f x
f x y f x y f x
f x y x y f x
f x y f x
g
+ − = + − + − + −
= + + − + −
≥ + + − + −
= + + − −
= + −
1 1
1
1
1
1
Es decir
( )( ) ( ) ( ) ( )g g gµα µ β µ α µ β+ − ≤ + −1 1
para cualesquiera α β, ∈ J y [ ]µ ∈ 0 1, , y por lo tanto g es convexa.
Lema 2.5.2 : SeanD ⊂ IRn un conjunto convexo y abierto y f D: → IR una función
convexa. Entonces en cada punto x D∈ la derivada ( )f x y+' ; existe para cada
y ∈IRn . Además ( )f x+ ⋅' ; es una función convexa y positivamente homogénea y,
para cada y ∈IRn ,
( ) ( ) ( )− − ≤+ +f x y f x y' '; ; .2 9
117
Demostración : Sean x D∈ e y ∈IRn fijos y defínase
{J = ∈λ IR }: x y D+ ∈λ .
Por el lema 2.1.1, J es un intervalo abierto que contiene al cero. Sea g J: → IR la
función definida por
( ) ( ) ( )g f x y f xλ λ= + − .
De acuerdo con el lema 2.5.1, g es convexa.
Por el teorema 1.2.2 existe la derivada
( ) ( ) ( ) ( )
( ) ( ) ( )
g lim lim
lim f x y
g g g
f x y f x
+↓
−− ↓
↓
+ −+
= =
= =
'
' ; .
00
00 0
0
λ
λλ λ
λλ
λ
λλ
Sean ahora u v, ∈IRn arbitrarios, [ ]µ ∈ 0 1, y λ > 0 suficientemente pequeño.
Entonces
( )( )( ) ( )[ ] ( ) ( )( )( ) ( )[ ]( ) ( ) ( ) ( )[ ]
( ) ( ) ( ) ( ) ( )
1 1
1
1 1
1
1
λ λ
λ
λλ
λ νλ
λ µ µ ν µ λ µ λ ν
µ λ µ λ ν
µ µ
f x u f x f x u x f x
f x u f x f x
f x u f x f x f x
+ + − − = + + − + −
≤ + + − + −
= + −+ − + −
y tomando el límite cuando λ ↓ 0 nos queda que
( )( ) ( ) ( ) ( )f x u v f x u f x+ + ++ − ≤ + −' ' '; ; ;µ µ µ µ ν1 1
lo cual expresa que ( )f x+ ⋅' ; es una función convexa.
Consideremos ahora µ ∈IR positivo y arbitrario y λ > 0 suficientemente pequeño.
Luego
118
( ) ( ) ( ) ( )f x y f x f x y f x+ − + −=
λ µλ
λ µλ µµ
y tomando el límite cuando λ ↓ 0 se tiene que
( ) ( )f x y f x y+ +=' '; ;µ µ
y por lo tanto ( )f x+ ⋅' ; es una función positivamente homogénea.
Obsérvese que ( )f x+ =' ; ,0 0 pues ( ) ( ) ( )f x lim lim
f x f x+
↓
+ −
↓= = =' ; 0 0
0
0
0
0
λ
λλ λ λ .
Finalmente, sea y ∈IRn arbitrario. Como ( )f x+ ⋅' ; es una función convexa
tenemos que
( ) ( )( )( ) ( )
0 0 12
12
12
12
= = + −
≤ + −
+ +
+ +
f x f x y y
f x y f x y
' '
' '
; ;
; ; .
Es decir
( ) ( )f x y f x y+ ++ − ≥' '; ; 0 ,
de donde
( ) ( )− − ≤+ +f x y f x y' '; ;
y así concluye la demostración.
Lema 2.5.3 : Sean D ⊂ IRn un conjunto convexo y abierto y f D: → IR una función
convexa. Entonces ( )∂ f x ≠ ∅ , para todo x D∈ .
Demostración : Consideremos el conjunto
( ){A x y= ∈, IRn × IR ( )}: ,x D y f x∈ > = int (epí f ).
119
El conjunto A es convexo pues epí f es un conjunto convexo. Además, los
puntos ( )( )x f x D, ∈ × IR son puntos de la frontera de A. Sea x D∈ . De acuerdo con
el teorema 2.2.4, existe un hiperplano de soporte H que pasa por el punto ( )( )x f x, .
El hiperplano H tiene una ecuación de la forma
( )( ) ( )c z x y f x; .− + − =α 0 2 10
donde c ∈IRn, α ∈IR y los puntos del hiperplano son los puntos
( )z y, ∈IRn× IR= IRn+1 que satisfacen la ecuación (2.10). Obsérvese que el punto
( )( )x f x, ∈IRn+1 satisface la ecuación del hiperplano. Además, H ⊂ IRn+1 es un
hiperplano de IRn+1. Si α = 0 , entonces para que se cumpla la ecuación (2.10),
necesariamente z x= , y así cualquier punto ( )x y, con y ∈IR arbitrario satisface la
ecuación (2.10), por lo tanto para ( )y f x> se tiene que ( )x y H, ∈ y como además
( )x y A, ∈ se tiene que H AI ≠ ∅ y dado que el conjunto convexo A es abierto
tenemos una contradicción porque H es un hiperplano de soporte de A y por lo tanto
no puede cortar a A. La contradicción proviene de haber supuesto que α = 0 . En
consecuencia α ≠ 0. Luego, podemos escribir la ecuación (2.10) en la forma
( )y f x c z x= + − −1α ; .
Los dos semiespacios en que H divide a IRn+1 son determinados por las
desigualdades
( ) ( )y f x c z x y f x c z x> + − − < + − −1 1α α; , ; .
Para ( )y f x> arbitrario, el punto ( )x y A, ∈ y se verifica que
( )y f x c x x> + − −1α ;
120
y por lo tanto el conjunto A está contenido en el semiespacio determinado por la
desigualdad
( )y f x c z x> + − −1α ; .
Sean z D∈ arbitrario y ( )t f z> arbitrario pero tan próximo a ( )f z como se quiera.
Entonces ( )z t A, ∈ y se tiene
( )t f x c z x> + − −1α ; .
Haciendo que ( )t f z↓ obtenemos
( ) ( )f z f x c z x≥ + − −1α ; ,
para todo z D∈ y en consecuencia ( )− ∈1α ∂c f x , y así ( )∂ f x ≠ ∅ .
Lema 2.5.4 : Sean D ⊂ IRn un conjunto convexo y abierto, f D: → IR una función
convexa, x D∈ y x* ∈IRn . Entonces, ( )x f x* ∈∂ si y sólo si
( ) ( )f x y x y+ ≥' *; ; .2 11
para todo y ∈IRn .
Demostración : Sea x D∈ fijo. De acuerdo con la definición de subgradiente,
( )x f x* ∈∂ si y sólo si
( ) ( )f z f x x z x z D≥ + − ∈* ; , .
Sean λ > 0 e y ∈IRn y consideremos z x y= + λ . Entonces, ( )x f x* ∈∂ si y
sólo si
121
( ) ( ) ( )f x y f x x y+ ≥ +λ λ* ; .2 12
para todo y ∈IRn y λ > 0 tal que x y D+ ∈λ .
Si ( )x f x* ∈∂ , entonces por (2.12) se tiene que
( ) ( )f x y f xx y
+ −≥
λλ
* ;
para todo y ∈IRn y λ > 0 tal que x y D+ ∈λ . Tomando el límite cuando λ ↓ 0 se
obtiene
( )f x y x y+ ≥' *; ; ,
para todo y ∈IRn .
Recíprocamente, supongamos que
( ) ( )f x y x y+ ≥' *; ; .2 13
para todo y ∈IRn . Sean ahora, y ∈IRn arbitrario, {J = ∈λ IR }: x y D+ ∈λ y
g J: → IR la función definida por
( ) ( ) ( )g f x y f xλ λ= + − .
De acuerdo con el lema 2.1.1, J es un intervalo abierto que contiene al cero y según el
lema 2.5.1, g es una función convexa. Luego, por la demostración del teorema 1.2.2
tenemos que si 0 < λ y λ ∈ J entonces
( ) ( ) ( ) ( )g
g g g+
−−≤ =' .0
00
λλ
λλ
De esto se deduce que
122
( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( )
f x y f x g g g
f x y f x
g lim
lim f x y
+ −+
↓
−
↓
+ −+
= ≥ =
= =
λλ
λλ λ
λλ
λ
λλ
'
' ; .
00
0
0
Es decir
( ) ( ) ( )f x y f xf x y
+ −+≥
λλ
' ;
y de acuerdo con la desigualdad (2.13) se verifica que
( ) ( )f x y f xx y
+ −≥
λλ
* ; ,
de donde
( ) ( )f x y f x x y+ ≥ +λ λ* ;
para todo y ∈IRn y λ > 0 tal que x y D+ ∈λ y en conclusión ( )x f x* ∈∂ .
Lema 2.5.5 : Sean D ⊂ IRn un conjunto convexo y abierto y f D: → IR una función
convexa. Entonces
( ) ( ){ } ( )f x y Sup x y x f x+ = ∈' * *; ; : .∂ 2 14
para cada x D∈ e y ∈IRn .
Demostración : En virtud del lema 2.5.4 es suficiente demostrar que existe un
( )x f x* ∈∂ tal que
( )f x y x y x D y+ = ∈ ∈' *; ; , , IR ( )n 2 15. .
123
De acuerdo con el lema 2.5.3 se tiene que ( )∂ f x ≠ ∅ . Luego, sí y = 0 como
( )f x+ =' ; 0 0 tenemos que la relación (2.15) es cierta para todo ( )x f x* ∈∂ . Sea
entonces y y≠ ∈0, IRn fijo.
Consideremos una aplicación afín T : IRn→ IRn biyectiva que transforme la
dirección dada por el vector y ∈IRn en la dirección dada por el vector e1 ∈IRn .
Debemos tener presente que T manda puntos sobre puntos ; esto es, T es una
aplicación de IRn en IRn donde IRn se considera como espacio afín. Mediante esta
transformación el dominio D de f se transforma en un conjunto ( )S T D= , también
convexo y abierto (ver : [8], p. 68). El punto x D∈ se transforma en el punto
( )x T x S= ∈ . Debido al cambio de variables la función f D: → IR se transforma en
una función g S: → IR también convexa.
Sea ϕ : IRn→ IR la función definida por ( ) ( )ϕ z g x z= +' ; .
Como g es convexa, se tiene por el lema 2.5.2 que ϕ es convexa y positivamente
homogénea. Definamos ahora la función ψ : IRn− →1 IR mediante
( ) ( )ψ ϕz z z zn n2 21, , , , , .K K=
Usando el hecho que ϕ es convexa y la desigualdad de Jensen se demuestra que la
función ψ también es convexa.
Para cada ( )z z zn= ∈1, ,K IRn definamos ( )~ , ,z z zn= ∈2 K IRn−1. Por el lema 2.5.3
se tiene que para 0 ∈IRn−1 se verifica que ( )∂ψ 0 ≠ ∅ , luego existe un z0* ∈IRn−1 tal
que ( )z0 0* ∈∂ψ . Por la definición de subgradiente tenemos que
( ) ( ) ( )ψ ψ~ ~ . ,*z z z− ≥ ⋅0 2 160
124
para todo z ∈IRn z, ~ ∈IRn−1, donde z z0* ~⋅ denota el producto escalar euclidiano de
los vectores z0* y ~z .
Sea ahora H ⊂ IRn el hiperplano
( ){H z z zn= = ∈1, ,K IR }n z: 1 1= .
Para z H∈ se tiene ( ) ( )ϕ ψz z= ~ y por la desigualdad (2.16) se verifica que
( ) ( ) ( ) ( )ϕ ϕ ψ ψz e z z z z H− = − ≥ ⋅ ∈1 00~ ~, .*
Es decir
( ) ( ) ( )ϕ ϕz e z z z H≥ + ⋅ ∈1 0 2 17* ~, . . .
Sea ( )( )z e z* *,= ∈ϕ 1 0 IR× IRn− =1 IRn . De acuerdo con (2.17) se verifica
( ) ( )
( )( ) ( )
ϕ ϕ
ϕ
z e z z
e z z
z z
≥ ⋅ + ⋅
=
=
1 0
1 0
1
1
*
*
*
~
, ; , ~
; .
Esto es
( ) ( )ϕ z z z z H≥ ∈* ; , .2 18 .
En particular, de acuerdo con la definición de z* :
( ) ( ) ( )( )ϕ ϕ ϕe e e z e1 1 1 0 11= ⋅ = , ;* ,
lo cual es equivalente a
( ) ( )ϕ e z e1 1 2 19= * ; . .
125
Sea P el semiespacio
( ){P z z zn= = ∈1, ,K IR }n z: .1 0>
Para cada z P∈ existen un $z H∈ y un λ > 0 tales que z z= λ $ . Como ϕ es
positivamente homogénea tenemos de (2.18) :
( ) ( ) ( )ϕ ϕ λ λ ϕ λ
λ
z z z z z
z z z z
= = ≥
= =
$ $ ; $
; $ ; .
*
* *
Es decir
( ) ( )ϕ z z z z P≥ ∈* ; , .2 20
Escojamos ahora un z ∈IRn arbitrario y consideremos el punto
( ) ( )z z e= + −λ λ1 2 211 . ,
con λ∈IR. Cuando λ → 0 el punto z se aproxima a e P P1 ∈ = int y podemos
escoger un ( )λ ∈ 0 1, tal que z P∈ . Supongamos que hemos fijado para un
( )λ ∈ 0 1, el correspondiente z P∈ dado por (2.21) y que
( ) ( )ϕ z z z< * ; .2 22
Entonces tenemos por (2.21), la convexidad de ϕ y las relaciones (2.22) y (2.19)
que :
( ) ( ) ( ) ( )
( )
( )
( )
ϕ λ ϕ λ ϕ
λ λ
λ λ
λ λ
z z e
z z z e
z z z e
z z e z z
≤ + −
< + −
= + −
= + − =
1
1
1
1
1
1
1
1
* *
* *
* *
; ;
; ;
; ;
126
Es decir
( )ϕ z z z< * ; ,
lo cual se contradice con (2.20) pues z P∈ . La contradicción proviene de haber
supuesto que
( )ϕ z z z< * ;
y por lo tanto
( )ϕ z z z z≥ ∈* ; , IRn .
Ahora bien, de acuerdo con la definición de ϕ , esto es equivalente a
( )g x z z z z+ ≥ ∈' *; ; , IRn ,
y por el lema 2.5.4 se verifica que ( )z g x* ∈∂ .
Además, de acuerdo con (2.19)
( ) ( )z e e g x e* '; ;1 1 1= = +ϕ .
Es decir
( )g x e z e+ =' *; ; .1 1
Aplicando la transformación inversa T −1 se tiene que a la dirección e1 ∈IRn
corresponde la dirección y ∈IRn , al punto x S∈ corresponde el punto x D∈ y por
isomorfismo trasladamos las propiedades de g a las propiedades de f y como se
preservan las operaciones tenemos que al subgradiente ( )z g x* ∈∂ corresponde un
subgradiente ( )x f x* ∈∂ tal que
127
( )f x y x y+ =' *; ;
con lo cual concluye la demostración.
Lema 2.5.6 : Sean f : IRn→ IR y g: IRn→ IR funciones aditivas. Si
( ) ( )f x g x≤ para todo x ∈IRn , entonces f g= .
Demostración : Como f y g son funciones aditivas se tiene de acuerdo con la
generalización del teorema 1.8.1 para el caso de IRn que f y g son funciones
impares. Supongamos que f g≠ y que para un x ∈IRn se verifica ( ) ( )f x g x< .
Entonces
( ) ( ) ( ) ( ) ( ) ( )[ ]g x f x g x f x g x f x− − − = − + = − − < 0,
esto es ( ) ( )g x f x− < − , lo cual se contradice con la hipótesis del teorema. La
contradicción proviene de haber supuesto que f g≠ , luego ( ) ( )f x g x= para todo
x ∈IRn .
Teorema 2.5.1 : Sean D ⊂ IRn un conjunto convexo y abierto, f D: → IR una
función convexa y x D∈ . Si f es diferenciable en el punto x, entonces
( ) ( ){ }∂ f x f x= ∇ . Recíprocamente, sí ( )∂ f x es un conjunto unitario, ( ) { }∂ f x x= * ,
entonces f es diferenciable Fréchet en x y ( )∇ =f x x* .
Demostración : Supongamos que f es diferenciable en x D∈ , en el sentido de la
definición 2.4.3. Entonces, por la ecuación (2.7) tenemos que
( ) ( )f x y f x y+ = ∇' ; ; para todo y ∈IRn . Escojamos cualquier ( )x f x* ∈∂ .
Por el lema 2.5.4 ( )f x y x y+ ≥' *; ; para todo y ∈IRn , o equivalentemente
128
( ) ( )∇ ≥f x y x y; ; .* 2 23
para todo y ∈IRn . Las expresiones en ambos lados de (2.23) son funciones aditivas
de y, luego por el lema 2.5.6 se tiene que ( )∇ =f x y x y; ;* para todo y ∈IRn .
Pero esto es cierto si y sólo si ( )x f x* = ∇ . En consecuencia ( ) ( ){ }∂ f x f x= ∇ .
Recíprocamente, supongamos que ( )∂ f x es un conjunto unitario, ( ) { }∂ f x x= * .
Definamos una función ( )p D x: − → IR por
( ) ( ) ( )p y f x y f x x y= + − − * ; .
Dado que x* es un subgradiente de f en x se tiene de acuerdo con la definición
2.4.4 que p ≥ 0 en D x− . Más aún, se puede verificar que para cada
u v D x, ∈ − y [ ]µ ∈ 0 1, se cumple
( )( ) ( ) ( ) ( )p u v p u p vµ µ µ µ+ − ≤ + −1 1 ,
y por lo tanto p es convexa.
Veamos que en efecto ( )p y y D x≥ ∈ −0, .
129
Sean y ∈IRn fijo pero arbitrario y
{J = ∈λ IR }: x y D+ ∈λ .
Por el lema 2.1.1, J es un intervalo abierto que contiene al cero. Definamos la función
g J: → IR por
( ) ( ) ( )g f x y f xλ λ= + − .
De acuerdo con el lema 2.5.1 la función g es convexa. Sea λ ∈ J tal que λ > 0 .
Usando el hecho que g es convexa y procediendo de manera análoga a como lo
hicimos en la demostración del lema 2.5.4 se prueba que
( ) ( ) ( )f x y f xf x y
+ −+≥
λλ
' ;
para cada y ∈IRn y λ > 0 tal que x y D+ ∈λ . Tomando λ = 1 tenemos que
( ) ( ) ( )f x y f x f x y y D x+ − ≥ ∈ −+' ; , ,
y por el lema 2.5.4 se verifica que
( ) ( ) ( ) ( )p y f x y f x x y f x y x y= + − − ≥ − ≥+* ' *; ; ; ,0
para cada y D x∈ − .
Es decir
( ) ( )p y y D x≥ ∈ −0 2 24, . .
Además, como ( )p 0 0= , (2.24) se puede escribir en la forma
( ) ( )p y p y y D x≥ + − ∈ −0 0 0; , ,
130
lo cual prueba que ( )0 0∈∂ p . Sí ( )y p* ,∈∂ 0 entonces para todo y D x∈ − se
verifica
( ) ( )p y p y y y y≥ + − =0 0* *; ;
o equivalentemente
( ) ( )f x y f x x y y y+ − − ≥* ; *; ,
de donde
( ) ( )f x y f x x y y y D x+ ≥ + + ∈ −* * ; , ,
es decir, para todo x y D+ ∈ . Por lo tanto, ( ) { }x y f x x* * *+ ∈ =∂ , lo cual implica
que x y x* * *+ = y así y* = 0. En consecuencia, ( ) { }∂ p 0 0= y por el lema
2.5.5 :
( ) ( ){ }{ }
p u Sup y u y p
Sup y u y
+ = ∈
= = =
' * *
* *
; ; :
; : .
0 0
0 0
∂
Esto es
( )p u u+ = ∈' ; ,0 0 IRn .
Definamos ahora
( ) ( )h u u D x
p uλ λ λλλ; , ,= > ∈ −0 .
Como ( )p 0 0= , se tiene
( ) ( ) ( ) ( ) ( )h u
p u p p u pλ λλ
λλ; = =− + −0 0 0
131
y
( ) ( ) ( )lim h u p uλ
λ↓
+= =0
0 0 2 25; ; .' .
El conjunto D x− es abierto y no vacío, y además 0 ∈ −D x pues x D∈ . Luego, por
el teorema 2.2.2, existe un simplex n − dimensional
{ }S conv p pn= +1 1, ,K
tal que S D x⊂ − y 0 ∈ int S con p p D xn1 1, ,K + ∈ − . Entonces, existe una
bola cerrada ( )B 0; γ de centro el origen y radio γ > 0 contenida en
( )( )S B S0; γ ⊂ . Escojamos un ( )u B∈ 0; γ arbitrario.
Según el comentario del teorema 2.2.1, existen [ ]λ λ1 1 0 1, , ,K n+ ∈ tales que
λii
n=
=
+∑ 1
1
1y u pi i
i
n=
=
+∑λ
1
1.
Sea ( )λ ∈ 0 1, . Del hecho que la función p es convexa y
( )λ λ λp p S D xi i= + − ∈ ⊂ −1 0 pues p Si , 0 ∈ y S es un conjunto convexo ;
se verifica que
( ) ( ) ( )
( ) ( ) ( )
( )
h u p u p p p p
p p h p
h p
i ii
n
i ii
n
i ii
n
ip p
i
n
i ii
n
ii
n
i
λ λ λ λ λ λ
λ λ λ λ λ
λ
λ λ λ
λλλ
;
;
; .
= =
=
≤ = =
≤
=
+
=
+
=
+
=
+
=
+
=
+
∑ ∑
∑ ∑ ∑
∑
1 1
1
11
1
1
1
1
1
1
1
1
1
1
1
Esto es
132
( ) ( ) ( )0 2 261
1≤ ≤
=
+∑h u h pii
nλ λ; ; .
ya que ( ) ( )h u
p uλ
λλ; = ≥ 0 porque p ≥ 0 y λ > 0 .
Como ( )lim h piλ
λ↓
=0
0; tenemos que ( )lim h uλ
λ↓
=0
0; uniformemente sobre
( )B 0; γ , es decir en forma continua para todo ( )u B∈ 0; γ .
Sea ahora y D x∈ − arbitrario. Existen un ( )u B∈ 0; γ y un λ > 0 tales que
u = γ e y u= λ . Para cualquier ε > 0 tan pequeño como se quiera, se cumple
que
( ) ( ) ( ) ( )p y
y
p u
u u
p uh u= = = <
λλ
λλ γ λ ε1 1 ;
previsto que λ sea suficientemente pequeño ( )λ > 0 . En otras palabras
( ) ( ) ( )0 ≤ = <
+ − −f x y f x x y
y
p y
y
* ;ε
cuando y es suficientemente pequeño.
Pero esto significa que
( ) ( ) ( )lim limy
f x y f x x y
y y
p y
y→
+ − −
→= =
0 00
* ;
y dado que x* ; ⋅ es un funcional lineal se deduce que f es diferenciable Fréchet
en el punto x y por lo tanto también diferenciable débil. Luego, ( )f x y x y' ; ;*= y
como además ( ) ( )f x y f x y' ; ;= ∇ pues ( )f x' ; ⋅ es lineal, se deduce que
( )x y f x y* ; ;= ∇ para todo y D x∈ − y en conclusión ( )x f x* = ∇ .
133
Lema 2.5.7 : Sea f : IRn→ IR una función convexa y positivamente homogénea, y
sea { }b bn1 , ,K una base de IRn . Si
( ) ( ) ( )f b f b i ni i− = − =, , , .1 2 27K
entonces f es lineal.
Demostración : Como f es positivamente homogénea, se tiene que
( ) ( ) ( )f f f0 2 0 2 0= ⋅ = , de donde
( ) ( )f 0 0 2 28= . .
Para λ < 0 , de acuerdo con (2.27), se verifica que
( ) ( ) ( ) ( ) ( )f b f b f b f b f bi i i i iλ λ λ λ λ= − = − = − = ,
para todo i n= 1, ,K .
De esta última relación, de (2.28) y del hecho que f es positivamente homogénea,
tenemos que
( ) ( )f b f bi iλ λ λ= ∈, IR ( ), , , . .i n= 1 2 29K
Además, dado que f es positivamente homogénea y convexa, se cumple que
( ) ( )( ) ( )( ) ( )( ) ( ) ( )
f x y f x y f x y
f x f y f x f y
+ = + = +
≤ + = +
2 2
2
12
12
12
12
12
12
,
es decir
( ) ( ) ( )f x y f x f y x y+ ≤ + ∈, , IR ( )n 2 30. .
Por inducción obtenemos que
( ) ( )f x f xii
m
ii
m
= =∑ ∑
≤
1 1
2 31. ,
134
para cada m∈IN y x xm1, ,K ∈IRn .
De (2.28) y (2.30) se sigue que para todo x ∈IRn se verifica
( ) ( )( ) ( ) ( )0 0= = + − ≤ + −f f x x f x f x ,
de donde
( ) ( )− − ≤ ∈f x f x x, IR ( )n 2 32. .
Escojamos ahora un x ∈IRn arbitrario. Entonces, existen λ λ1, ,K n ∈IR tales que
x bi ii
n=
=∑λ
1
.
Por (2.29), (2.31) y (2.32) tenemos que
( ) ( ) ( )
( ) ( )
( ) ( )
λ λ λ
λ
λ λ
i ii
n
i ii
n
i ii
n
i ii
n
i i i ii
n
i
n
f b f b f b f x
f x f b
f b f b
= = =
=
==
∑ ∑ ∑
∑
∑∑
= ≥
=
≥ − − = − −
≥ − − =
1 1 1
1
11
,
es decir
( ) ( ) ( ) ( )λ λi i i ii
n
i
nf b f x f x f b≥ ≥ − − ≥
==∑∑
11
,
de donde ( ) ( )f x f x= − − y por lo tanto f es impar, esto es
( ) ( )f x f x para todo x− = − ∈, IRn .
En consecuencia, para cualesquiera x y, ∈IRn , tenemos que
135
( ) ( )( ) ( ) ( )( )( ) ( )[ ] ( ) ( )[ ]
( ) ( )
f x y f x y f x y f x y
f x f y f x f y
f x f y
+ = − − − = − − − = − − + −
≥ − − + − = − − −
= + ,
lo cual es equivalente a
( ) ( ) ( )f x y f x f y x y+ ≥ + ∈, , IR ( )n 2 33. .
De (2.30) y (2.33) se deduce que f es aditiva :
( ) ( ) ( )f x y f x f y x y+ = + ∈, , IR ( )n. .2 34
Por otra parte, como f es aditiva, tenemos por la generalización al caso de IRn del
teorema 1.8.1 que
( ) ( )f x f x xλ λ= ∈, IRn y λ ∈Q.
Sean λ ∈IR y { }λm m IN∈ una sucesión de números racionales que converge a
λ λ λ λlimm
m m→∞
= ∈ , Q ) . Luego, para cada m ∈IN se verifica que
( ) ( )f x f x xm mλ λ= ∈, IRn .
Dado que f es convexa y IRn es abierto, se tiene que f es continua y en consecuencia
( ) ( )
( ) ( )
f x f lim x lim f x
lim f x f x
mm
mm
mm
λ λ λ
λ λ
=
=
= =
→∞ →∞
→∞.
Es decir : ( ) ( )f x f xλ λ= , para todo λ ∈IR , x ∈IRn .
De esto y de (2.34) se concluye que f es lineal.
136
Ahora estamos en condiciones de probar el teorema principal de esta sección,
el cual presentamos a continuación.
Teorema 2.5.2 : Sean D ⊂ IRn un conjunto convexo y abierto, f D: → IR una
función convexa y x D∈ . Entonces, f es diferenciable en x si y sólo si existen todas
las derivadas parciales de f en x.
Demostración : En la sección 2.4 demostramos que sí f es diferenciable en el punto
x entonces existen todas las derivadas parciales de f en x. Más aún, probamos que
( ) ( )f x y f x y+ = ∇' ; ; para todo y ∈IRn .
Recíprocamente, supongamos que existen todas las derivadas parciales de f en x. Por
el lema 2.5.2 la derivada ( )f x y+' ; existe para cada y ∈IRn y además la función
( )f x+ ⋅' ; es convexa y positivamente homogénea. Debemos probar que
( )f x+ ⋅' ; es lineal. En efecto, sea { }e en1 , ,K la base canónica de IRn . Dado que
existen las derivadas parciales de f en x, tenemos que para cada i n= 1, ,K se
verifica
( ) ( ) ( ) ( )f x e lim xif x e f x f
xi+
↓
+ −= =' ;
λ
λλ
∂∂0
1 ,
y
137
( ) ( )( ) ( )
( )( ) ( )
( )( ) ( )
( ) ( )
( )
f x e lim
lim
lim
lim
x
if x e f x
f x e f x
f x e f x
f x e f x
fx
i
i
i
i
i
+↓
+ − −
↓
+ − −
↓
+ − −−
↑
+ −
− =
=
= −
= −
= −
' ;
.
λ
λλ
λ
λλ
λ
λλ
λ
λλ
∂∂
0
0
0
0
Esto implica que ( ) ( )f x e f x ei i+ += − −' '; ; , para cada i n= 1, ,K . Lo cual es
equivalente a
( ) ( )f x e f x e i ni i+ +− = − =' '; ; , , ,1 K .
De esto se deduce, aplicando el lema 2.5.7, que la función ( )f x+ ⋅' ; : IRn→ IR es
lineal y queda así probado que f es diferenciable en x D∈ , en el sentido de la
definición 2.4.3.
2.6. Caracterización de las Funciones Convexas.
En esta sección caracterizaremos las funciones convexas a partir de sus
propiedades de diferenciabilidad. Veremos en la proposición 2.6.2 el análogo del
teorema 1.3.1 y en el teorema 2.6.2 la generalización a IRn del corolario 1.3.1. El
teorema 2.6.2 presenta una condición necesaria y suficiente para que una función
f D: ⊂ IRn→ IR, donde D es un conjunto convexo y abierto, sea convexa cuando
existen todas las derivadas parciales de segundo orden de la función. Antes del
teorema presentamos previamente la definición de forma cuadrática y una versión de
la regla de la cadena en el lema 2.6.1.
138
Empezamos entonces con la siguiente proposición.
Proposición 2.6.1 : (ver [1], p. 80). Sean D ⊂ IRn un conjunto convexo y abierto, y
f D: → IR una función diferenciable. Entonces f es convexa si y sólo si
( ) ( ) ( ) ( )∇ − ≤ −f x y x f y f x; .2 36
para todo x y D, ∈ .
Demostración : Supongamos que f es convexa y sean ( ]x y D, , ,∈ ∈λ 0 1 .
Entonces
( )( ) ( ) ( ) ( )( )f x y x f x f y f x+ − ≤ + −λ λ ,
de donde
( )( ) ( ) ( ) ( )f x y x f xf y f x
+ − −≤ −
λλ .
Tomando el límite cuando ( )λ λ λ↓ → >0 0 0, , tenemos que
( ) ( ) ( ) ( )f x y x f y f x+ − ≤ −' ; .2 37 .
Como f es diferenciable en el punto x, existen todas las derivadas parciales de f en x
y según la ecuación (2.7) se verifica
( ) ( )f x y x f x y x+ − = ∇ −' ; ; .
De esto y de la desigualdad (2.37) obtenemos
( ) ( ) ( ) ( )∇ − ≤ −f x y x f y f x; .2 38
para todo x y D, ∈ .
139
Recíprocamente, supongamos que la relación (2.38) es cierta para todo x y D, ∈ y
sea [ ]λ ∈ 0 1, . Entonces :
Sustituyendo en (2.38) a x por ( ) ( )x y x y x D+ − = + − ∈λ λ λ1 se verifica
( )( ) ( )( ) ( ) ( )( ) ( )∇ + − − − ≤ − + −f x y x y x f y f x y xλ λ λ; .1 2 39 .
Sustituyendo, también en (2.38), a y por x, y a x por ( )x y x+ −λ se cumple :
( )( ) ( ) ( ) ( )( ) ( )∇ + − − − ≤ − + −f x y x y x f x f x y xλ λ λ; .2 40 .
Multiplicando (2.39) por λ y (2.40) por ( )1− λ :
( )( ) ( )( ) ( ) ( )( )( ) ( )
( )( ) ( )( ) ( ) ( ) ( )( )( ) ( )
∇ + − − − ≤ − + −
∇ + − − − − ≤ − − + −
f x y x y x f y f x y x
f x y x y x f x f x y x
λ λ λ λ λ
λ λ λ λ λ
; .
; .
1 2 41
1 1 2 42
Sumando (2.41) y (2.42) :
( ) ( )( )( ) ( ) ( ) ( )( )( )0 1≤ − + − + − − + −λ λ λ λf y f x y x f x f x y x .
Luego
( )( ) ( ) ( ) ( )( )f x y x f x f y f x+ − ≤ + −λ λ
para todo x y D, ∈ y [ ]λ ∈ 0 1, , por lo tanto se concluye que f es convexa.
Presentamos a continuación el teorema del valor medio del cálculo diferencial,
el cual nos será útil en la demostración de la proposición 2.6.2.
Teorema 2.6.1 : (del valor medio). Sean D ⊂ IRn un conjunto abierto, f D: → IR
una función diferenciable y x y D, ∈ . Entonces,
( ) ( ) ( )( )f y f x f x y x y x− = ∇ + − −λ ;
140
para algún ( )λ ∈ 0 1, .
Demostración : Para el caso n = 2 se pueden consultar : [4], p. 95 o [7], p. 154.
Sin embargo, la demostración se puede generalizar para n > 2.
Cabe destacar aquí que en el caso n = 1 se tiene
( ) ( ) ( )( )( )( )f y f x f x y x y x− = + − −' λ
de donde
( ) ( ) ( )( )f y f x
y xf x y x y x
−− = + − ≠' ,λ .
Como el punto ( )x y x+ −λ está entre x e y, tenemos entonces el teorema del valor
medio del cálculo diferencial para funciones de una variable, el cual ya tuvimos la
oportunidad de usar en el capítulo 1.
Estamos ahora en condiciones de demostrar la proposición siguiente.
Proposición 2.6.2 : (ver [1], p. 81). Sean D ⊂ IRn un conjunto convexo y abierto, y
f D: → IR una función diferenciable. Entonces f es convexa si y sólo si
( ) ( ) ( )∇ − ∇ − ≥f y f x y x; .0 2 43
para todo x y D, ∈ .
Demostración : Supongamos que f es convexa y sean x y D, ∈ . Entonces, por la
proposición 2.6.1, tenemos :
( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
∇ − ≤ −
∇ − ≤ −
f x y x f y f x
f y x y f x f y
; .
; . .
2 44
2 45
Sumando las relaciones (2.44) y (2.45) y utilizando las propiedades del producto
escalar, se verifican :
141
( ) ( ) ( )
( ) ( )
( ) ( )
∇ − + ∇ − − ≤
∇ − + −∇ − ≤
∇ −∇ − ≤
f x y x f y y x
f x y x f y y x
f x f y y x
; ;
; ;
;
0
0
0
y finalmente
( ) ( ) ( )∇ −∇ − ≥f y f x y x; .0 2 46
para todo x y D, ∈ .
Recíprocamente, supongamos que se cumple la desigualdad (2.46) para todo
x y D, ∈ . Como f es diferenciable, tenemos por el teorema del valor medio que
( )( ) ( ) ( ) ( )∇ + − − = −f x y x y x f y f xλ ; .2 47
para algún ( )λ ∈ 0 1, .
Sí en (2.46) sustituimos ay por ( )x y x D+ − ∈λ tenemos :
( )( ) ( ) ( )∇ + − −∇ − ≥f x y x f x y xλ λ; 0
de donde
( )( ) ( )∇ + − −∇ − ≥f x y x f x y xλ ; 0 ,
luego
( )( ) ( )∇ + − − ≥ ∇ −f x y x y x f x y xλ ; ;
y de acuerdo con (2.47) se cumple
( ) ( ) ( )f y f x f x y x− ≥ ∇ −; ,
para todo x y D, ∈ , por lo tanto, aplicando la proposición 2.6.1, se concluye que f es
convexa.
142
Continuamos con la definición de forma cuadrática, la cual nos será muy útil
en la demostración del teorema 2.6.2.
Definición 2.6.1 : (Forma cuadrática). Dados un vector
( )x x x xnt= 1 2, , ,K
y una matriz
A
a a a
a a a
a a a
n
n
n n n n
=
11 12 1
21 22 2
1 2
K
K
M M M
K
la función
Q ( )x x A x a x xti j i j
j
n
i
n= =
==∑∑
11
se conoce como forma cuadrática.
La forma cuadrática Q se dice que es
1. Definida positiva si Q( )x > 0 para cada x ≠ ∈0 IRn .
2. Semidefinida positiva si Q( )x ≥ 0 para cada x ∈IRn y existe x ≠ 0 tal que
Q( )x = ∈0 IR.
A continuación presentamos como lema una versión de la regla de la cadena.
Lema 2.6.1 : (Regla de la cadena). Sean g I: ⊂ IR→ IRn y f D: ⊂ IRn→ IR
funciones, con ( )g I D⊂ . Supongamos que la función g es derivable en t Io ∈ y
143
además que la función f es diferenciable Fréchet en ( )x g to o= , entonces la función
compuesta h f g= o es derivable en to y además esta derivada se calcula mediante la
formula :
( ) ( ) ( )h t f x g to o o' ; '= ∇ .
Demostración : (ver [7], p. 253).
Para concluir presentamos el teorema principal de esta sección.
Teorema 2.6.2 : (ver [11], p. 176). Sean D ⊂ IRn un conjunto convexo y abierto, y
f D: → IR una función dos veces diferenciable. La función f es convexa si y sólo si
la matriz Hessiana
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
∂∂ ∂
∂∂ ∂
∂∂ ∂
∂∂ ∂
∂∂ ∂
∂∂ ∂
∂∂ ∂
∂∂ ∂
∂∂ ∂
2
1 1
2
1 2
2
1
2
2 1
2
2 2
2
2
2
1
2
2
2
fx x
fx x
fx x
fx x
fx x
fx x
fx x
fx x
fx x
x x x
x x x
x x x
n
n
n n n n
L
L
M M M
L
es semidefinida positiva para cada x D∈ .
Demostración : Para cada x D∈ e y ∈IRn consideremos el intervalo
{Jx y = ∈λ IR }: x y D+ ∈λ
y la función h Jx y x y: → IR definida por
( ) ( ) ( )h f x yx y λ λ= + 2 48. .
Obsérvese que hx y es dos veces diferenciable en Jx y porque f lo es en x y+ λ .
Además, f es convexa en D si y sólo si hx y es convexa en Jx y para cada
144
x D y∈ ∈, IRn . En efecto, de acuerdo con la proposición 2.1.3, sí f es convexa
entonces hx y es convexa para cada x D y∈ ∈, IRn . Recíprocamente, supongamos
que hx y es convexa para cada x D y∈ ∈, IRn y sean [ ]u v D, , ,∈ ∈µ 0 1 .
Tomemos
x yu v v u= =+ −2 2
, .
Entonces
x y u D x y v D− = ∈ + = ∈,
y por lo tanto − ∈1 1, .Jx y
Como hx y es convexa se verifica
( ) ( )( ) ( ) ( ) ( )h h hx y x y x yµ µ µ µ− + − ⋅ ≤ − + −1 1 1 1 1 1 ,
es decir, de acuerdo con (2.48)
( ) ( )( )( ) ( ) ( ) ( )f x y f x y f x y+ − + − ⋅ ≤ − + − +µ µ µ µ1 1 1 1
lo cual es equivalente a
( ) ( )( )( ) ( ) ( ) ( )f x y x y f x y f x yµ µ µ µ− + − + ≤ − + − +1 1 ,
esto es
( )( ) ( ) ( ) ( )f u v f u f vµ µ µ µ+ − ≤ + −1 1
para cualesquiera [ ]u v D, , ,∈ ∈µ 0 1 , de donde resulta que f es convexa.
Por otra parte, de acuerdo con el corolario 1.3.1, la función hx y es convexa si y sólo
si ′′ ≥hx y 0 en Jx y . Por lo tanto, f es convexa si y sólo si
145
( )dd
f x y para cada x D2
2 0λ
λ+ ≥ ∈ e y ∈IRn ,
y para cada λ en el correspondiente intervalo Jx y .
En otras palabras, f es convexa si y sólo si
( )dd x y uf x y para cada u D
2
2 0λ λλ+ ≥ ∈+ = , e y ∈IRn.
Consideremos la función g Jx y x y: → IRn definida por
( )g x yx y λ λ= + .
Entonces h f gx y x y= o , esto es
( ) ( )( )h f g para todo Jx y x y x yλ λ λ= ∈, .
Luego, por el lema 2.6.1, tenemos que
( ) ( )( ) ( )dd x y x y x yh f g gλ λ λ λ= ∇ ; '
o equivalentemente
( ) ( )dd x yh f x y yλ λ λ= ∇ + ;
es decir ;
( ) ( )
( ) ( ) ( )
dd x y
fx
fx n
h f u y
u y u yn
λ
∂∂
∂∂
λ = ∇
= + +
;
.1
1 2 49L
donde ( )y y yn= ∈1, ,K IRn .
Luego, de (2.49) tenemos que
146
( ) ( ) ( )
( ) ( )
( ) ( )
( ) ( ) ( )
dd x y
dd
fx
fx n
dd
fx n
dd
fx
fx n
fx
f
x
fx x n
nf
x
h x y y x y y
y x y y x y
y x y y y x y y
y u u y y
y
n
n
n
n
2
21
1
1
2
1
2
2
1
2
1
1
1
1
1 1
λ λ∂∂
∂∂
λ∂∂ λ
∂∂
∂∂
∂∂
∂∂
∂∂ ∂
∂∂
λ λ λ
λ λ
λ λ
= + + + +
=
+ + +
+
= ∇ + + + ∇
+
=
+ +
L
L
L
K K
L
; ;
, , ; , ,
( ) ( ) ( )
( ) ( ) ( ) ( )
∂∂∂
∂∂
∂∂ ∂
∂∂ ∂
∂∂
xf
x n
fx
fx x n
fx x n
fx n
n n
n n n
u u y y
u y u y y u y y u y
, , ; , ,
.
K K
L K L
2
2
2
12
2
1
2
1
2
2
1
12
1 12
= + + + + + +
Lo cual implica que
( ) ( ) ( )dd x y
fx x i j
j
n
i
nh u y y
i j
2
2
2
2 5011
λ∂
∂ ∂λ ===∑∑ .
Pero la condición
( )dd x y x yh J x D y
2
2 0λ
λ λ≥ ∈ ∈ ∈, , , IRn
es equivalente a que la forma cuadrática (2.50) sea no negativa para cada
u D y∈ ∈, IRn , y esto a su vez es equivalente a que la matriz Hessiana
( )∂∂ ∂
2 fx x
n x ni j
x
sea semidefinida positiva para cada x D∈ .
Comentario : Hemos supuesto en el teorema 2.6.2 que la función f es dos veces
diferenciable. Esto significa que f es diferenciable en D y que la función
( )f y+ ⋅' ; es diferenciable en D para cada y ∈IRn . Es decir, la expresión
147
( )f x y+' ; , donde x D∈ , es diferenciable como función de su primer argumento
cualquiera sea y ∈IRn .
2.7. Extremos de Funciones Convexas.
En los problemas de optimización es fundamental determinar los valores
extremos (máximos y mínimos) de funciones a valores reales definidas sobre
subconjuntos arbitrarios de IRn . Este estudio es considerablemente más complicado
en IRn que en el caso de funciones definidas en subconjuntos de IR .
Sin embargo, como el dominio de cualquier función convexa es un conjunto
convexo y además estas funciones tienen una estructura bastante sencilla en lo que
respecta al estudio de valores extremos, la determinación de las condiciones para la
existencia de puntos óptimos se simplifica notablemente.
En el siguiente teorema demostraremos que todo punto de mínimo de una
función convexa es un mínimo global.
Teorema 2.7.1 : (ver [8], p. 130). Sean D ⊂ IRn un conjunto convexo y f D: → IR
una función convexa. Si f alcanza un mínimo en x D∈ , entonces ( )f x es un
mínimo global. Además, el conjunto V sobre el cual f alcanza su mínimo es
convexo, y si f es estrictamente convexa en una vecindad de un mínimo, entonces V
se reduce a un sólo punto.
Demostración : Supongamos que f alcanza un mínimo local en un punto x D∈ .
Sean y D∈ arbitrario y ( ]λ ∈ 0 1, . Para λ suficientemente pequeño el punto
( )1− +λ λx y está suficientemente próximo ax , de tal manera que por alcanzar f
un mínimo local en x y ser convexa se verifica que
148
( ) ( )( ) ( ) ( ) ( ) ( )f x f x y f x f y≤ − + ≤ − +1 1 2 51λ λ λ λ .
de donde
( ) ( )( )0 ≤ −λ f y f x
y en consecuencia
( ) ( )f x f y para todo y D≤ ∈, ,
por lo cual ( )f x es un mínimo global.
Sean ahora m el mínimo de f y V el conjunto de puntos sobre los cuales f
alcanza su mínimo, esto es
( ){ }V x D f x m= ∈ =: .
Si x x V1 2, ∈ y [ ]λ ∈ 0 1, , entonces
( )( ) ( ) ( ) ( )( )
m f x x f x f x
m m m
≤ − + ≤ − +
= − + =
1 1
1
1 2 1 2λ λ λ λ
λ λ .
Es decir
( )( )f x x m1 1 2− + =λ λ
lo cual implica que ( )1 1 2− + ∈λ λx x V y por lo tanto V es convexo.
Por otra parte, si f es estrictamente convexa en una vecindad de un punto x de
mínimo, entonces en (2.51) se tiene
( ) ( ) ( ) ( )f x f x f y< − +1 λ λ
de donde se obtiene inmediatamente
( ) ( )f x f y para todo y D y x< ∈ ≠, , ,
y en conclusión V consiste de un sólo punto, { }V x= .
149
Es importante destacar que el teorema anterior no garantiza la existencia de un
mínimo.
Existen muchas razones por las cuales una función convexa puede no tener mínimo.
Por ejemplo :
1) El dominio D puede no ser cerrado como en el caso de la función ( )f : ,1 2 → IR
definida por ( )f x x= −1.
2) El dominio D puede ser cerrado pero no acotado, como sucede con la función
[ )f : ,1 ∞ → IR definida por ( )f x x= −1.
3) El dominio D puede ser compacto (cerrado y acotado) pero no existir mínimos
debido a discontinuidades de la función, como en el caso de la función
[ ]f : ,1 2 → IR definida por
( ) [ )f x
x si x
si x=
∈
=
−1 1 2
1 2
,
.
El teorema siguiente establece que si una función convexa f es diferenciable
en un punto x del interior de su dominio y además ( )∇ =f x 0 entonces ( )f x es un
mínimo global de f.
Teorema 2.7.2 : (ver [8], p. 131). Sean D ⊂ IRn un conjunto convexo y f D: → IR
una función convexa. Si ( )∇ =f x 0 en un punto x D∈ int , entonces ( )f x es un
mínimo global de f . Si además f es dos veces diferenciable en una vecindad de x y
la matriz Hessiana
∂∂ ∂
2 fx x
n x ni j
150
existe y es definida positiva en esa vecindad, entonces ( )f x es el único mínimo de f
en D.
Demostración : Por la proposición 2.6.1 sabemos que
( ) ( ) ( )f y f x f x y x− ≥ ∇ − =; 0
para todo y D∈ int , lo cual demuestra que ( )f x es un mínimo local y por el teorema
2.7.1 ( )f x también es un mínimo global. Si la matriz Hessiana
( )∂∂ ∂
2 fx x
n x ni j
x
es definida positiva, por la demostración del teorema 2.6.2 se tiene que f es
estrictamente convexa en una vecindad del punto x, y por el teorema 2.7.1 ( )f x es el
único mínimo de la función.
Finalizamos este capítulo con los dos teoremas siguientes relacionados con los
máximos de funciones convexas.
Teorema 2.7.3 : (ver [8], p. 131). Sean D ⊂ IRn un conjunto convexo y f D: → IR
una función convexa. Si f alcanza un máximo global en x D∈ int , entonces f es
constante en D.
Demostración : Supongamos que f alcanza un máximo global en x D∈ int pero no
es constante y sean y D∈ , tal que ( ) ( )f y f x< y λ > 1, tal que
( )z y x y D= + − ∈λ . Despejando x, obtenemos
( )x z y= + −1 11λ λ ,
y por convexidad :
151
( ) ( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
( )
f x f z f y
f x f y
f x f x
f x
≤ + −
≤ + −
< + −
=
1 1
1 1
1 1
1
1
1
λ λ
λ λ
λ λ
.
Es decir
( ) ( )f x f x< ,
lo cual es una contradicción. La contradicción proviene de haber supuesto que f no
es constante. Luego, f es constante en D.
A continuación presentamos el último teorema de este capítulo, el cual
establece que si una función convexa y no constante alcanza un máximo en un punto
xo de su dominio entonces xo pertenece a la frontera de este.
Teorema 2.7.4 : (ver [1], p. 126). Sean D ⊂ IRn un conjunto convexo y f D: → IR
una función convexa que no es constante. Si x Do ∈ es un punto donde f alcanza un
máximo sobre ( ) ( )( )D f x f x para todo x Do ≥ ∈, , entonces ( )x f r Do ∈ .
Demostración : Supongamos que ( )x f r Do ∉ , esto es x Do ∈ int . Como f no es
constante en D, existe x D∈ , tal que ( ) ( )f x f xo< . Puesto que x Do ∈ int , existe
λ > 1, tal que :
( )x x x Do+ − ∈λ int .
Por otra parte :
( )( ) ( ) ( )( )x x x x xo o= + − + − ∈1 1 11 0 1λ λ λλ , , ,
luego
152
( ) ( )( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
( )
f x f x x x f x
f x f x
f x f x
f x
o o
o
o o
o
≤ + − + −
≤ + −
< + −
=
1 1
1 1
1 1
1
1
1
λ λ
λ λ
λ λ
λ
.
Por lo tanto, ( ) ( )f x f xo o< , lo cual es una contradicción. Esta contradicción
proviene de suponer que x Do ∈ int . En conclusión, ( )x f r Do ∈ .
153
Capítulo III
Funciones Convexas Sobre
Espacios Vectoriales Normados. En este capítulo estudiaremos funciones convexas f U L: ⊂ → IR , donde U
es un subconjunto convexo no vacío de un espacio vectorial normado L.
El capítulo lo hemos dividido en cuatro secciones. En la sección 3.1
presentamos la definición analítica de función convexa y algunas de las propiedades
básicas de estas funciones. En la sección 3.2 tratamos la continuidad de funciones
convexas y demostramos que toda función convexa a valores reales definida sobre un
subconjunto convexo y abierto de un espacio vectorial normado es continua si es
acotada superiormente en un entorno de un punto de su dominio. En la sección 3.3
exponemos algunos resultados de carácter general relacionados con la
diferenciabilidad de funciones en espacios normados. Por último, en la sección 3.4,
caracterizamos las funciones convexas a partir de sus propiedades de
diferenciabilidad usando los criterios de la primera y de la segunda derivada.
3.1. Definición y Propiedades Básicas. En la siguiente definición presentamos el concepto de función convexa para
funciones a valores reales definidas en un subconjunto convexo no vacío de un
espacio vectorial.
Definición 3.1.1 : (Función Convexa). Sean U un subconjunto convexo de un
espacio vectorial L y f U: → IR una función. Se dice que f es convexa si y sólo si
( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1
154
para cualesquiera x y U, ∈ y todo [ ]λ ∈ 0 1, .
Comentarios :
1) De manera análoga al caso de funciones f I: ⊂ IR→ IR, donde I es un intervalo,
se demuestra que una función f U L: ⊂ → IR es convexa si y sólo si se verifica
( ) ( )f x f xi ii
n
i ii
nα α
= =∑ ∑
≤
1 1
3 1.
para todo x U i ni ∈ =, , , ;1 K y αi ≥ 0 tales que αii
n=
=∑ 1
1
.
Esta desigualdad se conoce como desigualdad de Jensen.
2) Como estudiaremos la continuidad y la diferenciabilidad de funciones convexas,
en lo sucesivo supondremos que el espacio vectorial L es normado.
3) De manera similar a como se demostró en el capítulo 2 se tiene que si x Uo ∈
entonces la función ( )g U xo: − → IR definida por ( ) ( ) ( )g x f x x f xo o= + − es
convexa si la función f U: → IR es convexa y además f es localmente acotada
(continua, diferenciable, etc.) en xo si y sólo si g es localmente acotada (continua,
diferenciable, etc.) en 0 ∈ L . Por otra parte, la condición ( )g 0 0= permite
simplificar las demostraciones relacionadas con las propiedades de f en el punto
xo .
4) Si U es un subconjunto convexo y abierto de un espacio vectorial L y
f U L: ⊂ → IR es una función convexa, entonces para y L∈ arbitrario la
función ( ) ( )g t f x t y x Uo o= + ∈, , es convexa sobre algún intervalo abierto
( )a b, que contiene al origen, lo cual es una forma de decir que la restricción de
una función convexa a cualquier segmento de recta contenido en su dominio
también es convexa.
155
3.2. Continuidad de Funciones Convexas.
Toda función lineal a valores reales definida sobre un espacio vectorial L es
convexa sobre L. Sin embargo, es conocido del Análisis Funcional que las
transformaciones lineales definidas sobre espacios vectoriales de dimensión infinita
no necesariamente son continuas (ver [17], problema B, p. 61) y por lo tanto una
función convexa a valores reales definida sobre un espacio vectorial arbitrario L, no
necesariamente es continua. Dos direcciones a seguir para garantizar la continuidad de
una función convexa son : 1) dando condiciones suficientes adicionales sobre la
función para que esta sea continua ; 2) imponiendo restricciones sobre el espacio
vectorial L de manera que se garantice la continuidad. Esto último fue lo que hicimos
en el capítulo 2 al considerar las funciones definidas sobre subconjuntos de IRn (un
espacio de dimensión finita). En este capítulo seguiremos la primera dirección, es
decir : daremos las condiciones que debe verificar una función convexa
f U L: ⊂ → IR para que sea continua.
Cabe destacar aquí que el contenido de este capítulo, exceptuando la sección 3.3, se
tomó de [17], Cap. IV, pp. 89-103.
El siguiente teorema es vital para nuestro estudio de la continuidad de
funciones convexas y en el mismo demostramos que toda función convexa acotada
superiormente en un entorno de un punto es localmente acotada sobre su dominio.
Teorema 3.2.1 : Sean U un subconjunto convexo y abierto de un espacio vectorial
normado L y f U: → IR una función convexa. Entonces se verifican :
1) Si f es acotada superiormente en un entorno de un punto de su dominio entonces
es acotada inferiormente en el mismo entorno.
2) Si f es acotada superiormente en un entorno de un punto x Uo ∈ , entonces es
localmente acotada, esto es, cada x U∈ tiene un entorno sobre el cual f es
acotada.
Demostración :
156
1) Sean x Uo ∈ y ( )g U xo: − → IR la función definida por
( ) ( ) ( )g x f x x f xo o= + − .
De acuerdo con el comentario número 3) de la sección 3.1, basta probar que si g
es acotada superiormente en un entorno del cero ( )0 ∈ −U xo entonces es acotada
inferiormente en este mismo entorno.
Supongamos entonces que g es acotada superiormente en un entorno del cero,
luego ; existen M > 0 y ε > 0 tales que para todo ( )x B U xo∈ ⊂ −0, ε se
verifica ( )g x M≤ . Como ( )0 12
12
= + −x x y g es convexa se tiene
( ) ( ) ( )0 0 12
12
= ≤ + −g g x g x
y por lo tanto
( ) ( )g x g x≥ − − .
Ahora bien, ( )x B∈ 0, ε implica que ( )− ∈x B 0, ε pues − = <x x ε y en
consecuencia ( )g x M− ≤ , de donde se deduce que
( ) ( )g x g x M≥ − − ≥ − .
Es decir ( )g x M≥ − para todo ( )x B∈ 0, ε , y así g es acotada inferiormente en
un entorno del cero.
En conclusión : si f es acotada superiormente en un entorno de un punto x Uo ∈
entonces es acotada inferiormente en el mismo entorno.
2) Supongamos que para todo ( )x B∈ 0, ε se cumple que ( )g x M≤ , donde
M > 0 y ε > 0. Demostraremos que g es acotada superiormente en un entorno
de y U xo∈ − , .para cualquier y ≠ 0. En efecto, como U xo− es abierto e
y U xo∈ − , existe ρ > 1 tal que z y U xo= ∈ −ρ . Sea λ ρ= 1 . Entonces
( ) ( ){ }( ) ( )
N v L v x z x B
B z
= ∈ = − + ∈
= − +
: , ,
,
1 0
1 0
λ λ ε
λ ε λ
157
es una bola de centro λ z y radio ( )1− λ ε .
Además, si v N∈ entonces se verifica
( ) ( ) ( ) ( )( ) ( )
( )
g v g x g z
M g z
M g z K
≤ − +
≤ − +
< + =
1
1
λ λ
λ λ
.
Luego, para todo v N∈ se cumple que ( )g v K< y por lo tanto g es acotada
superiormente sobre ( )( )B zλ λ ε, ,1− es decir : g es acotada superiormente en
un entorno de λ z y= , de donde se infiere que f es acotada superiormente en un
entorno de y xo+ . Dado que y U xo∈ − es arbitrario, tenemos que y x Uo+ ∈ es
un punto arbitrario de U y en consecuencia deducimos que f es acotada
superiormente en un entorno de cualquier punto de U y por la parte 1) del
teorema, f es acotada inferiormente en el mismo entorno, de donde se concluye
que f es localmente acotada.
Veamos la definición de lipschitzidad local, la cual será de utilidad en el
siguiente teorema.
Definición 3.2.1 : Sean U un subconjunto abierto de un espacio vectorial normado L
y f U: → IR una función. Se dice que f es localmente Lipschitz si para cada x U∈ ,
existe un entorno ( )B x U, ε ⊂ y una constante ( )K K x= tal que si ( )y z B x, , ,∈ ε
entonces
( ) ( )f y f z K y z− ≤ − .
Como puede observarse de la definición toda función localmente Lipschitz es
continua. En el siguiente teorema demostraremos que toda función convexa acotada
superiormente en un entorno de un punto de su dominio es localmente Lipschitz en
todo su dominio y por lo tanto continua.
158
Teorema 3.2.2 : Sean U un subconjunto convexo y abierto de un espacio vectorial
normado L y f U: → IR una función convexa. Si f es acotada superiormente en un
entorno de un punto de U, entonces f es localmente Lipschitz en U.
Demostración : De acuerdo con el teorema 3.2.1, f es acotada localmente en U,
luego ; dado x Uo ∈ podemos encontrar un entorno ( )B x Uo , 2 ε ⊂ sobre el cual f
es acotada, es decir, tal que para todo ( )x B xo∈ , 2 ε se verifica ( )f x M≤ , donde
M > 0 es un número real.
Demostraremos que f satisface la condición de Lipschitz sobre ( )B xo , .ε
En efecto, supongamos que no se satisface la condición de Lipschitz sobre ( )B xo , ,ε
entonces dada la constante KM= 2ε existen ( )x x B x x xo1 2 1 2, , , ,∈ ≠ε tales que
( ) ( )f x f x x xM
2 12
2 1− > −ε .
Siempre es posible elegir x1 y x2 de forma tal que
( ) ( )f x f x x xM
2 12
2 1− > −ε
ya que x1 y x2 se pueden intercambiar.
Por lo tanto
( ) ( )f x f x
x x
M2 1
2 1
2−−
> ε .
Consideremos α ε=−x x2 1
y tomemos
( )x x x x3 2 2 1= + −α .
Entonces
x x x x3 2 2 1− = − =α ε
y además
159
( )x x x x x x x x x x3 0 2 0 2 1 2 0 2 1 2− = − + − ≤ − + − < + =α α ε ε ε,
luego
( )x B x3 0 2∈ , .ε
Como los puntos x x x1 2 3, , están sobre una misma recta R y f es convexa sobre
R U∩ , por propiedades de las funciones convexas sobre la recta real tenemos que las
pendientes o razones
( ) ( )f y f x
y xx y R U x y
−−
∈ ∩ ≠, , , ,
son crecientes cuando los puntos para los cuales se calculan están ordenados sobre la
recta. Por lo tanto, en este caso podemos escribir
( ) ( ) ( ) ( )f x f x
x x
f x f x
x x
M3 2
3 2
2 1
2 1
2−−
−−
≥ > ε
y dado que x x3 2− = ε , esto implica que
( ) ( )f x f x M3 2 2− > ,
lo cual se contradice con el hecho de que ( )f x M≤ , para todo ( )x B xo∈ , 2 ε ,
pues en este caso debería verificarse que
( ) ( ) ( ) ( )f x f x f x f x M3 2 3 2 2− ≤ + ≤ ,
ya que ( )x x B xo2 3 2, , .∈ ε
La contradicción proviene de haber supuesto que f no satisface la condición de
Lipschitz sobre ( )B xo , ,ε lo cual prueba que f es localmente Lipschitz en U, y
concluye así la demostración.
Finalizamos esta sección con el siguiente corolario sobre la continuidad de una
función convexa.
Corolario 3.2.1 : Sean U un subconjunto convexo y abierto de un espacio vectorial
normado L y f U: → IR una función convexa. Si f es acotada superiormente en
un entorno de un punto de U, entonces f es continua sobre U.
160
Demostración : De acuerdo con el teorema 3.2.2, f es localmente Lipschitz en U y
dado que la condición de Lipschitz implica continuidad se obtiene inmediatamente la
conclusión.
3.3. Diferenciabilidad en Espacios Vectoriales Normados.
A continuación veremos a modo de referencia algunos resultados sobre
diferenciabilidad de funciones que usaremos en la próxima sección. El lector
interesado en los detalles de los aspectos tratados aquí puede remitirse a cualquier
texto que trate la teoría de diferenciación en espacios normados.
Empezamos con la definición de diferencial de una función definida sobre un
conjunto abierto U L⊂ , donde L es un espacio vectorial normado y la función toma
sus valores en otro espacio vectorial normado M.
Definición 3.3.1 : (Diferencial Fréchet). Sean L y M espacios vectoriales
normados, U un subconjunto abierto de ( )L U L⊂ y f U M: → una función.
Se dice que f es diferenciable en x Uo ∈ si existe una transformación lineal
T L M: → tal que para h L∈ , suficientemente pequeño, se verifica
( ) ( ) ( ) ( )f x h f x T h r x ho o o+ − = + , ,
donde
( )r x h
ho M cuando h,
.→ ∈ →0 0
La transformación lineal T es llamada la derivada de f en xo y es
denotada por ( )f xo' . La definición anterior expresa que si f es derivable en un
punto x Uo ∈ entonces ( )f xo' es una transformación lineal de L en M. Esto
significa que si ( )f xo' existe y es continua para todo x Uo ∈ entonces se tiene una
161
función ( )f U Hom L M' : , ,→ donde ( )Hom L M, es el espacio vectorial de las
transformaciones lineales continuas o acotadas de L en M.
Por lo tanto, si x Uo ∈ y ( )f x' 0 es continua, se tiene que
( ) ( )f x Hom L Mo' ,∈ . Además, como ( )f x L Mo' : → es una función, si h L∈
tenemos que ( )( )f x h Mo' ∈ . A este elemento de M se le llama diferencial fuerte (o
diferencial de Fréchet) de la función f en el punto xo .
En lo sucesivo nos interesaremos en el caso donde ( )f xo' es una función
continua para todo x Uo ∈ , es decir ( ) ( )f x Hom L Mo' ,∈ , para todo x Uo ∈ .
La igualdad
( ) ( ) ( )( ) ( )f x h f x f x h r x ho o o o+ − = +' ,
define el “resto” ( )r x h Mo , ∈ cuando existe la diferencial ( )( )f x ho' . La
diferenciabilidad de f en el punto xo nos dice que este resto es un “infinitesimo de
orden superior a h”, es decir que
( )limh
r x h
ho
→=
00
,.
Esto significa, claro está, que dado ε > 0, existe δ > 0 tal que h < δ implica
( )r x h ho , ,≤ ε o lo que es lo mismo
( ) ( ) ( )( )f x h f x f x h ho o o+ − − ≤' ε .
En algunas ocasiones es conveniente escribir la diferenciabilidad de la función
f U L M: ⊂ → en el punto x Uo ∈ del siguiente modo :
( ) ( ) ( )( ) ( ) ( )f x h f x f x h h x ho o o o+ − = +' , .ρ 3 2
donde ( )lim x hh
o→
=0
0ρ , .
162
Para tal efecto, basta tomar ( ) ( )ρ x h r x h ho o, , /= . Esta expresión no tiene
sentido para h = 0. Sin embargo, cuando f es diferenciable en el punto xo , se puede
definir ( )ρ xo , 0 0= y entonces ( )ρ xo , ⋅ es una función continua en h L= ∈0 .
Si f U L M: ⊂ → es diferenciable en el punto x Uo ∈ entonces, para cada
vector h L∈ , se tiene
( )( ) ( )( ) ( ) ( ) ( )f x h ho
f x t h
t
f x t h f x
ttt
r x t h
t ho' ,
' ,= = −
+ −0 0 0
para t ∈IR, t ≠ 0, suficientemente próximo a cero.
Luego :
( )( ) ( ) ( ) ( )f x h limot
f x t h f x
to o' . .=
→
+ −
03 3
Antes de tratar el caso de la segunda derivada presentamos la definición de
aplicación bilineal y algunas consideraciones relacionadas con estas funciones.
Definición 3.3.2 : (Aplicación bilineal). Sean L y M espacios vectoriales y
B L L M: × → una función. Se dice que B es una aplicación bilineal si se cumplen
las siguientes condiciones :
1) para cualesquiera vectores x x x x x x, ' , , , ,' '1 2 1 2 de L y cualesquiera números
α β, se verifican las igualdades :
( ) ( ) ( )
( ) ( ) ( )B x x x B x x B x x
B x x x B x x B x x
α β α β
α β α β
1 2 1 2
1 2 1 2
+ = +
+ = +
, ' , ' , ' ,
, , , ;' ' ' '
2) existe un número positivo K tal que
( ) ( )B x x K x x, ' ' .≤ ⋅ 3 4
para todo x x L, '∈ .
La condición 1) expresa que la aplicación B es lineal respecto a cada uno de
sus dos argumentos y la condición 2) equivale a la continuidad de B respecto a ambos
163
argumentos. El ínfimo de los números K que satisfacen la condición (3.4) se denota
B y recibe el nombre de norma de la aplicación bilineal B. El conjunto de todas las
aplicaciones bilineales B L L M: × → se denota ( )Hom L L M2 × , . Dotamos a
( )Hom L L M2 × , de una estructura de espacio vectorial definiendo f g+ y k f
por
( )( ) ( ) ( )( )( ) ( )
f g x x f x x g x x
k f x x k f x x
+ = +
=
, ' , ' , '
, ' , '
para todo ( )f g Hom L L M, ,∈ ×2 y todo elemento k del cuerpo sobre el cual
están definidos los espacios vectoriales L y M, el cual para nuestro estudio
supondremos que es el cuerpo de los números reales. De esta forma
( )Hom L L M2 × , es un espacio vectorial normado.
Existe un isomorfismo canónico entre
( )Hom L L M2 × , y ( )( )Hom L Hom L M, ,
dado por la aplicación
( ) ( )( )Γ : , , ,Hom L L M Hom L Hom L M2 × →
definida por
( )( )( ) ( )Γ f v w f v w= ,
para todo ( )v w L f Hom L L M, , , .∈ ∈ ×2
En efecto :
1) Γ es una aplicación bien definida.
Sean ( )f g Hom L L M, ,∈ ×2 , entonces si f g= se verifica ( ) ( )Γ Γf g= , ya
que para todo ( ) ( )x y L f x y g x y, , , ,∈ = implica ( )( )( ) ( )( )( )Γ Γf x y g x y= .
2) Γ es lineal.
Sean ( )f g Hom L L M x y L, , , ,∈ × ∈2 y α β, números reales, entonces
164
( )( )( ) ( )( )( ) ( )( )( )( ) ( )( )( )
( ) ( )( ) ( )( )
Γ
Γ Γ
Γ Γ
α β α β
α β
α β
α β
f g x y f g x y
f x y g x y
f x y g x y
f g x y
+ = +
= +
= +
= +
,
, ,
.
Luego
( ) ( ) ( )Γ Γ Γα β α βf g f g+ = + .
3) Γ es inyectiva.
Sea ( )f Hom L L M∈ ×2 , tal que
( ) ( )( )Γ f Hom L Hom L M= ∈0 , , ,
entonces para todo x y L, ∈ se cumple ( )( )( )Γ f x y M= ∈0 , pero entonces
( )f x y M, = ∈0 , para todo ( )x y L L, ∈ × , y por lo tanto f = 0 .
4) Γ es sobreyectiva.
Sea ( )( )g Hom L Hom L M∈ , , , es decir ( )g L Hom L M: ,→ es una
transformación lineal continua.
Sea f L L M: × → la función definida por f T g= o~ , donde las funciones
( )T L Hom L M M: ,× →
y
( )~ : ,g L L L Hom L M× → ×
están definidas por
( ) ( ) ( ) ( )T y h h y para todo y h L Hom L M, , , ,= ∈ ×
y
( ) ( )( )~ , , , , ,g y z z g y para todo y z L= ∈
entonces ~g y T son aplicaciones bilineales, y por lo tanto T go~ es bilineal, es
decir
165
( )T g Hom L L Mo ~ ,∈ ×2
y además
( ) ( )Γ Γf T g g= =o ~ ,
ya que
( )( )( ) ( )( )
( )( )( )( )
( )( )
Γ T g x y T g x y
T g x y
T y g x
g x y
o o~ ~ ,
~ ,
,
=
=
=
=
para todo x y L, .∈
Queda así probado que los espacios
( )Hom L L M2 × , y ( )( )Hom L Hom L M, , son isomorfos.
Ahora estamos en condiciones de tratar el caso de la segunda derivada.
En efecto, supongamos que L y M son espacios vectoriales normados, U L⊂ un
conjunto abierto y f U L M: ⊂ → una función derivable en cada punto de U. Así
tenemos la función derivada
( )f U L Hom L M' : , .⊂ →
Ahora bien, como ( )Hom L M, es el espacio de las transformaciones lineales
continuas ( )T L M Hom L M: , ,→ tiene una estructura de espacio vectorial
normado, considerando la norma
( ){ }T T x x= ≤sup : 1
(ver [8], Ejercicio 1, pp. 285-286).
De esta manera tiene sentido plantearse la posibilidad de que f ' sea derivable de
acuerdo a la definición 3.3.1. En tal caso a esta derivada la denotamos por f ' ' , y si
( )f x' ' es continua para cada x U∈ , entonces f ' ' es una función que asocia a cada
166
x U∈ una transformación lineal continua de ( )( )Hom L Hom L M, , , es decir,
tenemos la función
( )( )f U L Hom L Hom L M' ' : , , .⊂ →
Por otra parte, si x Uo ∈ entonces
( ) ( )( )f x Hom L Hom L Mo' ' , , ,∈
de modo que tiene sentido evaluar ( )f xo' ' en un punto y L∈ y así
( )( ) ( )f x y Hom L Mo' ' ,∈
y podemos ahora evaluar la transformación lineal ( )( )f x y L Mo' ' : → en otro punto
z L∈ obteniendo que
( )( )( )f x y z Mo' ' ∈
y este elemento de M depende linealmente de los dos vectores y z L, ∈ . Finalmente,
como los espacios ( )( )Hom L Hom L M, , y ( )Hom L L M2 × , son isomorfos,
podemos identificar la función ( )f xo' ' con un elemento de ( )Hom L L M2 × , y
pensar la función ( )f xo' ' como una aplicación bilineal ( )f x L L Mo' ' : .× →
Para concluir esta parte, tenemos en particular que si
M = IR y B L L: × → IR es una aplicación bilineal, esta recibe el nombre de
forma bilineal. Por razones muy diversas estamos interesados en las formas
bilineales simétricas. Se dice que una forma bilineal B L L: × → IR es simétrica si
( ) ( )B h k B k h, ,= para todo h k L, ∈ . Además, tal aplicación es definida positiva
(definida no negativa) si para todo h L∈ , no nulo, ( ) ( )( )B h h B h h, , .> ≥0 0
En el siguiente teorema exponemos la regla de la cadena. Aunque esta sección
es principalmente de referencia, presentamos la demostración del teorema debido a su
simplicidad e importancia.
167
Teorema 3.3.1 : (ver [7], p. 257 o [17], p. 66). (Regla de la cadena). Sean
L M, y N espacios vectoriales normados, U y V subconjuntos abiertos de
L y M respectivamente, f U L M: ⊂ → una función diferenciable en un punto
x Uo ∈ , con ( )f U V⊂ , y g V M N: ⊂ → una función diferenciable en el
punto ( )y f x Vo o= ∈ . Entonces la función compuesta g f U No : → es
diferenciable en el punto xo y
( ) ( ) ( ) ( )g f x g y f xo o oo o' ' ' .=
De modo abreviado : la derivada de la función compuesta es la compuesta de las
derivadas.
Demostración : Como f es diferenciable en el punto x Uo ∈ y g es diferenciable
en el punto ( )y f x Vo o= ∈ , tenemos que para h L∈ y k M∈ suficientemente
pequeños, se verifican
( ) ( ) ( ) ( )( ) ( ) ( ) ( )
f x h f x f x h h x h
g y k g y g y k k y k
o o o o
o o o o
+ = + ⋅ + ⋅
+ = + ⋅ + ⋅
' , ,
' , ,
ρ
σ
con ( )lim x hh
o→
=0
0ρ , y ( )lim y kk
o→
=0
0σ , .
Entonces
( )( ) ( ) ( ) ( )( )g f x h g f x f x h h x ho o o oo + = + ⋅ + ⋅' , .ρ
Sea
( ) ( )k f x h h x ho o= ⋅ + ⋅' , .ρ
De la linealidad de ( )g yo' obtenemos
( )( ) ( )( ) ( )
( ) ( ) ( ) ( ) ( ) ( )
( )( ) ( ) ( )[ ] ( )
g f x h g f x h g y k
g y g y f x h g y x h h y k k
g f x g y f x h h x h
o o o
o o o o o o
o o o o
o
o o
+ = + = +
= + ⋅ ⋅ + ⋅ ⋅ + ⋅
= + ⋅ + ⋅
' ' ' , ,
' ' ,
ρ σ
τ
168
donde
( ) ( ) ( ) ( ) ( ) ( )τ ρ σ ρx h g y x h y k f x x ho o o o ohh o, ' , , ' , .= ⋅ + ⋅ ⋅ +
Si h → 0 entonces k → 0 y además ( )f xohh
' ⋅ está acotada, por lo cual
( )lim x hh
o→
=0
0τ ,
y en consecuencia ( ) ( ) ( ) ( )g f x g y f xo o oo o' ' ' ,= concluyendo así la demostración.
Cuando los espacios L M, y N son de dimensiones finitas las
transformaciones lineales ( )g yo' y ( )f xo' se representan por matrices y la regla de
la cadena nos provee de la transformación lineal ( ) ( )g f x L Noo ' : → como un
producto de matrices :
( ) ( )[ ] ( )[ ] ( )[ ]g f x g y f xo o oo ' ' ' .=
Comentario : En Análisis Funcional se acostumbra cuando se tiene una
transformación lineal T L M: → , donde L y M son espacios vectoriales, usar la
notación Tx en lugar de ( )T x para representar el elemento de M que corresponde al
vector x L∈ . Aquí, en la demostración del teorema 3.3.1, hemos utilizado la notación
T x⋅ en vez de Tx y la misma no debe dar lugar a confusión si se lee en su contexto.
Consideremos ahora una función dos veces continuamente diferenciable
f U L: ⊂ → IR, donde U es un subconjunto abierto de un espacio vectorial normado
L. Luego, existe la derivada de f y es una función f U Hom' : → (L, IR ) y en
consecuencia, si x U∈ tenemos una función lineal ( )f x L' : → IR . Sea
g I: ⊂ IR→ L , donde I es un intervalo abierto, la función definida por
( )g t x t ho= + , con x U h Lo ∈ ∈, y x t h Uo + ∈ cada vez que t I∈ . Como g
es diferenciable, existe la función derivada g I Hom' : → (IR, L) y si t I∈ se tiene
una función lineal ( )g t' : IR→ L . Además, si s∈IR se verifica que
169
( )( ) ( ) ( )
( ) ( )
g t s lim
lim
lim sh
g t s g t
x t s h x t h
s h
o o
'
.
=
=
= =
→
+ −
→
+ + − +
→
λ
λλ
λ
λλ
λ
λλ
0
0
0
Es decir
( )( )g t s sh para todo t I s' , ,= ∈ ∈IR .
Obsérvese que esta es una función lineal de s .
Sea φ = ⊂f g Io : IR→ IR . Dado que f y g son derivables y además f ' es
continua en ( )g t existe la derivada de φ y es una función φ ' : I Hom→ (IR, IR ) por
lo cual si t I∈ tenemos una función lineal ( )φ ' :t IR→ IR . Aplicando la regla de la
cadena a la función φ se verifica que
( ) ( )( ) ( ) ( ) ( )φ ' ' ' ' 't f g t g t f x t h g to= = +o o
y por ser esta una función lineal de IR en IR tiene sentido evaluarla en un punto
s∈IR arbitrario de tal manera que
( )( ) ( ) ( )( ) ( )
( ) ( )( )( ) ( )( )
φ ' ' '
' ' ' .
t s f x t h g t s
f x t h g t s f x t h sh
o
o o
= +
= + = +
o
Además, como la función ( )f x t h Lo' :+ → IR es una transformación lineal se
verifica
( )( ) ( )( ) ( )φ ' ' .t s s f x t h ho= + 3 5
y dado que ( )φ ' :t IR→ IR también es una transformación lineal, existe una matriz
1 1× , es decir un número real a, tal que
( )[ ] [ ]φ ' ,t a a= =
donde hemos identificado la matriz [ ]a 1 1× con el número real a, y así
( )( ) [ ]φ ' .t s a s a s= = ⋅
170
Comparando esta última expresión con la igualdad (3.5), vemos que el número a ∈IR
es precisamente el número real ( )( )f x t h ho' ,+ de modo que
( )[ ] ( )( )[ ]φ ' 't f x t h ho= +
o equivalentemente
( ) ( )( ) ( )φ ' ' .t f x t h ho= + 3 6 .
Aplicando nuevamente la regla de la cadena a la función φ ' concluimos que
( ) ( )( ) ( )φ ' ' ' ' , . .t f x t h h ho= + 3 7
Ahora estamos en condiciones de abordar el teorema final de esta sección, el
cual presentamos a continuación.
Teorema 3.3.2 : (ver [17], p. 70). Sean L un espacio vectorial normado, U un
subconjunto convexo y abierto de L , y f U: → IR una función continuamente
diferenciable. Si ( )f x' ' existe en cada punto de U, entonces para cualesquiera
x x Uo, ,∈ existe un ( )s∈ 0 1, tal que
( ) ( ) ( )( ) ( )( )f x f x f x h f x sh h ho o o= + + +' ' ' , ,12
donde h x x Lo= − ∈ .
Demostración : Dados x x Uo, ,∈ consideremos un intervalo abierto ( )a b, tal que
[ ] ( )0 1, ,⊂ a b y la función ( )φ : ,a b → IR, definida por
( ) ( )φ t f x t ho= +
con x t h Uo + ∈ cada vez que ( )t a b∈ , y para h x x Lo= − ∈ . Aplicando dos veces
la regla de la cadena, se tiene según las igualdades (3.6) y (3.7) que
( ) ( )( )φ ' 't f x t h ho= +
y
( ) ( )( )φ ' ' ' ' , .t f x t h h ho= +
171
De acuerdo con el desarrollo en serie de Taylor de orden 2 para funciones de una
variable, tenemos que para todo ( )t a b t∈ >, , 0, existe ( )s t∈ 0, tal que
( ) ( ) ( ) ( )φ φ φ φt t s t= + +0 0 12
2' ' ' .
Haciendo las sustituciones correspondientes nos queda
( ) ( ) ( )( ) ( )( )f x t h f x f x t h f x sh t h t ho o o o+ = + + +' ' ' ,12
que para t = 1 equivale al resultado buscado.
3.4. Caracterización de las Funciones Convexas.
Con esta sección finalizamos el último capítulo de este trabajo exponiendo
tres teoremas relacionados con la diferenciabilidad de funciones convexas que
generalizan los resultados sobre diferenciabilidad de funciones convexas
f I: ⊂ IR→ IR., estudiados en el primer capítulo.
El siguiente teorema es la generalización a espacios normados de la
proposición 2.6.1.
Teorema 3.4.1 : (ver [17], p. 98). Sean L un espacio vectorial normado, U un
subconjunto convexo y abierto de L y f U: → IR una función. Si f es convexa
y diferenciable en un punto x Uo ∈ , entonces para todo x U∈ , se verifica
( ) ( ) ( )( ) ( )f x f x f x x xo o o− ≥ −' . .3 8
Si f es diferenciable en todo punto de U, entonces f es convexa si y sólo si la
desigualdad (3.8) es válida para todo x x Uo, ∈ . Además, f es estrictamente
convexa si y sólo si la desigualdad es estricta.
Demostración : Supongamos que f es convexa y diferenciable en x Uo ∈ , entonces
para todo ( )t ∈ 0 1, y x U∈ ,
172
( )( ) ( )( )( ) ( ) ( )
( ) ( ) ( )( )
f x t x x f t x t x
t f x t f x
f x t f x f x
o o o
o
o o
+ − = − +
≤ − +
= + −
1
1
.
Haciendo h x xo= − , obtenemos
( ) ( ) ( ) ( )( ) ( )f x t h f x t f x h f xo o o o+ − ≤ + − 3 9. .
Restando ( )( )f x t ho' a ambos lados de la desigualdad y dividiendo por t, se obtiene
( ) ( ) ( ) ( ) ( ) ( ) ( )( )f x t h f x f x t h
t o o oo o o f x h f x f x h+ − −
≤ + − −'
' .
Es decir, de acuerdo con la definición de diferenciabilidad (ecuación (3.2)), se tiene :
( ) ( ) ( ) ( )( )t h x t h
t o o oo f x h f x f x h
⋅≤ + − −
ρ ,'
y dado que ( )t ∈ 0 1, se cumple que
( ) ( ) ( ) ( )( )h x t h f x h f x f x ho o o o⋅ ≤ + − −ρ , ' .
Cuando ( )t t t↓ → >0 0 0, , el lado izquierdo tiende a cero mientras que el lado
derecho, siendo independiente de t, permanece constante. Luego
( ) ( ) ( )( )0 ≤ + − −f x h f x f x ho o o' ,
y en consecuencia
( ) ( ) ( )( )f x h f x f x ho o o+ − ≥ '
que es precisamente la desigualdad (3.8).
Además, si f es estrictamente convexa, (3.9) es una desigualdad estricta y usando la
desigualdad (3.8) ya demostrada, obtenemos de (3.9), con la desigualdad estricta,
que :
( ) ( )( ) ( ) ( )
( )( ) ( )( )t f x h f x f x t h f x
f x t h por
o o o o
o
+ − > + −
≥ ' . .3 8
Dividiendo por ( )t ∈ 0 1, nos queda la desigualdad estricta
173
( ) ( ) ( )( )f x h f x f x ho o o+ − > ' .
Supongamos ahora que f es diferenciable en todo punto de U y satisface la
desigualdad (3.8). Dados x x U1 2, ∈ y ( )t ∈ 0 1, , sea ( )x t x t xo = + −1 21 .
Como ( ) ( )( )t x x t x x Lo o1 21 0− + − − = ∈ y ( )( )f xo' ,0 0= podemos escribir
( ) ( ) ( ) ( ) ( )( )( )f x f x f x t x x t x xo o o o o= + − + − −' 1 21
y usando la linealidad de ( )f xo' tenemos
( ) ( ) ( )( ) ( ) ( )( )
( ) ( )( )( )( ) ( ) ( )( )( ) ( )
f x f x t f x x x t f x x x
t f x f x x x
t f x f x x x
o o o o o o
o o o
o o o
= + − + − −
= + −
+ − + −
' '
'
' . .
1 2
1
2
1
1 3 10
Ahora bien, de acuerdo con la desigualdad (3.8) se verifican
( ) ( )( ) ( ) ( )f x f x x x f xo o o+ − ≤' .1 1 3 11
y
( ) ( )( ) ( ) ( )f x f x x x f xo o o+ − ≤' .2 2 3 12
Sustituyendo (3.11) y (3.12) en (3.10) nos queda :
( ) ( ) ( ) ( )f x t f x t f xo ≤ + −1 21 .
Esto es,
( )( ) ( ) ( ) ( ) ( )f t x t x t f x t f x1 2 1 21 1 3 13+ − ≤ + − .
para todo ( )t ∈ 0 1, y x x U1 2, ∈ . Por lo tanto, f es convexa cuando es
diferenciable y se satisface (3.8). Además, si (3.8) es una desigualdad estricta, la
desigualdad (3.13) también es estricta y así f es estrictamente convexa.
La siguiente definición será de utilidad para demostrar que toda función
convexa definida en un subconjunto convexo y abierto de un espacio normado tiene
derivada monótona creciente.
174
Definición 3.4.1 : Sean L un espacio vectorial normado, U un subconjunto abierto de
L y f U: → IR una función diferenciable. Se dice que f ' es monótona
creciente si
( ) ( )[ ][ ]f x f y x y' ' ,− − ≥ 0
para todo x y U, ∈ . Si la desigualdad es estricta para x y≠ , se dice que f ' es
estrictamente monótona creciente.
El teorema siguiente es una generalización del teorema 1.3.1 y en el mismo se
indica que una función diferenciable sobre un conjunto convexo y abierto es convexa
si y sólo si su derivada f ' es monótona creciente.
Teorema 3.4.2 : (ver [17], p. 99). Sean L un espacio vectorial normado, U un
subconjunto convexo y abierto de L y f U: → IR una función continua y
diferenciable en todo punto de U. Entonces, f es convexa (estrictamente convexa) si
y sólo si la derivada f ' es monótona (estrictamente monótona) creciente sobre U.
Demostración : Supongamos que f es convexa. Como f es diferenciable, se tiene,
de acuerdo con el teorema 3.4.1, que para cualesquiera x y U, ∈ se verifican
( ) ( ) ( )( )( ) ( ) ( )( )
f x f y f y x y
f y f x f x y x
− ≥ −
− ≥ −
'
' .
Sumando lado a lado las desigualdades anteriores tenemos
( )( ) ( )( )( )( ) ( )( )
( ) ( )[ ] [ ]
0 ≥ − + −
= − − −
= − −
f y x y f x y x
f x y x f y y x
f x f y y x
' '
' '
' ' ,
de donde
( ) ( )[ ][ ] ( )f x f y x y' ' .− − ≥ 0 3 14
175
y por lo tanto f ' es monótona creciente. Además, la desigualdad (3.14) es estricta
cuando f es estrictamente convexa.
Recíprocamente, supongamos que la derivada f ' es monótona creciente.
Sean x y U, ∈ y [ ]φ : ,0 1 → IR la función definida por
( ) ( )( )φ λ λ λ= + −f x y1 . Para 0 11 2< < <λ λ , sean
( ) ( )u x y u x y1 1 1 2 2 21 1= + − = + −λ λ λ λ, .
Entonces, ( )( )u u x y2 1 2 1− = − −λ λ . Luego
( ) ( )[ ][ ]( ) ( ) ( )[ ][ ]
0 2 1 2 1
2 1 2 1
≤ − −
= − − −
f u f u u u
f u f u x y
' '
' ' ,λ λ
es decir
( ) ( )[ ][ ]0 2 1≤ − −f u f u x y' ' ,
de donde
( )( ) ( )( )f u x y f u x y' ' .1 2− ≤ −
Aplicando la regla de la cadena a la función φ obtenemos
( ) ( )( ) ( )
( )( ) ( )( )
( )( ) ( )
( )
φ λ λ λ
λ λ
φ λ
' '
' '
'
' .
1 1 1
1 2
2 2
2
1
1
= + − −
= − ≤ −
= + − −
=
f x y x y
f u x y f u x y
f x y x y
Esto es,
( ) ( )φ λ φ λ' ' ,1 2≤
para todo ( )λ λ λ λ1 2 1 2 0 1< ∈, , , .
En consecuencia, φ es convexa en el intervalo ( )0 1, (estrictamente convexa si la
derivada f ' es estrictamente monótona creciente).
176
Como f es continua se tiene que φ es continua en 0 y en 1 y por lo tanto convexa en
el intervalo [ ]0 1, , por lo cual podemos escribir
( )( ) ( ) ( ) ( )( )( ) ( ) ( )( ) ( ) ( )
f x y
f x f y
λ λ φ λ φ λ λ
λ φ λ φ
λ λ
+ − = = + −
≤ + −
= + −
1 1 1 0
1 1 0
1 ,
para todo [ ]λ ∈ ∈0 1, , , .x y U
En conclusión : f es convexa cuando la derivada f ' es monótona creciente y es
estrictamente convexa si f ' es estrictamente monótona creciente.
Hemos caracterizado las funciones convexas en términos de la primera
derivada. En el próximo y último teorema del presente trabajo, caracterizaremos las
funciones en términos de la segunda derivada.
Teorema 3.4.3 : (ver [17], pp. 100-101). Sean L un espacio vectorial normado, U un
subconjunto convexo y abierto de L y f U: → IR una función continuamente
diferenciable que tiene segunda derivada en cada punto de U. Entonces f es convexa
si y sólo si ( )f x' ' es definida no negativa para cada x U∈ . Además, si ( )f x' ' es
definida positiva sobre U, entonces f es estrictamente convexa.
Demostración : De acuerdo con el teorema 3.3.2, para cualesquiera x x Uo, ∈ ,
existe ( )s∈ 0 1, tal que
( ) ( ) ( )( ) ( )( )f x f x f x h f x sh h ho o o= + + +' ' ' , ,12
donde h x xo= − . Supongamos que ( )f x sho' ' + es definida no negativa. Entonces
es inmediato que
( ) ( ) ( )( ) ( )f x f x f x x xo o o≥ + −' .3 15
177
y aplicando el teorema 3.4.1 concluimos que f es convexa. Además, si ( )f x sho' ' +
es definida positiva entonces la desigualdad (3.15) es estricta y nuevamente aplicando
el teorema 3.4.1 obtenemos que f es estrictamente convexa.
Recíprocamente, si f es convexa entonces la función ( )g a bx : , → IR
definida por
( ) ( )g t f x t hx = + ,
para todo x U h L∈ ∈, fijo pero arbitrario, y con su dominio tal que x t h U+ ∈ si
y sólo si ( )t a b∈ , , es convexa. Aplicando la regla de la cadena tenemos
( ) ( )( )
( ) ( )( )
g t f x t h h
g t f x t h h h
x
x
'
"
'
' ' , .
= +
= +
Como gx es convexa, se verifica para todo ( )t a b∈ , que ( )g tx" .≥ 0 En particular
( )gx" ,0 0≥ luego ( )( )f x h h' ' , ≥ 0 . Dado que h es arbitrario, se concluye que
( )f x' ' es definida no negativa para cada x U∈ .
178
BIBLIOGRAFIA
[1] Abreu J., Monagas O., Ortíz J. R., Rivas S., Introducción a la teoría de la
optimización, tomo I, Universidad Nacional Abierta, Caracas, 1985.
[2] Bernstein F., Doetsch G., Zur Theorie der Konvexen Funktionen, Math. Ann. 76
(1915), 514-526.
[3] Blumberg H., On convex functions, Trans. Amer. Math. Soc. 29 (1919), 40-44.
[4] Courant R., John F., Introducción al cálculo y al análisis matemático, Vols. I y
II, Editorial Limusa, S.A., México 1984.
[5] Egleston H. G., Convexity, Cambridge University Press, London, 1966.
[6] González J. S., Cálculo II, Universidad Nacional Abierta, Caracas, 1989.
[7] González J. S., Cálculo III, Universidad Nacional Abierta, Caracas, 1992.
[8] González J., Ortega J., Cálculo V (Análisis Numérico), Universidad Nacional
Abierta, Caracas, 1984.
[9] Jensen J. L. W. V., Om Konvekse funktioner og uligheder imellem
middelvaerdier, Nyt. Tidsskrift for Mathematik 16 B (1905), 49-69.
179
[10] Jensen J. L. W. V., Sur les functions convexes et les inégalités entre les valeurs
moyennes, Acta Math. 30 (1906), 179-193.
[11] Kuczma M., An introduction to the theory of functional equations and
inequalities, Uniwersytet Slaski, Warzawa-Kraków-Katowice, 1985.
[12] Lipschutz S., Algebra Lineal, Serie de compendios Schaum, Libros McGraw-
Hill, México, 1971.
[13] Lipschutz S., Topología General, Serie de compendios Schaum, Libros
McGraw-Hill, México, 1978.
[14] Mohr E., Beitrag zur Theorie der Konvexen Funktionen, Math. Nachr. 8 (1952),
133-148.
[15] Orellana M., Torres E., Geometría, tomos I y II, Universidad Nacional Abierta,
Caracas, 1988.
[16] Pecarié J. E., Proschan F., Tong Y. L., Convex functions, partial orderings,
and statistical aplications, Academic Press, New York, 1992.
[17] Roberts A. W., Varberg D. E., Convex functions, Academic Press, New York,
1973.