convexas completo

REPUBLICA DE VENEZUELA

UNIVERSIDAD NACIONAL ABIERTA

CENTRO LOCAL ZULIA

FUNCIONES CONVEXAS

TRABAJO ESPECIAL DE GRADO PARA OPTAR AL TITULO DE LICENCIADO EN

MATEMÁTICA MENCION ANÁLISIS NUMÉRICO.

Realizado por :

Hernan Rafael Romero

C.I. : 5.803.158

MARACAIBO, DICIEMBRE DE 1.998

ii

APROBACIÓN DE LOS TUTORES

En nuestra condición de tutores del Trabajo de Grado presentado por el ciudadano

Hernan Rafael Romero para optar al Titulo de Licenciado en Matemática , Mención Análisis

Numérico , consideramos que dicho trabajo reúne los requisitos y méritos suficientes para

ser sometido a la presentación pública y evaluación por parte del jurado examinador que se

designe.

En la ciudad de Maracaibo, a los días del mes de de

1.999.

Prof. Jose Luis Flores MSc. Sergio Rivas

C.I. : C.I. :

iii

Trabajo de Grado aprobado en nombre de la muy ilustre Universidad Nacional

Abierta por el siguiente Jurado, a los días del mes de de 1.999.

Prof. Prof.

C.I. : C.I. :

Prof. Prof.

C.I. : C.I. :

iv

REPUBLICA DE VENEZUELA

UNIVERSIDAD NACIONAL ABIERTA

CENTRO LOCAL ZULIA

FUNCIONES CONVEXAS

TRABAJO ESPECIAL DE GRADO PARA OPTAR AL TITULO DE LICENCIADO EN

MATEMÁTICA MENCION ANÁLISIS NUMÉRICO.

Realizado por :

Hernan Rafael Romero

C.I. : 5.803.158

MARACAIBO, DICIEMBRE DE 1.998

v

DEDICATORIA A la memoria de mi

padre a los quince años

de su muerte.

A la verdad objetiva y

no utópica.

vi

AGRADECIMIENTO

A Dios todopoderoso por sobre todas las cosas, por darme la inteligencia y sabiduría

necesarias para poder hacer el trabajo.

A toda mi familia por estimularme a seguir adelante.

A mis hermanos en general y muy especialmente a Nelson por su ayuda, a Iris y a

Magaly por haber hecho la transcripción al computador del trabajo.

A mis tutores los profesores Sergio Rivas y José Luis Flores quienes con su

experiencia, conocimientos, preocupada atención y excelente trato, supieron orientar éste

Trabajo Especial de Grado.

vii

RESUMEN

Romero, Hernan R. “Funciones Convexas”. Universidad Nacional Abierta. Centro Local

Zulia. Maracaibo. Diciembre. 1.998.

En la literatura castellana la Bibliografía sobre Funciones Convexas es muy escasa,

por no decir inexistente. Son muy pocos los libros de texto que tratan el tema no obstante la

gran importancia que tienen las Funciones Convexas en la Matemática, tanto pura como

aplicada. Se plantea así la necesidad de realizar un trabajo de investigación sobre las

Funciones Convexas que luego pueda ser útil como material de referencia en el desarrollo de

otras investigaciones.

Se utilizó como metodología de trabajo la investigación documental y consistió ésta

esencialmente en la recopilación de información de distintos materiales bibliográficos

aparecidos principalmente en lengua inglesa.

El resultado final es un trabajo escrito en el cual se desarrollan y amplían algunos de

los aspectos tratados en las fuentes originales y aunque no contiene nada nuevo puede

considerarse como un modesto aporte al estudio de las Funciones Convexas debido al

enfoque y tratamiento del tema y a que algunas demostraciones son de carácter original.

viii

INDICE GENERAL

Pág.

INTRODUCCION............................................................................................................. 1

CAPITULO I

Funciones Convexas Sobre IR............................................................................................. 3

1.1. Definición y Propiedades Básicas.................................... .....................................3

1.2. Continuidad y Diferenciabilidad...........................................................................15

1.3. Caracterización de las Funciones Convexas.........................................................26

1.4. Operaciones con Funciones Convexas.................................................................38

1.5. Funciones de Young y Funciones Convexas.........................................................50

1.6. Desigualdades Clásicas........................................................................................53

1.7. Funciones log-convexas.......................................................................................68

1.8. Funciones Aditivas y Funciones mid convexas.....................................................73

CAPITULO II

Funciones Convexas Sobre IRn .........................................................................................83

2.1. Definición y Propiedades Básicas.........................................................................83

2.2. Hiperplanos y Propiedades Fundamentales de los Conjuntos Convexos................92

2.3. Continuidad de Funciones Convexas....................................................................96

2.4. Diferenciabilidad de Funciones..........................................................................107

2.5. Diferenciabilidad de Funciones Convexas..........................................................115

2.6. Caracterización de las Funciones Convexas.......................................................137

2.7. Extremos de Funciones Convexas......................................................................147

CAPITULO III

Funciones Convexas Sobre Espacios Vectoriales Normados............................................153

3.1. Definición y Propiedades Básicas.......................................................................153

ix

3.2. Continuidad de Funciones Convexas..................................................................155

3.3. Diferenciabilidad en Espacios Vectoriales Normados.........................................160

3.4. Caracterización de las Funciones Convexas.......................................................171

BIBLIOGRAFIA.............................................................................................................178

1

INTRODUCCION

El estudio de las funciones convexas es de fundamental importancia en varios

campos de la Matemática, tanto pura como aplicada, pues ellas son requisito casi

indispensable para abordar estudios en campos tales como la teoría de la

optimización, la programación lineal y no lineal, la programación convexa, y además

aportan un tratamiento unificado para demostrar algunas de las desigualdades clásicas

de la Matemática, como por ejemplo, la desigualdad de la Media Geométrica - Media

Aritmética, la desigualdad de Hölder, la desigualdad de Cauchy-Schawrz y otras.

El objetivo central de ésta investigación es el estudio de las Funciones

Convexas a valores reales definidas sobre subconjuntos convexos de un espacio

vectorial.

El tratamiento del tema se desarrolla en tres capítulos.

En el primer capítulo se hace un estudio de las Funciones Convexas a valores

reales definidas sobre intervalos de la recta real y se tratan aspectos tales como la

continuidad y la diferenciabilidad, caracterización de las Funciones Convexas a partir

de propiedades de sus derivadas, operaciones que preservan la convexidad de las

funciones, desigualdades clásicas, funciones log-convexas y propiedades,

concluyendo el capítulo con un pequeño estudio sobre las funciones aditivas y

funciones mid convexas.

En el segundo capítulo se estudian las Funciones Convexas a valores reales

definidas sobre subconjuntos convexos de IRn y se consideran las propiedades

básicas de estas funciones, la continuidad, la diferenciabilidad, la caracterización de

las Funciones Convexas a partir de sus propiedades de diferenciabilidad para

finalmente concluir el capítulo con el estudio de las propiedades de los extremos de

Funciones Convexas.

En el tercer y último capítulo se desarrollan las Funciones Convexas a valores

reales definidas sobre subconjuntos convexos de un espacio vectorial normado cuya

2

dimensión puede ser finita o infinita, se analizan sus propiedades básicas y las

condiciones bajo las cuales dichas funciones son continuas, concluyéndose el capítulo

con la caracterización de las Funciones Convexas a partir de propiedades de su

primera y de su segunda derivada.

3

Capítulo I

Funciones Convexas Sobre IR Históricamente, el estudio de las funciones convexas f I: ⊂ IR→ IR , donde

I es un intervalo, se inicia con el trabajo de J. L. W. Jensen [10]. Realmente Jensen

llamó convexas a las funciones que ahora se conocen como midconvexas o convexas

en el punto medio, las cuales son definidas en la sección 8 de este capítulo. Iniciamos

el presente trabajo con el estudio de las funciones convexas f I: → IR, donde I es un

intervalo, ya que la teoría de estas es más fácil de asimilar y muchas de sus

propiedades se generalizan sin mayor dificultad.

1.1. Definición y Propiedades Básicas. Iniciamos esta sección con la definición de función convexa que será utilizada

a lo largo de todo el capítulo para luego presentar un conjunto de propiedades de

carácter básico relacionadas con estas funciones.

Definición 1.1.1 : (Función Convexa). Sean I ⊂ IR un intervalo y f I: → IR una

función. Se dice que f es convexa sí y sólo si

( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1 (1.1)

para todo x, y ∈ I y λ ∈ [0, 1].

Si la desigualdad es estricta cuando x ≠ y, y λ ∈ (0, 1), se dice que f es

estrictamente convexa.

Obsérvese que para x y= = =, λ λ0 1 o siempre se cumple la igualdad.

4

Si se invierte la desigualdad en (1.1) se dice que f es cóncava. La función es

estrictamente cóncava si la desigualdad es estricta cuando x y≠ y λ ∈( , )0 1 .

Geométricamente, la definición de una función convexa f significa que para

cualesquiera dos puntos ( ) ( )x f x y f y Gra f, ( ) , , ( ) ∈ , donde Gra f es el gráfico de f ,

la cuerda que los une nunca está por debajo de la gráfica de la función, como

demostramos a continuación.

Sean x y I x y, , ,∈ < y considérese la ecuación de la recta que pasa por los

puntos ( ) ( )x f x y f y, ( ) , , ( ) , es decir

( )r tf y f x

y xt y f y t( )

( ) ( )( ) ,= −

−− + ∈ IR..

Si ( ) ( )z x y= + − ∈λ λ λ1 0 1, , , entonces

( )( ) ( )( )

( )( ) ( )

( )

r z r x yf y f x

y xx y y f y

f y f x

y xx y f y f x f y f y

f x f y

( )( ) ( )

( )

( ) ( )( ) ( ) ( ) ( )

( ) ( ).

= + − = −−

+ − − +

= −−

− + = − +

= + −

λ λ λ λ

λ λ

λ λ

1 1

1

Es decir ( )r z f x f y( ) ( ) ( )= + −λ λ1 , y así el punto ( )z r z, ( ) está sobre el segmento

de recta que une los puntos ( ) ( )x f x y f y, ( ) , , ( ) .

Además, como f es una función convexa se verifica

( ) ( )( ) ( )f z f x y f x f y r z= + − ≤ + − =λ λ λ λ1 1( ) ( ) ( )

5

y por lo tanto f z r z( ) ( )≤ para todo [ ]z x y∈ , , de donde se concluye que el segmento

de recta que une los puntos ( ) ( )x f x y f y, ( ) , , ( ) nunca está por debajo de la gráfica

de la función. Gráficamente :

Figura 1.1

Análogamente, la interpretación geométrica de función cóncava establece que

si f I: → IR es una función cóncava entonces la cuerda que une los puntos

( ) ( )x f x y f y Gra f, ( ) , , ( ) ∈ nunca está por arriba de la gráfica de f . Gráficamente :

Figura 1.2

Por otra parte, si se multiplica la desigualdad (1.1) por −1 se obtiene

( )( ) ( )− + − ≥ − − −f x y f x f yλ λ λ λ1 1( ) ( )

Es decir

6

( ) ( )( ) ( )( ) ( )( )( )− + − ≥ − + − −f x y f x f yλ λ λ λ1 1

para todo [ ]x y I, ,∈ ∈ y λ 0 1 .

Esto permite deducir que f es convexa si y sólo si − f es cóncava.

Ahora podemos plantearnos la pregunta : ¿Cómo debe ser la gráfica de una

función que sea a la vez cóncava y convexa ?. La respuesta es : una función que es a

la vez cóncava y convexa es afín, es decir existen constantes m b, ∈IR , tales que

f x mx b x I( ) ,= + ∈ .

Demostración : Supóngase que f I: → IR es una función simultáneamente cóncava y

convexa, es decir

( )( ) ( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − = + −1 1 1 2, ..

para todo [ ]x y I, , , .∈ ∈λ 0 1

Se probará que f es una función afín en el intervalo [ ] ( )x y x y, .<

En efecto, si se verifica la igualdad (1.2) se tiene que para todo

[ ]x y I, ,∈ ∈ y λ 0 1 se cumple

( )( ) ( )f y x y f y f x f y+ − = + −λ λ( ) ( ) ( ) ,

entonces si ( )x y z y x yz y

x y≠ = + − = −

− y tenemos λ λ y por lo tanto

( ) [ ]f zf x f y

x yz y f y z x y( )

( ) ( )( ), ,= −

−− + ∈ .

Esta última expresión indica que f es una función afín en el intervalo [ ]x y, .

7

Recíprocamente, si f I: → IR es una función afín, entonces existen constantes

m b, ∈IR , tales que f x mx b( ) = + . Luego, si [ ]λ ∈ 0 1, y x y I, ∈ resulta

( )( ) ( )( )( ) ( )

( ) ( )( )( ) ( ) ( )

f x y m x y b

m x m y b b

mx b my b

f x f y

λ λ λ λ

λ λ λ λ

λ λ

λ λ

+ − = + − +

= + − + + −

= + + − +

= + −

1 1

1 1

1

1 .

y en consecuencia f es cóncava y convexa. Además, se concluye que

( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − = + −1 1 , [ ]λ ∈ ∈0 1, , ,x y I , si y solo si f es afín

sobre I.

Es de hacer notar que si f I: → IR es una función convexa y alcanza un

mínimo en x Io ∈ entonces − f (cóncava) alcanza un máximo en dicho punto. Este

tipo de consideraciones hace inferir que el estudio de las funciones convexas permite

sacar conclusiones acerca de las funciones cóncavas.

Ejemplos de funciones convexas son :

1. ( )f x x= sobre I = IR ;

2. g x x( ) = 2 sobre I = IR ;

3. ( )h xx

= 1 sobre ( )0, .∞

Probemos que f y g son funciones convexas. En efecto sean x y, ∈IR y

[ ]λ ∈ 0 1, ,entonces :

( )( ) ( )

( )

( )( )

1 1 1

1

1

1

)

( ) ( )

f x y x y

x y

x y

f x f y

λ λ λ λ

λ λ

λ λ

λ λ

+ − = + −

≤ + −

= + −

= + −

(desigualdad triangular)

8

( )( ) ( )

( )( ) ( )( ) ( )( ) ( )( )

( ) ( )( )

2

2

2 0 0

2 2 2 2

) ( ) ( ) ( )g g y x y g y g x g y

y x y y x y

x y y x y x y x y

y x y x y x y

x y x y

es convexa

y

⇔ + − ≤ + −

⇔ + − − ≤ −

⇔ − + − ≤ − +

⇔ + − ≤ + ≠ − >

⇔ − ≤ −

λ λ

λ λ

λ λ λ

λ λ

λ

y esto último es cierto porque ( ]λ ∈ − >0 1 0, . y x y

3) Veamos ahora que h es convexa. En efecto, sean ( ) [ ]x y, , , ,∈ ∞ ∈0 0 1λ ,

entonces

( )( ) ( )

( ) ( )

h x y h x h y

x y x y

λ λ λ λ

λ λλ λ

+ − ≤ + −

⇔+ −

≤ + −

1 1

1

1

11

1

( ) ( )

( ) ( ) ( )⇔ ≤ + − + − + −xy y x y y x x y yλ λ λ λ λ λ1

( ) ( )

( ) ( )[ ]⇔ ≤ + − + + − − − +

⇔ ≤ + + − + +

xy xy y y x xy xy x xy xy

xy x y x xy y

λ λ λ λ λ λ λ λ

λ λ λ λ λ λ

2 2 2 2 2 2

2 2 2 2 20 2 2

( ) ( )

( ) ( ) ( )

( )

( )

⇔ ≤ + + − + + ≠

⇔ ≤ − + − + −

⇔ ≤ − + + − >

⇔ ≤ −

0 2 2 0

0 2 1 1 1

0 2 1 0

0

2 2 2 2

2 2

2 2

2

λ λ λ λ

λ λ λ

λ

xy x y x xy y

xy x y

xy x y

x y ,

lo cual es cierto, y por lo tanto h es convexa.

9

Comentario : como la relación (1.1) de la definición 1.1.1 siempre se cumple cuando

x=y, se puede suponer que x≠y, y sin pérdida de generalidad que x>y. Esto fue lo que

hicimos para demostrar que g es convexa. Análogamente se puede suponer λ≠0 y

λ≠1.

A continuación se verán otras formas equivalentes de definir las funciones

convexas.

Considerando [ ]λ ∈ 0 1, y haciendo α λ β λ= = −, 1 en la definición 1.1.1,

obtenemos que f I: → IR es una función convexa si y sólo si

( )f x y f x f yα β α β+ ≤ +( ) ( )

para todo [ ]x y I, , , ,∈ ∈ y tales que + = 1.α β α β0 1

Además, para todo x y I p q p q, , , , ,∈ ≥ + >0 0 la desigualdad anterior es

equivalente a

fpx qy

p q

pf x qf y

p q

++

≤ +

+( ) ( )

ya que se puede hacer α β=+

=+

p

p q

q

p q, verificándose que

[ ] + = 1 con α β α β, , ,∈ 0 1 y entonces

fpx qy

p qf

p

p qx

q

p qy

p

p qf x

q

p qf y

pf x qf y

p q

++

=

++

+

≤+

++

= ++

( ) ( )( ) ( )

A continuación se presenta la desigualdad de Jensen, la cual es una

generalización de la desigualdad (1.1).

10

Teorema 1.1.1 : (Desigualdad de Jensen). Sean I ⊂ IR un intervalo y f I: → IR una

función. Entonces f es convexa sí y sólo si

f x f xi ii

n

i ii

nα α

= =∑ ∑

≤

1 1

13( ) ( . )

para todo x I i ni i n∈ ≥ = + + =, , , , , .α α α0 1 11K K tales que

Demostración : La condición necesaria se prueba por inducción. Para n=2 la relación

(1.3) es la desigualdad que define la convexidad de la función f. Supóngase que la

desigualdad (1.3) es cierta para n-1 sumandos (n>2), se probará que también es cierta

para n. Sin pérdida de generalidad se puede suponer que α αn n< − >1 1 0, luego y

entonces

( )

( )

f x f x x x

fx x

x

i ii

n

n n n n

nn n

nn n

α α α α

α α αα

α

=− −

− −

∑

= + + +

= − + +−

+

11 1 1 1

1 1 1 111

K

K

( )= −−

+ +−

+

−

−f x x xnn

n

nn n n1

1 11

11

1α αα

αα

αK

( )

( )

( )

≤ −−

+ +−

+

= −−

+

≤ −−

+

= + =

−−

=

−

=

−

=

−

=

∑

∑

∑ ∑

11 1

11

11

11

11

1

1

1

1

1

1

1

α αα

αα

α

α αα

α

αα

αα

α α α

nn

n

nn n n

ni

ni

i

n

n n

ni

ni

i

n

n n

i i n ni

n

i ii

n

f x x f x

f x f x

f x f x

f x f x f x

K ( ) ( )

( )

( ) ( ) (

( ) ( ) ( )

por convexidad

por hipotesis inductiva)

11

Lo anterior implica que f x f xi ii

n

i ii

nα α

= =∑ ∑

≤

1 1

( ) , como se quería demostrar.

Comentario : En la demostración el punto α

αα

α1

11

11 1−+ +

−−

−n

n

nnx xK está en el

intervalo I por ser combinación convexa de elementos de I (ver [8], pp. 66-67).

Además, la prueba del recíproco es inmediata porque la desigualdad (1.3) es válida

para todo n≥1 tal que n∈IN y en particular para n=2, que es precisamente la

desigualdad que define la convexidad.

De este teorema se deriva inmediatamente el corolario siguiente.

Corolario 1.1.1 : Sean I ⊂ IR un intervalo y f I: → IR una función. Entonces, f es

convexa si y sólo si

f

x f xi ii

n

ii

n

i ii

n

ii

n

β

β

β

β

=

=

=

=

∑

∑

∑

∑

≤1

1

1

1

14

( )

( . )

para todo x I i ni i ii

n∈ ≥ = >

=∑, , , , , .β β0 1 0

1

K tales que

Demostración : Se obtiene inmediatamente del teorema anterior haciendo

α β

βi

i

jj

n=

=∑

1

, para todo i n= 1, , .K

El lema que sigue se usará luego en la demostración del teorema 1.2.2.

Lema 1.1.1 : Sean I ⊂ IR un intervalo y f I: → IR una función. Entonces, f es

convexa sí y sólo si

12

f z f x

z x

f y f x

y x

f y f z

y z

( ) ( ) ( ) ( ) ( ) ( )−−

≤ −−

≤ −−

para todo x y z I x z y, , .∈ < < tal que

Demostración : Para probar la primera desigualdad, consideremos

( ) ( )z x y x= + − ∈λ λ, ,0 1 , luego λ = −−

z x

y x. Dado que f es convexa se verifica

( )f z f x f y f x( ) ( ) ( ) ( )≤ + −λ ,

de donde

( )f z f xz x

y xf y f x( ) ( ) ( ) ( )− ≤ −

−−

y en consecuencia

f z f x

z x

f y f x

y x

( ) ( ) ( ) ( )−−

≤ −−

que es la primera desigualdad.

Sea ahora ( )z y x y= + −λ , entonces ( )λ = −−

∈z y

x y0 1, y de la convexidad de la

función f se tiene

( )f z f y f x f y( ) ( ) ( ) ( )≤ + −λ

de donde se obtiene inmediatamente

( )f z f y

z y

f x f y

x yz y

( ) ( ) ( ) ( )−−

≥ −−

− < 0

13

que es precisamente la segunda desigualdad. Recíprocamente, supóngase que f

verifica las desigualdades del lema con [ ]x z y< < ∈; , y sea λ 0 1 tal que

( )z x y x= + −λ . Obsérvese que λ = −−

z x

y x. Por la primera desigualdad

f z f x

z x

f y f x

y x

( ) ( ) ( ) ( )−−

≤ −−

,

luego

( )f z f xz x

y xf y f x( ) ( ) ( ) ( )≤ + −

−

−

es decir

( )( ) ( )f x y x f x f y f x+ − ≤ + −λ λ( ) ( ) ( )

para todo [ ]x y I, , ,∈ ∈ y λ 0 1 y por lo tanto f es una función convexa.

Comentario : Respecto a la figura 1.3, el lema expresa lo siguiente :

Pendiente de AB ≤ Pendiente de AC ≤Pendiente de BC

Figura 1.3

La proposición que sigue es otra propiedad de las funciones convexas.

14

Proposición 1.1.1 : Sean I ⊂ IR un intervalo y f I: → IR una función. Entonces, f

es convexa sí y sólo si para todo x z y I, , ∈ tal que x z y< < las siguientes

desigualdades son equivalentes :

( ) ( ) ( )1

1

1

1

0)

( )

( )

( )

( ) ( ) ( )

x f x

z f z

y f y

y z f x x y f z z x f y= − + − + − ≥

( )( ) ( )( ) ( )( )2 0)( ) ( ) ( )f x

x z x y

f z

z y z x

f y

y x y z− −+

− −+

− −≥

Demostración : Se probará primero la condición necesaria. Sean x z y I, , ∈ tales que

x z y< < , entonces ( )z x yy z

y x

z x

y x= + ∈ + = = −

−= −

−α β α β α β α β con y , , , , .0 1 1

Como f es convexa se cumple ( )f x y f x f yα β α β+ ≤ +( ) ( ) , es decir

f zy z

y xf x

z x

y xf y( ) ( ) ( ) ( . )≤ −

−+ −

−15

Pero esto es cierto si y sólo si ( ) ( ) ( )y x f z y z f x z x f y− ≤ − + −( ) ( ) ( ) y esta

desigualdad es equivalente a

( ) ( ) ( )y z f x x y f z z x f y− + − + − ≥( ) ( ) ( ) 0

que es precisamente la relación 1).

Ahora bien, esta desigualdad es cierta si y sólo si

( )( ) ( )( ) ( )( )f x

x y z x

f z

y z z x

f y

y z x y

( ) ( ) ( )

− −+

− −+

− −≤ 0

ya que ( )( )( )y z x y z x− − − < 0. Pero esto es cierto si y sólo si

15

( )( ) ( )( ) ( )( )f x

x z x y

f z

z y z x

f y

y x y z

( ) ( ) ( )

− −+

− −+

− −≥ 0,

que es la relación 2).

Queda así probado que si f es una función convexa entonces las desigualdades

1) y 2) son equivalentes.

Recíprocamente, como para cualesquiera x z y I, , ∈ tales que x z y< < las

desigualdades 1) y 2) se pueden escribir en la forma dada por la relación (1.5), se

concluye que f es convexa.

1.2. Continuidad y Diferenciabilidad. En esta sección se estudiarán las propiedades de continuidad y

diferenciabilidad de las funciones convexas. La sección se inicia con una proposición

que expresa que toda función convexa definida en un intervalo cerrado y acotado es

acotada.

Proposición 1.2.1 : (ver [17], Cap. 1, p. 3). Si [ ]f a b: , → IR es una función

convexa, entonces es acotada.

Demostración : Sea { }M max f a f b= ( ), ( ) . Considérese [ ]z a b∈ , , luego

existe [ ]λ ∈ 0 1, tal que ( )z a b= + −λ λ1 y como f es una función convexa se tiene

( )( ) ( )

( )

f z f a b f a f b

M M M

( ) ( ) ( )

.

= + − ≤ + −

≤ + − =

λ λ λ λ

λ λ

1 1

1

Es decir f es acotada superiormente.

16

Para ver que f es acotada inferiormente tomemos t ∈IR de tal forma que los

puntos

xa b

t ya b

t= + − = + +2 2

,

estén en [ ]a b, . Entonces

fa b

fa b

ta b

t

fa b

t fa b

t

+

= + +

+ + −

≤ + +

+ + −

2

1

2 2

1

2 2

1

2 2

1

2 2,

de donde

fa b

t fa b

fa b

t

fa b

M m

+ +

≥ +

− + −

≥ +

− =

22

2 2

22

Como cualquier punto de [ ]a b, se puede escribir en la forma a b

t+ +2

, para

algún t debidamente seleccionado, se deduce que f es acotada inferiormente.

En conclusión, para todo [ ]z a b∈ , se verifica que

m f z M≤ ≤( )

donde { }M max f a f b= ( ), ( ) y m fa b

M= +

−2

2 y por lo tanto f es acotada.

Comentario : Es indispensable que el intervalo en que está definida la función sea

cerrado y acotado ya que en caso contrario puede suceder que la función no sea

acotada. Como ejemplos de esto se tienen las funciones ( ]f : ,0 1 → IR definida por

17

f x x( ) = −1 y [ )g: ,0 ∞ → IR definida por g x x( ) = 2 , que son convexas pero no son

acotadas superiormente.

A continuación se introduce la definición de función de Lipschitz para luego

demostrar que toda función convexa f I: → IR es Lipschitz en cualquier intervalo

[ ]a b, contenido en el interior de I.

Definición 1.2.1 : Se dice que una función [ ]f a b: , → IR satisface la condición de

Lipschitz (o es Lipschitz) si para todo [ ]x y a b, ,∈ existe una constante k tal que

f y f x k y x( ) ( )− ≤ − .

La constante k se denomina constante de Lipschitzidad.

El siguiente teorema expresa que toda función f I: ⊂ IR→ IR convexa, donde I

es un intervalo, satisface una condición de Lipschitz en cualquier intervalo cerrado

contenido en el interior de I.

Teorema 1.2.1 : (ver [8], teorema 2, p. 26). Sean I ⊂ IR un intervalo y f I: → IR

una función convexa. Entonces f satisface una condición de Lipschitz en cualquier

intervalo cerrado [ ]a b I, ⊂ o

y, por lo tanto, f es continua en el interior de I.

Demostración : Sea ε > 0 tal que a b− +ε ε y están en I, y sean m y M las cotas

inferior y superior de f en el intervalo [ ]a b− +ε ε, . Sean [ ]x y a b, ,∈ , con x y≠ .

Como ( )11

y xy x

−− = , resulta que ( ) [ ]z y

y xy x a b= +

−− ∈ − +ε ε ε, . Luego,

18

yy x

y xz

y xx=

−+ −

++ −ε

εε

. En consecuencia, si tomamos ( )λε

=−

+ −∈

y x

y x0,1 ,

resulta que ( )y z x= + −λ λ1 y como f es convexa se tiene que

( ) [ ]f y f z f x f z f x f x( ) ( ) ( ) ( ) ( ) ( )≤ + − = − +λ λ λ1 .

Por lo tanto

( ) ( )f y f x M my x

M m k y x( ) ( )− ≤ − <−

− = −λε

,

donde ( )k M m= − / ε . Como esto es cierto para [ ]x y a b, ,∈ , x y≠ , se deduce que

f y f x k y x( ) ( )− < − y así f es Lipschitz en cualquier intervalo [ ]a b I, ⊂ o

. De la

arbitrariedad del intervalo[ ]a b, se concluye que f es continua en el interior de I.

Comentario : El teorema que se acaba de demostrar establece que toda función

f I: → IR convexa, es continua en el interior del intervalo I. Pero no se aclara la

situación en los puntos extremos del intervalo I. Con el fin de aclarar esto,

considérese la función [ ]g: ,− →1 1 IR definida por

[ )g x

x si x

si x( )

,=

∈ −

=

2 1 1

2 1

Esta función es convexa, continua en x = −1 y discontinua en x = 1.

En este ejemplo se puede observar que si f I: → IR es una función convexa,

no se puede decir nada sobre la continuidad de f en los extremos del intervalo I. Sin

embargo, el número de discontinuidades que puede tener una función convexa nunca

excede de dos ya que en el interior de su dominio es continua.

19

Antes de dar un corolario que se deriva del teorema 1.2.1 consideremos la

siguiente definición.

Definición 1.2.2 : Una función f I: → IR es absolutamente continua sobre I, si para

cada ε > 0 , existe δ > 0 tal que, para toda colección de intervalos abiertos

( )a b Ii i, ⊂ , disjuntos dos a dos, se tiene que

( )f b f a b ai ii

n

i ii

n( ) ( ) ,− < − <

= =∑ ∑

1 1

ε δ cuando .

Corolario 1.2.1 : Si I es un intervalo en IR y f I: → IR es una función convexa,

entonces f es absolutamente continua sobre cualquier intervalo [ ]a b I, ⊂ o

.

Demostración : Sea ( ){ }a b i ni i, : , ,= 1K una colección de intervalos abiertos

disjuntos dos a dos, contenidos en [ ]a b I, ⊂ o

. Por el teorema 1.2.1 se tiene que f es

Lipschitz sobre el intervalo cerrado [ ]a b, , esto es ; existe una constante k, tal que si

[ ]x y a b, ,∈ entonces f x f y k x y( ) ( )− ≤ − . Sea ε > 0 y considérese un δ > 0 tal

que

b ai ii

n− <

=∑

1

δ .

Entonces

f b f a k b a k b a ki ii

n

i ii

n

i ii

n( ) ( )− ≤ − = − <

= = =∑ ∑ ∑

1 1 1

δ .

Por lo tanto, f b f ai ii

n( ) ( )− <

=∑

1

ε si consideramos 0 < <δ εk

y en consecuencia

toda función convexa f I: → IR es absolutamente continua en Iο

.

20

En lo que sigue de esta sección se tratará la diferenciabilidad de funciones

convexas. Recuérdese que si f I: → IR es una función, donde I es un intervalo en IR,

la derivada (lateral) izquierda de f en el punto x I∈ está definida por

f x limf y f x

y xy x−

↑= −

−' ( )

( ) ( )

donde y x↑ quiere decir y x y x→ <, y se supone que x no es el extremo izquierdo

de I y además y I∈ . Similarmente la derivada (lateral) derecha de f en x se define

como :

f x limf y f x

y xy x+

↓= −

−' ( )

( ) ( )

donde y x↓ quiere decir y x y x→ >, y suponemos que x no es el extremo derecho

de I e y I∈ .

El siguiente teorema establece que las derivadas laterales de una función

convexa existen, son monótonas y crecientes.

Teorema 1.2.2 : (ver [17], Cap. 1, teorema B, p. 5). Si I es un intervalo en IR y

f I: → IR es una función convexa (estrictamente convexa), entonces las derivadas

laterales f f−′

+ y ' existen, son crecientes (estrictamente crecientes) en

I f x f x o

y − +≤' '( ) ( ) , para todo x I∈ o

.

Demostración : Considérense cuatro puntos w x y z I, , , ∈ o

tales que w x y z< < < y

sean

21

( ) ( ) ( ) ( )A w f w B x f x C y f y D z f z= = = =, ( ) , , ( ) , , ( ) , ( ) y (ver figura 1.4).

Figura 1.4

Aplicando el lema 1.1.1 primero a los puntos A, B, C y luego a los puntos B,

C, D se tiene :

Pendiente de AB≤Pendiente de AC≤Pendiente de BC

≤Pendiente de BD≤Pendiente de CD

con desigualdades estrictas si f es estrictamente convexa. Esto equivale a las

siguientes desigualdades :

f w f x

w x

f w f y

w y

f x f y

x y

f x f z

x z

f y f z

y zA

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )( )

−−

≤ −−

≤ −−

≤ −−

≤ −−

De la segunda desigualdad de (A) se obtiene que

f w f y

w yw w y B

( ) ( )( ) ( )

−−

< es creciente en

De las desigualdades segunda, tercera y cuarta se tiene

f w f y

w y

f y f z

y z

( ) ( ) ( ) ( ),

−−

≤ −−

22

es decir

f w f y

w y

( ) ( )−−

está acotado superiormente por f y f z

y zC

( ) ( )( )

−−

para cualquier z y> .

De (B) y (C) resulta que limf w f y

w yw y↑

−−

( ) ( ) existe y

limf w f y

w y

f w f y

w yw y w y↑ <

−−

= −−

( ) ( )sup

( ) ( ).

Por lo tanto, si y I∈ o

, existe la derivada lateral f y−' ( ) .

De manera similar, se comprueba que existe derivada lateral f x+' ( ) , para todo

x I∈ o

y

f x limf x f z

x z

f x f z

x zz x z x+

↓ >= −

−= −

−' ( )

( ) ( )inf

( ) ( )

Además de las cuatro desigualdades de (A) se obtiene que

f x f x f y f y− + − +≤ ≤ ≤' ' ' '( ) ( ) ( ) ( )

y por lo tanto

a f x f x) ( ) ( ),' '− +≤ para todox I∈

o,

b f f) ,' '− + son funciones crecientes.

Comentario : Considérense los tres puntos w x y I, , ∈ o

tales que w x y< < . Como

la función derivada lateral f+' es monótona, existe el límite de f x+

' ( ) cuando x w↓ .

23

Además de la desigualdad

f xf y f x

y x+ ≤ −−

' ( )( ) ( )

y de la continuidad de f se obtiene

lim f x limf y f x

y x

f y f w

y wx w x w↓+

↓≤ −

−= −

−' ( )

( ) ( ) ( ) ( ).

Si se hace y w↓ se tiene que

lim f x limf y f w

y wf w

x w y w↓+

↓+≤ −

−=' '( )

( ) ( )( ) .

Esto implica que

lim f x f wx w↓

+ +≤' '( ) ( ) ( . )16

Por otra parte, como w x< , la monotonía de f+' implica que f w f x+ +≤' '( ) ( ) y por lo

tanto

f w lim f xx w

+↓

+≤' '( ) ( ) ( . )17

De (1.6) y (1.7) se deduce que

lim f x f wx w↓

+ +=' '( ) ( ) ( . )18 .

Supóngase ahora que los tres puntos x y w I, , ∈ o

son tales que y x w< < .

Dado que la función f+' es monótona creciente se verifica

f y f x

y xf x

( ) ( )( )'−

−≤ +

24

y de la continuidad de f se tiene

limf y f x

y xlim f x

x w x w↑ ↑+

−−

≤( ) ( )( )'

es decir

f y f w

y wlim f xx w

( ) ( )( )'−

−≤

↑+

Si ahora se hace que y w↑ , se obtiene

limf y f w

y wlim f x

y w x w↑ ↑+

−−

≤( ) ( )( )' ,

es decir

f w lim f xx w

−↑

+≤' '( ) ( ) ( . )19

Además, como x w< , la monotonía de las derivadas laterales implica que

f x f w+ −≤' '( ) ( ) y en consecuencia

lim f x f wx w↑

+ −≤' '( ) ( ) ( . )110

De (1.9) y (1.10) se obtiene que

lim f x f wx w↑

+ −=' '( ) ( ) ( . )111

En resumen se tiene que

lim f x f wx w↓

+ +=' '( ) ( ) ( . )18

25

y

lim f x f wx w↑

+ −=' '( ) ( ) ( . )111

con lo que concluye este comentario.

Las desigualdades (1.8) y (1.11) permiten demostrar el teorema siguiente

Teorema 1.2.3 : (ver [17], Cap. 1, teorema C, p.7). Si f I: → IR es una función

convexa sobre el intervalo abierto I, el conjunto E formado por los puntos en los

cuales f ' no existe, es numerable, y además f ' es continua en I E\ .

Demostración : Como f w f w− +≤' '( ) ( ) , de (1.8) y (1.11) resulta

f w lim f x lim f x f wx w x w

−↑

+↓

+ += ≤ =' ' ' '( ) ( ) ( ) ( ) .

Luego, f w f w− +=' '( ) ( ) en aquellos puntos w tales que ( ) ( )lim f x lim f xx w x w↑

+↓

+=' ' , es

decir, los puntos donde la función monótona f+' es continua. Como f+

' es creciente,

el conjunto de puntos donde f+' es discontinua es un conjunto numerable (Ver [8],

p.35) y así, si f es convexa, entonces es derivable salvo un conjunto numerable E y

además f ' es continua salvo este conjunto E

Comentario : Como en los puntos donde existe la derivada de f se tiene que

f x f x f x− += =' ' '( ) ( ) ( ) y además esto se cumple para todos los puntos del dominio de

la función f si esta es diferenciable, se deduce teniendo en cuenta que las derivadas

laterales de cualquier función convexa son crecientes que : si f I: → IR es una

función convexa y diferenciable sobre el intervalo abierto I, entonces la derivada de f

es creciente en I.

26

1.3. Caracterización de las Funciones Convexas En las aplicaciones resulta muy útil poder reconocer las funciones convexas

por propiedades de sus derivadas. En esta sección se darán varias de estas

propiedades, la primera de las cuales se fundamenta en el teorema 1.2.2.

Teorema 1.3.1 : ( ver [8], teorema 5, p. 29 ). Sean I ⊂ IR un intervalo abierto y

f I: → IR una función diferenciable sobre I . Entonces f es convexa (estrictamente

convexa) si y sólo si la derivada f ' es creciente (estrictamente creciente) sobre I .

Demostración : Si f es convexa, el teorema 1.2.2 demuestra que f ' es creciente en I.

Recíprocamente, supongamos que f ' es creciente y sean x y z I, , ∈ tales que

x z y< < . Por el teorema del valor medio existen ( )ξ ∈ x z, y ( )η ∈ z y, tales que

( ) ( )ff z f x

z xy f

f y f z

y z' '( ) ( ) ( ) ( )ξ η= −

−= −

−.

Como f ' es creciente se verifica

( ) ( ) ( )f f' 'ξ η ξ η≤ <

es decir

f z f x

z x

f y f z

y z

( ) ( ) ( ) ( )−−

≤ −−

de donde

( )( ) ( )( )y z f z f x z x f y f z− − ≤ − −( ) ( ) ( ) ( )

lo cual es equivalente a

( ) ( ) ( )y x f z y z f x z x f y− ≤ − + −( ) ( ) ( )

27

Dividiendo por y x− > 0, tenemos

f zy z

y xf x

z x

y xf y( ) ( ) ( )≤ −

−+ −

−

Haciendo

α β= −−

= −−

y z

y xy

z x

y x

se cumple que

( )z x y= + ∈ + =α β α β α β con y , ,0 1 1

y además

( )f x y f x f yα β α β+ ≤ +( ) ( )

para todo x y I, ∈ . Por lo tanto f es convexa.

Corolario 1.3.1 : Sean I ⊂ IR un intervalo abierto y f I: → IR una función que tiene

segunda derivada f x''( ) , para todo x I∈ . Entonces f es convexa si y sólo si,

f x''( ) ≥ 0, para todo x I∈ .

Demostración : Si f es una función convexa entonces la derivada f ' es creciente y,

por consiguiente, la segunda derivada f '' es no negativa (f x''( ) ≥ 0, para todo

x I∈ ). Recíprocamente, si f x''( ) ≥ 0, para todo x I∈ , entonces f ' es creciente y,

por el teorema 1.3.1, f es convexa.

28

Corolario 1.3.2 : Sean I ⊂ IR un intervalo abierto y f I: → IR una función que tiene

segunda derivada f x''( ) , para todo x I∈ . Si f x''( ) > 0, para todo x I∈ , entonces f

es estrictamente convexa.

Demostración : Si f x''( ) > 0, para todo x I∈ , entonces f ' es estrictamente

creciente y por lo tanto f es estrictamente convexa.

El recíproco del corolario 1.3.2 no es cierto, es decir : una función f puede ser

estrictamente convexa y sin embargo no verificarse que f x''( ) > 0 para todo x I∈ .

Por ejemplo, la función ( )f : ,− →1 1 IR definida por f x x( ) = 4 es estrictamente

convexa pero la segunda derivada f x x''( ) = 12 2 se anula en x = 0.

Como ejemplos de aplicación de lo visto en esta sección tenemos los siguientes :

1) La función f : IR→ IR definida por f x ex( ) = es estrictamente convexa ya que

f x ex' ( ) = es estrictamente creciente ; o también porque f x ex''( ) = > 0, para

todo x ∈ IR .

2) g: IR→ IR definida por g x x( ) = 2 es estrictamente convexa porque g x x' ( ) = 2 es

estrictamente creciente, o bien ( )g x x' ' ,= > ∈2 0 IR.

3) ( )h: ,0 ∞ → IR definida por h x x( ) = −1 es estrictamente convexa porque

h x x''( ) = >−2 03 , para todo ( )x ∈ ∞0, .

29

4) ( )r: ,0 ∞ → IR definida por r x x pp( ) ,= > 1, es estrictamente convexa ya que

r x pxp' ( ) = −1 es estrictamente creciente ; o también porque

r x p p xp''( ) ( )= − >−1 02 para todo ( )x ∈ ∞0, .

5) ( )s: ,0 ∞ → IR definida por s x x( ) = es cóncava porque ( )( )− = −s x x es

convexa ya que ( ) ( )− = >−s x x'' 1

403 2 , para todo ( )x ∈ ∞0, .

6) ( )t: ,0 ∞ → IR definida por t x Ln x( ) = es cóncava porque ( )( )− = −t x Ln x es

convexa ya que ( ) ( )− = >t xx

'' 10

2, para todo ( )x ∈ ∞0, .

30

El próximo teorema presenta una forma de reconocer las funciones convexas

como integrales de funciones crecientes.

Teorema 1.3.2 : (ver [8], teorema 6, p. 30). Una función ( )f a b: , → IR es convexa

(estrictamente convexa) si y sólo si existe una función creciente (estrictamente

creciente) ( )g a b: , → IR y un punto ( )c a b∈ , , tales que para todo ( )x a b∈ ,

f x f c g t dtc

x

( ) ( ) ( ) ( . )− = ∫ 112

Demostración : Supóngase que la relación (1.12) es cierta con g creciente y sean

α β, números positivos tales que α β+ = 1. Entonces, para todo ( )x y a b, ,∈ tales

que x y< , se tienex x y y< + <α β . Luego :

( ) ( )α β α β α β α β α βf x f y f x y f x f y f x y( ) ( ) ( ) ( ) ( )+ − + = + − + +

( )( ) ( )( )= − + − + −β α β α α βf y f x y f x y f x( ) ( )

( )= −+

+

∫ ∫β αα β

α βg t dt g t dt

x y

y

x

x y

( ) ( ) Por (1.12)

( ) ( )≥ + − ++

+

∫ ∫β α β α α βα β

α βg x y dt g x y dt A

x y

y

x

x y

( )

( ) ( )( ) ( )( )= + − + − + + −β α β α β α α β α βg x y y x y g x y x y x

( ) ( )( ) ( )( )= + − + − + −g x y y x y x y xα β β α β α α β

( ) ( ) ( )( )= + − + − + +g x y y x y x y xα β β β α β α α β α

( ) ( )( )( )= + + − + +g x y x y x yα β α β α β α β

( ) ( )( )= + + − + =g x y x y x yα β α β α β 0

31

Esto implica que

( )α β α βf x f y f x y B( ) ( ) ( )+ − + ≥ 0

para todo α β α β, [ , ],∈ + =0 1 1, y ( )x y a b, ,∈ . Por lo tanto f es convexa. Además,

como g es una función creciente se verifican

( )( )

x t x y g t g x y

x y t y g x y g t

< < + ⇒ ≤ +

+ < < ⇒ + ≤

α β α β

α β α β

( )

( )

y si g es estrictamente creciente estas desigualdades son estrictas, y por lo tanto la

desigualdad (A) es estricta, de donde la desigualdad (B) también es estricta y así la

función f es estrictamente creciente.

Recíprocamente, supóngase que f es una función convexa (estrictamente

convexa). Por el teorema 1.2.2. se sabe que la derivada lateral f+' existe y es

creciente (estrictamente creciente). Consideremos una partición

{ }∏ = = < < < =c x x x xo n1 L del intervalo [ ]c x, . Como x xk k− <1 para todo

1≤ ≤k n, se tiene de acuerdo con el lema 1.1.1 y el teorema 1.2.2 que

( )f xf x f x

x xf xk

k k

k kk+ −

−

−+≤ −

−≤' '( ) ( )

( )11

1

de donde se obtiene

( ) ( )f x x x f x f x f x x xk k k k k k k k+ − − − + −− ≤ − ≤ −' '( ) ( ) ( ) ( )1 1 1 1

Sumando sobre k, se tiene

( ) ( )f x x x f x f x f x x xk k kk

n

n ok

n

k k k+ − −=

+=

−− ≤ − ≤ −∑ ∑' '( ) ( ) ( ) ( )1 11 1

1

32

Las dos sumas de estas ultimas desigualdades son las sumas de Riemann de la función

f+' asociadas a la partición Π y verifican las desigualdades independientemente de la

partición del intervalo [ ]c x, que se considere. Como la función f+' es creciente,

entonces es Riemann-integrable y al tomar el supremo de la suma de la izquierda y el

ínfimo de la suma de la derecha sobre todas las particiones se obtiene por definición

de integral de Riemann que

f t dt f x f c f t dtc

x

c

x

+ +∫ ∫≤ − ≤' '( ) ( ) ( ) ( )

es decir

f x f c f t dtc

x

( ) ( ) ( )'− = +∫

y así se puede tomar g t f t( ) ( )'= + . La función f−' también se puede usar en lugar de

f+' ya que ambas funciones son crecientes (estrictamente crecientes) cuando f es

convexa (estrictamente convexa).

Comentario : El teorema 1.3.2 permite dar otra demostración del teorema 1.3.1. En

efecto, si f es convexa (estrictamente convexa) y diferenciable, entonces por el

teorema 1.2.2 la derivada f ' es creciente (estrictamente creciente). Además el

teorema fundamental del cálculo asegura que

f x f c f t dtc

x

( ) ( ) ( ) ( . )'− = ∫ 113

para cualquier ( )c a b∈ , .

33

Recíprocamente, si la derivada f ' es creciente (estrictamente creciente) y existe en

todos los puntos del dominio de la función f, entonces de acuerdo con la relación

(1.13) y de la aplicación del teorema 1.3.2 con g t f t( ) ( )'= para todo ( )t a b∈ , , se

concluye que f es convexa (estrictamente convexa).

Para algunos de los ejemplos que se dieron como aplicación del teorema 1.3.1, la

aplicación del teorema 1.3.2 y la relación (1.12) lleva a las siguientes expresiones :

e e e dt c xx c t

c

x

− = ∈∫ , , IR

x c tdt c xc

x2 2 2− = ∈∫ , , IR

( )1 1 10

2x c tdt c x

c

x

− = − ∈ ∞∫ , , ,

Antes de demostrar el próximo teorema se dará la definición siguiente.

Definición 1.3.1 : Sean I ⊂ IR un intervalo y f I: → IR una función. Se dice que f

tiene soporte en x Io ∈ si existe un número m∈ IR tal que la función afín

( )A x f x m x xo o( ) ( )= + − verifica que A x f x( ) ( )≤ para todo x I∈ . La función A se

conoce como la función (o recta) de soporte de f en xo .

Si observamos una función convexa como la de la figura 1.5, podremos notar

que en cada punto del interior de su dominio tiene soporte.

34

Figura 1.5

El próximo teorema provee una demostración de este hecho.

Teorema 1.3.3 : (ver [8], teorema 7, p. 32). Una función ( )f a b: , → IR es convexa,

si y sólo si existe al menos una recta de soporte para cada ( )x a bo ∈ , .

Demostración : Supongamos que f es convexa, entonces para cada ( )x a bo ∈ ,

podemos escoger [ ]m f x f xo o∈ − +' '( ), ( ) . Si ( )x a b∈ , es tal que x xo < , entonces

f x m f xf x f x

x xo oo

o− +≤ ≤ ≤ −

−' '( ) ( )

( ) ( )

de donde

( )f x f x m x xo o( ) ( )− ≥ − .

Por otra parte, si x xo< se verifica

f x f x

x xf x m f xo

oo o

( ) ( )( ) ( )' '−

−≤ ≤ ≤− +

y como x xo− < 0 resulta :

35

( )f x f x m x xo o( ) ( )− ≥ − .

En cualquier caso se cumple que

( )f x f x m x x A xo o( ) ( ) ( )≥ + − =

y así A es una recta de soporte de f en xo .

Supongamos ahora que f tiene una recta de soporte en cada punto de ( )a b, y sean

( )x y a b, ,∈ . Si ( ) [ ]x x yo = + − ∈λ λ λ1 0 1, , , sea ( )A x f x m x xo o( ) ( )= + − la recta

de soporte f en xo , entonces

( )( ) ( )( )( ) ( )

f x y f x A x A x y

A x A y f x f y

o oλ λ λ λ

λ λ λ λ

+ − = = = + −

= + − ≤ + −

1 1

1 1

( ) ( )

( ) ( ) ( ) ( )

Es decir :

( )( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1( ) ( )

para todo ( )x y a b, ,∈ y [ ]λ ∈ 0 1, . Por lo tanto f es convexa.

Comentario : La primera parte de la demostración de este teorema se puede hacer

también de la siguiente manera : Si f es convexa y [ ]m f x f xo o∈ − +' '( ), ( ) se tiene

que para ( )x x x a bo < ∈, , , y para todo ( )t x xo∈ , se verifica

f x m f x f t f xo o− + + −≤ ≤ ≤ ≤' ' ' '( ) ( ) ( ) ( ) .

Luego, aplicando el teorema 1.3.2 :

36

( )f x f x f t dt mdt m x xox

x

x

x

o

o o

( ) ( ) ( )'− = ≥ = −+∫ ∫ .

Por otra parte, en el caso x xo< se tiene que para todo ( )t x xo∈ , se verifica

f x f t f x m f xo o+ + − +≤ ≤ ≤ ≤' ' ' '( ) ( ) ( ) ( )

y aplicando el teorema 1.3.2 se obtiene

( )f x f x f t dt mdt m x xox

x

x

x

o

o o

( ) ( ) ( )'− = ≤ = −+∫ ∫

es decir

( )f x f x m x xo o( ) ( )− ≤ −

y luego :

( )f x f x m x xo o( ) ( )− ≥ − .

En cualquier caso se verifica

( )f x f x m x xo o( ) ( )≥ + − .

El teorema que sigue, el último de esta sección, expresa que si una función

convexa f I: ⊂ IR→ IR tiene derivada en el punto x Io ∈ , entonces la recta de soporte

de f en xo , tiene como pendiente el valor de la derivada en este punto.

Teorema 1.3.4 : (ver [8], teorema 8, p. 33). Sea ( )f a b: , → IR una función

convexa. Entonces la función f tiene derivada en xo , si y sólo si la recta de soporte

37

de f en xo es única, y en este caso ( )A x f x f x x xo o o( ) ( ) ( )'= + − es la recta de

soporte.

Demostración : En el comentario del teorema 1.3.3 se observó que para cada

[ ]m f x f xo o∈ − +' '( ), ( ) hay una recta de soporte de f en xo . Supóngase ahora que la

recta de soporte de f en xo es única, entonces el valor de la pendiente m es único y

se tiene f x f xo o− +=' '( ) ( ) y por lo tanto f tiene derivada en xo .

Recíprocamente, supóngase que f xo' ( ) existe. Para cualquier recta de soporte

( )A x f x m x xo o( ) ( )= + − , se tiene f x A x( ) ( )≥ , para todo ( )x a b∈ , . Por lo tanto, si

( )x y a b, ,∈ se verifica :

( )( )

f x f x m x x

f y f x m y x

o o

o o

( ) ( ) ( . )

( ) ( ) ( . )

≥ + −

≥ + −

114

115

Si x x yo< < , de la relación (1.14) se obtiene

f x f x

x xmo

o

( ) ( )−−

≤

ya que x xo− < 0 ; y de (1.15)

f y f x

y xmo

o

( ) ( )−−

≥ .

Estas dos últimas desigualdades son equivalentes a :

f x f x

x xm

f y f x

y xo

o

o

o

( ) ( ) ( ) ( )−−

≤ ≤ −−

Tomando límites se tiene que

38

limf x f x

x xm lim

f y f x

y xx x

o

o y x

o

oo o↑ ↓

−−

≤ ≤ −−

( ) ( ) ( ) ( )

es decir

f x m f xo o− +≤ ≤' '( ) ( ) .

Esto último implica que : si f tiene derivada en xo , entonces m es única y por lo

tanto la recta de soporte de f en xo es única, y es la recta tangente a la gráfica de f

en el punto ( )( )x f xo o, .

1.4. Operaciones con Funciones Convexas En la sección 1.3 vimos formas de identificar las funciones convexas a partir

de propiedades de sus derivadas. En esta sección se verán otras formas de reconocer

estas funciones a partir de operaciones que preserven la convexidad. Por ejemplo, será

posible reconocer que la función f : ( , )0 ∞ → IR definida por f t t t( ) = +−1 3 es

convexa porque es una suma de funciones convexas y como veremos la suma de

funciones es una operación que preserva convexidad.

El siguiente teorema establece que la suma de funciones convexas y el

producto de una constante no negativa por una función convexa son funciones

convexas.

Teorema 1.4.1 : (ver [ 8 ], Teorema 9, p. 37 ). Sea I ⊂ IR un intervalo. Si f I: → IR

y g I: → IR son funciones convexas y α ≥ 0, entonces f g+ y α f son funciones

convexas sobre I.

Demostración : Sean x y I, ∈ y λ ∈[ , ].0 1 Entonces

39

( )f g+ ( ( ) ) ( ( ) ) ( ( ) )λ λ λ λ λ λx y f x y g x y+ − = + − + + −1 1 1≤ + − + + −λ λ λ λf x f y g x g y( ) ( ) ( ) ( ) ( ) ( )1 1= + + − +λ λ( ( ) ( ) ) ( ) ( ( ) ( ) )f x g x f y g y1

= + + − +λ λ( ) ( ) ( ) ( ) ( ).f g x f g y1

Es decir

( ) ( ( ) ) ( ) ( ) ( ) ( ) ( )f g x y f g x f g y+ + − ≤ + + − +λ λ λ λ1 1

y por lo tanto f + g es convexa.

También se tiene

( ) ( ( ) ) ( ( ) )α λ λ α λ λf x y f x y+ − = + −1 1

≤ + −

= + −

α λ λ

λα λ α

( ( ) ( ) ( ) )

( ) ( ) ( )

f x f y

f x f y

1

1

= + −λ α λ α( ) ( ) ( ) ( ) ( )f x f y1

y por consiguiente α f es convexa.

Ejemplos :

1) Si f : IR→ IR y g : IR→ IR son las funciones definidas por f(x) = x y g(x) = x2

entonces ( ) ( )f g x x+ = + x2, para todo x ∈IR , es convexa porque f y g lo

son.

2) Como la función h : (0,∞ →) IR definida por h( )x = x−1 es convexa tenemos que

la función ( ) ( )3 3 1h x x= − definida sobre ( , )0 ∞ también es convexa.

40

Corolario 1.4.1 : Sean Ι ⊂ IR un intervalo y { }fn n IN∈ una sucesión de funciones

f In : → IR convexas. Si la serie f xnn

( )=

∞∑

1

converge a f x( ) para cada x I∈ ,

entonces f es una función convexa sobreI .

Demostración : Sea{ }gn n IN∈ la sucesión de funcionesgn : Ι → IR definidas como

sigue :

1) g x f x1 1( ) ( ),= para todo x I∈ ;

2) g x f x f x2 1 2( ) ( ) ( ),= + para todox I∈ ;

3) g x f x f x f x x Im m( ) ( ) ( ) ( ) , .= + + + ∈1 2 L

Entonces

f x f x lim g xn

nn

n( ) ( ) ( ) ,= ==

∞

→∞∑

1

para todo x I∈ .

Luego, para todo [ ]λ ∈ 0 1, y x y I, ∈ se verifica :

f x y lim g x yn

n( ( ) ) ( ( ) )λ λ λ λ+ − = + −→∞

1 1

≤ + −→∞lim g x g y

nn n( ( ) ( ) ( ) )λ λ1

= + −→∞ →∞

λ λlim g x lim g yn

nn

n( ) ( ) ( )1

= + −λ λf x f y( ) ( ) ( )1

lo cual implica que f fnn

==

∞∑

1

es convexa.

41

Comentario : Se ha usado el hecho que gn es una función convexa, es decir, que la

suma de cualquier número finito de funciones convexas es una función convexa. Esto

se prueba por inducción usando el teorema 1.4.1.

En el teorema siguiente se presentan las condiciones que deben verificar dos

funciones para que su composición sea una función convexa o cóncava.

Teorema 1.4.2 : Sea I ⊂ IR un intervalo y sean f I: → IR y g f I: ( ) → IR

funciones. Entonces :

1) Si f es convexa y g es convexa y creciente, entonces g fo es convexa.

2) Si f es cóncava y g es convexa y decreciente, entonces g fo es convexa.

3) Si f es cóncava y g es cóncava y creciente, entonces g fo es cóncava.

4) Si f es convexa y g es cóncava y decreciente, entonces g fo es cóncava.

Demostración : Sean x y I, ∈ y λ ∈[ , ].0 1 Entonces :

1) ( ) ( ( ) ) ( ( ( ) )g f x y g f x yo λ λ λ λ+ − = + −1 1

≤ + −g f x f y( ( ) ( ) ( ) )λ λ1 ( f convexa y g creciente)

≤ + −λ λg f x g f y( ( ) ) ( ) ( ( ) )1 (ya que g es convexa)

= + −λ λ( ) ( ) ( ) ( )( )g f x g f yo o1

2) ( )( ( ) ) ( ( ( ) ) )g f x y g f x yo λ λ λ λ+ − = + −1 1

≤ + −g f x f y( ( ) ( ) ( ) )λ λ1 ( f cóncava y g decreciente)

≤ + −λ λg f x g f y( ( ) ) ( ) ( ( ) )1 (porque g es convexa)

= + −λ λ( )( ) ( ) ( )( )g f x g f yo o1

3) ( )( ( ) ) ( ( ( ) ) )g f x y g f x yo λ λ λ λ+ − = + −1 1

≥ + −g f x f y( ( ) ( ) ( ) )λ λ1 ( f cóncava y g creciente).

42

≥ + −λ λg f x g f y( ( ) ) ( ) ( ( ) )1 (ya que g es cóncava)

= λ λ( )( ) ( ) ( ) ( )g f x g f yo o+ −1

4) ( )( ( ) ) ( ( ( ) ) )g f x y g f x yo λ λ λ λ+ − = + −1 1

≥ + −g f x f y( ( ) ( ) ( ) )λ λ1 ( f convexa y g decreciente)

≥ + −λ λg f x g f y( ( )) ( ) ( ( ) )1 (porque g es cóncava)

= + −λ λ( )( ) ( )( ) ( ).g f x g f yo o1

Ejemplos :

1) Si ( )f : ,0 ∞ → IR y g: ( , )0 ∞ → IR son las funciones definidas por f x x( ) = −1 y

g x x( ) = 3 entonces ( )( )g f x xo = −3 es convexa sobre ( , )0 ∞ porque f es

convexa y g es convexa y creciente.

2) Como las funciones f : ( , )0 ∞ → IR y g: ( , )0 ∞ → IR definidas por f x x( ) = y

g x x( ) = −1 son tales que f es cóncava y g es convexa y decreciente se concluye

que la función ( )( )g f x xo = − 12 es convexa sobre ( , ).0 ∞

3) Si f : ( , )0 ∞ → IR y g: ( , )0 ∞ → IR son las funciones definidas por f x x( ) = y

g x Ln x( ) = entonces ( )( )g f x Ln xo = es cóncava sobre ( , )0 ∞ pues f es

cóncava y g cóncava y creciente.

En el próximo teorema se exhiben las condiciones bajo las cuales el producto

de funciones es una función convexa.

43

Teorema 1.4.3 : (ver [ 8 ], Teorema 11, p. 38 ). Sea I ⊂ IR un intervalo y sean

f I: → IR y g I: → IR funciones no negativas, crecientes (decrecientes) y convexas,

entonces la función h f g= ⋅ también tiene estas tres propiedades.

Demostración : Si f y g son crecientes y no negativas, se tiene que para

cualesquiera x y I, ∈ tales que x < y se verifica

0 ≤ ≤f x f y( ) ( ) y 0 ≤ ≤g x g y( ) ( ). .

Entonces

0 ≤ = ≤ =h x f x g x f y g y h y( ) ( ) ( ) ( ) ( ) ( )

y por lo tanto h es creciente y no negativa.

Para el caso en que f y g son decrecientes se procede de manera análoga.

Para demostrar la convexidad se usa el hecho que si x < y se verifica

( ( ) ( ) ) ( ( ) ( ) )f x f y g y g x− − ≤ 0

es decir

f x g y f y g x f x g x f y g y( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ).+ ≤ +

Usando esta desigualdad se ve que para todo [ ]λ ∈ 0 1, y x y I, ∈ se cumple :

h x y f x y g x y( ( ) ) ( ( ) ) ( ( ) )λ λ λ λ λ λ+ − = + − + −1 1 1

44

≤ + − + −

= + − + + −

≤ + − + + −

+

= + +

( ( ) ( ) ( ) )( ( ) ( ) ( ) )

( ) ( ) ( ) ( ( ) ( ) ( ) ( ) ) ( ) ( ) ( )

( ) ( ) ( )( ( ) ( ) ( ) ( ) ) ( ) ( ) ( ) ( )

( ) ( )

( ) ( ) ( ) ( ) ( )

λ λ λ λ

λ λ λ λ

λ λ λ λ

λ

λ λ λ

f x f y g x g y

f x g x f x g y f y g x f y g y

f x g x f x g x f y g y f y g y f y g y

f y g y

f x g x f x g x f y g

1 1

1 1

1 2

2 2

2

2

2 ( ) ( ) ( ) ( ) ( ) ( ) ( )

( ) ( ) ( ) ( )

( ) ( ) ( ) ( ) ( ) ( )

( ) ( ) ( ) ( ) ( )

( ) ( ) ( ).

y f x g x f y g y f y g y

f y g y f y g y

f x g x f y g y f y g y

f x g x f y g y

h x h y

− − +

− +

= + −

= + −

= + −

λ λ

λ λ

λ λ

λ λ

λ λ

2 2

22

1

1

Esto implica que

h x y h x h y( ( ) ) ( ) ( ) ( )λ λ λ λ+ − ≤ + −1 1

y por lo tanto h f g= • es convexa.

En el teorema siguiente se establece bajo qué condición el supremo de una

familia arbitraria de funciones convexas es una función convexa.

Teorema 1.4.4 : (ver [ 8 ], Teorema 12, p.38 ). Sea { fα } una familia arbitraria de

funciones convexas definidas sobre el intervalo I, y sea f x Sup f x( ) ( )= α . Si

J= { : ( ) }x I f x∈ < ∞ es un conjunto no vacío, entonces J es un intervalo y f es una

función convexa sobre J.

Demostración : Si λ ∈[ , ]0 1 y x y J, ∈ (es decir f x( ) < ∞ y f y( ) ),< ∞ entonces

f x y( ( ) )λ λ+ − =1 Sup f x yα λ λ( ( ) )+ −1

≤ + −

≤ + −

= + − < ∞

Sup f x f y

Sup f x Sup f y

f x f y

( ( ) ( ) ( ) )

( ) ( ) ( )

( ) ( ) ( ) .

λ λ

λ λ

λ λ

α α

α α

1

1

1

45

Esto prueba que f es convexa sobre J y además que si x y J, ∈ entonces

f x y( ( ) ) ,λ λ+ − < ∞1 lo cual significa que λ λx y J+ − ∈( )1 y por lo tanto J es un

intervalo.

A continuación veremos que el límite de una sucesión de funciones convexas ,

que converge puntualmente a una función finita, es una función convexa.

Teorema 1.4.5 : ( ver [ 8 ], Teorema 13, p. 38 ). Sean I ⊂ IR un intervalo y

{ fn } n IN∈ una sucesión de funciones f In: → IR convexas que converge

puntualmente a una función finita f sobre I. Entonces f es convexa y además la

convergencia es uniforme en cualquier subintervalo de Io

.

Demostración : Sean λ ∈[ , ]0 1 y x y I, ,∈ entonces

f x y lim f x yn

n( ( ) ) ( ( ) )λ λ λ λ+ − = + −→∞

1 1

≤ + −

= + −

→∞lim f x f y

f x f y

nn n( ( ) ( ) ( ) )

( ) ( ) ( )

λ λ

λ λ

1

1

y por lo tanto f es convexa.

Sean a b c I, , ∈o

tales que a < c < b y definamos

α β γ= = =Sup f a Sup f b f cn

nn

nn

n( ) , ( ) , inf ( ).

Consideremos además las funciones afines L, M y N tales que

L a L b M c M b N a N c( ) , ( ) ; ( ) , ( ) ; ( ) , ( ) .= = = = = =α β γ β α γ

46

Se mostrará que la sucesión está uniformemente acotada por estas funciones afines, en

el intervalo [ a, b ].

Sea x a b∈[ , ], entonces existe λ ∈[ , ]0 1 tal que x a b= + −λ λ( ) .1 Para cualquier

n∈IN se verifica

f x f a b f a f bn n n n( ) ( ( ) ) ( ) ( ) ( )= + − ≤ + −λ λ λ λ1 1

≤ + − = + −

= + − =

λα λ β λ λ

λ λ

( ) ( ) ( ) ( )

( ( ) ) ( )

1 1

1

L a L b

L a b L x

Por otra parte, si x a c∈( , ) entonces c x b∈( , ) y existe λ ∈( , )0 1 tal que

c x b= + −λ λ( ) ,1 de donde

( )x c b= + − ≠1 11 0λ λ λ, ( ).

Luego

M c f c f x bn n( ) ( ) ( ( ) )= ≤ = + −γ λ λ1

≤ + − ≤ + −

= + −

λ λ λ λ β

λ λ

f x f b f x

f x M b

n n n

n

( ) ( ) ( ) ( ) ( )

( ) ( ) ( ).

1 1

1

Es decir

M c f x M bn( ) ( ) ( ) ( )≤ + −λ λ1

de donde

f x M c M bn ( ) ( ) ( )≥ + −

11

1

λ λ

= + −

=M c b M x

11

1

λ λ( ).

47

Además, si x c b∈( , ) entonces c a x∈( , ) y para algún λ ∈( , )0 1 se verifica

c a x= − +( ) ,1 λ λ de donde

x c a= + −

≠1

11

0λ λ

λ, ( ).

Luego

N c f c f a xn n( ) ( ) ( ( ) )= ≤ = − +γ λ λ1

≤ − +

≤ − +

= − +

( ) ( ) ( )

( ) ( )

( ) ( ) ( ).

1

1

1

λ λ

λ α λ

λ λ

f a f x

f x

N a f x

n n

n

n

Es decir

N c N a f xn( ) ( ) ( ) ( )≤ − +1 λ λ

de donde

f x N c N an( ) ( ) ( )≥ + −

11

1

λ λ

= + −

=N c a N x

11

1

λ λ( ) .

Como fn es convexa entonces es Lipschitz en cualquier subintervalo [ , ]a b I⊂o

y

por lo tanto existe una constante k tal que

f x f y k x yn n( ) ( )− ≤ −

para todo x y a b, [ , ].∈

Además, como las cotas que se han obtenido para fn son independientes de n, la

demostración del teorema 1.2.1 permite deducir que se puede escoger k independiente

de n.

48

Sea E a b⊂ [ , ] un subconjunto finito tal que cualquier punto de [ a, b ] se encuentra a

una distancia menor que ε

3k de algún punto de E, donde ε > 0 es arbitrario.

Como E es un conjunto finito y la sucesión de funciones { }fn converge puntualmente

a la función f, se tiene que para todo z E∈ , la sucesión de números reales

{ }f zn ( ) n IN∈ converge al número real f ( )z y dado que toda sucesión convergente de

números reales es una sucesión de Cauchy se deduce que existe nο ∈IN tal que si

m n n, ≥ ο entonces

f z f zn m( ) ( ) .− ≤ ε3

Por lo tanto, si x a b∈[ , ], existe z ∈ E con z xk

− < ε3

y en consecuencia, si

m, n ≥ nο se verifica :

f x f x f x f z f z f z f z f xn m n n n m m m( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )− ≤ − + − + −

≤ − + + −

< + + =

k x z k z x

kk

kk

ε

ε ε ε ε

3

3 3 3,

y como esta es la condición de Cauchy para convergencia uniforme en [ a , b ], queda

demostrado el teorema.

En el teorema que sigue y con el cual finaliza esta sección, se dan condiciones

para que la inversa de una función sea cóncava o convexa.

49

Teorema 1.4.6 : Sean I ⊂ IR un intervalo abierto y f I: → IR una función

estrictamente monótona. Sea f f I I− →1: ( ) la función inversa de f . Entonces :

1) Si f es convexa y creciente, entonces f −1 es cóncava ;

2) Si f es convexa y decreciente, entonces f −1 es convexa ;

3) Si f es cóncava y creciente, entonces f −1 es convexa ;

4) Si f es cóncava y decreciente, entonces f −1 es cóncava.

Demostración : Sean x y f I, ( )∈ y λ ∈[ , ]0 1 . Si u= −f x1( ) y v= −f y1( ) ,

entonces :

1) Como f es convexa se verifica

f u v f u f v( ( ) ) ( ) ( ) ( )λ λ λ λ+ − ≤ + −1 1

= + −λ λx y( )1 ,

y por ser f −1 creciente, se tiene

( ) ( )f f u v f x y− −+ − ≤ + −1 11 1( ( ) ) ( )λ λ λ λ

luego

λ λ λ λu v f x y+ − ≤ + −−( ) ( ( ) )1 11

es decir

λ λ λ λf x f y f x y− − −+ − ≤ + −1 1 11 1( ) ( ) ( ) ( ( ) )

y en consecuencia f −1 es cóncava.

2) De la convexidad de f

f u v x y( ( ) ) ( )λ λ λ λ+ − ≤ + −1 1 ,

y como f −1 es decreciente, se verifica

50

(f f u v f x y− −+ − ≥ + −1 11 1( ( ) ) ( ( ) )λ λ λ λ

luego

λ λ λ λu v f x y+ − ≥ + −−( ) ( ( ) )1 11

es decir

λ λ λ λf x f y f x y− − −+ − ≥ + −1 1 11 1( ) ( ) ( ) ( ( ) )

y por lo tanto f −1 es convexa.

De manera análoga se demuestran 3) y 4).

Por ejemplo, como la función f : IR→ IR definida por f ( )x = ex es convexa y

creciente, su inversa f − ∞ →1 0:( , ) IR definida por f x Ln x− =1( ) es cóncava.

Además, por ser la función g : IR→ IR definida por g( )x = e x− convexa y decreciente,

su inversa g− ∞1 0: ( , )→ IR definida por g x Ln x− = −1( ) es convexa.

1.5. Funciones de Young y Funciones Convexas.

Esta sección se inicia con la definición de ϕ − función o función de Young.

Veremos que toda función f : [ , ) [ , )0 0∞ → ∞ convexa que se anula sólo en t = 0 es

una ϕ − función. Se tiene la siguiente definición.

Definición 1.5.1 : (ϕ − función). Una ϕ − función es una función ϕ:[ , ) [ , )0 0∞ → ∞

que verifica las siguientes condiciones :

a) ϕ es continua en [ 0,∞ ) ;

b) ϕ ( )t = 0 sólo para t =0 ;

51

c) ϕ es creciente ;

d) ϕ ( )t → ∞ cuando t → ∞ .

A continuación se introduce como lema un resultado que se usará en la demostración

de la proposición 1.5.1.

Lema 1.5.1 : Sea f : [ , ) [ , )0 0∞ → ∞ una función convexa tal que ( )f 0 0= .

Entonces se verifica :

1) f t f t( ) ( )λ λ≤ si λ ∈[ ,0 1 ] ;

2) f t f t( ) ( )λ λ≥ si λ ≥ 1.

Demostración :

1) Sea λ ∈[ , ]0 1 . Como f es convexa y f(0)=0 se tiene que

f t f t f t f( ) ( ( ) ) ( ) ( ) ( )λ λ λ λ λ= + − ≤ + −1 0 1 0 = λf t( ).

2) Sea λ ≥ 1, luego 1

0 1λ

∈[ , ] y por 1) se cumple :

f t f t f t( ) ( ) ( )=

≤1 1

λλ

λλ .

De donde

f t f t( ) ( )λ λ≥ .

El lema 1.5.1 permite demostrar la proposición principal de esta sección, la

cual presentamos a continuación.

Proposición 1.5.1 : Sea f : [ , ) [ , )0 0∞ → ∞ una función convexa tal que f(t)=0 sólo

para t=0. Entonces f es una ϕ − función.

Demostración :

a) f es continua en [ 0,∞ ).

52

Por el teorema 1.2.1 se sabe que f es continua en el intervalo ( 0,∞ ).

Sólo se tiene que probar la continuidad en el extremo t=0 del intervalo. Sea ε > 0

dado y consideremos δ ∈ ( 0, 1 ). Si 0 ≤ <t δ se tiene

f t f f t f t f t t f f( ) ( ) ( ) ( ) ( ) ( ) ( )− = = = ⋅ ≤ <0 1 1 1δ

Por lo tanto, para que se verifique f t f( ) ( )− <0 ε basta que se cumpla

δ εf ( )1 < y esto es cierto con sólo tomar 0< <

δ εmin

f ( ),

11 .

b) ( )f t = 0 sólo para t=0.

Se verifica por hipótesis.

c) f es creciente.

Como el rango de f está contenido en el intervalo [ 0,∞ ) se tiene que si 0 < t

entonces 0 0= ≤f f t( ) ( ) . Sean ahora t t1 2 0, [ , )∈ ∞ tales que 0 1 2< <t t . Luego,

existe λ > 0 tal que λ t t1 2= .

Además λ > 1 por ser ( )t t t t1 2 2 1< =λ / . Entonces

f t f t f t f t( ) ( ) ( ) ( )2 1 1 1= ≥ >λ λ .

Es decir t t f t f t1 2 1 2< ⇒ <( ) ( ) y por lo tanto f es creciente.

d) lim f tt→∞

= ∞( ) .

Como f es convexa y f(0)=0, se tiene por el lema 1.5.1 que, para todo t > 1 se

verifica f t t f( ) ( )≥ 1 . Tomando límites cuando t → ∞ a ambos lados de esta

desigualdad se obtiene que f t( ) → ∞ .

Finalizamos esta sección con la siguiente proposición.

53

Proposición 1.5.2 : Sea f : [ , ) [ , )0 0∞ → ∞ una función convexa tal que ( )f 0 0= .

Entonces la función h : ( , ) [ , )0 0∞ → ∞ definida por h tf t

t( )

( )= es creciente.

Demostración : Sean x y, ( , )∈ ∞0 tales que x < y. Entonces existe λ ∈( , )0 1 tal

que λ λy x x y= =( / ) . Luego :

( )( )h x h y h y

f y

y( ) ( ) ( ( ) )= = + − =

+ −λ λ λ

λ λλ

1 01 0

( )≤+ −

= = =λ λ

λλ

λf y f

y

f y

y

f y

yh y

( ) ( ) ( ) ( )( )

1 0.

Es decir, x y h x h y< ⇒ ≤( ) ( ) y por lo tanto h es creciente.

1.6. Desigualdades Clásicas.

Las desigualdades desempeñan un papel importante en análisis, matemáticas

aplicadas, estadística, etc. La teoría de funciones convexas aporta un tratamiento

unificado de algunas de las desigualdades importantes en matemáticas.

En esta sección se verán algunas de las desigualdades clásicas de la

matemática y las mismas se han tomado casi en su totalidad de [17], Cap. 6, pp. 189-

192. Por ejemplo, la desigualdad de la media geométrica - media aritmética (M G -

M A) en su forma conocida es

( ) ( )/x x xn

x x xnn

n1 21

1 21⋅ ≤ + + +K L (1.16 )

para todo xi ≥ 0 y n entero positivo.

A continuación se presenta una forma más general de la desigualdad (1.16 ).

54

Proposición 1.6.1 : (Desigualdad MG-MA). Sean x i ni i, , , , ,α = 1L números reales

tales que, x yi i ii

n≥ > =

=∑0 0 1

1

, α α , entonces

x x x x x xn n nn

1 2 1 1 2 21 2α α α α α αL L≤ + + + (1.17 )

Demostración : Sí xi = 0 para algún i la desigualdad se cumple. Supóngase entonces

que xi > 0 para todo i n∈{ , , , }1 2 K . Por lo tanto se puede escribir

y Ln x x ei i iyi= =( ).

Entonces

x x x yi i i i i ii iα α α α= = =exp ( ) exp ( ) exp ( )Ln Ln .

Como et es una función convexa se puede aplicar la desigualdad de Jensen (teorema

1.1.1) y escribir

Π Πi

n

ii

n

i i i ii

nx y yi

= = == =

∑

1 1 1

α α αexp( ) exp ≤ ===∑∑α αi i i ii

n

i

ny xexp( )

11

lo cual implica que

Πi

n

i i ii

nx xi

= =≤ ∑

1 1

α α

Comentario : En el caso especial donde n=2,

p p q> = = + =1 1 1 11 2 1 2, / , / ( )α α α α se tiene que

x xp

xq

xp q11

21

1 21 1/ / .≤ +

Si ahora se hace x xp1 = y x yq

2 = se obtiene la desigualdad fundamental

55

x yp

xq

yp q⋅ ≤ +1 1 ( 1.18 )

La relación ( 1.18 ) permite demostrar la siguiente desigualdad.

Proposición 1.6.2 : ( Desigualdad de Hölder). Sean x y i ni i, , , , ,= 1 K números

reales tales que, x y pi i≥ ≥ >0 0 1, ; y 1 1 1/ /p q+ = . Entonces

x y x yi ii

n

ip

i

n p

iq

i

n q

= = =∑ ∑ ∑≤

1 1

1

1

1/ /

( 1.19 )

En particular se tiene la desigualdad de Cauchy-Schawrz :

x y x yi ii

n

ii

n

ii

n

= = =∑ ∑ ∑≤

1

2

1

1 22

1

1 2/ /

( 1.20 )

Demostración : Sin pérdida de generalidad se puede suponer que alguno de los xi y

alguno de los yi son mayores que cero. En este caso u xip

i

n p

=

=∑

1

1/

y

v yiq

i

n q

=

=∑

1

1/

son números positivos. Usando la desigualdad (1.18) con

x x u y y vi i= =/ , / , se obtiene

x

u

y

v p

x

u q

y

vi i i

pi

q

⋅ ≤

+

1 1

Sumando se tiene

x

u

y

v p

x

u q

y

vi

i

ni

i

nip

pi

niq

q= = =∑ ∑ ∑⋅ ≤ +

1 1 1

1 1

56

es decir

x y

uv p

x

u q

y

v p q

i ii

n

ip

i

n

p

iq

i

n

q= = =∑ ∑ ∑

≤ + = ⋅ + ⋅ =1 1 11 1 11

11 1

de donde x y u vi ii

n≤ ⋅

=∑

1

, lo cual equivale a

x y x yi i ip

i

n

i

n p

iq

i

n q

≤

== =∑∑ ∑

11

1

1

1/ /

Usando la desigualdad de Hölder se demuestra la siguiente desigualdad.

Proposición 1.6.3 : (Desigualdad de Minkowski). Sean x y i ni i, , , , ,= 1K números

reales tales que, x yi i≥ ≥0 0, y p ≥ 1, entonces

( )x y x yi ip

i

n p

ip

i

n p

ip

i

n p

+

≤

+

= = =

∑ ∑ ∑1

1

1

1

1

1/ / /

(1.21)

Demostración : Cuando p = 1 se tiene la igualdad. Si p > 1, se puede escoger q > 1

tal que 1 1 1/ / ,p q+ = de donde ( )p q p− =1 . Además, sin pérdida generalidad se

puede suponer que x yi i+ > 0 para todo i n= 1, ,K . Si ahora se escribe

( ) ( ) ( )x y x x y y x yi ip

i

n

i i ip

i

n

i i ip

i

n+ = + + +

=

−

=

−

=∑ ∑ ∑

1

1

1

1

1

y se aplica la desigualdad de Hölder al miembro derecho de esta igualdad, se tiene

57

( ) ( )

( )

( )

x y x x y

y x y

x y x y

i ip

i

n

ip

i

n p

i ip q

i

n q

ip

i

n p

i ip q

i

n q

i ip

i

n q

ip

i

n p

ip

i

n p

+ ≤

+

+

+

= +

+

= =

−

=

=

−

=

= = =

∑ ∑ ∑

∑ ∑

∑ ∑ ∑

1 1

11

1

1

1

11

1

1

1

1

1

1

1

1

/( )

/

/( )

/

/ / /

Dividiendo por ( )x yi ip

i

n q

+

=

∑1

1/

queda :

( )x y x yi ip

i

n qip

i

n p

ip

i

n p

+

≤

+

=

−

= =∑ ∑ ∑

1

11

1

1

1

1/ /

y como 1 1 1− =/ /q p , esto es equivalente a la relación (1.21).

A continuación se tiene la siguiente proposición.

Proposición 1.6.4 : Sean x y i ki i, , , , ,= 1 K números reales tales que, x yi i≥ ≥0 0, ;

y sea k un entero positivo. Entonces

( )Π Π Πi

k

i i

k

i

k

i

k

i

k

i

k

x y x y= = =

+

≥

+

1

1

1

1

1

1/ / /

(1.22)

Demostración : Sin pérdida de generalidad se puede suponer que x yi i+ > 0 para

todo i k= 1, ,K . Entonces

58

( ) ( ) ( )

Π Π

Π

Π

Π

Π

Π

Π Π

i

k

i

k

i

k

i

k

i

k

i i

ki

k

i

i

k

i i

k

i

k

i

i

k

i i

k

i

ki

i i

k

i

ki

i i

k

i

i ii

k

x y

x y

x

x y

y

x y

x

x y

y

x y

k

x

x y k

y

= =

=

=

=

=

=

= =

=

+

+

=+

++

=+

+

+

≤+

+∑

1

1

1

1

1

11

1

1

1

1

1

1

1

1

1

1

1 1

/ /

/

/ /

/ /

i

i ii

k

x y+=

=∑

1

1

Para la última desigualdad se ha usado la desigualdad MG-MA en su forma simple, es

decir la relación (1.16). Se tiene entonces que

( )

Π Π

Π

i

k

i

k

i

k

i

k

i

k

i i

k

x y

x y

= =

=

+

+

≤1

1

1

1

1

11

/ /

/

lo cual es equivalente a (122).

Seguidamente presentamos una generalización de la desigualdad (1.22).

Proposición 1.6.5 : Sean x y i ki i i, , , , ,α = 1 K números reales, tales que

x yi i≥ ≥0 0, y αi > 0 con αii

k

=∑ =

1

1. Entonces

( )Π Π Πi

k

ii

k

ii

k

i ix y x yi i i

= = =+ ≤ +

1 1 1

α α α (1.23).

Demostración : Sin pérdida de generalidad supóngase que x yi i+ > 0 para todo

i k= 1, , .K Entonces

59

( ) ( ) ( )

( ) ( )

Π Π

Π

Π

Π

Π

Π

Π Π

Π Π

i

k

ii

k

i

i

k

i i

i

k

i

i

k

i i

i

k

i

i

k

i i

i

ki

i i i

ki

i i

i

ki

i i i

ki

i i

ii

ki

i ii

i

ki

i i

x y

x y

x

x y

y

x y

x

x y

y

x y

x

x y

y

x y

x

x y

y

x y

i i

i

i

i

i

i

i

i

i

i

i i

= =

=

=

=

=

=

= =

= =

= =

+

+=

++

+

=+

++

=+

+

+

≤+

++∑ ∑

1 1

1

1

1

1

1

1 1

1 1

1 1

α α

α

α

α

α

α

α

α

α

α

α α

α α ( )Por

x

x y

y

x y

x

x y

y

x y

ii

i ii

i

i ii

k

ii

ki

i i

i

i ii

i

k

( . ) .117

1 1

1

1 1

=+

++

=+

++

= ⋅ =

=

= =

∑

∑ ∑

α α

α α

Esto implica que

( )

Π Π

Π

i

k

ii

k

i

i

k

i i

x y

x y

i i

i

= =

=

+

+≤1 1

1

1

α α

α,

lo cual es equivalente a (1.23).

Como caso particular de la desigualdad (1.23) se tiene que si

x x y y1 2 1 2, , , , ,α β son números positivos con α β+ = 1 entonces

( ) ( )x x y y x y x y1 2 1 2 1 1 2 2α β α β α β+ ≤ + + (1.24)

Esta desigualdad la usaremos en la sección 1.7 para demostrar que la suma de

funciones log-convexas es una función log-convexa.

60

A continuación se presenta la desigualdad de Hölder para integrales y su caso

particular la desigualdad de Cauchy-Schawrz que también será usada en la sección 1.7

con el fin de probar que la función Gamma es log-convexa.

Proposición 1.6.6 : (Desigualdad de Hölder para integrales). Sean

f g a b, : ( , ) → IR funciones no negativas y los números reales p > 1 y q > 1 tales que

1 1 1/ /p q+ = . Si las funciones f p y gq son integrables, entonces f g⋅ es

integrable y se verifica la desigualdad

( ) ( ) ( ) ( )f t g t dt f t dt g t dta

bp

a

b p

q

a

b q

∫ ∫ ∫≤

1 1/ /

(1.25)

En particular se tiene para p=q=2 la desigualdad de Cauchy-Schawrz :


b

a

b

a

b

≤

∫ ∫ ∫

2

1 2

2

1 2/ /

(1.26).

Demostración : Sean

( )f f t dtpp

a

b p

=

∫

1/

y ( )g g t dtqq

a

b q

=

∫

1/

.

Si f p = 0 ó g q = 0, entonces la desigualdad

( ) ( )0 ≤ ≤∫ f t g t dt f gp qa

b

es cierta ya que f ó g son nulas, excepto posiblemente en un conjunto de medida de

Lebesgue nula. Supóngase que f p > 0 y g q > 0.

Si en la desigualdad (1.18) se hace

61

( )x

f t

f p

= e( )

yg t

g q

= ,

se verifica que

( ) ( ) ( ) ( )f t

f

g t

g p

f t

f q

g t

gp q

p

pp

q

qq

≤ +1 1

para todo t a b∈( , ) , excepto posiblemente para t a b∈{ , } que es un conjunto de

medida de Lebesgue nula.

Como f p y gq son integrables por hipótesis, por la monotonía de la integral se tiene

( ) ( ) ( ) ( )f t g t dt

f g p

f t dt

f q

g t dt

g

p

f

f q

g

g p q

a

b

p q

p

a

b

pp

q

a

b

qq

pp

pp

qq

qq

∫ ∫ ∫≤ +

= + = + =

1 1

1 1 1 11

De donde

( ) ( )f t g t dt f gp qa

b

≤∫

es decir


bp

a

b p

q

a

b q

∫ ∫ ∫≤

1 1/ /

.

62

Comentario : Se ha supuesto que f y g están definidas en un intervalo abierto (a, b)

para no descartar las posibilidades a = −∞ o b = +∞ . Sin embargo, si el intervalo es

cerrado también son válidos los argumentos anteriores. Sólo se requiere que f y g

sean no negativas y f p y gq sean integrables.

La desigualdad de la proposición siguiente se obtiene a partir de la

desigualdad (1.4) del corolario 1.1.1.

Proposición 1.6.7 : Sean f a b: ( , ) → IR una función convexa y ϕ: [ , ]c d → IR una

función Riemann-integrable con a t b< <ϕ( ) para todo t c d∈[ , ] . Si α: [ , ]c d → IR

es una función no negativa tal que α( )t dtc

d

=∫ 1 y α ϕ es integrable sobre el intervalo

[ , ]c d , entonces

( ) ( ) ( ) ( )( )f t t dt t f t dtc

d

c

d

α ϕ α ϕ∫ ∫

≤ . (1.27)

Demostración : Dado un número n∈IN arbitrario hágase ∆ td c

n= −

y sea

t c t t i tiο ο= = +, ∆ para todo i n= 1, ,K una partición del intervalo [c, d]. De

acuerdo con la relación (1.4) se verifica

( )f

t t

t

t f t

t

i ii

n

ii

n

i ii

n

ii

n

α ϕ

α

α ϕ

α

( ) ( )

( )

( ) ( )

( )

=

=

=

=

∑

∑

∑

∑

≤1

1

1

1


63

( )f

t t t

t t

t f t t

t t

i ii

n

ii

n

i ii

n

ii

n

α ϕ

α

α ϕ

α

( ) ( )

( )

( ) ( )

( )

∆

∆

∆

∆

=

=

=

=

∑

∑

∑

∑

≤1

1

1

1

Tomando límites cuando ( )n t→ ∞ →∆ 0 se tiene

( )lim f

t t t

t t

lim

t f t t

t tn

i ii

n

ii

n n

i ii

n

ii

n→∞=

=

→∞=

=

∑

∑

∑

∑

≤α ϕ

α

α ϕ

α

( ) ( )

( )

( ) ( )

( )

∆

∆

∆

∆

1

1

1

1

Como f es continua se cumple

( )f lim

t t t

t t

lim t f t t

lim t tn

i ii

n

ii

n

ni i

i

n

ni

i

n→∞=

=

→∞ =

→∞ =

∑

∑

∑

∑

≤α ϕ

α

α ϕ

α

( ) ( )

( )

( ) ( )

( )

∆

∆

∆

∆

1

1

1

1

y por definición de integral de Riemann se obtiene

( )f

t t dt

t dt

t f t dt

t dt

c

d

c

dc

d

c

d

α ϕ

α

α ϕ

α

( ) ( )

( )

( ) ( )

( )

∫

∫

∫

∫

≤

es decir

( )f t t dt t f t dtc

d

c

d

α ϕ α ϕ( ) ( ) ( ) ( )∫ ∫

≤

64

Por ejemplo, si f : ( , )0 ∞ → IR es la función definida por f x x pp( ) ,= ≥ 1 y

ϕ: [ , ]c d → IR es positiva entonces ( )α ϕ α ϕ( ) ( ) ( ) ( )t t dt t t dtc

d pp

c

d

∫ ∫

≤ .

Comentario : La desigualdad (1.27) se conoce como “desigualdad de Jensen para

integrales”. La hemos obtenido suponiendo que

α( ) .t dtc

d

=∫ 1

Sin embargo, si la integral no vale 1, se tiene el resultado más general :

( )f

t t dt

t dt

t f t dt

t dt

c

d

c

dc

d

c

d

α ϕ

α

α ϕ

α

( ) ( )

( )

( ) ( )

( )

∫

∫

∫

∫

≤ .

Antes de concluir esta sección con la demostración de la desigualdad de

Young consideremos una ϕ − función g estrictamente creciente. En este caso la

función inversa g−1 existe y tiene las mismas propiedades que g. Si se define

f x g s ds f y g t dtx y

( ) ( ) , ( ) ( )*= =∫ ∫−

0

1

0

entonces, por el teorema 1.3.2, ambas funciones son estrictamente convexas. La

función f * recibe el nombre de función conjugada de f. Obsérvese que

f f( ) ( )*0 0 0= = .

Estas consideraciones nos permiten introducir la siguiente proposición.

65

Proposición 1.6.8 : (Desigualdad de Young). Sea g: [ , ) [ , )0 0∞ → ∞ una

ϕ − función estrictamente creciente. Entonces si

f x g s dsx

( ) ( )= ∫0

, para todo x ∈ ∞[ , )0

y

f y g t dty

* ( ) ( )= −∫

1

0

para todo y ∈ ∞[ , )0 ,

donde g−1 es la función inversa de g, se tiene que cualesquiera sean a b, [ , )∈ ∞0 , se

cumple que

0 ≤ ≤ +ab f a f b( ) ( )* (1.28)

y la igualdad vale, si y solamente si b g a= ( ) .

La desigualdad (1.28) es llamada desigualdad de Young.

Demostración : Sea a ∈ ∞[ , )0 . Si a=0 no hay nada que demostrar. Supóngase que

a ≠ 0, entonces a g a( ) es el área de un rectángulo de “base” el número a y altura el

número g a( ) , luego se verifica

( )

a g a g s ds g t dt

f a f g a

g aa

( ) ( ) ( )

( ) ( ) .

( )

*

= +

= +

−∫∫

1

00

Es decir

( )a g a f a f g a( ) ( ) ( )*= + (1.29)

Esta relación se ilustra en la siguiente figura.

66

Figura 1.6

Escojamos b o∈ ∞[ , ) y supongamos que b g a≠ ( ) . Se demostrará que

ab g s ds g t dtba

< + −∫∫ ( ) ( ) .1

00

Supongamos primero que g a b( ) < . Como g−1 es estrictamente creciente en el

intervalo [ , )0 ∞ , se tiene que si g a t b( ) < < entonces a g t g b< <− −1 1( ) ( ) . De la

propiedad de monotonía de la integral de Riemann se deduce que :

( )a b g a g t dtg a

b

− < −∫( ) ( ) .( )

1

De esta desigualdad y de la relación (1.29) se obtiene

67

( )ab ag a a b g a

g s ds g t g t dt

g s ds g t dt

f a f b

g a

bg aa

ba

= + −

< + +

= +

= +

− −

−

∫∫∫

∫∫

( ) ( )

( ) ( ) ( )

( ) ( )

( ) ( ).

( )

( )

*

1 1

00

1

00

Es decir

ab f a f b< +( ) ( ).*

Para concluir, supongamos que b g a< ( ) . En este caso se tiene que

b t g a g t a< < ⇒ <−( ) ( )1 .

Por lo tanto

( )g t dt a g a bb

g a− < −∫1( ) ( )

( )

Usando esta desigualdad y la relación (1.29) se tiene

68

( )ab ag a a g a b

g s ds g t dt g t dt

g s ds g t dt g t dt

g s ds g t dt f a f b

a g a

b

g a

g a

bg aa

ba

= − −

< + −

= + +

= + = +

∫ ∫ ∫

∫∫∫

∫∫

− −

− −

−

( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( ) ( ).

( ) ( )

( )

( )

*

0

1

0

1

1 1

00

1

00

Es decir

ab f a f b< +( ) ( ).*

1.7. Funciones log- convexas.

El contenido de esta sección lo hemos tomado casi en su totalidad de [8], pp.

53-54, a excepción de la parte relacionada con la función Gamma que fue tomada de

[4], pp. 560-561.

Una función f I: ⊂ IR→ IR, donde I es un intervalo, es log-convexa si es

positiva y Ln f es convexa sobre I.

Esta definición nos lleva a la siguiente proposición.

Proposición 1.7.1 : Sean I ⊂ IR un intervalo y f I: → IR una función. Entonces f es

log-convexa si y sólo si f es positiva y

( ) ( ) ( )f x y f x f yα β α β+ ≤ ,

para todo x y I, , ,∈ >α β 0 y α β+ = 1.

69

Demostración : Supongamos que f es log-convexa, entonces Ln f es convexa y se

verifica que

( ) ( ) ( )

( ) ( )

( ) ( )

Ln f x y Ln f x Ln f y

Ln f x Ln f y

Ln f x f y

α β α β

α β

α β

+ ≤ +

= +

=


Como la función Ln es creciente se tiene que

( ) ( ) ( )f x y f x f yα β α β+ ≤ (1.30)


Recíprocamente, supongamos que la desigualdad (1.30) es cierta para todo

x y I, , , [ , ], ,∈ ∈ + =α β α β0 1 1 y que además f es positiva. Entonces

( ) ( ) ( )( ) ( )

Ln f x y Ln f x f y

Ln f x Ln f y

α β

α β

α β+ ≤

= +

lo cual implica que Ln f es una función convexa y por lo tanto f es log-convexa.

La siguiente proposición establece que toda función log-convexa es convexa.

Proposición 1.7.2 : Sean I ⊂ IR un intervalo y f I: → IR una función log-convexa.

Entonces f es convexa.

70

Demostración : Supongamos que f es log-convexa. Entonces está definido ( )Ln f x

para todo x I∈ y se tiene ( ) ( )( ) ( )( )f x Ln f x goh x= =exp , donde ( )g x ex= y

( ) ( )h x Ln f x= .

Como f es log-convexa se verifica que h Ln f= es convexa y dado que g es

convexa y además estrictamente creciente, se concluye aplicando el teorema 1.4.2

(parte 1) que f goh= es convexa.

La siguiente proposición expresa que la suma y el producto de funciones log-

convexas es log-convexa.

Proposición 1.7.3 : Sean I ⊂ IR un intervalo y f I: → IR , g I: → IR funciones log-

convexas. Entonces f g⋅ y f+g son log-convexas.

Demostración : Supongamos que f y g son funciones log-convexas. Entonces f y g

son positivas y se verifica que

Ln f g Ln f Ln g⋅ = +

es una función convexa por ser la suma de dos funciones convexas y, por tanto, el

producto f g⋅ es log-convexo.

Verifiquemos ahora que la suma de funciones log-convexas es una función log-

convexa.

En efecto, como f y g son funciones log-convexas se tiene que f+g es positiva. Sean

α β, > 0 tales que α β+ = 1 y x y I, ∈ , entonces

71

( )

( ) ( )

( ) ( )

f g x y f x y g x y

f x f y g x g y porque f y g son convexas

f x g x f y g y por

f g x f g y

+ + = + + +

≤ + −

≤ + +

= + +

( ) ( ) ( )

( ) ( ) ( ) ( ) ( log )

( ) ( ) ( ) ( ) ( . )

( ) ( ).

α β α β α β

α β α β

α β

α β

124

Es decir

( ) ( ) ( )f g x y f g x f g y+ + ≤ + +( ) ( ) ( )α β α β

para todo x y I, , ,∈ >α β 0 tales que α β+ = 1. Luego, aplicando la proposición

1.7.1 se concluye que f + g es log - convexa.

Seguidamente se presenta una proposición que establece que si el límite de

una sucesión de funciones log-convexas existe y es positivo entonces también es una

función log-convexa.

Proposición 1.7.4 : Sean I ⊂ IR un intervalo y { }fn n IN∈ una sucesión de funciones

f In: → IR log-convexas para cada n∈IN . Si lim fn

n existe y es positivo entonces es

una función log-convexa.

Demostración : Sea f x lim f xn

n( ) ( )=→∞

para cada x I∈ . Como cada fn , n∈IN , es

log-convexa se tiene que fn es positiva y dado que la función Ln es continua en

( )0, + ∞ se verifica que

( )lim Ln f x Ln lim f x Ln f xn

nn

n→∞ →∞

=

=( ) ( ) ( ).

Por lo tanto, tenemos que :

72

( )Ln f Ln lim f lim Ln fn

nn

n=

=

y del hecho que Ln fn es una función convexa se tiene que Ln f es el límite de una

sucesión de funciones convexas y, por el teorema 1.4.5, concluimos que Ln f es

convexa, es decir que f es log-convexa.

Para finalizar esta sección consideremos la función Γ (Gamma) definida para

todo x>0 por la integral impropia

Γ( ) .x e t dtt x= − −∞

∫1

0

Demostraremos a continuación que la función Γ es log-convexa en ( , ).0 + ∞ Para

demostrarlo sólo necesitamos probar que LnΓ es convexa, es decir :

d Ln

dx

2

2

2

20

Γ Γ Γ ΓΓ

=−

≥" '

(1.31)

En efecto

Γ

Γ

' ( ) ( )

"( ) ( )

xx

e t dt

e t Ln t dt

x e t Ln t dt

t x

t x

t x

=

=

=

∞− −

− −∞

− −∞

∫

∫

∫

∂∂

0

1

1

0

1 2

0

Aplicando ahora la desigualdad de Chauchy-Schawrz para las integrales (desigualdad

(1.26) ) tenemos que :

73

( )

Γ

Γ Γ

'

".

/ /

/ /

2 1

0

2

2 1

0

2 1

2

2 12

2 12

00

1 1 2

00

=

=

≤

=

=

− −∞

− −∞

− −

− − − −∞∞

− − − −∞∞

∫

∫

∫∫

∫∫

e t Lnt dt

e t e t Lnt dt

e t dt e t Lnt dt

e t dt e t Lnt dt

t x

t x t x

t x t x

t x t x

Esto implica que

Γ Γ Γ" '− ≥2 0

y por consiguiente la desigualdad (1.31) es cierta, y así LnΓ es convexa, es decir Γ

es log-convexa.

1.8. Funciones Aditivas y Funciones mid convexas.

En esta sección presentaremos las definiciones de función aditiva y función

mid convexa. Veremos también que si f : IR→ IR es una función aditiva y además

continua entonces es lineal y demostraremos que toda función mid convexa y

continua es convexa.

Lo expuesto aquí ha sido tomado casi completamente de [11], Capítulos 5 y 7,

exceptuando la parte relacionada con el teorema 1.8.3 que se encuentra en [8], p. 49.

Empezamos con la definición de función aditiva.

74

Definición 1.8.1 : (Función aditiva)(1). Una función f : IR→ IR se dice aditiva si

satisface la ecuación de Cauchy

f x y f x f y( ) ( ) ( )+ = + (1.32)

para todo x y, ∈IR..

Pasamos entonces a las siguientes proposiciones.

Proposición 1.8.1 : Sea f : IR→ IR una función aditiva. Entonces

f x f xii

n

ii

n

= =∑ ∑

=

1 1

( ) (1.33)

para cada n∈IN y para cualesquiera x xn1, ,K ∈IR.

Demostración : Si n=2 tenemos la igualdad (1.32) que es la definición de función

aditiva.

Supongamos que la igualdad (1.33) es cierta para n − 1 sumandos y probemos que

también es cierta para n. En efecto :

( )

( )

f x f x x

f x f x f es aditiva

f x f x

f x f x f x

ii

n

ii

n

n

ii

n

n

i ni

n

i ii

n

ii

n

i

n

= =

−

=

−

=

−

= ==

∑ ∑

∑

∑

∑ ∑∑

=

+

=

+

= +

= ⇒

=

1 1

1

1

1

1

1

1 11

( )

( ) ( )

( ) .

Proposición 1.8.2 : Sean f1: IR→ IR y f2: IR→ IR funciones aditivas. Entonces, para

cada a b, ∈IR la función f af bf= +1 2 es aditiva.

Demostración : Sean x y, ∈IR , entonces

(1) Esta definición también es válida para funciones f : IR n → IR

75

( )

( ) ( )( ) ( )

( )

f x y af x y bf x y

a f x f y b f x f y

af x bf x af y bf y

f x f y f x y f x f y

+ = + + +

= + + +

= + + +

= + ⇒ + = +

1 2

1 1 2 2

1 2 1 2

( ) ( )

( ) ( ) ( ) ( )

( ) ( ) ( ) ( )

( ) ( ) ( ) ( ).

El teorema siguiente nos caracteriza las soluciones de la ecuación de Cauchy.

Teorema 1.8.1 : Sea f :IR→ IR una función que satisface la ecuación de Cauchy.

Entonces,

f x f x( ) ( )λ λ=

para todo x ∈IR y λ ∈Q.

Demostración : Para x=y=0 tenemos según (1.32) que

f f f f( ) ( ) ( ) ( )0 0 0 0 0= + = +

es decir

f f f( ) ( ) ( )0 0 0= −

de donde

f ( )0 0= (1.34)

Por otra parte

( ) ( )( ) ( ) ( )0 0= = − = + − = + −f f x x f x x f x f x( ) ,


f x f x( ) ( )− = − (1.35)

para todo x ∈ IR y, por lo tanto, f es una función impar.

Hagamos ahora en (1.33) x x xn1 = = =L , entonces tenemos que

76

( )f x f x f x f xii

n

ii

n

i

n

i

n

= = = =∑ ∑ ∑ ∑

= ⇒

=

1 1 1 1

( )

y por lo tanto

f nx nf x( ) ( )= (1.36)

Ahora bien, si λ ∈Z se tiene para λ ≥ 0 que

f x f x( ) ( )λ λ=

y si λ < 0, como − >λ 0 se verifica

( ) ( )( )( ) ( )

( )( ) ( )

f x f x f x

f x f x

λ λ λ

λ λ

= − − = − −

= − − = .

En cualquier caso, si λ ∈Z entonces

( )f x f xλ λ= ( ).

Dado que para cualquier λ ∈Q existen k ∈Z y m∈IN tales que λ = k m/ tenemos

que kx m x= ( )λ y por consiguiente

( ) ( )( ) ( )kf x f kx f m x mf x( ) = = =λ λ

de donde

( ) ( ) ( )f xk

mf x f xλ λ= =

para todo x ∈IR y λ ∈Q.

En el siguiente teorema probamos que toda solución de la ecuación de Cauchy

es lineal cuando la función además de aditiva es continua.

Teorema 1.8.2 : Sea f : IR→ IR una función aditiva y continua. Entonces

77

f x f x( ) ( )= 1

para todo x ∈IR..

Demostración : Sea x ∈IR y consideremos una sucesión { }λn tal que lim xn

n→∞

=λ , y

λn ∈Q para cada n ∈ IN. Entonces

( ) ( ) ( )f f fn n nλ λ λ= ⋅ =1 1 .

Tomando límite cuando n → ∞ y usando la continuidad de f, tenemos

( ) ( )

( )

f x f lim lim f

lim f f lim

f x

nn

nn

nn

nn

=

=

= =

=

→∞ →∞

→∞ →∞

λ λ

λ λ1 1

1

( )

( ) .

Es decir f x f x( ) ( )= 1 para todo x ∈IR..

A continuación presentamos la definición de función mid-convexa o convexa

en el punto medio, llamadas también Jensen-convexas.

Definición 1.8.2 : (Función mid convexa). Sea I ⊂ IR un intervalo. Una función

f I: → IR se dice mid convexa (o convexa en el punto medio) si y sólo si satisface la

desigualdad

fx y f x f y+

≤ +

2 2

( ) ( )(1.37)

para todo x y I, ∈ . Si la desigualdad es estricta para x y≠ , f es llamada

estrictamente mid convexa.

Obsérvese que de acuerdo con la definición , toda función convexa es también

mid convexa. El recíproco en general no es cierto , sin embargo veremos que bajo

condiciones bastante generales, ambas definiciones son equivalentes.

78

En primer lugar tenemos que si f : IR→ IR es una función aditiva entonces

( )fx y

f x yf x f y+

= + = +

2

1

2 2

( ) ( )

es decir, cualquier función aditiva es mid convexa.

Continuamos con el siguiente teorema.

Teorema 1.8.3 : Sean I ⊂ IR un intervalo y f I: → IR una función mid convexa.

Entonces

( ) ( )( )fx x

n nf x f xn

n1

11+ +

≤ + +L

L (1.38)

para todo entero positivo n y cualesquiera x I i ni ∈ =, , , .1K

Demostración : Si n=2 la desigualdad (1.38) es la definición de función mid

convexa. Supongamos que la relación es cierta para n m= 2 y demostremos que

también es cierta para n m= +2 1. En efecto, sean

x x x xm i

im i

i

m

m

m

' , " ,= == = +∑ ∑

+

1

2

1

21

2

2 1

2 1

entonces

fx x

nf

x xnm

m1 1 21

1

2

+ +

=

+ +

+

+L L

= +

+

=+

= +∑ ∑

+

f x xm i

im i

i

m

m

m

1

2

1

211

2

12 1

2 1

= +

= = +∑ ∑

+

f x xm i

im i

i

m

m

m

1

2

1

2

1

21

2

2 1

2 1

79

( )

( ) ( )

( ) ( )

( ) ( )( )

= +

= +

≤+

=

+

≤+

=+

=

= = +

= = +

= = ++

=

∑ ∑

∑ ∑

∑ ∑∑

+

+

+

f x x fx x

f x f xf es mid convexa

f x f x

f x f x

Hipotesis inductiva

f x f x

nf x

m ii

m ii

m ii

m ii

ii

ii

m ii

n

m

m

m

m

m

m

m

m

m

1

2 2

2

1

2

1

2

2

1

2

1

2

2

2

1

1

2

2 1

2

1

2

2 1

2

1

2

2 1

2

11

1

1

1

' "' "

' "( )

( )

,

lo cual implica que sí n m= 2 para algún m∈IN se verifica

( )fn

xn

f xii

n

ii

n1 1

1 1= =∑ ∑

≤ .

Supongamos ahora que n no es de esta forma, es decir n ∈IN es arbitrario (n>2), y

sea m∈IN tal que n m< 2 . Definiendo

yx x

nn= + +1 L

tenemos

( ) ( )y

x x n ynm

m=

+ + + −1 2

2

L=

+= +=∑∑ x yi

i ni

n

m

m

1

2

1

2,

80

es decir

y x ym i

i ni

n m

= +

= +=∑∑

1

2 1

2

1

y por la primera parte de la demostración tenemos que

( ) ( )

( ) ( ) ( )

f y f x y

f x f y

f x n f y

m ii ni

n

m ii ni

n

m im

i

n

m

m

( )

.

= +

≤ +

= + −

= +=

= +=

=

∑∑

∑∑

∑

1

2

1

2

1

22

1

2

1

1

2

1

1

Es decir

( ) ( ) ( ) ( )2 21

mi

m

i

nf y f x f y n f y≤ + −

=∑ ,

de donde

( ) ( )n f y f xii

n≤

=∑

1

y por consiguiente

( ) ( )f

x x

n

f x f x

nn n1 1+ +

≤

+ +L L,

con lo cual concluye la demostración.

Estamos en condiciones de demostrar el siguiente teorema.

81

Teorema 1.8.4 : Sean I ⊂ IR un intervalo y f I: → IR una función mid convexa.

Entonces

( )( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1 ( ) (1.39)

para todo x y I, ∈ y λ ∈QI[ , ].0 1

Demostración : Sea λ = k n/ donde { }k n∈ 0 1 2, , , ,K y n ∈IN, es decir

λ ∈QI[ , ]0 1 . De acuerdo con la desigualdad (1.38) se tiene que para todo x y I, ∈

se verifica

( )

( ) ( ) ( ) ( ) ( )

fk

nx

k

ny f

kx n k y

n

k f x n k f y

n

k

nf x

k

nf y

+ −

=

+ −

≤+ −

= + −

1

1

lo cual implica que

( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1 ,

para todo x y I, ∈ y λ ∈Q [ ]I 0 1, .

Finalizamos este capitulo con el siguiente teorema, el cual establece que toda

función mid convexa y continua es convexa.

Teorema 1.8.5 : Sean I ⊂ IR un intervalo y f I: → IR una función mid convexa y

continua. Entonces f es convexa.

Demostración : Sean x y I, ∈ y [ ]λ ∈ 0 1, . Sea { }λn una sucesión de números

racionales pertenecientes al intervalo cerrado [0, 1] (λn ∈Q [ ]I 0 1, ,n ∈IN ) que

converge a λ λ λlimn

n→∞

=

.

82

Entonces, por el teorema anterior, tenemos que

( )( ) ( )f x y f x f yn n n nλ λ λ λ+ − ≤ + −1 1( ) ( ).

Utilizando esto y el hecho que f es continua se obtiene

( )( ) ( )( )

( )( )

( ) ( ) ( )( )

( ) ( )

f x y f lim x y

lim f x y

lim f x f y

f x f y

nn n

nn n

nn n

λ λ λ λ

λ λ

λ λ

λ λ

+ − = + −

= + −

≤ + −

= + −

→∞

→∞

→∞

1 1

1

1

1( ) .

Es decir

( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1

para todo x y I, ∈ y [ ]λ ∈ 0 1, .

83

Capítulo II

Funciones Convexas Sobre IR n En el capítulo 1 tratamos funciones convexas definidas sobre un intervalo de

la recta real. En este capítulo consideraremos funciones convexas f D: ⊂ IRn→ IR

donde D es un conjunto convexo no vacío. Utilizaremos algunas propiedades de los

conjuntos convexos, las cuales el lector puede encontrar en [1], [5], [8], [15] o [17].

Las funciones convexas sobre subconjuntos convexos de IRn desempeñan un

papel muy importante en la teoría de la optimización, principalmente en la

programación lineal y la programación convexa. Por otra parte, cualquiera que se

interese en el estudio de la programación no lineal debe dominar primero la teoría

referente a estas funciones. De aquí la importancia de este capítulo que sirve de base

para el estudio mencionado.

2.1. Definición y Propiedades Básicas. Los conceptos de conjunto convexo y función convexa están estrechamente

relacionados. Para destacar la relación que existe entre las propiedades analíticas y las

propiedades geométricas de la gráfica de una función convexa, empezaremos por

presentar la definición analítica de función convexa y luego veremos una definición

geométrica equivalente a la analítica.

A continuación se presenta la definición analítica de función convexa la cual

viene expresada por la desigualdad de Jensen.

Definición 2.1.1. (Función convexa). Sean D ⊂ IRn un conjunto convexo y

f D: → IR una función. Se dice que f es convexa si y sólo si

84

( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1 (2.1)

para todo λ ∈ ∈[ , ] ; , .0 1 x y D

Comentarios : La desigualdad (2.1) se conoce con el nombre de desigualdad de

Jensen. En la definición se requiere que el dominio D de la función f sea un conjunto

convexo porque esto garantiza que para cualesquiera x y D, , [ , ],∈ ∈λ 0 1 f está

definida en el punto ( )λ λx y+ −1 .

De manera similar al caso de funciones f I: ⊂ IR → IR, donde I es un

intervalo, se demuestra que si D es un subconjunto convexo de IRn , una función

f D: ⊂ IRn→ IR es convexa si y sólo si

( )f x f xi ii

n

i ii

nα α

= =∑ ∑

≤

1 1

para todo x D i ni ∈ =, , , ;1K y αi ≥ 0 tales que αii

n=

=∑ 1

1

.

Los detalles de la demostración se encuentran en el teorema 1.1.1.

Algunos ejemplos de funciones convexas son :

1) f x x D( ) ,= = IRn ;

2) f r s r s D( , ) ,= + =2 2 IR2 ;

3) f r s r s D( , ) exp ( ) ,= + =2 2 IR2 ;

4) f x x x xn n( , , ) ,1 1K L= + +α α

85

si ( )α ≥ > =1 0 1, , , .x i ni K

La demostración de que las funciones dadas en 1), 2) y 4) son convexas se hace

directamente usando la desigualdad de Jensen expresada en la definición 2.1.1. En 1)

se aplica la desigualdad triangular ; en 2) se utiliza el hecho de que la función

g : IR→ IR definida por ( )g t t= 2 es convexa ; y en 4) nos apoyamos en que la

función ( )h : ,0 ∞ → IR definida por ( )h t t= α , con α ≥ 1, es convexa. Finalmente,

para demostrar que la función dada en 3) es convexa, se usa el criterio de la matriz

Hessiana, el cual exponemos en el teorema 2.6.2. El lector interesado en los detalles

de la demostraciones puede consultar [8], pp. 135 y 137.

Ahora definiremos un conjunto de gran interés cuando se estudian las

funciones convexas porqué a través del mismo podemos dar un tratamiento

geométrico a las funciones convexas.

Definición 2.1.2 : (Epígrafo). Sean D ⊂ IRn un conjunto no vacío y f D: → IR una

función. El epígrafo de f (epí f) es el conjunto

epí ( ){f x D= ∈ ×, α IR ( ) }: .f x ≤ α

Geométricamente, en los casos D ⊂ IR y D ⊂ IR2 ( )n y n= =1 2 el conjunto

epí f consiste en todos los puntos de la gráfica de f y en los puntos que están por

encima de dicha gráfica. En la figura 2.1 se puede observar el conjunto epí f para el

caso de una función f a b:[ , ] → IR .

86

Figura 2.1

Sí [ ]f a b: , → IR es una función convexa se tiene que epí f es un conjunto

convexo (ver figura 2.2).

Figura 2.2

Esta afirmación la exponemos en la siguiente proposición.

epí f

epí f

87

Proposición 2.1.1 : Sean D ⊂ IRn un conjunto convexo y f D: → IR una función.

Entonces f es convexa si y sólo si epí f es un conjunto convexo.

Demostración : Supongamos que f es convexa y sean ( ) ( )x y, , ,α β ∈ epí f ,

entonces ( )f x ≤ α y ( )f y ≤ β . Si [ ]λ ∈ 0 1, , tenemos

( )( ) ( ) ( ) ( )

( )

f x y f x f yλ λ λ λ

λ α λ β

+ − ≤ + −

≤ + −

1 1

1 ,

luego

( ) ( )( )λ λ λ α λ βx y+ − + − ∈1 1, epí f ,

es decir

( ) ( )( )λ α λ βx y, ,+ − ∈1 epí f

y en consecuencia epí f es un conjunto convexo.

Recíprocamente, supongamos que epí f es un conjunto convexo. Sean

x y D, .∈ Como ( )( )x f x, ∈epí f y ( )( )y f y, ∈ epí f , se verifica para todo

[ ]λ ∈ 0 1, que

( )( ) ( ) ( )( )λ λx f x y f y, ,+ − ∈1 epí f ,

es decir ( ) ( ) ( ) ( )( )λ λ λ λx y f x f y+ − + − ∈1 1, epí f y por lo tanto

( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1

de donde resulta que f es convexa.

A continuación presentamos la definición de aplicación afín para funciones a

valores reales definidas sobre IRn, para luego demostrar que toda función afín f es

tal que f y − f son convexas.

88

Definición 2.1.3 : (Aplicación afín). Se dice que una función A: IRn→ IR es una

aplicación afín sí existen una transformación lineal T: IRn→ IR y una constante

b ∈IR tales que

( ) ( )A x T x b x= + ∈, IRn.

La siguiente proposición establece que una función f es afín si y sólo si f y − f son

convexas.

Proposición 2.1.2 : (ver [1], pp. 124-125). Si f : IRn→ IR es una función, entonces

f es afín si y sólo si

( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − = + −1 1 (2.2)

para todo [ ]λ ∈ ∈0 1, ; ,x y IRn.

Demostración : Supongamos que f es una aplicación afín. Entonces existen una

transformación lineal T : IRn→ IR y una constante b ∈IR , tales que

( ) ( )f x T x b x= + ∈, IRn.

En consecuencia, para todo [ ]λ ∈ ∈0 1, ; ,x y IRn, se verifica :

( )( ) ( )( )( ) ( ) ( ) ( )

( )( ) ( ) ( )( )( ) ( ) ( )

f x y T x y b

T x T y b b

T x b T y b

f x f y

λ λ λ λ

λ λ λ λ

λ λ

λ λ

+ − = + − +

= + − + + −

= + + − +

= + −

1 1

1 1

1

1 ,

es decir

( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − = + −1 1

89

y por lo tanto f y − f son convexas.

Recíprocamente, supongamos que para todo [ ]λ ∈ ∈0 1, ; ,x y IRn , se verifica

la igualdad (2.2) y sea T : IRn→ IR la función definida por

( ) ( ) ( )T x f x f x= − ∈0 , IRn.

Para demostrar que f es una aplicación afín basta probar que T es lineal.

En primer lugar demostremos que ( ) ( )T x T xλ λ= para todo λ ∈IR, x ∈IRn en varios

pasos.

a) ( ) ( )T x T xλ λ= , si [ ]λ ∈ ∈0 1, , x IRn.

Sean [ ]λ ∈ 0 1, y x ∈IRn, entonces

( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( )

( ) ( ) ( ) ( )( ) ( )

T x f x f f x f f x f f

f x f f x f T x

λ λ λ λ λ λ

λ λ λ λ

= − = + − − = + − −

= − = − =

0 1 0 0 1 0 0

0 0 .

b) ( ) ( )T x T xλ λ= , si λ > ∈1, x IRn.

Sean x ∈IRn y λ > 1 , luego ( )1 0 1λ ∈ , y por a) tenemos :

( ) ( )( ) ( )T x T x T x= =1 1λ λλ λ

de donde

( ) ( )T x T x xλ λ= ∈, IRn, .λ > 1

c) ( ) ( )T x T x x− = − ∈, IRn.

90

( ) ( )( ) ( )( ) ( ) ( ) ( ) ( )

( ) ( )( ) ( ) ( )( ) ( ) ( )

0 0 0 0

0 0

12

12

12

12

12

12

12

12

12

12

= = + − = + − − = + − −

= − + − − = + −

T T x x f x x f f x f x f

f x f f x f T x T x .

Es decir ( ) ( )T x T x+ − = 0 , de donde ( ) ( )T x T x− = − .

d) ( ) ( )T x T xλ λ= , si λ < ∈0, x IRn.

Sean x ∈IRn y λ < 0, entonces − >λ 0 y de a), b) y c) tenemos

( ) ( )( ) ( ) ( )( ) ( )T x T x T x T x T xλ λ λ λ λ= − − = − − = − − = .

En consecuencia,

( ) ( )T x T xλ λ λ= ∈, IR, x ∈IRn.

Para concluir probaremos que

( ) ( ) ( )T x y T x T y x y+ = + ∈, , IRn.

Efectivamente, sean x y, ∈IRn , entonces

( ) ( )( ) ( ) ( ) ( )( )( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )( )

( ) ( )

T x y T x y T x y f x y f

f x f y f f x f f y f

T x T y

+ = + = + = + −

= + − = − + −

= +

2 2 2 0

2 0 0 0

12

12

12

12

12

12

12

12

.

Concluimos así que T es lineal y por lo tanto f es una aplicación afín.

El siguiente lema será útil en la demostración de la proposición 2.1.3.

Lema 2.1.1 : Sean D ⊂ IRn un conjunto convexo, x D∈ int e y ∈IRn .

Entonces {J = ∈λ IR }: x y D+ ∈λ es un intervalo que contiene al 0 ∈. IR .

91

Demostración : Para demostrar que J es un intervalo basta probar que es un conjunto

convexo. Sean α β, ∈ J y [ ]µ ∈ 0 1, . Luego, x y D x y D+ ∈ + ∈α β, y como

D es convexo se verifica

( ) ( )( )µ α µ βx y x y D+ + − + ∈1 ,

es decir ( )( )x y D+ + − ∈µ α µ β1 , de donde ( )µ α µ β+ − ∈1 J y así J es un

subconjunto convexo de IR (un intervalo). Finalmente, como x y x D+ = ∈0 se

concluye que 0 ∈ J.

La siguiente proposición expresa una propiedad básica de las funciones

convexas que consiste en que la restricción de una función convexa a cualquier

segmento de recta contenido en su dominio también es una función convexa.

Proposición 2.1.3 : Sean D ⊂ IRn un conjunto convexo, f D: → IR una función

convexa, x D y∈ ∈int , IRn y {J = ∈λ IR }: .x y D+ ∈λ Entonces, la función

g J: → IR definida por ( ) ( )g f x yλ λ= + es convexa.

Demostración : Sean α β, ∈ J y [ ]µ ∈ 0 1, . Entonces

( )x y D x y D J+ ∈ + ∈ + − ∈α β µ α µ β, , 1 y por la convexidad de f se tiene

( ) ( ) ( ) ( ) ( ) ( )

( ) ( )( )( )( )( )( )

( )( )

µ α µ β µ α µ β

µ α µ β

µ α µ β

µ α µ β

g g f x y f x y

f x y x y

f x y

g

+ − = + + − +

≥ + + − +

= + + −

= + −

1 1

1

1

1 .

Es decir ( )( ) ( ) ( ) ( )g g gµ α µ β µ α µ β+ − ≤ + −1 1 para todo [ ]α β µ, , , ,∈ ∈J 0 1 y

por lo tanto g es convexa.

92

2.2. Hiperplanos y Propiedades Fundamentales de los

Conjuntos Convexos.

Debido a que este trabajo trata sólo de la teoría de funciones convexas y

presupone conocidas nociones tales como las de hiperplano en IRn , semiespacios

asociados, semiespacio de soporte, hiperplano de soporte, etc., así como también la

teoría concerniente a los conjuntos convexos ; en esta sección nos limitaremos a

definir estos conceptos y exponer sin demostración los teoremas fundamentales

relacionados con los conjuntos convexos, remitiendo al lector interesado en las

demostraciones a la bibliografía correspondiente.

Empezamos presentando un conjunto de definiciones.

Definición 2.2.1 : (Hiperplano). Sea H ⊂ IRn. Se dice que H es un hiperplano si y

sólo si existen un vector b ∈IRn, no nulo, y un número real α , tales que

{H x= ∈IR }n x b: ; .= α

Definición 2.2.2 : (Semiespacios asociados a un hiperplano). Dado un hiperplano

{H x= ∈IR }n x b: ; = α de IRn, a los conjuntos

{H x+ = ∈IR }n x b: ; ≥ α y {H x− = ∈IR }n x b: ; ≤ α

se les denomina semiespacios asociados al hiperplano H.

93

Definición 2.2.3 : (Semiespacio de soporte). Sea A ⊂ IRn un conjunto convexo. Un

semiespacio de soporte de A es un semiespacio cerrado que contiene a A y tiene al

menos un punto de A en su frontera.

Definición 2.2.4 : (Hipérplano de soporte). Sea A ⊂ IRn un conjunto convexo. Un

hiperplano de soporte de A es un hiperplano que es la frontera de un semiespacio de

soporte de A, es decir, es un hiperplano que intercepta la clausura de A y no tiene

puntos en común con int A.

Simbólicamente, los hiperplanos de soporte de A son aquellos que se pueden

representar de la forma :

{H x= ∈IR }n x b b: ; ,= ∈α IR

donde x b; ,≤ α para todo x A∈ y x b; ,= α para al menos un x A∈ ,

donde A es la clausura de A.

Definición 2.2.5: (Cápsula convexa). Sea M ⊂ IRn. Se denomina cápsula convexa

de M y se denota conv(M), a la intersección de todos los subconjuntos convexos de

IRn que contienen a M.

También podemos decir que conv (M) es el menor (en el sentido de inclusión)

conjunto convexo que contiene a M.

Si M es un conjunto convexo entonces conv (M)=M.

Definición 2.2.6 : (Simplex). Se llama simplex de dimensión m o también

m− simplex a la cápsula convexa de un conjunto de puntos p p pm0 1, , ,K ∈IRn

94

afinmente libres. Se denota conv{ }p pm0, , .K Los puntos p pm0, ,K se llaman

vértices.

Comentario : El lector que ignore la definición de conjunto afinmente libre puede

consultar [15], Tomo I, p. 58. Sin embargo, esto lo podemos ilustrar, en el caso de

IR3, diciendo que el conjunto de cuatro puntos { }p p p p0 1 2 3, , , ⊂ IR3 es

afinmente libre sí estos puntos no están todos contenidos en un plano y que el

conjunto de tres puntos { }p p p0 1 2, , ⊂ IR3 es afinmente libre sí estos tres puntos

no están contenidos todos en una recta.

Ejemplos de simplex de IR3 son :

1) Si m= 0 y p0 ∈ IR3, el 0− simplex conv{ }p0 es un punto.

2) Si m= 1 y { }p p0 1, ⊂ IR30 1, ,p p≠ el 1− simplex conv{ }p p0 1, es el

segmento de recta de extremos p0 y p1.

3) Si m= 2 y los puntos p p p0 1 2, , ∈IR3 son afinmente libres, el 2 − simplex

conv{ }p p p0 1 2, , es el triángulo de vértices p p p0 1 2, , , incluido su interior.

4) Si m= 3 y el conjunto { }p p p p0 1 2 3, , , ⊂ IR3 es afinmente libre, el

3− simplex conv{ }p p p p0 1 2 3, , , es el tetraedro de vértices

p p p p0 1 2 3, , , , incluido su interior.

El conjunto de teoremas que presentamos a continuación nos serán de utilidad

más adelante. Empezamos con el teorema de Caratheodory y su corolario dado como

un comentario.

95

Teorema 2.2.1 : (Teorema de Caratheodory). Sea M un subconjunto no vacío de

IRn. Entonces la cápsula convexa de M es el conjunto de todas las combinaciones

convexas de a lo sumo n + 1 puntos de M. En otras palabras, p∈conv{M} si y sólo si

existen n + 1 puntos (no necesariamente distintos dos a dos) p p p Mn0 1, , ,K ∈

tales que p pi ii

n=

=∑α

0

, donde αi ≥ 0 para todo i n= 0, ,K y αii

n=

=∑ 1

0

.

Demostración : ver [1], p. 43 ; [8], p. 88 o [15], Tomo II, p. 178.

Comentario : En el caso de un m− simplex S de un conjunto de puntos,

p p pm0 1, , ,K ∈ IRn afinmente libre, se tiene que

{ }

[ ]

S conv p p p

p R p p i m

m

ni i i i

i

m

i

m

=

= ∈ = ∈ = =

==∑∑

0 1

00

0 1 0 1

, , ,

: , , , , , ; .

K

Kα α α

(Ver [11], p. 115).

Teorema 2.2.2 : Sea G ⊂ IRn un conjunto abierto no vacío. Entonces para cada

x G∈ existe un simplex n − dimensional S G⊂ tal que x S∈ int .

Demostración : ver [11], p. 116.

Teorema 2.2.3 : Sea A ⊂ IRn un conjunto convexo tal que int .A ≠ ∅ Entonces el

conjunto int A es convexo.

Demostración : ver [11], p. 117 o [17], p. 77.

Comentario : De acuerdo con la proposición 2.1.1, si D ⊂ IRn es un conjunto

convexo y f D: → IR es una función convexa entonces epíf es un conjunto

convexo y aplicando el teorema 2.2.3 concluimos que int (epí f ) es un conjunto

convexo.

96

Teorema 2.2.4 : Sea A ⊂ IRn un conjunto convexo. Entonces por cada punto de la

frontera de A pasa un hiperplano de soporte de A.

Demostración : ver [11], p. 119 o [17], p. 84.

2.3. Continuidad de Funciones Convexas.

Análogamente al caso de funciones f I: ⊂ IR→ IR , donde I es un intervalo, la

propiedad de convexidad es una condición de regularidad bastante fuerte para las

funciones f D: ⊂ IRn→ IR , donde D es un conjunto convexo.

En esta sección se verá que la convexidad es suficiente para garantizar

continuidad. Más explícitamente, veremos que toda función convexa f D: ⊂ IRn→ IR,

donde D es un conjunto convexo, es continua en el interior de D.

Pasamos entonces a la siguiente proposición, la cual será útil para demostrar

que toda función convexa definida sobre un subconjunto convexo de IRn es continua

en el interior de su dominio.

Proposición 2.3.1 : Sean D ⊂ IRn un conjunto convexo y abierto, f D: → IR una

función convexa, x Do ∈ y {D x xo− = ∈IR }nox x D: + ∈ . Entonces las

funciones ( )g g D xo1 2, : − → IR definidas por

( ) ( ) ( )g x f x x g x f x x f xo o o1 2( ) , ( )= + = + −

verifican las siguientes propiedades :

1) g g1 2, son funciones convexas ;

97

2) f es acotada superiormente en una vecindad de xo, si y sólo si, g1 es acotada

superiormente en una vecindad de 0 ∈IRn ;

3) f es acotada superiormente en una vecindad de xo , si y sólo si, g2 es acotada

superiormente en una vecindad de 0 ∈IRn ;

4) f es continua en xo, si y sólo si, g1 es continua en 0 ;

5) f es continua en xo, si y sólo si, g2 es continua 0 .

Demostración :

1) Sean x y D xo, ∈ − y [ ]λ ∈ 0 1, . Entonces :

( ) ( ) ( ) ( ) ( ) ( )

( ) ( )( )( ) ( )

( )( ) ( )( )

λ λ λ λ

λ λ

λ λ λ λ

g x g y f x x f y x

f x x y x f es convexa

f x y x g x y

o o

o o

o

1 1

1

1 1

1

1 1

+ − = + + − +

≥ + + − +

= + − + = + − .

Es decir

( )( ) ( ) ( ) ( )g x y g x g y1 1 11 1λ λ λ λ+ − ≤ + − .

Análogamente

( ) ( ) ( ) ( ) ( )( ) ( ) ( ) ( )( )( ) ( ) ( ) ( )

( ) ( )( )( ) ( )

( )( ) ( )

( )( )

λ λ λ λ

λ λ

λ λ

λ λ

λ λ

g x g y f x x f x f y x f x

f x x f y x f x

f x x y x f x

f x y x f x

g x y

o o o o

o o o

o o o

o o

2 2

2

1 1

1

1

1

1

+ − = + − + − + −

= + + − + −

≥ + + − + −

= + − + −

= + −

Es decir

98

( )( ) ( ) ( ) ( )g x y g x g y2 2 21 1λ λ λ λ+ − ≤ + −

Por lo tanto, g1 y g2 son convexas.

2) Supongamos que f es acotada superiormente en una vecindad de xo, entonces

existen γ > 0 y M ∈IR tales que si x D∈ y ( ) ( )x B x B xo o∈ = +, ,γ γ0

se verifica ( )f x M≤ .

Luego

( ) ( )f x x x M x D B xo o o− + ≤ ∈, ,I γ .

Como ( ) ( )y x x D x Bo o= − ∈ − I 0, γ se tiene que

( ) ( ) ( ) ( )g y f y x M y B D xo o1 0= + ≤ ∈ −, , γ I

y en consecuencia g1 es acotada superiormente en una vecindad del cero.

Recíprocamente, supongamos que g1 es acotada superiormente en una

vecindad del cero, entonces existen γ > 0 y M ∈IR tales que si

x D xo∈ − y ( ) ( )x B B x xo o∈ = −0, , ,γ γ se verifica ( )g x M1 ≤ . Es decir

( )f x x Mo+ ≤ , para todo ( ) ( )x D x Bo∈ − I 0, γ

y dado que ( )y x x D B xo o= + ∈ I , γ se tiene que

( )f y M≤ , para todo ( )y B x Do∈ , γ I

y por lo tanto, f es acotada superiormente en una vecindad de xo .

3) Como ( ) ( ) ( )g x g x f xo2 1= − , para todo x D xo∈ − , es decir, g2 difiere de

g1 tan sólo en una constante, se tiene que g2 es acotada superiormente en una

vecindad de 0 ∈IRn si y sólo sig1 es acotada superiormente en una vecindad de

99

cero y por la parte 2) esto es equivalente a que f es acotada superiormente en una

vecindad de xo, con lo cual concluye la demostración.

4) Supongamos que f es continua en xo . Luego, dado ε > 0 existe δ > 0 tal que si

x D∈ y ( ) ( )x B x B xo o∈ = +, ,δ δ0 entonces ( ) ( )f x f xo− < ε , es decir

( ) ( ) ( )f x x x f x x D B xo o o o− + − < ∈ε δ, ,I .

Como ( ) ( )y x x D x Bo o= − ∈ − I 0,δ se deduce que dado ε > 0, existe δ > 0 tal

que si ( ) ( )y B D xo∈ −0,δ I entonces

( ) ( )f y x f xo o+ − < ε


( ) ( )g y g1 1 0− < ε

y en consecuencia g1 es continua en 0 ∈IRn.

Recíprocamente, supongamos que g1 es continua en cero. Luego, dado ε > 0

existe δ > 0 tal que tal que si x D xo∈ − y ( ) ( )x B B x xo o∈ = −0, ,δ δ

entonces ( ) ( )g x g1 1 0− < ε , es decir

( ) ( ) ( ) ( )f x x f x x D x Bo o o+ − < ∈ −ε δ, ,I 0 .

Como ( )y x x D B xo o= + ∈ I , δ se tiene que dado ε > 0 existe δ > 0 tal que si

( )y B x Do∈ , δ I entonces

( ) ( )f y f xo− < ε

y por lo tanto f es continua en xo.

100

5) Dado que ( ) ( ) ( )g x g x f xo2 1= − para todo x D xo∈ − , se ve inmediatamente que

g2 es continua en 0 ∈IRn si y sólo si g1 es continua en cero y como esto ultimo

es por 4) equivalente a que f es continua en xo queda demostrada la proposición.

La proposición siguiente establece que una función convexa acotada

superiormente en el interior de su dominio es continua en el interior del mismo.

Proposición 2.3.2 : (ver [1], pp. 77-78). Sean D ⊂ IRn un conjunto convexo,

f D: → IR una función convexa y x Do ∈ int . Si f es acotada superiormente en una

vecindad de xo, entonces f es continua en xo .

Demostración : De acuerdo con la proposición 2.3.1, para demostrar que f es

continua en el punto xo, basta probar la continuidad en cero, de la función convexa

( )g D xo: − → IR, definida por ( ) ( ) ( )g x f x x f xo o= + − .

Por otra parte, dado que f es acotada superiormente en una vecindad de xo , se tiene

que g es acotada superiormente en una vecindad de cero y como ( )0 ∈ −int ,D xo

existen números reales M > 0 y γ > 0, tales que ( ) ( )B D xo0, γ ⊂ − , y

( )g x M≤ , para todo ( )x B∈ 0, γ .

Sea ε > 0, tal que εM

< 1. Consideremos ( ) ( )x B B D xM o∈ ⊂ ⊂ −0 0, ,ε γ γ ,

entonces tomando x xM1 = ε tenemos que ( )x B1 0∈ , γ pues

x xM MM1 = < =ε εε γ γ . Como g es convexa con ( )g 0 0= y además x x

M= ε

1 se

verifica

101

( ) ( ) ( )( )( ) ( ) ( )

( ) ( )( )

g x g x g x

g x g

g x M porque x B

M M M

M M

M M

= = + −

≤ + −

= ≤ ⋅ = ∈

ε ε ε

ε ε

ε ε ε γ

1 1

1

1 1

1 0

1 0

0,

Es decir :

( ) ( ) ( )g x x B D x AM o≤ ∈ ⊂ −ε γε, ,0 .

Además

( )− = − ∈M x x Bε γ1 0, y ( )0 = + −+ +M

M MMx xε

εε ε .

Por lo tanto

( ) ( )( )( ) ( )( )

0 0= = + −

≤ + −

≤ +

+ +

+ +

+ +

g g x x

g x g x

g x M

MM M

M

MM M

M

MM M

εε

ε ε

εε

ε ε

εε

ε .

Es decir

( )MM M

g x M+ ++ ≥εε

ε 0

de donde

( ) ( ) ( )g x x B D x BM o≥ − ∈ ⊂ −ε γε, , .0

De ( )A y ( )B se tiene que

( ) ( )− ≤ ≤ ∈ ⊂ −ε ε γεg x x B D xM

, , .0 0

En consecuencia, dado ε > 0 existe γ > 0 tal que si ( )x B D xM

∈ ⊂ −ε γ0 0, ,

entonces

102

( ) ( ) ( ) ( )g x g x g x g= − = − ≤0 0 ε ,

es decir, g es continua en 0 ∈IRn, de donde se concluye, por la proposición 2.3.1, que

f es continua en xo.

El siguiente lema lo utilizaremos luego en la demostración del teorema 2.3.1.

Lema 2.3.1 : Sean ( )x x x Bn1 2 0, , , , ,K ∈ γ tales que x x xn1 2, , ,K formen una base

de IRn, y sea

G x i ni i ii

n

i

n

i= < > =

==∑∑λ λ λ: , , , , ,1 0 1 2

11

K .

Entonces G es un conjunto abierto y ( )B G0, .γ I ≠ ∅ Además, si z G∈ entonces

( ) ( )B G z0, γ I − es una vecindad abierta de cero.

Demostración : Para demostrar que el conjunto

G x x i ni i ii

n

i

n

i i ii

n= <

> =

== =∑∑ ∑λ λ α α: : , , ,1 0 1

11 1

I K

es abierto, basta probar que su complemento

G x x para a un i nci i i

i

n

i

n

i i ii

n= ≥

≤ =

== =∑∑ ∑λ λ α α: : , lg , ,1 0 1

11 1

U K es cerrado.

En efecto, sea { }zm m IN∈ una sucesión de puntos de Gc que converge a un punto

z ∈IRn . Entonces, para cada m∈IN existen números reales λmi i n, , , ,= 1K tales

que :

z xm mi ii

n=

=∑λ

1

y λmii

n≥

=∑ 1

1

,

103

o existen números reales αmi i n, , , ,= 1K tales que

z xm mi ii

n=

=∑α

1

con αmi para a un i n≤ =0 1, lg , ,K .

Como la sucesión { }zm m IN∈ es convergente, existen números reales λ λ1, ,K n tales

que { }λmi m IN∈ converge a λi , para cada i n= 1, , ;K o existen números reales

α α1, , ,K n tales que la sucesión { }αmi m IN∈ converge a αi i n, , , .= 1K Luego,

tomando el límite cuando m→ ∞, obtenemos

z xi ii

n=

=∑λ ,

1

con λ λim

mii

n

i

nlim= ≥→∞ ==∑∑ 1

11

o

z xi ii

n=

=∑α ,

1

con αi para a un i n≤ =0 1, lg , , .K

En consecuencia, z Gc∈ y por lo tanto Gc es cerrado y así G es abierto.

Por otra parte, sean λi ni n= =+

11

1, , , ;K entonces

λi ni

nn

ni

n= = <+

=+

=∑∑ 1

11

11

1 y λi i n> =0 1, , ,K . Luego

( )x x G Ai ii

n= ∈

=∑λ

1

y además

x x x x xn i

i

n

n i n ii

n

i

n

n i nn

ni

n

i

n= ≤ = = ≤ = <+

=+ +

==+ + +

==∑ ∑∑ ∑∑1

11

11

11

11

11

11 1

11

γ γ γ.

Es decir :

104

( ) ( )x B B∈ 0, .γ

De las relaciones ( )A y ( )B se deduce que

( )x B G∈ ≠ ∅0, .γ I

Además, sí z G∈ entonces ( )0 ∈ −G z y G z− es un conjunto abierto pues es una

traslación del conjunto G el cual es abierto ; de donde se concluye que

( ) ( )B G z0, γ I − es una vecindad abierta de 0 ∈IRn.

Ahora estamos en condiciones de demostrar el teorema fundamental de esta

sección, el cual establece que toda función convexa definida sobre un subconjunto

convexo de IRn es continua en el interior de su dominio.

Teorema 2.3.1 : Sean D ⊂ IRn un conjunto convexo y f D: → IR una función

convexa. Entonces f es continua en int D .

105

Demostración : (Esta demostración se tomó con ciertas modificaciones de [1], pp.

78-79).

Sea x Do ∈ int , para demostrar que la función f es continua en xo, basta probar la

continuidad en 0 ∈IRn de la función convexa ( )g D xo: − → IR, definida por :

( ) ( )g x f x xo= + .

Como ( )0 ∈ −int ,D xo existe γ > 0, tal que ( )B D xo0, γ ⊂ − . Sean

( )x x Bn1 0, , ,K ∈ γ tales que x xn1 , ,K , formen una base de IRn y consideremos

G x i ni i i ii

n

i

n= < > =

==∑∑λ λ λ: , , , ,1 0 1

11

K .

Por el lema anterior ( )G BI 0, .γ ≠ ∅ Fijemos ( )z G B∈ I 0, γ . Entonces

( )− ∈ ⊂ −z B D xo0, γ y por el lema 2.3.1, ( ) ( )B G z0, γ I − es una vecindad abierta

de 0.

Sea ( ) ( )x B G z∈ −0, γ I , entonces existen números reales positivos λ λ1, ,K n tales

que λii

n<

=∑ 1

1

, y

x x zi ii

n=

−

=∑λ

1

.

Luego

( ) ( )x x z zi i ii

n

i

n= − + −

−

==∑∑λ λ1

11

.

Como g es convexa, se tiene

106

( ) ( ) ( )g x g x z g zi i ii

n

i

n≤ − + −

−

==∑∑λ λ1

11

.

Tomando

( ) ( ){ }M m a x g z g x z i ni= − − =, : , ,1K

se tiene que

( )g x M≤ , para todo ( ) ( )x B G z∈ −0, γ I

y por lo tanto, g es acotada superiormente en una vecindad del cero y en

consecuencia, por la proposición 2.3.1, f es acotada superiormente en una vecindad

de xo . Finalmente, aplicando la proposición 2.3.2, se concluye que f es continua en

xo . Dado que xo es un punto arbitrario de int D esto equivale a decir que f es

continua en int D .

A continuación presentamos otra forma de demostrar el teorema 2.3.1 :

Sea x D∈ int . Luego, por el teorema 2.2.2 existe un simplex n − dimensional

S D⊂ int tal que x S∈ int .

Sea z S∈ , entonces por el corolario del teorema 2.2.1 existen n + 1 puntos

x x Do n, ,K ∈ afinmente libres tales que z xi ii

n=

=∑λ ,

0

donde

[ ]λi i n∈ =0 1 0, , , , ,K y λii

n=

=∑ 1

0

.

Como f es convexa, se verifica que

( ) ( )f z f x f xi ii

n

i ii

n=

≤

= =∑ ∑λ λ

0 0

.

Tomando

107

( ){ }M m a x f x i ni= =: , ,0 K

se tiene

( )f z M≤ , para todo z S∈ .

Por lo tanto, f es acotada superiormente en una vecindad de x D∈ int y aplicando la

proposición 2.3.2 se concluye que f es continua en int .D

Comentario : El teorema 2.3.1 expresa que toda función convexa definida sobre un

subconjunto convexo de IRn es continua en el interior de su dominio pero no se

aclara la situación en la frontera del mismo. Con el fin de aclarar esta situación

consideremos el conjunto

( ){D x y= ∈, IR }2 2 2 1: x y+ ≤

y la función f D: → IR definida por :

( )( )( )

f x yx y si x y D

si x y fr D,

, int

,=

+ ∈

∈

2 2

2

La gráfica de esta función se asemeja a un paraboloide de revolución y su epígrafo es

un conjunto convexo de donde se concluye que f es convexa. Sin embargo, la

función es discontinua en la frontera de su dominio. De todo esto se desprende que

una función convexa puede ser discontinua en la frontera de su dominio pero siempre

es continua en el interior del mismo.

2.4. Diferenciabilidad de Funciones.

En esta sección presentaremos algunos resultados de carácter general

relacionados con el concepto de diferenciabilidad de funciones de varias variables. Se

darán las definiciones de diferencial fuerte, diferencial débil, subgradiente, etc.

108

Empezamos con la definición de diferencial fuerte.

Definición 2.4.1 : (Diferencial fuerte o diferencial Fréchet). Sean D ⊂ IRn un

conjunto abierto y f D: → IRm una función. Se dice que f es diferenciable en un

punto dado x Do ∈ cuando existe una transformación lineal Lxo: IRn→ IRm tal que

( ) ( ) ( ) ( ) ( )f x h f x L h x ho o x oo+ − = + ε , .2 3

con

( )ε x h

ho ,

→ ∈0 IRm cuando h → 0.

La expresión ( )L hxo∈IRm para todo h ∈IRn y se denomina diferencial

fuerte (o diferencial Fréchet) de la aplicación f en el punto xo. La transformación

lineal Lxo se llama derivada, más precisamente, derivada fuerte de la función f en el

punto xo.

Obsérvese que de (2.3) se obtiene

( ) ( ) ( ) ( )f x h f x L h

h

x h

ho o xo o+ − −

=ε ,

.

Esto nos permite deducir que f es diferenciable en el punto xo, si existe una

transformación lineal Lxo: IRn→ IRm, tal que

( ) ( ) ( )limh

f x h f x L h

ho o xo

→

+ − −= ∈

00 IRm.

En el caso m= 1 tenemos que Lxo: IRn→ IR es un funcional lineal y por lo

tanto para todo x ∈IRn existe un x* ∈IRn fijo tal que ( )L x x xxo= * ; .

109

A continuación presentamos otra definición de diferenciabilidad.

Definición 2.4.2 : (Diferencial débil o diferencial de Gato). Sean D ⊂ IRn un

conjunto abierto y f D: → IRm una función. Se llama diferencial débil, o

diferencial de Gato, de la función f en el punto x D∈ al límite (siempre que

exista)

( ) ( ) ( )f x y lim

f x y f x' ; =→

+ −

λ

λλ0

.

La diferencial débil ( )f x y' ; puede no ser lineal respecto a y . Sí esta linealidad se

verifica, entonces la función lx : IRn→ IRm definida por

( ) ( )l y f x yx = ' ;

es un operador lineal, este operador se llama derivada débil (o derivada de Gato).

Consideremos los limites laterales

( ) ( ) ( )f x y lim

f x y f x−

↑

+ −=' ;λ

λλ0

y ( ) ( ) ( )f x y lim

f x y f x+

↓

+ −=' ;λ

λλ0

.

( )λ λ λ λ λ λ↑ → < ↓ → >0 0 0 0 0 0significa mientras que significa: , , , .

Obsérvese que si ( )f x y+' ; existe y es una función lineal de “y” entonces

( ) ( ) ( ) ( )( ) ( ) ( )( ) ( )

( ) ( ) ( )

f x y lim lim lim

f x y f x y f x y

f x y f x f x y f x f x y f x−

↑

+ −

↓

+ − −− ↓

+ − −

+ +

= = = −

= − − = =

'

' '

;

; ; ' ; .

λ

λλ λ

λλ λ

λλ0 0 0

110

Es decir, si ( )f x y+' ; existe para cada y ∈IRn y es una función lineal de “y ”

entonces existe el limite ( )f x y' ; para todo y ∈IRn y depende linealmente de “y ”.

Cabe destacar también que el límite ( )f x y' ; , cuando existe, es denominado por

muchos autores, derivada direccional de la función f en el punto x según la dirección

del vector y .

En otro orden de ideas, sean D ⊂ IRn un conjunto abierto, f D: → IRm una

función diferenciable Fréchet en un punto x D∈ fijo e y ∈IRn arbitrario. Entonces

existe un número real γ > 0 tal que x y D+ ∈λ , cada vez que λ γ< . Por ser f

diferenciable Fréchet en el punto x, tenemos que existe una transformación lineal

Lx : IRn→ IRm tal que :

( ) ( ) ( ) ( ) ( )f x y f x L y x yx+ − = +λ λ ε λ; .2 4

donde

( )limy

x y

yλ

ε λλ→

= ∈0

0;

IRm.

Dividiendo la igualdad (2.4) por λ ≠ 0 y teniendo en cuenta que Lx es lineal,

tenemos

( ) ( ) ( ) ( ) ( )f x y f xx

x yL y

+ −= +

λλ

ε λλ;

.2 5 .

Como

( ) ( )lim lim y

x y x y

yλ

ε λλ λ

λλ

ε λλ→ →

= =0 0

0; ;

nos queda, al tomar el limite en la igualdad (2.5) cuando λ → 0 , que

( ) ( )f x y L yx' ; =

111

y por lo tanto ( )f x y' ; es una función lineal de “y ”, y en consecuencia la

diferenciabilidad fuerte implica la diferenciabilidad débil y ambas diferenciales son

iguales.

El recíproco en general no es cierto, en otras palabras, la diferenciabilidad

débil no implica la diferenciabilidad fuerte. Por ejemplo, consideremos la función

f : IR2→ IR ( )m= 1 definida por

( )( ) ( )

( ) ( )f x x

x x si x x

si x x

x xx x

1 21 2 1 2

1 2

13

2

14

22 0 0

0 0 0

,, , , ;

, , , .

=+ + ≠

=

+

Esta función es continua en todo el plano, incluido el punto ( )0 0, . Tiene diferencial

débil en el punto ( )0 0, , ya que para todo ( )y y y= ∈1 2, IR ( ){ }2 0 0− , se verifica que

( ) ( ) ( ) ( )f y lim lim lim y y y y

f y f f y y yy y

' ; .00

0 0

0 01 2 1 2

4

1

3

24

1

4 2

2

2= = = + +

= +

→

+ −

→ → +λ

λλ λ

λλ λ

λλ λ

Es decir ( )f y y y' ;0 1 2= + y así ( )f ' ;0 ⋅ es lineal.

Sin embargo, tomando

( ) ( ) ( ) ( )ω 0 0 0 0 1

3

2

1

4

2

2, ' ; ,y f y f f yy y

y y= + − − =

+

y aproximándonos a 0 ∈IR2 a lo largo de la parábola y y2 12= , y1 0> , tendremos

( )lim limy

y

y y

y

y y y→ ↓ += = ≠

0

0

0 212

1

15

1

4

1

2

2

20

ω ,.

Por lo tanto, ( )f y' ;0 no es la diferencial fuerte de f y así f no es diferenciable

Fréchet.

112

Para la teoría que nos interesa desarrollar es suficiente la diferenciabilidad

débil y por lo tanto esta es la que utilizaremos en gran parte de lo que resta del

capítulo, en el sentido en que la definimos a continuación.

Definición 2.4.3 : (Diferenciabilidad). Sean D ⊂ IRn un conjunto abierto y

f D: → IR una función. Se dice que f es diferenciable en un punto x D∈ si y sólo si

para cada y ∈IRn existe el límite

( ) ( ) ( ) ( )f x y limf x y f x

+↓

+ −=' ; .

λ

λλ0

2 6

y ( )f x y+' ; es una función lineal de y.

Para concluir esta parte, consideremos D ⊂ IRn un conjunto abierto y

f D: → IR una función diferenciable en el punto x D∈ (en el sentido que acabamos

de definir). Entonces, sí { }e en1 , ,K es la base canónica de IRn , tenemos que

( ) ( ) ( )f x e limi

f x e f xi' ; .=→

+ −

λ

λλ0

Este número usualmente se denomina derivada parcial de f y se denota ( )∂∂

fei

x o

( )∂∂

fxi

x y por ser ( )f x' ; ⋅ lineal se cumple que si y y ei ii

n=

=∑

1

, entonces

( ) ( ) ( )

( ) ( )

f x y f x y e f x y e y f x e

y x f x y

i ii

n

i i i ii

n

i

n

ifx

i

n

i

' ; ' ; ' ; ' ;

; .

=

= =

= = ∇

= ==

=

∑ ∑∑

∑

1 11

1

∂∂

113

Es decir

( ) ( )f x y f x y' ; ;= ∇

o equivalentemente

( ) ( ) ( )f x y f x y+ = ∇' ; ; . ,2 7

donde ( ) ( ) ( )∇ =

f x x x

fx

fxn

∂∂

∂∂1

, ,K .

A continuación presentamos las definiciones de subgradiente y subdiferencial

las cuales nos serán muy útiles para desarrollar lo que sigue del capítulo.

Definición 2.4.4 : (Subgradiente y subdiferencial). Sean D ⊂ IRn un conjunto

abierto y f D: → IR una función. Cualquier vector x* ∈IRn, tal que

( ) ( ) ( )f z f x x z x z D≥ + − ∈* ; , .2 8

es llamado subgradiente de f en x. El conjunto de todos los subgradientes de f en x

se denomina subdiferencial de f en x y se denota por ( )∂ f x , es decir :

( ) {∂ f x x= ∈* IR ( ) ( ) }n f z f x x z x para todo z D: ;*− ≥ − ∈

Por ejemplo, para la función valor absoluto, definida por ( )f x x= para todo

x ∈IR, se tiene que ( ) [ ]∂ f 0 1 1= − , .

En efecto, supongamos que f es subdiferenciable en el cero, esto es

( )∂ f 0 ≠ ∅ , luego existe ( )x f* ∈ ⊂∂ 0 IR tal que :

( ) ( ) ( )f z f x z para todo z− ≥ ⋅ − ∈0 0* , IR,

es decir

114

z x z para todo z≥ ⋅ ∈* , IR.

Si z > 0, entonces xz

z* ≤ = 1, lo cual significa que ( ]x* , .∈ −∞ 1

Si z < 0 , entonces xz

z* ,≥ = −1 es decir [ )x* , .∈ − + ∞1

Si z = 0, entonces x* puede tomar cualquier valor ( *x ∈IR) .

De las tres ultimas relaciones obtenemos que [ ]x* ,∈ −1 1 .

Por lo tanto, sí ( )x f* ∈∂ 0 entonces [ ]x* ,∈ −1 1 , de donde ( ) [ ]∂ f 0 1 1⊂ − , .

Analicemos la inclusión en el otro sentido : Sea [ ]x* ,∈ −1 1 . En consecuencia, sí

z > 0, entonces z

zx= ≥1 * , de donde ( )z x z− ≥ ⋅ −0 0* , es decir

( ) ( ) ( )f z f x z− ≥ ⋅ −0 0* , sí z > 0.

Si z < 0, entonces z

zx= − ≤1 * , de donde ( )z x z− ≥ ⋅ −0 0* , esto es

( ) ( ) ( )f z f x z− ≥ ⋅ −0 0* , sí z < 0.

Si z = 0, es evidente que se cumple

( )z x z− ≥ ⋅ −0 0* .

En consecuencia

( ) ( ) ( )f z f x z para todo z− ≥ ⋅ − ∈0 0* IR,

lo cual implica que ( )x f* .∈∂ 0

Hemos demostrado que si [ ]x* ,∈ −1 1 entonces ( )x f* ,∈∂ 0 es decir que

[ ] ( )− ⊂1 1 0, .∂ f

115

De todo lo anterior se concluye que

( ) [ ]∂ f 0 1 1= − , .

El lector interesado en más ejemplos de subdiferenciales puede consultar [1], pp. 87-

104.

2.5. Diferenciabilidad de Funciones Convexas.

En esta sección presentamos algunos resultados concernientes a la

diferenciabilidad de funciones convexas a valores reales definidas sobre subconjuntos

convexos y abiertos de IRn . El principal teorema de esta sección establece que si

D ⊂ IRn es un conjunto convexo y abierto, f D: → IR una función convexa y x un

punto de D, entonces f es diferenciable en x si y sólo si existen todas las derivadas

parciales de f en x.

Empezamos entonces con la siguiente definición.

Definición 2.5.1 : (Función positivamente homogénea). Sea f : IRn→ IR una

función. Se dice que f es positivamente homogénea si ( )f 0 0= y para todo x ∈IRn

y todo número real no negativo α , se tiene que

( ) ( )f x f xα α= .

A continuación presentamos un conjunto de lemas, los cuales serán útiles para

demostrar los teoremas 2.5.1 y 2.5.2. Cabe destacar también que lo que sigue de esta

sección se tomó de [11], Cap. VII, pp. 165-172.

116

Lema 2.5.1 : Sean D ⊂ IRn un conjunto convexo y abierto, f D: → IR una función

convexa, x D y∈ ∈, IRn y {J = ∈λ IR }: x y D+ ∈λ . Entonces la función

g J: → IR definida por

( ) ( ) ( )g f x y f xλ λ= + −

es convexa.

Demostración : Sean α β, ∈ J y [ ]µ ∈ 0 1, . Entonces

x y D x y D+ ∈ + ∈α β, y como f es convexa se verifica

( ) ( ) ( ) ( ) ( )[ ] ( ) ( ) ( )[ ]( ) ( ) ( ) ( )

( ) ( )( )( ) ( )

( )( )( ) ( )

( )( )

µ α µ β µ α µ β

µ α µ β

µ α µ β

µ α µ β

µ α µ β

g g f x y f x f x y f x

f x y f x y f x

f x y x y f x

f x y f x

g

+ − = + − + − + −

= + + − + −

≥ + + − + −

= + + − −

= + −

1 1

1

1

1

1

Es decir

( )( ) ( ) ( ) ( )g g gµα µ β µ α µ β+ − ≤ + −1 1

para cualesquiera α β, ∈ J y [ ]µ ∈ 0 1, , y por lo tanto g es convexa.

Lema 2.5.2 : SeanD ⊂ IRn un conjunto convexo y abierto y f D: → IR una función

convexa. Entonces en cada punto x D∈ la derivada ( )f x y+' ; existe para cada

y ∈IRn . Además ( )f x+ ⋅' ; es una función convexa y positivamente homogénea y,

para cada y ∈IRn ,

( ) ( ) ( )− − ≤+ +f x y f x y' '; ; .2 9

117

Demostración : Sean x D∈ e y ∈IRn fijos y defínase

{J = ∈λ IR }: x y D+ ∈λ .

Por el lema 2.1.1, J es un intervalo abierto que contiene al cero. Sea g J: → IR la

función definida por

( ) ( ) ( )g f x y f xλ λ= + − .

De acuerdo con el lema 2.5.1, g es convexa.

Por el teorema 1.2.2 existe la derivada

( ) ( ) ( ) ( )

( ) ( ) ( )

g lim lim

lim f x y

g g g

f x y f x

+↓

−− ↓

↓

+ −+

= =

= =

'

' ; .

00

00 0

0

λ

λλ λ

λλ

λ

λλ

Sean ahora u v, ∈IRn arbitrarios, [ ]µ ∈ 0 1, y λ > 0 suficientemente pequeño.

Entonces

( )( )( ) ( )[ ] ( ) ( )( )( ) ( )[ ]( ) ( ) ( ) ( )[ ]

( ) ( ) ( ) ( ) ( )

1 1

1

1 1

1

1

λ λ

λ

λλ

λ νλ

λ µ µ ν µ λ µ λ ν

µ λ µ λ ν

µ µ

f x u f x f x u x f x

f x u f x f x

f x u f x f x f x

+ + − − = + + − + −

≤ + + − + −

= + −+ − + −

y tomando el límite cuando λ ↓ 0 nos queda que

( )( ) ( ) ( ) ( )f x u v f x u f x+ + ++ − ≤ + −' ' '; ; ;µ µ µ µ ν1 1

lo cual expresa que ( )f x+ ⋅' ; es una función convexa.

Consideremos ahora µ ∈IR positivo y arbitrario y λ > 0 suficientemente pequeño.

Luego

118

( ) ( ) ( ) ( )f x y f x f x y f x+ − + −=

λ µλ

λ µλ µµ

y tomando el límite cuando λ ↓ 0 se tiene que

( ) ( )f x y f x y+ +=' '; ;µ µ

y por lo tanto ( )f x+ ⋅' ; es una función positivamente homogénea.

Obsérvese que ( )f x+ =' ; ,0 0 pues ( ) ( ) ( )f x lim lim

f x f x+

↓

+ −

↓= = =' ; 0 0

0

0

0

0

λ

λλ λ λ .

Finalmente, sea y ∈IRn arbitrario. Como ( )f x+ ⋅' ; es una función convexa

tenemos que

( ) ( )( )( ) ( )

0 0 12

12

12

12

= = + −

≤ + −

+ +

+ +

f x f x y y

f x y f x y

' '

' '

; ;

; ; .

Es decir

( ) ( )f x y f x y+ ++ − ≥' '; ; 0 ,

de donde

( ) ( )− − ≤+ +f x y f x y' '; ;

y así concluye la demostración.

Lema 2.5.3 : Sean D ⊂ IRn un conjunto convexo y abierto y f D: → IR una función

convexa. Entonces ( )∂ f x ≠ ∅ , para todo x D∈ .

Demostración : Consideremos el conjunto

( ){A x y= ∈, IRn × IR ( )}: ,x D y f x∈ > = int (epí f ).

119

El conjunto A es convexo pues epí f es un conjunto convexo. Además, los

puntos ( )( )x f x D, ∈ × IR son puntos de la frontera de A. Sea x D∈ . De acuerdo con

el teorema 2.2.4, existe un hiperplano de soporte H que pasa por el punto ( )( )x f x, .

El hiperplano H tiene una ecuación de la forma

( )( ) ( )c z x y f x; .− + − =α 0 2 10

donde c ∈IRn, α ∈IR y los puntos del hiperplano son los puntos

( )z y, ∈IRn× IR= IRn+1 que satisfacen la ecuación (2.10). Obsérvese que el punto

( )( )x f x, ∈IRn+1 satisface la ecuación del hiperplano. Además, H ⊂ IRn+1 es un

hiperplano de IRn+1. Si α = 0 , entonces para que se cumpla la ecuación (2.10),

necesariamente z x= , y así cualquier punto ( )x y, con y ∈IR arbitrario satisface la

ecuación (2.10), por lo tanto para ( )y f x> se tiene que ( )x y H, ∈ y como además

( )x y A, ∈ se tiene que H AI ≠ ∅ y dado que el conjunto convexo A es abierto

tenemos una contradicción porque H es un hiperplano de soporte de A y por lo tanto

no puede cortar a A. La contradicción proviene de haber supuesto que α = 0 . En

consecuencia α ≠ 0. Luego, podemos escribir la ecuación (2.10) en la forma

( )y f x c z x= + − −1α ; .

Los dos semiespacios en que H divide a IRn+1 son determinados por las

desigualdades

( ) ( )y f x c z x y f x c z x> + − − < + − −1 1α α; , ; .

Para ( )y f x> arbitrario, el punto ( )x y A, ∈ y se verifica que

( )y f x c x x> + − −1α ;

120

y por lo tanto el conjunto A está contenido en el semiespacio determinado por la

desigualdad

( )y f x c z x> + − −1α ; .

Sean z D∈ arbitrario y ( )t f z> arbitrario pero tan próximo a ( )f z como se quiera.

Entonces ( )z t A, ∈ y se tiene

( )t f x c z x> + − −1α ; .

Haciendo que ( )t f z↓ obtenemos

( ) ( )f z f x c z x≥ + − −1α ; ,

para todo z D∈ y en consecuencia ( )− ∈1α ∂c f x , y así ( )∂ f x ≠ ∅ .

Lema 2.5.4 : Sean D ⊂ IRn un conjunto convexo y abierto, f D: → IR una función

convexa, x D∈ y x* ∈IRn . Entonces, ( )x f x* ∈∂ si y sólo si

( ) ( )f x y x y+ ≥' *; ; .2 11

para todo y ∈IRn .

Demostración : Sea x D∈ fijo. De acuerdo con la definición de subgradiente,

( )x f x* ∈∂ si y sólo si

( ) ( )f z f x x z x z D≥ + − ∈* ; , .

Sean λ > 0 e y ∈IRn y consideremos z x y= + λ . Entonces, ( )x f x* ∈∂ si y

sólo si

121

( ) ( ) ( )f x y f x x y+ ≥ +λ λ* ; .2 12

para todo y ∈IRn y λ > 0 tal que x y D+ ∈λ .

Si ( )x f x* ∈∂ , entonces por (2.12) se tiene que

( ) ( )f x y f xx y

+ −≥

λλ

* ;

para todo y ∈IRn y λ > 0 tal que x y D+ ∈λ . Tomando el límite cuando λ ↓ 0 se

obtiene

( )f x y x y+ ≥' *; ; ,

para todo y ∈IRn .

Recíprocamente, supongamos que

( ) ( )f x y x y+ ≥' *; ; .2 13

para todo y ∈IRn . Sean ahora, y ∈IRn arbitrario, {J = ∈λ IR }: x y D+ ∈λ y

g J: → IR la función definida por

( ) ( ) ( )g f x y f xλ λ= + − .

De acuerdo con el lema 2.1.1, J es un intervalo abierto que contiene al cero y según el

lema 2.5.1, g es una función convexa. Luego, por la demostración del teorema 1.2.2

tenemos que si 0 < λ y λ ∈ J entonces

( ) ( ) ( ) ( )g

g g g+

−−≤ =' .0

00

λλ

λλ

De esto se deduce que

122

( ) ( ) ( ) ( ) ( ) ( )

( ) ( ) ( )

f x y f x g g g

f x y f x

g lim

lim f x y

+ −+

↓

−

↓

+ −+

= ≥ =

= =

λλ

λλ λ

λλ

λ

λλ

'

' ; .

00

0

0

Es decir

( ) ( ) ( )f x y f xf x y

+ −+≥

λλ

' ;

y de acuerdo con la desigualdad (2.13) se verifica que

( ) ( )f x y f xx y

+ −≥

λλ

* ; ,

de donde

( ) ( )f x y f x x y+ ≥ +λ λ* ;

para todo y ∈IRn y λ > 0 tal que x y D+ ∈λ y en conclusión ( )x f x* ∈∂ .

Lema 2.5.5 : Sean D ⊂ IRn un conjunto convexo y abierto y f D: → IR una función

convexa. Entonces

( ) ( ){ } ( )f x y Sup x y x f x+ = ∈' * *; ; : .∂ 2 14

para cada x D∈ e y ∈IRn .

Demostración : En virtud del lema 2.5.4 es suficiente demostrar que existe un

( )x f x* ∈∂ tal que

( )f x y x y x D y+ = ∈ ∈' *; ; , , IR ( )n 2 15. .

123

De acuerdo con el lema 2.5.3 se tiene que ( )∂ f x ≠ ∅ . Luego, sí y = 0 como

( )f x+ =' ; 0 0 tenemos que la relación (2.15) es cierta para todo ( )x f x* ∈∂ . Sea

entonces y y≠ ∈0, IRn fijo.

Consideremos una aplicación afín T : IRn→ IRn biyectiva que transforme la

dirección dada por el vector y ∈IRn en la dirección dada por el vector e1 ∈IRn .

Debemos tener presente que T manda puntos sobre puntos ; esto es, T es una

aplicación de IRn en IRn donde IRn se considera como espacio afín. Mediante esta

transformación el dominio D de f se transforma en un conjunto ( )S T D= , también

convexo y abierto (ver : [8], p. 68). El punto x D∈ se transforma en el punto

( )x T x S= ∈ . Debido al cambio de variables la función f D: → IR se transforma en

una función g S: → IR también convexa.

Sea ϕ : IRn→ IR la función definida por ( ) ( )ϕ z g x z= +' ; .

Como g es convexa, se tiene por el lema 2.5.2 que ϕ es convexa y positivamente

homogénea. Definamos ahora la función ψ : IRn− →1 IR mediante

( ) ( )ψ ϕz z z zn n2 21, , , , , .K K=

Usando el hecho que ϕ es convexa y la desigualdad de Jensen se demuestra que la

función ψ también es convexa.

Para cada ( )z z zn= ∈1, ,K IRn definamos ( )~ , ,z z zn= ∈2 K IRn−1. Por el lema 2.5.3

se tiene que para 0 ∈IRn−1 se verifica que ( )∂ψ 0 ≠ ∅ , luego existe un z0* ∈IRn−1 tal

que ( )z0 0* ∈∂ψ . Por la definición de subgradiente tenemos que

( ) ( ) ( )ψ ψ~ ~ . ,*z z z− ≥ ⋅0 2 160

124

para todo z ∈IRn z, ~ ∈IRn−1, donde z z0* ~⋅ denota el producto escalar euclidiano de

los vectores z0* y ~z .

Sea ahora H ⊂ IRn el hiperplano

( ){H z z zn= = ∈1, ,K IR }n z: 1 1= .

Para z H∈ se tiene ( ) ( )ϕ ψz z= ~ y por la desigualdad (2.16) se verifica que

( ) ( ) ( ) ( )ϕ ϕ ψ ψz e z z z z H− = − ≥ ⋅ ∈1 00~ ~, .*

Es decir

( ) ( ) ( )ϕ ϕz e z z z H≥ + ⋅ ∈1 0 2 17* ~, . . .

Sea ( )( )z e z* *,= ∈ϕ 1 0 IR× IRn− =1 IRn . De acuerdo con (2.17) se verifica

( ) ( )

( )( ) ( )

ϕ ϕ

ϕ

z e z z

e z z

z z

≥ ⋅ + ⋅

=

=

1 0

1 0

1

1

*

*

*

~

, ; , ~

; .

Esto es

( ) ( )ϕ z z z z H≥ ∈* ; , .2 18 .

En particular, de acuerdo con la definición de z* :

( ) ( ) ( )( )ϕ ϕ ϕe e e z e1 1 1 0 11= ⋅ = , ;* ,


( ) ( )ϕ e z e1 1 2 19= * ; . .

125

Sea P el semiespacio

( ){P z z zn= = ∈1, ,K IR }n z: .1 0>

Para cada z P∈ existen un $z H∈ y un λ > 0 tales que z z= λ $ . Como ϕ es

positivamente homogénea tenemos de (2.18) :

( ) ( ) ( )ϕ ϕ λ λ ϕ λ

λ

z z z z z

z z z z

= = ≥

= =

$ $ ; $

; $ ; .

*

* *

Es decir

( ) ( )ϕ z z z z P≥ ∈* ; , .2 20

Escojamos ahora un z ∈IRn arbitrario y consideremos el punto

( ) ( )z z e= + −λ λ1 2 211 . ,

con λ∈IR. Cuando λ → 0 el punto z se aproxima a e P P1 ∈ = int y podemos

escoger un ( )λ ∈ 0 1, tal que z P∈ . Supongamos que hemos fijado para un

( )λ ∈ 0 1, el correspondiente z P∈ dado por (2.21) y que

( ) ( )ϕ z z z< * ; .2 22

Entonces tenemos por (2.21), la convexidad de ϕ y las relaciones (2.22) y (2.19)

que :

( ) ( ) ( ) ( )

( )

( )

( )

ϕ λ ϕ λ ϕ

λ λ

λ λ

λ λ

z z e

z z z e

z z z e

z z e z z

≤ + −

< + −

= + −

= + − =

1

1

1

1

1

1

1

1

* *

* *

* *

; ;

; ;

; ;

126

Es decir

( )ϕ z z z< * ; ,

lo cual se contradice con (2.20) pues z P∈ . La contradicción proviene de haber

supuesto que

( )ϕ z z z< * ;

y por lo tanto

( )ϕ z z z z≥ ∈* ; , IRn .

Ahora bien, de acuerdo con la definición de ϕ , esto es equivalente a

( )g x z z z z+ ≥ ∈' *; ; , IRn ,

y por el lema 2.5.4 se verifica que ( )z g x* ∈∂ .

Además, de acuerdo con (2.19)

( ) ( )z e e g x e* '; ;1 1 1= = +ϕ .

Es decir

( )g x e z e+ =' *; ; .1 1

Aplicando la transformación inversa T −1 se tiene que a la dirección e1 ∈IRn

corresponde la dirección y ∈IRn , al punto x S∈ corresponde el punto x D∈ y por

isomorfismo trasladamos las propiedades de g a las propiedades de f y como se

preservan las operaciones tenemos que al subgradiente ( )z g x* ∈∂ corresponde un

subgradiente ( )x f x* ∈∂ tal que

127

( )f x y x y+ =' *; ;

con lo cual concluye la demostración.

Lema 2.5.6 : Sean f : IRn→ IR y g: IRn→ IR funciones aditivas. Si

( ) ( )f x g x≤ para todo x ∈IRn , entonces f g= .

Demostración : Como f y g son funciones aditivas se tiene de acuerdo con la

generalización del teorema 1.8.1 para el caso de IRn que f y g son funciones

impares. Supongamos que f g≠ y que para un x ∈IRn se verifica ( ) ( )f x g x< .

Entonces

( ) ( ) ( ) ( ) ( ) ( )[ ]g x f x g x f x g x f x− − − = − + = − − < 0,

esto es ( ) ( )g x f x− < − , lo cual se contradice con la hipótesis del teorema. La

contradicción proviene de haber supuesto que f g≠ , luego ( ) ( )f x g x= para todo

x ∈IRn .

Teorema 2.5.1 : Sean D ⊂ IRn un conjunto convexo y abierto, f D: → IR una

función convexa y x D∈ . Si f es diferenciable en el punto x, entonces

( ) ( ){ }∂ f x f x= ∇ . Recíprocamente, sí ( )∂ f x es un conjunto unitario, ( ) { }∂ f x x= * ,

entonces f es diferenciable Fréchet en x y ( )∇ =f x x* .

Demostración : Supongamos que f es diferenciable en x D∈ , en el sentido de la

definición 2.4.3. Entonces, por la ecuación (2.7) tenemos que

( ) ( )f x y f x y+ = ∇' ; ; para todo y ∈IRn . Escojamos cualquier ( )x f x* ∈∂ .

Por el lema 2.5.4 ( )f x y x y+ ≥' *; ; para todo y ∈IRn , o equivalentemente

128

( ) ( )∇ ≥f x y x y; ; .* 2 23

para todo y ∈IRn . Las expresiones en ambos lados de (2.23) son funciones aditivas

de y, luego por el lema 2.5.6 se tiene que ( )∇ =f x y x y; ;* para todo y ∈IRn .

Pero esto es cierto si y sólo si ( )x f x* = ∇ . En consecuencia ( ) ( ){ }∂ f x f x= ∇ .

Recíprocamente, supongamos que ( )∂ f x es un conjunto unitario, ( ) { }∂ f x x= * .

Definamos una función ( )p D x: − → IR por

( ) ( ) ( )p y f x y f x x y= + − − * ; .

Dado que x* es un subgradiente de f en x se tiene de acuerdo con la definición

2.4.4 que p ≥ 0 en D x− . Más aún, se puede verificar que para cada

u v D x, ∈ − y [ ]µ ∈ 0 1, se cumple

( )( ) ( ) ( ) ( )p u v p u p vµ µ µ µ+ − ≤ + −1 1 ,

y por lo tanto p es convexa.

Veamos que en efecto ( )p y y D x≥ ∈ −0, .

129

Sean y ∈IRn fijo pero arbitrario y

{J = ∈λ IR }: x y D+ ∈λ .

Por el lema 2.1.1, J es un intervalo abierto que contiene al cero. Definamos la función

g J: → IR por

( ) ( ) ( )g f x y f xλ λ= + − .

De acuerdo con el lema 2.5.1 la función g es convexa. Sea λ ∈ J tal que λ > 0 .

Usando el hecho que g es convexa y procediendo de manera análoga a como lo

hicimos en la demostración del lema 2.5.4 se prueba que

( ) ( ) ( )f x y f xf x y

+ −+≥

λλ

' ;

para cada y ∈IRn y λ > 0 tal que x y D+ ∈λ . Tomando λ = 1 tenemos que

( ) ( ) ( )f x y f x f x y y D x+ − ≥ ∈ −+' ; , ,

y por el lema 2.5.4 se verifica que

( ) ( ) ( ) ( )p y f x y f x x y f x y x y= + − − ≥ − ≥+* ' *; ; ; ,0

para cada y D x∈ − .

Es decir

( ) ( )p y y D x≥ ∈ −0 2 24, . .

Además, como ( )p 0 0= , (2.24) se puede escribir en la forma

( ) ( )p y p y y D x≥ + − ∈ −0 0 0; , ,

130

lo cual prueba que ( )0 0∈∂ p . Sí ( )y p* ,∈∂ 0 entonces para todo y D x∈ − se

verifica

( ) ( )p y p y y y y≥ + − =0 0* *; ;

o equivalentemente

( ) ( )f x y f x x y y y+ − − ≥* ; *; ,

de donde

( ) ( )f x y f x x y y y D x+ ≥ + + ∈ −* * ; , ,

es decir, para todo x y D+ ∈ . Por lo tanto, ( ) { }x y f x x* * *+ ∈ =∂ , lo cual implica

que x y x* * *+ = y así y* = 0. En consecuencia, ( ) { }∂ p 0 0= y por el lema

2.5.5 :

( ) ( ){ }{ }

p u Sup y u y p

Sup y u y

+ = ∈

= = =

' * *

* *

; ; :

; : .

0 0

0 0

∂

Esto es

( )p u u+ = ∈' ; ,0 0 IRn .

Definamos ahora

( ) ( )h u u D x

p uλ λ λλλ; , ,= > ∈ −0 .

Como ( )p 0 0= , se tiene

( ) ( ) ( ) ( ) ( )h u

p u p p u pλ λλ

λλ; = =− + −0 0 0

131

y

( ) ( ) ( )lim h u p uλ

λ↓

+= =0

0 0 2 25; ; .' .

El conjunto D x− es abierto y no vacío, y además 0 ∈ −D x pues x D∈ . Luego, por

el teorema 2.2.2, existe un simplex n − dimensional

{ }S conv p pn= +1 1, ,K

tal que S D x⊂ − y 0 ∈ int S con p p D xn1 1, ,K + ∈ − . Entonces, existe una

bola cerrada ( )B 0; γ de centro el origen y radio γ > 0 contenida en

( )( )S B S0; γ ⊂ . Escojamos un ( )u B∈ 0; γ arbitrario.

Según el comentario del teorema 2.2.1, existen [ ]λ λ1 1 0 1, , ,K n+ ∈ tales que

λii

n=

=

+∑ 1

1

1y u pi i

i

n=

=

+∑λ

1

1.

Sea ( )λ ∈ 0 1, . Del hecho que la función p es convexa y

( )λ λ λp p S D xi i= + − ∈ ⊂ −1 0 pues p Si , 0 ∈ y S es un conjunto convexo ;

se verifica que

( ) ( ) ( )

( ) ( ) ( )

( )

h u p u p p p p

p p h p

h p

i ii

n

i ii

n

i ii

n

ip p

i

n

i ii

n

ii

n

i

λ λ λ λ λ λ

λ λ λ λ λ

λ

λ λ λ

λλλ

;

;

; .

= =

=

≤ = =

≤

=

+

=

+

=

+

=

+

=

+

=

+

∑ ∑

∑ ∑ ∑

∑

1 1

1

11

1

1

1

1

1

1

1

1

1

1

1

Esto es

132

( ) ( ) ( )0 2 261

1≤ ≤

=

+∑h u h pii

nλ λ; ; .

ya que ( ) ( )h u

p uλ

λλ; = ≥ 0 porque p ≥ 0 y λ > 0 .

Como ( )lim h piλ

λ↓

=0

0; tenemos que ( )lim h uλ

λ↓

=0

0; uniformemente sobre

( )B 0; γ , es decir en forma continua para todo ( )u B∈ 0; γ .

Sea ahora y D x∈ − arbitrario. Existen un ( )u B∈ 0; γ y un λ > 0 tales que

u = γ e y u= λ . Para cualquier ε > 0 tan pequeño como se quiera, se cumple

que

( ) ( ) ( ) ( )p y

y

p u

u u

p uh u= = = <

λλ

λλ γ λ ε1 1 ;

previsto que λ sea suficientemente pequeño ( )λ > 0 . En otras palabras

( ) ( ) ( )0 ≤ = <

+ − −f x y f x x y

y

p y

y

* ;ε

cuando y es suficientemente pequeño.

Pero esto significa que

( ) ( ) ( )lim limy

f x y f x x y

y y

p y

y→

+ − −

→= =

0 00

* ;

y dado que x* ; ⋅ es un funcional lineal se deduce que f es diferenciable Fréchet

en el punto x y por lo tanto también diferenciable débil. Luego, ( )f x y x y' ; ;*= y

como además ( ) ( )f x y f x y' ; ;= ∇ pues ( )f x' ; ⋅ es lineal, se deduce que

( )x y f x y* ; ;= ∇ para todo y D x∈ − y en conclusión ( )x f x* = ∇ .

133

Lema 2.5.7 : Sea f : IRn→ IR una función convexa y positivamente homogénea, y

sea { }b bn1 , ,K una base de IRn . Si

( ) ( ) ( )f b f b i ni i− = − =, , , .1 2 27K

entonces f es lineal.

Demostración : Como f es positivamente homogénea, se tiene que

( ) ( ) ( )f f f0 2 0 2 0= ⋅ = , de donde

( ) ( )f 0 0 2 28= . .

Para λ < 0 , de acuerdo con (2.27), se verifica que

( ) ( ) ( ) ( ) ( )f b f b f b f b f bi i i i iλ λ λ λ λ= − = − = − = ,

para todo i n= 1, ,K .

De esta última relación, de (2.28) y del hecho que f es positivamente homogénea,

tenemos que

( ) ( )f b f bi iλ λ λ= ∈, IR ( ), , , . .i n= 1 2 29K

Además, dado que f es positivamente homogénea y convexa, se cumple que

( ) ( )( ) ( )( ) ( )( ) ( ) ( )

f x y f x y f x y

f x f y f x f y

+ = + = +

≤ + = +

2 2

2

12

12

12

12

12

12

,

es decir

( ) ( ) ( )f x y f x f y x y+ ≤ + ∈, , IR ( )n 2 30. .

Por inducción obtenemos que

( ) ( )f x f xii

m

ii

m

= =∑ ∑

≤

1 1

2 31. ,

134

para cada m∈IN y x xm1, ,K ∈IRn .

De (2.28) y (2.30) se sigue que para todo x ∈IRn se verifica

( ) ( )( ) ( ) ( )0 0= = + − ≤ + −f f x x f x f x ,

de donde

( ) ( )− − ≤ ∈f x f x x, IR ( )n 2 32. .

Escojamos ahora un x ∈IRn arbitrario. Entonces, existen λ λ1, ,K n ∈IR tales que

x bi ii

n=

=∑λ

1

.

Por (2.29), (2.31) y (2.32) tenemos que

( ) ( ) ( )

( ) ( )

( ) ( )

λ λ λ

λ

λ λ

i ii

n

i ii

n

i ii

n

i ii

n

i i i ii

n

i

n

f b f b f b f x

f x f b

f b f b

= = =

=

==

∑ ∑ ∑

∑

∑∑

= ≥

=

≥ − − = − −

≥ − − =

1 1 1

1

11

,

es decir

( ) ( ) ( ) ( )λ λi i i ii

n

i

nf b f x f x f b≥ ≥ − − ≥

==∑∑

11

,

de donde ( ) ( )f x f x= − − y por lo tanto f es impar, esto es

( ) ( )f x f x para todo x− = − ∈, IRn .

En consecuencia, para cualesquiera x y, ∈IRn , tenemos que

135

( ) ( )( ) ( ) ( )( )( ) ( )[ ] ( ) ( )[ ]

( ) ( )

f x y f x y f x y f x y

f x f y f x f y

f x f y

+ = − − − = − − − = − − + −

≥ − − + − = − − −

= + ,


( ) ( ) ( )f x y f x f y x y+ ≥ + ∈, , IR ( )n 2 33. .

De (2.30) y (2.33) se deduce que f es aditiva :

( ) ( ) ( )f x y f x f y x y+ = + ∈, , IR ( )n. .2 34

Por otra parte, como f es aditiva, tenemos por la generalización al caso de IRn del

teorema 1.8.1 que

( ) ( )f x f x xλ λ= ∈, IRn y λ ∈Q.

Sean λ ∈IR y { }λm m IN∈ una sucesión de números racionales que converge a

λ λ λ λlimm

m m→∞

= ∈ , Q ) . Luego, para cada m ∈IN se verifica que

( ) ( )f x f x xm mλ λ= ∈, IRn .

Dado que f es convexa y IRn es abierto, se tiene que f es continua y en consecuencia

( ) ( )

( ) ( )

f x f lim x lim f x

lim f x f x

mm

mm

mm

λ λ λ

λ λ

=

=

= =

→∞ →∞

→∞.

Es decir : ( ) ( )f x f xλ λ= , para todo λ ∈IR , x ∈IRn .

De esto y de (2.34) se concluye que f es lineal.

136

Ahora estamos en condiciones de probar el teorema principal de esta sección,

el cual presentamos a continuación.

Teorema 2.5.2 : Sean D ⊂ IRn un conjunto convexo y abierto, f D: → IR una

función convexa y x D∈ . Entonces, f es diferenciable en x si y sólo si existen todas

las derivadas parciales de f en x.

Demostración : En la sección 2.4 demostramos que sí f es diferenciable en el punto

x entonces existen todas las derivadas parciales de f en x. Más aún, probamos que

( ) ( )f x y f x y+ = ∇' ; ; para todo y ∈IRn .

Recíprocamente, supongamos que existen todas las derivadas parciales de f en x. Por

el lema 2.5.2 la derivada ( )f x y+' ; existe para cada y ∈IRn y además la función

( )f x+ ⋅' ; es convexa y positivamente homogénea. Debemos probar que

( )f x+ ⋅' ; es lineal. En efecto, sea { }e en1 , ,K la base canónica de IRn . Dado que

existen las derivadas parciales de f en x, tenemos que para cada i n= 1, ,K se

verifica

( ) ( ) ( ) ( )f x e lim xif x e f x f

xi+

↓

+ −= =' ;

λ

λλ

∂∂0

1 ,

y

137

( ) ( )( ) ( )

( )( ) ( )

( )( ) ( )

( ) ( )

( )

f x e lim

lim

lim

lim

x

if x e f x

f x e f x

f x e f x

f x e f x

fx

i

i

i

i

i

+↓

+ − −

↓

+ − −

↓

+ − −−

↑

+ −

− =

=

= −

= −

= −

' ;

.

λ

λλ

λ

λλ

λ

λλ

λ

λλ

∂∂

0

0

0

0

Esto implica que ( ) ( )f x e f x ei i+ += − −' '; ; , para cada i n= 1, ,K . Lo cual es

equivalente a

( ) ( )f x e f x e i ni i+ +− = − =' '; ; , , ,1 K .

De esto se deduce, aplicando el lema 2.5.7, que la función ( )f x+ ⋅' ; : IRn→ IR es

lineal y queda así probado que f es diferenciable en x D∈ , en el sentido de la

definición 2.4.3.

2.6. Caracterización de las Funciones Convexas.

En esta sección caracterizaremos las funciones convexas a partir de sus

propiedades de diferenciabilidad. Veremos en la proposición 2.6.2 el análogo del

teorema 1.3.1 y en el teorema 2.6.2 la generalización a IRn del corolario 1.3.1. El

teorema 2.6.2 presenta una condición necesaria y suficiente para que una función

f D: ⊂ IRn→ IR, donde D es un conjunto convexo y abierto, sea convexa cuando

existen todas las derivadas parciales de segundo orden de la función. Antes del

teorema presentamos previamente la definición de forma cuadrática y una versión de

la regla de la cadena en el lema 2.6.1.

138

Empezamos entonces con la siguiente proposición.

Proposición 2.6.1 : (ver [1], p. 80). Sean D ⊂ IRn un conjunto convexo y abierto, y

f D: → IR una función diferenciable. Entonces f es convexa si y sólo si

( ) ( ) ( ) ( )∇ − ≤ −f x y x f y f x; .2 36

para todo x y D, ∈ .

Demostración : Supongamos que f es convexa y sean ( ]x y D, , ,∈ ∈λ 0 1 .

Entonces

( )( ) ( ) ( ) ( )( )f x y x f x f y f x+ − ≤ + −λ λ ,

de donde

( )( ) ( ) ( ) ( )f x y x f xf y f x

+ − −≤ −

λλ .

Tomando el límite cuando ( )λ λ λ↓ → >0 0 0, , tenemos que

( ) ( ) ( ) ( )f x y x f y f x+ − ≤ −' ; .2 37 .

Como f es diferenciable en el punto x, existen todas las derivadas parciales de f en x

y según la ecuación (2.7) se verifica

( ) ( )f x y x f x y x+ − = ∇ −' ; ; .

De esto y de la desigualdad (2.37) obtenemos

( ) ( ) ( ) ( )∇ − ≤ −f x y x f y f x; .2 38


139

Recíprocamente, supongamos que la relación (2.38) es cierta para todo x y D, ∈ y

sea [ ]λ ∈ 0 1, . Entonces :

Sustituyendo en (2.38) a x por ( ) ( )x y x y x D+ − = + − ∈λ λ λ1 se verifica

( )( ) ( )( ) ( ) ( )( ) ( )∇ + − − − ≤ − + −f x y x y x f y f x y xλ λ λ; .1 2 39 .

Sustituyendo, también en (2.38), a y por x, y a x por ( )x y x+ −λ se cumple :

( )( ) ( ) ( ) ( )( ) ( )∇ + − − − ≤ − + −f x y x y x f x f x y xλ λ λ; .2 40 .

Multiplicando (2.39) por λ y (2.40) por ( )1− λ :

( )( ) ( )( ) ( ) ( )( )( ) ( )

( )( ) ( )( ) ( ) ( ) ( )( )( ) ( )

∇ + − − − ≤ − + −

∇ + − − − − ≤ − − + −

f x y x y x f y f x y x

f x y x y x f x f x y x

λ λ λ λ λ

λ λ λ λ λ

; .

; .

1 2 41

1 1 2 42

Sumando (2.41) y (2.42) :

( ) ( )( )( ) ( ) ( ) ( )( )( )0 1≤ − + − + − − + −λ λ λ λf y f x y x f x f x y x .

Luego

( )( ) ( ) ( ) ( )( )f x y x f x f y f x+ − ≤ + −λ λ

para todo x y D, ∈ y [ ]λ ∈ 0 1, , por lo tanto se concluye que f es convexa.

Presentamos a continuación el teorema del valor medio del cálculo diferencial,

el cual nos será útil en la demostración de la proposición 2.6.2.

Teorema 2.6.1 : (del valor medio). Sean D ⊂ IRn un conjunto abierto, f D: → IR

una función diferenciable y x y D, ∈ . Entonces,

( ) ( ) ( )( )f y f x f x y x y x− = ∇ + − −λ ;

140

para algún ( )λ ∈ 0 1, .

Demostración : Para el caso n = 2 se pueden consultar : [4], p. 95 o [7], p. 154.

Sin embargo, la demostración se puede generalizar para n > 2.

Cabe destacar aquí que en el caso n = 1 se tiene

( ) ( ) ( )( )( )( )f y f x f x y x y x− = + − −' λ

de donde

( ) ( ) ( )( )f y f x

y xf x y x y x

−− = + − ≠' ,λ .

Como el punto ( )x y x+ −λ está entre x e y, tenemos entonces el teorema del valor

medio del cálculo diferencial para funciones de una variable, el cual ya tuvimos la

oportunidad de usar en el capítulo 1.

Estamos ahora en condiciones de demostrar la proposición siguiente.

Proposición 2.6.2 : (ver [1], p. 81). Sean D ⊂ IRn un conjunto convexo y abierto, y

f D: → IR una función diferenciable. Entonces f es convexa si y sólo si

( ) ( ) ( )∇ − ∇ − ≥f y f x y x; .0 2 43


Demostración : Supongamos que f es convexa y sean x y D, ∈ . Entonces, por la

proposición 2.6.1, tenemos :

( ) ( ) ( ) ( )

( ) ( ) ( ) ( )

∇ − ≤ −

∇ − ≤ −

f x y x f y f x

f y x y f x f y

; .

; . .

2 44

2 45

Sumando las relaciones (2.44) y (2.45) y utilizando las propiedades del producto

escalar, se verifican :

141

( ) ( ) ( )

( ) ( )

( ) ( )

∇ − + ∇ − − ≤

∇ − + −∇ − ≤

∇ −∇ − ≤

f x y x f y y x

f x y x f y y x

f x f y y x

; ;

; ;

;

0

0

0

y finalmente

( ) ( ) ( )∇ −∇ − ≥f y f x y x; .0 2 46


Recíprocamente, supongamos que se cumple la desigualdad (2.46) para todo

x y D, ∈ . Como f es diferenciable, tenemos por el teorema del valor medio que

( )( ) ( ) ( ) ( )∇ + − − = −f x y x y x f y f xλ ; .2 47

para algún ( )λ ∈ 0 1, .

Sí en (2.46) sustituimos ay por ( )x y x D+ − ∈λ tenemos :

( )( ) ( ) ( )∇ + − −∇ − ≥f x y x f x y xλ λ; 0

de donde

( )( ) ( )∇ + − −∇ − ≥f x y x f x y xλ ; 0 ,

luego

( )( ) ( )∇ + − − ≥ ∇ −f x y x y x f x y xλ ; ;

y de acuerdo con (2.47) se cumple

( ) ( ) ( )f y f x f x y x− ≥ ∇ −; ,

para todo x y D, ∈ , por lo tanto, aplicando la proposición 2.6.1, se concluye que f es

convexa.

142

Continuamos con la definición de forma cuadrática, la cual nos será muy útil

en la demostración del teorema 2.6.2.

Definición 2.6.1 : (Forma cuadrática). Dados un vector

( )x x x xnt= 1 2, , ,K

y una matriz

A

a a a

a a a

a a a

n

n

n n n n

=

11 12 1

21 22 2

1 2

K

K

M M M

K

la función

Q ( )x x A x a x xti j i j

j

n

i

n= =

==∑∑

11

se conoce como forma cuadrática.

La forma cuadrática Q se dice que es

1. Definida positiva si Q( )x > 0 para cada x ≠ ∈0 IRn .

2. Semidefinida positiva si Q( )x ≥ 0 para cada x ∈IRn y existe x ≠ 0 tal que

Q( )x = ∈0 IR.

A continuación presentamos como lema una versión de la regla de la cadena.

Lema 2.6.1 : (Regla de la cadena). Sean g I: ⊂ IR→ IRn y f D: ⊂ IRn→ IR

funciones, con ( )g I D⊂ . Supongamos que la función g es derivable en t Io ∈ y

143

además que la función f es diferenciable Fréchet en ( )x g to o= , entonces la función

compuesta h f g= o es derivable en to y además esta derivada se calcula mediante la

formula :

( ) ( ) ( )h t f x g to o o' ; '= ∇ .

Demostración : (ver [7], p. 253).

Para concluir presentamos el teorema principal de esta sección.

Teorema 2.6.2 : (ver [11], p. 176). Sean D ⊂ IRn un conjunto convexo y abierto, y

f D: → IR una función dos veces diferenciable. La función f es convexa si y sólo si

la matriz Hessiana

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

∂∂ ∂

∂∂ ∂

∂∂ ∂

∂∂ ∂

∂∂ ∂

∂∂ ∂

∂∂ ∂

∂∂ ∂

∂∂ ∂

2

1 1

2

1 2

2

1

2

2 1

2

2 2

2

2

2

1

2

2

2

fx x

fx x

fx x

fx x

fx x

fx x

fx x

fx x

fx x

x x x

x x x

x x x

n

n

n n n n

L

L

M M M

L

es semidefinida positiva para cada x D∈ .

Demostración : Para cada x D∈ e y ∈IRn consideremos el intervalo

{Jx y = ∈λ IR }: x y D+ ∈λ

y la función h Jx y x y: → IR definida por

( ) ( ) ( )h f x yx y λ λ= + 2 48. .

Obsérvese que hx y es dos veces diferenciable en Jx y porque f lo es en x y+ λ .

Además, f es convexa en D si y sólo si hx y es convexa en Jx y para cada

144

x D y∈ ∈, IRn . En efecto, de acuerdo con la proposición 2.1.3, sí f es convexa

entonces hx y es convexa para cada x D y∈ ∈, IRn . Recíprocamente, supongamos

que hx y es convexa para cada x D y∈ ∈, IRn y sean [ ]u v D, , ,∈ ∈µ 0 1 .

Tomemos

x yu v v u= =+ −2 2

, .

Entonces

x y u D x y v D− = ∈ + = ∈,

y por lo tanto − ∈1 1, .Jx y

Como hx y es convexa se verifica

( ) ( )( ) ( ) ( ) ( )h h hx y x y x yµ µ µ µ− + − ⋅ ≤ − + −1 1 1 1 1 1 ,

es decir, de acuerdo con (2.48)

( ) ( )( )( ) ( ) ( ) ( )f x y f x y f x y+ − + − ⋅ ≤ − + − +µ µ µ µ1 1 1 1


( ) ( )( )( ) ( ) ( ) ( )f x y x y f x y f x yµ µ µ µ− + − + ≤ − + − +1 1 ,

esto es

( )( ) ( ) ( ) ( )f u v f u f vµ µ µ µ+ − ≤ + −1 1

para cualesquiera [ ]u v D, , ,∈ ∈µ 0 1 , de donde resulta que f es convexa.

Por otra parte, de acuerdo con el corolario 1.3.1, la función hx y es convexa si y sólo

si ′′ ≥hx y 0 en Jx y . Por lo tanto, f es convexa si y sólo si

145

( )dd

f x y para cada x D2

2 0λ

λ+ ≥ ∈ e y ∈IRn ,

y para cada λ en el correspondiente intervalo Jx y .

En otras palabras, f es convexa si y sólo si

( )dd x y uf x y para cada u D

2

2 0λ λλ+ ≥ ∈+ = , e y ∈IRn.

Consideremos la función g Jx y x y: → IRn definida por

( )g x yx y λ λ= + .

Entonces h f gx y x y= o , esto es

( ) ( )( )h f g para todo Jx y x y x yλ λ λ= ∈, .

Luego, por el lema 2.6.1, tenemos que

( ) ( )( ) ( )dd x y x y x yh f g gλ λ λ λ= ∇ ; '

o equivalentemente

( ) ( )dd x yh f x y yλ λ λ= ∇ + ;

es decir ;

( ) ( )

( ) ( ) ( )

dd x y

fx

fx n

h f u y

u y u yn

λ

∂∂

∂∂

λ = ∇

= + +

;

.1

1 2 49L

donde ( )y y yn= ∈1, ,K IRn .

Luego, de (2.49) tenemos que

146

( ) ( ) ( )

( ) ( )

( ) ( )

( ) ( ) ( )

dd x y

dd

fx

fx n

dd

fx n

dd

fx

fx n

fx

f

x

fx x n

nf

x

h x y y x y y

y x y y x y

y x y y y x y y

y u u y y

y

n

n

n

n

2

21

1

1

2

1

2

2

1

2

1

1

1

1

1 1

λ λ∂∂

∂∂

λ∂∂ λ

∂∂

∂∂

∂∂

∂∂

∂∂ ∂

∂∂

λ λ λ

λ λ

λ λ

= + + + +

=

+ + +

+

= ∇ + + + ∇

+

=

+ +

L

L

L

K K

L

; ;

, , ; , ,

( ) ( ) ( )

( ) ( ) ( ) ( )

∂∂∂

∂∂

∂∂ ∂

∂∂ ∂

∂∂

xf

x n

fx

fx x n

fx x n

fx n

n n

n n n

u u y y

u y u y y u y y u y

, , ; , ,

.

K K

L K L

2

2

2

12

2

1

2

1

2

2

1

12

1 12

= + + + + + +

Lo cual implica que

( ) ( ) ( )dd x y

fx x i j

j

n

i

nh u y y

i j

2

2

2

2 5011

λ∂

∂ ∂λ ===∑∑ .

Pero la condición

( )dd x y x yh J x D y

2

2 0λ

λ λ≥ ∈ ∈ ∈, , , IRn

es equivalente a que la forma cuadrática (2.50) sea no negativa para cada

u D y∈ ∈, IRn , y esto a su vez es equivalente a que la matriz Hessiana

( )∂∂ ∂

2 fx x

n x ni j

x

sea semidefinida positiva para cada x D∈ .

Comentario : Hemos supuesto en el teorema 2.6.2 que la función f es dos veces

diferenciable. Esto significa que f es diferenciable en D y que la función

( )f y+ ⋅' ; es diferenciable en D para cada y ∈IRn . Es decir, la expresión

147

( )f x y+' ; , donde x D∈ , es diferenciable como función de su primer argumento

cualquiera sea y ∈IRn .

2.7. Extremos de Funciones Convexas.

En los problemas de optimización es fundamental determinar los valores

extremos (máximos y mínimos) de funciones a valores reales definidas sobre

subconjuntos arbitrarios de IRn . Este estudio es considerablemente más complicado

en IRn que en el caso de funciones definidas en subconjuntos de IR .

Sin embargo, como el dominio de cualquier función convexa es un conjunto

convexo y además estas funciones tienen una estructura bastante sencilla en lo que

respecta al estudio de valores extremos, la determinación de las condiciones para la

existencia de puntos óptimos se simplifica notablemente.

En el siguiente teorema demostraremos que todo punto de mínimo de una

función convexa es un mínimo global.

Teorema 2.7.1 : (ver [8], p. 130). Sean D ⊂ IRn un conjunto convexo y f D: → IR

una función convexa. Si f alcanza un mínimo en x D∈ , entonces ( )f x es un

mínimo global. Además, el conjunto V sobre el cual f alcanza su mínimo es

convexo, y si f es estrictamente convexa en una vecindad de un mínimo, entonces V

se reduce a un sólo punto.

Demostración : Supongamos que f alcanza un mínimo local en un punto x D∈ .

Sean y D∈ arbitrario y ( ]λ ∈ 0 1, . Para λ suficientemente pequeño el punto

( )1− +λ λx y está suficientemente próximo ax , de tal manera que por alcanzar f

un mínimo local en x y ser convexa se verifica que

148

( ) ( )( ) ( ) ( ) ( ) ( )f x f x y f x f y≤ − + ≤ − +1 1 2 51λ λ λ λ .

de donde

( ) ( )( )0 ≤ −λ f y f x

y en consecuencia

( ) ( )f x f y para todo y D≤ ∈, ,

por lo cual ( )f x es un mínimo global.

Sean ahora m el mínimo de f y V el conjunto de puntos sobre los cuales f

alcanza su mínimo, esto es

( ){ }V x D f x m= ∈ =: .

Si x x V1 2, ∈ y [ ]λ ∈ 0 1, , entonces

( )( ) ( ) ( ) ( )( )

m f x x f x f x

m m m

≤ − + ≤ − +

= − + =

1 1

1

1 2 1 2λ λ λ λ

λ λ .

Es decir

( )( )f x x m1 1 2− + =λ λ

lo cual implica que ( )1 1 2− + ∈λ λx x V y por lo tanto V es convexo.

Por otra parte, si f es estrictamente convexa en una vecindad de un punto x de

mínimo, entonces en (2.51) se tiene

( ) ( ) ( ) ( )f x f x f y< − +1 λ λ

de donde se obtiene inmediatamente

( ) ( )f x f y para todo y D y x< ∈ ≠, , ,

y en conclusión V consiste de un sólo punto, { }V x= .

149

Es importante destacar que el teorema anterior no garantiza la existencia de un

mínimo.

Existen muchas razones por las cuales una función convexa puede no tener mínimo.

Por ejemplo :

1) El dominio D puede no ser cerrado como en el caso de la función ( )f : ,1 2 → IR

definida por ( )f x x= −1.

2) El dominio D puede ser cerrado pero no acotado, como sucede con la función

[ )f : ,1 ∞ → IR definida por ( )f x x= −1.

3) El dominio D puede ser compacto (cerrado y acotado) pero no existir mínimos

debido a discontinuidades de la función, como en el caso de la función

[ ]f : ,1 2 → IR definida por

( ) [ )f x

x si x

si x=

∈

=

−1 1 2

1 2

,

.

El teorema siguiente establece que si una función convexa f es diferenciable

en un punto x del interior de su dominio y además ( )∇ =f x 0 entonces ( )f x es un

mínimo global de f.


una función convexa. Si ( )∇ =f x 0 en un punto x D∈ int , entonces ( )f x es un

mínimo global de f . Si además f es dos veces diferenciable en una vecindad de x y

la matriz Hessiana

∂∂ ∂

2 fx x

n x ni j

150

existe y es definida positiva en esa vecindad, entonces ( )f x es el único mínimo de f

en D.

Demostración : Por la proposición 2.6.1 sabemos que

( ) ( ) ( )f y f x f x y x− ≥ ∇ − =; 0

para todo y D∈ int , lo cual demuestra que ( )f x es un mínimo local y por el teorema

2.7.1 ( )f x también es un mínimo global. Si la matriz Hessiana

( )∂∂ ∂

2 fx x

n x ni j

x

es definida positiva, por la demostración del teorema 2.6.2 se tiene que f es

estrictamente convexa en una vecindad del punto x, y por el teorema 2.7.1 ( )f x es el

único mínimo de la función.

Finalizamos este capítulo con los dos teoremas siguientes relacionados con los

máximos de funciones convexas.


una función convexa. Si f alcanza un máximo global en x D∈ int , entonces f es

constante en D.

Demostración : Supongamos que f alcanza un máximo global en x D∈ int pero no

es constante y sean y D∈ , tal que ( ) ( )f y f x< y λ > 1, tal que

( )z y x y D= + − ∈λ . Despejando x, obtenemos

( )x z y= + −1 11λ λ ,

y por convexidad :

151

( ) ( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( )

f x f z f y

f x f y

f x f x

f x

≤ + −

≤ + −

< + −

=

1 1

1 1

1 1

1

1

1

λ λ

λ λ

λ λ

.

Es decir

( ) ( )f x f x< ,

lo cual es una contradicción. La contradicción proviene de haber supuesto que f no

es constante. Luego, f es constante en D.

A continuación presentamos el último teorema de este capítulo, el cual

establece que si una función convexa y no constante alcanza un máximo en un punto

xo de su dominio entonces xo pertenece a la frontera de este.


una función convexa que no es constante. Si x Do ∈ es un punto donde f alcanza un

máximo sobre ( ) ( )( )D f x f x para todo x Do ≥ ∈, , entonces ( )x f r Do ∈ .

Demostración : Supongamos que ( )x f r Do ∉ , esto es x Do ∈ int . Como f no es

constante en D, existe x D∈ , tal que ( ) ( )f x f xo< . Puesto que x Do ∈ int , existe

λ > 1, tal que :

( )x x x Do+ − ∈λ int .

Por otra parte :

( )( ) ( ) ( )( )x x x x xo o= + − + − ∈1 1 11 0 1λ λ λλ , , ,

luego

152

( ) ( )( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( )

f x f x x x f x

f x f x

f x f x

f x

o o

o

o o

o

≤ + − + −

≤ + −

< + −

=

1 1

1 1

1 1

1

1

1

λ λ

λ λ

λ λ

λ

.

Por lo tanto, ( ) ( )f x f xo o< , lo cual es una contradicción. Esta contradicción

proviene de suponer que x Do ∈ int . En conclusión, ( )x f r Do ∈ .

153

Capítulo III

Funciones Convexas Sobre

Espacios Vectoriales Normados. En este capítulo estudiaremos funciones convexas f U L: ⊂ → IR , donde U

es un subconjunto convexo no vacío de un espacio vectorial normado L.

El capítulo lo hemos dividido en cuatro secciones. En la sección 3.1

presentamos la definición analítica de función convexa y algunas de las propiedades

básicas de estas funciones. En la sección 3.2 tratamos la continuidad de funciones

convexas y demostramos que toda función convexa a valores reales definida sobre un

subconjunto convexo y abierto de un espacio vectorial normado es continua si es

acotada superiormente en un entorno de un punto de su dominio. En la sección 3.3

exponemos algunos resultados de carácter general relacionados con la

diferenciabilidad de funciones en espacios normados. Por último, en la sección 3.4,

caracterizamos las funciones convexas a partir de sus propiedades de

diferenciabilidad usando los criterios de la primera y de la segunda derivada.

3.1. Definición y Propiedades Básicas. En la siguiente definición presentamos el concepto de función convexa para

funciones a valores reales definidas en un subconjunto convexo no vacío de un

espacio vectorial.

Definición 3.1.1 : (Función Convexa). Sean U un subconjunto convexo de un

espacio vectorial L y f U: → IR una función. Se dice que f es convexa si y sólo si

( )( ) ( ) ( ) ( )f x y f x f yλ λ λ λ+ − ≤ + −1 1

154

para cualesquiera x y U, ∈ y todo [ ]λ ∈ 0 1, .

Comentarios :

1) De manera análoga al caso de funciones f I: ⊂ IR→ IR, donde I es un intervalo,

se demuestra que una función f U L: ⊂ → IR es convexa si y sólo si se verifica

( ) ( )f x f xi ii

n

i ii

nα α

= =∑ ∑

≤

1 1

3 1.

para todo x U i ni ∈ =, , , ;1 K y αi ≥ 0 tales que αii

n=

=∑ 1

1

.

Esta desigualdad se conoce como desigualdad de Jensen.

2) Como estudiaremos la continuidad y la diferenciabilidad de funciones convexas,

en lo sucesivo supondremos que el espacio vectorial L es normado.

3) De manera similar a como se demostró en el capítulo 2 se tiene que si x Uo ∈

entonces la función ( )g U xo: − → IR definida por ( ) ( ) ( )g x f x x f xo o= + − es

convexa si la función f U: → IR es convexa y además f es localmente acotada

(continua, diferenciable, etc.) en xo si y sólo si g es localmente acotada (continua,

diferenciable, etc.) en 0 ∈ L . Por otra parte, la condición ( )g 0 0= permite

simplificar las demostraciones relacionadas con las propiedades de f en el punto

xo .

4) Si U es un subconjunto convexo y abierto de un espacio vectorial L y

f U L: ⊂ → IR es una función convexa, entonces para y L∈ arbitrario la

función ( ) ( )g t f x t y x Uo o= + ∈, , es convexa sobre algún intervalo abierto

( )a b, que contiene al origen, lo cual es una forma de decir que la restricción de

una función convexa a cualquier segmento de recta contenido en su dominio

también es convexa.

155

3.2. Continuidad de Funciones Convexas.

Toda función lineal a valores reales definida sobre un espacio vectorial L es

convexa sobre L. Sin embargo, es conocido del Análisis Funcional que las

transformaciones lineales definidas sobre espacios vectoriales de dimensión infinita

no necesariamente son continuas (ver [17], problema B, p. 61) y por lo tanto una

función convexa a valores reales definida sobre un espacio vectorial arbitrario L, no

necesariamente es continua. Dos direcciones a seguir para garantizar la continuidad de

una función convexa son : 1) dando condiciones suficientes adicionales sobre la

función para que esta sea continua ; 2) imponiendo restricciones sobre el espacio

vectorial L de manera que se garantice la continuidad. Esto último fue lo que hicimos

en el capítulo 2 al considerar las funciones definidas sobre subconjuntos de IRn (un

espacio de dimensión finita). En este capítulo seguiremos la primera dirección, es

decir : daremos las condiciones que debe verificar una función convexa

f U L: ⊂ → IR para que sea continua.

Cabe destacar aquí que el contenido de este capítulo, exceptuando la sección 3.3, se

tomó de [17], Cap. IV, pp. 89-103.

El siguiente teorema es vital para nuestro estudio de la continuidad de

funciones convexas y en el mismo demostramos que toda función convexa acotada

superiormente en un entorno de un punto es localmente acotada sobre su dominio.

Teorema 3.2.1 : Sean U un subconjunto convexo y abierto de un espacio vectorial

normado L y f U: → IR una función convexa. Entonces se verifican :

1) Si f es acotada superiormente en un entorno de un punto de su dominio entonces

es acotada inferiormente en el mismo entorno.

2) Si f es acotada superiormente en un entorno de un punto x Uo ∈ , entonces es

localmente acotada, esto es, cada x U∈ tiene un entorno sobre el cual f es

acotada.

Demostración :

156

1) Sean x Uo ∈ y ( )g U xo: − → IR la función definida por

( ) ( ) ( )g x f x x f xo o= + − .

De acuerdo con el comentario número 3) de la sección 3.1, basta probar que si g

es acotada superiormente en un entorno del cero ( )0 ∈ −U xo entonces es acotada

inferiormente en este mismo entorno.

Supongamos entonces que g es acotada superiormente en un entorno del cero,

luego ; existen M > 0 y ε > 0 tales que para todo ( )x B U xo∈ ⊂ −0, ε se

verifica ( )g x M≤ . Como ( )0 12

12

= + −x x y g es convexa se tiene

( ) ( ) ( )0 0 12

12

= ≤ + −g g x g x

y por lo tanto

( ) ( )g x g x≥ − − .

Ahora bien, ( )x B∈ 0, ε implica que ( )− ∈x B 0, ε pues − = <x x ε y en

consecuencia ( )g x M− ≤ , de donde se deduce que

( ) ( )g x g x M≥ − − ≥ − .

Es decir ( )g x M≥ − para todo ( )x B∈ 0, ε , y así g es acotada inferiormente en

un entorno del cero.

En conclusión : si f es acotada superiormente en un entorno de un punto x Uo ∈

entonces es acotada inferiormente en el mismo entorno.

2) Supongamos que para todo ( )x B∈ 0, ε se cumple que ( )g x M≤ , donde

M > 0 y ε > 0. Demostraremos que g es acotada superiormente en un entorno

de y U xo∈ − , .para cualquier y ≠ 0. En efecto, como U xo− es abierto e

y U xo∈ − , existe ρ > 1 tal que z y U xo= ∈ −ρ . Sea λ ρ= 1 . Entonces

( ) ( ){ }( ) ( )

N v L v x z x B

B z

= ∈ = − + ∈

= − +

: , ,

,

1 0

1 0

λ λ ε

λ ε λ

157

es una bola de centro λ z y radio ( )1− λ ε .

Además, si v N∈ entonces se verifica

( ) ( ) ( ) ( )( ) ( )

( )

g v g x g z

M g z

M g z K

≤ − +

≤ − +

< + =

1

1

λ λ

λ λ

.

Luego, para todo v N∈ se cumple que ( )g v K< y por lo tanto g es acotada

superiormente sobre ( )( )B zλ λ ε, ,1− es decir : g es acotada superiormente en

un entorno de λ z y= , de donde se infiere que f es acotada superiormente en un

entorno de y xo+ . Dado que y U xo∈ − es arbitrario, tenemos que y x Uo+ ∈ es

un punto arbitrario de U y en consecuencia deducimos que f es acotada

superiormente en un entorno de cualquier punto de U y por la parte 1) del

teorema, f es acotada inferiormente en el mismo entorno, de donde se concluye

que f es localmente acotada.

Veamos la definición de lipschitzidad local, la cual será de utilidad en el

siguiente teorema.

Definición 3.2.1 : Sean U un subconjunto abierto de un espacio vectorial normado L

y f U: → IR una función. Se dice que f es localmente Lipschitz si para cada x U∈ ,

existe un entorno ( )B x U, ε ⊂ y una constante ( )K K x= tal que si ( )y z B x, , ,∈ ε

entonces

( ) ( )f y f z K y z− ≤ − .

Como puede observarse de la definición toda función localmente Lipschitz es

continua. En el siguiente teorema demostraremos que toda función convexa acotada

superiormente en un entorno de un punto de su dominio es localmente Lipschitz en

todo su dominio y por lo tanto continua.

158

Teorema 3.2.2 : Sean U un subconjunto convexo y abierto de un espacio vectorial

normado L y f U: → IR una función convexa. Si f es acotada superiormente en un

entorno de un punto de U, entonces f es localmente Lipschitz en U.

Demostración : De acuerdo con el teorema 3.2.1, f es acotada localmente en U,

luego ; dado x Uo ∈ podemos encontrar un entorno ( )B x Uo , 2 ε ⊂ sobre el cual f

es acotada, es decir, tal que para todo ( )x B xo∈ , 2 ε se verifica ( )f x M≤ , donde

M > 0 es un número real.

Demostraremos que f satisface la condición de Lipschitz sobre ( )B xo , .ε

En efecto, supongamos que no se satisface la condición de Lipschitz sobre ( )B xo , ,ε

entonces dada la constante KM= 2ε existen ( )x x B x x xo1 2 1 2, , , ,∈ ≠ε tales que

( ) ( )f x f x x xM

2 12

2 1− > −ε .

Siempre es posible elegir x1 y x2 de forma tal que

( ) ( )f x f x x xM

2 12

2 1− > −ε

ya que x1 y x2 se pueden intercambiar.

Por lo tanto

( ) ( )f x f x

x x

M2 1

2 1

2−−

> ε .

Consideremos α ε=−x x2 1

y tomemos

( )x x x x3 2 2 1= + −α .

Entonces

x x x x3 2 2 1− = − =α ε

y además

159

( )x x x x x x x x x x3 0 2 0 2 1 2 0 2 1 2− = − + − ≤ − + − < + =α α ε ε ε,

luego

( )x B x3 0 2∈ , .ε

Como los puntos x x x1 2 3, , están sobre una misma recta R y f es convexa sobre

R U∩ , por propiedades de las funciones convexas sobre la recta real tenemos que las

pendientes o razones

( ) ( )f y f x

y xx y R U x y

−−

∈ ∩ ≠, , , ,

son crecientes cuando los puntos para los cuales se calculan están ordenados sobre la

recta. Por lo tanto, en este caso podemos escribir

( ) ( ) ( ) ( )f x f x

x x

f x f x

x x

M3 2

3 2

2 1

2 1

2−−

−−

≥ > ε

y dado que x x3 2− = ε , esto implica que

( ) ( )f x f x M3 2 2− > ,

lo cual se contradice con el hecho de que ( )f x M≤ , para todo ( )x B xo∈ , 2 ε ,

pues en este caso debería verificarse que

( ) ( ) ( ) ( )f x f x f x f x M3 2 3 2 2− ≤ + ≤ ,

ya que ( )x x B xo2 3 2, , .∈ ε

La contradicción proviene de haber supuesto que f no satisface la condición de

Lipschitz sobre ( )B xo , ,ε lo cual prueba que f es localmente Lipschitz en U, y

concluye así la demostración.

Finalizamos esta sección con el siguiente corolario sobre la continuidad de una

función convexa.

Corolario 3.2.1 : Sean U un subconjunto convexo y abierto de un espacio vectorial

normado L y f U: → IR una función convexa. Si f es acotada superiormente en

un entorno de un punto de U, entonces f es continua sobre U.

160

Demostración : De acuerdo con el teorema 3.2.2, f es localmente Lipschitz en U y

dado que la condición de Lipschitz implica continuidad se obtiene inmediatamente la

conclusión.

3.3. Diferenciabilidad en Espacios Vectoriales Normados.

A continuación veremos a modo de referencia algunos resultados sobre

diferenciabilidad de funciones que usaremos en la próxima sección. El lector

interesado en los detalles de los aspectos tratados aquí puede remitirse a cualquier

texto que trate la teoría de diferenciación en espacios normados.

Empezamos con la definición de diferencial de una función definida sobre un

conjunto abierto U L⊂ , donde L es un espacio vectorial normado y la función toma

sus valores en otro espacio vectorial normado M.

Definición 3.3.1 : (Diferencial Fréchet). Sean L y M espacios vectoriales

normados, U un subconjunto abierto de ( )L U L⊂ y f U M: → una función.

Se dice que f es diferenciable en x Uo ∈ si existe una transformación lineal

T L M: → tal que para h L∈ , suficientemente pequeño, se verifica

( ) ( ) ( ) ( )f x h f x T h r x ho o o+ − = + , ,

donde

( )r x h

ho M cuando h,

.→ ∈ →0 0

La transformación lineal T es llamada la derivada de f en xo y es

denotada por ( )f xo' . La definición anterior expresa que si f es derivable en un

punto x Uo ∈ entonces ( )f xo' es una transformación lineal de L en M. Esto

significa que si ( )f xo' existe y es continua para todo x Uo ∈ entonces se tiene una

161

función ( )f U Hom L M' : , ,→ donde ( )Hom L M, es el espacio vectorial de las

transformaciones lineales continuas o acotadas de L en M.

Por lo tanto, si x Uo ∈ y ( )f x' 0 es continua, se tiene que

( ) ( )f x Hom L Mo' ,∈ . Además, como ( )f x L Mo' : → es una función, si h L∈

tenemos que ( )( )f x h Mo' ∈ . A este elemento de M se le llama diferencial fuerte (o

diferencial de Fréchet) de la función f en el punto xo .

En lo sucesivo nos interesaremos en el caso donde ( )f xo' es una función

continua para todo x Uo ∈ , es decir ( ) ( )f x Hom L Mo' ,∈ , para todo x Uo ∈ .

La igualdad

( ) ( ) ( )( ) ( )f x h f x f x h r x ho o o o+ − = +' ,

define el “resto” ( )r x h Mo , ∈ cuando existe la diferencial ( )( )f x ho' . La

diferenciabilidad de f en el punto xo nos dice que este resto es un “infinitesimo de

orden superior a h”, es decir que

( )limh

r x h

ho

→=

00

,.

Esto significa, claro está, que dado ε > 0, existe δ > 0 tal que h < δ implica

( )r x h ho , ,≤ ε o lo que es lo mismo

( ) ( ) ( )( )f x h f x f x h ho o o+ − − ≤' ε .

En algunas ocasiones es conveniente escribir la diferenciabilidad de la función

f U L M: ⊂ → en el punto x Uo ∈ del siguiente modo :

( ) ( ) ( )( ) ( ) ( )f x h f x f x h h x ho o o o+ − = +' , .ρ 3 2

donde ( )lim x hh

o→

=0

0ρ , .

162

Para tal efecto, basta tomar ( ) ( )ρ x h r x h ho o, , /= . Esta expresión no tiene

sentido para h = 0. Sin embargo, cuando f es diferenciable en el punto xo , se puede

definir ( )ρ xo , 0 0= y entonces ( )ρ xo , ⋅ es una función continua en h L= ∈0 .

Si f U L M: ⊂ → es diferenciable en el punto x Uo ∈ entonces, para cada

vector h L∈ , se tiene

( )( ) ( )( ) ( ) ( ) ( )f x h ho

f x t h

t

f x t h f x

ttt

r x t h

t ho' ,

' ,= = −

+ −0 0 0

para t ∈IR, t ≠ 0, suficientemente próximo a cero.

Luego :

( )( ) ( ) ( ) ( )f x h limot

f x t h f x

to o' . .=

→

+ −

03 3

Antes de tratar el caso de la segunda derivada presentamos la definición de

aplicación bilineal y algunas consideraciones relacionadas con estas funciones.

Definición 3.3.2 : (Aplicación bilineal). Sean L y M espacios vectoriales y

B L L M: × → una función. Se dice que B es una aplicación bilineal si se cumplen

las siguientes condiciones :

1) para cualesquiera vectores x x x x x x, ' , , , ,' '1 2 1 2 de L y cualesquiera números

α β, se verifican las igualdades :

( ) ( ) ( )

( ) ( ) ( )B x x x B x x B x x

B x x x B x x B x x

α β α β

α β α β

1 2 1 2

1 2 1 2

+ = +

+ = +

, ' , ' , ' ,

, , , ;' ' ' '

2) existe un número positivo K tal que

( ) ( )B x x K x x, ' ' .≤ ⋅ 3 4

para todo x x L, '∈ .

La condición 1) expresa que la aplicación B es lineal respecto a cada uno de

sus dos argumentos y la condición 2) equivale a la continuidad de B respecto a ambos

163

argumentos. El ínfimo de los números K que satisfacen la condición (3.4) se denota

B y recibe el nombre de norma de la aplicación bilineal B. El conjunto de todas las

aplicaciones bilineales B L L M: × → se denota ( )Hom L L M2 × , . Dotamos a

( )Hom L L M2 × , de una estructura de espacio vectorial definiendo f g+ y k f

por

( )( ) ( ) ( )( )( ) ( )

f g x x f x x g x x

k f x x k f x x

+ = +

=

, ' , ' , '

, ' , '

para todo ( )f g Hom L L M, ,∈ ×2 y todo elemento k del cuerpo sobre el cual

están definidos los espacios vectoriales L y M, el cual para nuestro estudio

supondremos que es el cuerpo de los números reales. De esta forma

( )Hom L L M2 × , es un espacio vectorial normado.

Existe un isomorfismo canónico entre

( )Hom L L M2 × , y ( )( )Hom L Hom L M, ,

dado por la aplicación

( ) ( )( )Γ : , , ,Hom L L M Hom L Hom L M2 × →

definida por

( )( )( ) ( )Γ f v w f v w= ,

para todo ( )v w L f Hom L L M, , , .∈ ∈ ×2

En efecto :

1) Γ es una aplicación bien definida.

Sean ( )f g Hom L L M, ,∈ ×2 , entonces si f g= se verifica ( ) ( )Γ Γf g= , ya

que para todo ( ) ( )x y L f x y g x y, , , ,∈ = implica ( )( )( ) ( )( )( )Γ Γf x y g x y= .

2) Γ es lineal.

Sean ( )f g Hom L L M x y L, , , ,∈ × ∈2 y α β, números reales, entonces

164

( )( )( ) ( )( )( ) ( )( )( )( ) ( )( )( )

( ) ( )( ) ( )( )

Γ

Γ Γ

Γ Γ

α β α β

α β

α β

α β

f g x y f g x y

f x y g x y

f x y g x y

f g x y

+ = +

= +

= +

= +

,

, ,

.

Luego

( ) ( ) ( )Γ Γ Γα β α βf g f g+ = + .

3) Γ es inyectiva.

Sea ( )f Hom L L M∈ ×2 , tal que

( ) ( )( )Γ f Hom L Hom L M= ∈0 , , ,

entonces para todo x y L, ∈ se cumple ( )( )( )Γ f x y M= ∈0 , pero entonces

( )f x y M, = ∈0 , para todo ( )x y L L, ∈ × , y por lo tanto f = 0 .

4) Γ es sobreyectiva.

Sea ( )( )g Hom L Hom L M∈ , , , es decir ( )g L Hom L M: ,→ es una

transformación lineal continua.

Sea f L L M: × → la función definida por f T g= o~ , donde las funciones

( )T L Hom L M M: ,× →

y

( )~ : ,g L L L Hom L M× → ×

están definidas por

( ) ( ) ( ) ( )T y h h y para todo y h L Hom L M, , , ,= ∈ ×

y

( ) ( )( )~ , , , , ,g y z z g y para todo y z L= ∈

entonces ~g y T son aplicaciones bilineales, y por lo tanto T go~ es bilineal, es

decir

165

( )T g Hom L L Mo ~ ,∈ ×2

y además

( ) ( )Γ Γf T g g= =o ~ ,

ya que

( )( )( ) ( )( )

( )( )( )( )

( )( )

Γ T g x y T g x y

T g x y

T y g x

g x y

o o~ ~ ,

~ ,

,

=

=

=

=

para todo x y L, .∈

Queda así probado que los espacios

( )Hom L L M2 × , y ( )( )Hom L Hom L M, , son isomorfos.

Ahora estamos en condiciones de tratar el caso de la segunda derivada.

En efecto, supongamos que L y M son espacios vectoriales normados, U L⊂ un

conjunto abierto y f U L M: ⊂ → una función derivable en cada punto de U. Así

tenemos la función derivada

( )f U L Hom L M' : , .⊂ →

Ahora bien, como ( )Hom L M, es el espacio de las transformaciones lineales

continuas ( )T L M Hom L M: , ,→ tiene una estructura de espacio vectorial

normado, considerando la norma

( ){ }T T x x= ≤sup : 1

(ver [8], Ejercicio 1, pp. 285-286).

De esta manera tiene sentido plantearse la posibilidad de que f ' sea derivable de

acuerdo a la definición 3.3.1. En tal caso a esta derivada la denotamos por f ' ' , y si

( )f x' ' es continua para cada x U∈ , entonces f ' ' es una función que asocia a cada

166

x U∈ una transformación lineal continua de ( )( )Hom L Hom L M, , , es decir,

tenemos la función

( )( )f U L Hom L Hom L M' ' : , , .⊂ →

Por otra parte, si x Uo ∈ entonces

( ) ( )( )f x Hom L Hom L Mo' ' , , ,∈

de modo que tiene sentido evaluar ( )f xo' ' en un punto y L∈ y así

( )( ) ( )f x y Hom L Mo' ' ,∈

y podemos ahora evaluar la transformación lineal ( )( )f x y L Mo' ' : → en otro punto

z L∈ obteniendo que

( )( )( )f x y z Mo' ' ∈

y este elemento de M depende linealmente de los dos vectores y z L, ∈ . Finalmente,

como los espacios ( )( )Hom L Hom L M, , y ( )Hom L L M2 × , son isomorfos,

podemos identificar la función ( )f xo' ' con un elemento de ( )Hom L L M2 × , y

pensar la función ( )f xo' ' como una aplicación bilineal ( )f x L L Mo' ' : .× →

Para concluir esta parte, tenemos en particular que si

M = IR y B L L: × → IR es una aplicación bilineal, esta recibe el nombre de

forma bilineal. Por razones muy diversas estamos interesados en las formas

bilineales simétricas. Se dice que una forma bilineal B L L: × → IR es simétrica si

( ) ( )B h k B k h, ,= para todo h k L, ∈ . Además, tal aplicación es definida positiva

(definida no negativa) si para todo h L∈ , no nulo, ( ) ( )( )B h h B h h, , .> ≥0 0

En el siguiente teorema exponemos la regla de la cadena. Aunque esta sección

es principalmente de referencia, presentamos la demostración del teorema debido a su

simplicidad e importancia.

167

Teorema 3.3.1 : (ver [7], p. 257 o [17], p. 66). (Regla de la cadena). Sean

L M, y N espacios vectoriales normados, U y V subconjuntos abiertos de

L y M respectivamente, f U L M: ⊂ → una función diferenciable en un punto

x Uo ∈ , con ( )f U V⊂ , y g V M N: ⊂ → una función diferenciable en el

punto ( )y f x Vo o= ∈ . Entonces la función compuesta g f U No : → es

diferenciable en el punto xo y

( ) ( ) ( ) ( )g f x g y f xo o oo o' ' ' .=

De modo abreviado : la derivada de la función compuesta es la compuesta de las

derivadas.

Demostración : Como f es diferenciable en el punto x Uo ∈ y g es diferenciable

en el punto ( )y f x Vo o= ∈ , tenemos que para h L∈ y k M∈ suficientemente

pequeños, se verifican

( ) ( ) ( ) ( )( ) ( ) ( ) ( )

f x h f x f x h h x h

g y k g y g y k k y k

o o o o

o o o o

+ = + ⋅ + ⋅

+ = + ⋅ + ⋅

' , ,

' , ,

ρ

σ

con ( )lim x hh

o→

=0

0ρ , y ( )lim y kk

o→

=0

0σ , .

Entonces

( )( ) ( ) ( ) ( )( )g f x h g f x f x h h x ho o o oo + = + ⋅ + ⋅' , .ρ

Sea

( ) ( )k f x h h x ho o= ⋅ + ⋅' , .ρ

De la linealidad de ( )g yo' obtenemos

( )( ) ( )( ) ( )

( ) ( ) ( ) ( ) ( ) ( )

( )( ) ( ) ( )[ ] ( )

g f x h g f x h g y k

g y g y f x h g y x h h y k k

g f x g y f x h h x h

o o o

o o o o o o

o o o o

o

o o

+ = + = +

= + ⋅ ⋅ + ⋅ ⋅ + ⋅

= + ⋅ + ⋅

' ' ' , ,

' ' ,

ρ σ

τ

168

donde

( ) ( ) ( ) ( ) ( ) ( )τ ρ σ ρx h g y x h y k f x x ho o o o ohh o, ' , , ' , .= ⋅ + ⋅ ⋅ +

Si h → 0 entonces k → 0 y además ( )f xohh

' ⋅ está acotada, por lo cual

( )lim x hh

o→

=0

0τ ,

y en consecuencia ( ) ( ) ( ) ( )g f x g y f xo o oo o' ' ' ,= concluyendo así la demostración.

Cuando los espacios L M, y N son de dimensiones finitas las

transformaciones lineales ( )g yo' y ( )f xo' se representan por matrices y la regla de

la cadena nos provee de la transformación lineal ( ) ( )g f x L Noo ' : → como un

producto de matrices :

( ) ( )[ ] ( )[ ] ( )[ ]g f x g y f xo o oo ' ' ' .=

Comentario : En Análisis Funcional se acostumbra cuando se tiene una

transformación lineal T L M: → , donde L y M son espacios vectoriales, usar la

notación Tx en lugar de ( )T x para representar el elemento de M que corresponde al

vector x L∈ . Aquí, en la demostración del teorema 3.3.1, hemos utilizado la notación

T x⋅ en vez de Tx y la misma no debe dar lugar a confusión si se lee en su contexto.

Consideremos ahora una función dos veces continuamente diferenciable

f U L: ⊂ → IR, donde U es un subconjunto abierto de un espacio vectorial normado

L. Luego, existe la derivada de f y es una función f U Hom' : → (L, IR ) y en

consecuencia, si x U∈ tenemos una función lineal ( )f x L' : → IR . Sea

g I: ⊂ IR→ L , donde I es un intervalo abierto, la función definida por

( )g t x t ho= + , con x U h Lo ∈ ∈, y x t h Uo + ∈ cada vez que t I∈ . Como g

es diferenciable, existe la función derivada g I Hom' : → (IR, L) y si t I∈ se tiene

una función lineal ( )g t' : IR→ L . Además, si s∈IR se verifica que

169

( )( ) ( ) ( )

( ) ( )

g t s lim

lim

lim sh

g t s g t

x t s h x t h

s h

o o

'

.

=

=

= =

→

+ −

→

+ + − +

→

λ

λλ

λ

λλ

λ

λλ

0

0

0

Es decir

( )( )g t s sh para todo t I s' , ,= ∈ ∈IR .

Obsérvese que esta es una función lineal de s .

Sea φ = ⊂f g Io : IR→ IR . Dado que f y g son derivables y además f ' es

continua en ( )g t existe la derivada de φ y es una función φ ' : I Hom→ (IR, IR ) por

lo cual si t I∈ tenemos una función lineal ( )φ ' :t IR→ IR . Aplicando la regla de la

cadena a la función φ se verifica que

( ) ( )( ) ( ) ( ) ( )φ ' ' ' ' 't f g t g t f x t h g to= = +o o

y por ser esta una función lineal de IR en IR tiene sentido evaluarla en un punto

s∈IR arbitrario de tal manera que

( )( ) ( ) ( )( ) ( )

( ) ( )( )( ) ( )( )

φ ' ' '

' ' ' .

t s f x t h g t s

f x t h g t s f x t h sh

o

o o

= +

= + = +

o

Además, como la función ( )f x t h Lo' :+ → IR es una transformación lineal se

verifica

( )( ) ( )( ) ( )φ ' ' .t s s f x t h ho= + 3 5

y dado que ( )φ ' :t IR→ IR también es una transformación lineal, existe una matriz

1 1× , es decir un número real a, tal que

( )[ ] [ ]φ ' ,t a a= =

donde hemos identificado la matriz [ ]a 1 1× con el número real a, y así

( )( ) [ ]φ ' .t s a s a s= = ⋅

170

Comparando esta última expresión con la igualdad (3.5), vemos que el número a ∈IR

es precisamente el número real ( )( )f x t h ho' ,+ de modo que

( )[ ] ( )( )[ ]φ ' 't f x t h ho= +

o equivalentemente

( ) ( )( ) ( )φ ' ' .t f x t h ho= + 3 6 .

Aplicando nuevamente la regla de la cadena a la función φ ' concluimos que

( ) ( )( ) ( )φ ' ' ' ' , . .t f x t h h ho= + 3 7

Ahora estamos en condiciones de abordar el teorema final de esta sección, el

cual presentamos a continuación.

Teorema 3.3.2 : (ver [17], p. 70). Sean L un espacio vectorial normado, U un

subconjunto convexo y abierto de L , y f U: → IR una función continuamente

diferenciable. Si ( )f x' ' existe en cada punto de U, entonces para cualesquiera

x x Uo, ,∈ existe un ( )s∈ 0 1, tal que

( ) ( ) ( )( ) ( )( )f x f x f x h f x sh h ho o o= + + +' ' ' , ,12

donde h x x Lo= − ∈ .

Demostración : Dados x x Uo, ,∈ consideremos un intervalo abierto ( )a b, tal que

[ ] ( )0 1, ,⊂ a b y la función ( )φ : ,a b → IR, definida por

( ) ( )φ t f x t ho= +

con x t h Uo + ∈ cada vez que ( )t a b∈ , y para h x x Lo= − ∈ . Aplicando dos veces

la regla de la cadena, se tiene según las igualdades (3.6) y (3.7) que

( ) ( )( )φ ' 't f x t h ho= +

y

( ) ( )( )φ ' ' ' ' , .t f x t h h ho= +

171

De acuerdo con el desarrollo en serie de Taylor de orden 2 para funciones de una

variable, tenemos que para todo ( )t a b t∈ >, , 0, existe ( )s t∈ 0, tal que

( ) ( ) ( ) ( )φ φ φ φt t s t= + +0 0 12

2' ' ' .

Haciendo las sustituciones correspondientes nos queda

( ) ( ) ( )( ) ( )( )f x t h f x f x t h f x sh t h t ho o o o+ = + + +' ' ' ,12

que para t = 1 equivale al resultado buscado.

3.4. Caracterización de las Funciones Convexas.

Con esta sección finalizamos el último capítulo de este trabajo exponiendo

tres teoremas relacionados con la diferenciabilidad de funciones convexas que

generalizan los resultados sobre diferenciabilidad de funciones convexas

f I: ⊂ IR→ IR., estudiados en el primer capítulo.

El siguiente teorema es la generalización a espacios normados de la

proposición 2.6.1.


subconjunto convexo y abierto de L y f U: → IR una función. Si f es convexa

y diferenciable en un punto x Uo ∈ , entonces para todo x U∈ , se verifica

( ) ( ) ( )( ) ( )f x f x f x x xo o o− ≥ −' . .3 8

Si f es diferenciable en todo punto de U, entonces f es convexa si y sólo si la

desigualdad (3.8) es válida para todo x x Uo, ∈ . Además, f es estrictamente

convexa si y sólo si la desigualdad es estricta.

Demostración : Supongamos que f es convexa y diferenciable en x Uo ∈ , entonces

para todo ( )t ∈ 0 1, y x U∈ ,

172

( )( ) ( )( )( ) ( ) ( )

( ) ( ) ( )( )

f x t x x f t x t x

t f x t f x

f x t f x f x

o o o

o

o o

+ − = − +

≤ − +

= + −

1

1

.

Haciendo h x xo= − , obtenemos

( ) ( ) ( ) ( )( ) ( )f x t h f x t f x h f xo o o o+ − ≤ + − 3 9. .

Restando ( )( )f x t ho' a ambos lados de la desigualdad y dividiendo por t, se obtiene

( ) ( ) ( ) ( ) ( ) ( ) ( )( )f x t h f x f x t h

t o o oo o o f x h f x f x h+ − −

≤ + − −'

' .

Es decir, de acuerdo con la definición de diferenciabilidad (ecuación (3.2)), se tiene :

( ) ( ) ( ) ( )( )t h x t h

t o o oo f x h f x f x h

⋅≤ + − −

ρ ,'

y dado que ( )t ∈ 0 1, se cumple que

( ) ( ) ( ) ( )( )h x t h f x h f x f x ho o o o⋅ ≤ + − −ρ , ' .

Cuando ( )t t t↓ → >0 0 0, , el lado izquierdo tiende a cero mientras que el lado

derecho, siendo independiente de t, permanece constante. Luego

( ) ( ) ( )( )0 ≤ + − −f x h f x f x ho o o' ,

y en consecuencia

( ) ( ) ( )( )f x h f x f x ho o o+ − ≥ '

que es precisamente la desigualdad (3.8).

Además, si f es estrictamente convexa, (3.9) es una desigualdad estricta y usando la

desigualdad (3.8) ya demostrada, obtenemos de (3.9), con la desigualdad estricta,

que :

( ) ( )( ) ( ) ( )

( )( ) ( )( )t f x h f x f x t h f x

f x t h por

o o o o

o

+ − > + −

≥ ' . .3 8

Dividiendo por ( )t ∈ 0 1, nos queda la desigualdad estricta

173

( ) ( ) ( )( )f x h f x f x ho o o+ − > ' .

Supongamos ahora que f es diferenciable en todo punto de U y satisface la

desigualdad (3.8). Dados x x U1 2, ∈ y ( )t ∈ 0 1, , sea ( )x t x t xo = + −1 21 .

Como ( ) ( )( )t x x t x x Lo o1 21 0− + − − = ∈ y ( )( )f xo' ,0 0= podemos escribir

( ) ( ) ( ) ( ) ( )( )( )f x f x f x t x x t x xo o o o o= + − + − −' 1 21

y usando la linealidad de ( )f xo' tenemos

( ) ( ) ( )( ) ( ) ( )( )

( ) ( )( )( )( ) ( ) ( )( )( ) ( )

f x f x t f x x x t f x x x

t f x f x x x

t f x f x x x

o o o o o o

o o o

o o o

= + − + − −

= + −

+ − + −

' '

'

' . .

1 2

1

2

1

1 3 10

Ahora bien, de acuerdo con la desigualdad (3.8) se verifican

( ) ( )( ) ( ) ( )f x f x x x f xo o o+ − ≤' .1 1 3 11

y

( ) ( )( ) ( ) ( )f x f x x x f xo o o+ − ≤' .2 2 3 12

Sustituyendo (3.11) y (3.12) en (3.10) nos queda :

( ) ( ) ( ) ( )f x t f x t f xo ≤ + −1 21 .

Esto es,

( )( ) ( ) ( ) ( ) ( )f t x t x t f x t f x1 2 1 21 1 3 13+ − ≤ + − .

para todo ( )t ∈ 0 1, y x x U1 2, ∈ . Por lo tanto, f es convexa cuando es

diferenciable y se satisface (3.8). Además, si (3.8) es una desigualdad estricta, la

desigualdad (3.13) también es estricta y así f es estrictamente convexa.

La siguiente definición será de utilidad para demostrar que toda función

convexa definida en un subconjunto convexo y abierto de un espacio normado tiene

derivada monótona creciente.

174

Definición 3.4.1 : Sean L un espacio vectorial normado, U un subconjunto abierto de

L y f U: → IR una función diferenciable. Se dice que f ' es monótona

creciente si

( ) ( )[ ][ ]f x f y x y' ' ,− − ≥ 0

para todo x y U, ∈ . Si la desigualdad es estricta para x y≠ , se dice que f ' es

estrictamente monótona creciente.

El teorema siguiente es una generalización del teorema 1.3.1 y en el mismo se

indica que una función diferenciable sobre un conjunto convexo y abierto es convexa

si y sólo si su derivada f ' es monótona creciente.


subconjunto convexo y abierto de L y f U: → IR una función continua y

diferenciable en todo punto de U. Entonces, f es convexa (estrictamente convexa) si

y sólo si la derivada f ' es monótona (estrictamente monótona) creciente sobre U.

Demostración : Supongamos que f es convexa. Como f es diferenciable, se tiene,

de acuerdo con el teorema 3.4.1, que para cualesquiera x y U, ∈ se verifican

( ) ( ) ( )( )( ) ( ) ( )( )

f x f y f y x y

f y f x f x y x

− ≥ −

− ≥ −

'

' .

Sumando lado a lado las desigualdades anteriores tenemos

( )( ) ( )( )( )( ) ( )( )

( ) ( )[ ] [ ]

0 ≥ − + −

= − − −

= − −

f y x y f x y x

f x y x f y y x

f x f y y x

' '

' '

' ' ,

de donde

( ) ( )[ ][ ] ( )f x f y x y' ' .− − ≥ 0 3 14

175

y por lo tanto f ' es monótona creciente. Además, la desigualdad (3.14) es estricta

cuando f es estrictamente convexa.

Recíprocamente, supongamos que la derivada f ' es monótona creciente.

Sean x y U, ∈ y [ ]φ : ,0 1 → IR la función definida por

( ) ( )( )φ λ λ λ= + −f x y1 . Para 0 11 2< < <λ λ , sean

( ) ( )u x y u x y1 1 1 2 2 21 1= + − = + −λ λ λ λ, .

Entonces, ( )( )u u x y2 1 2 1− = − −λ λ . Luego

( ) ( )[ ][ ]( ) ( ) ( )[ ][ ]

0 2 1 2 1

2 1 2 1

≤ − −

= − − −

f u f u u u

f u f u x y

' '

' ' ,λ λ

es decir

( ) ( )[ ][ ]0 2 1≤ − −f u f u x y' ' ,

de donde

( )( ) ( )( )f u x y f u x y' ' .1 2− ≤ −

Aplicando la regla de la cadena a la función φ obtenemos

( ) ( )( ) ( )

( )( ) ( )( )

( )( ) ( )

( )

φ λ λ λ

λ λ

φ λ

' '

' '

'

' .

1 1 1

1 2

2 2

2

1

1

= + − −

= − ≤ −

= + − −

=

f x y x y

f u x y f u x y

f x y x y

Esto es,

( ) ( )φ λ φ λ' ' ,1 2≤

para todo ( )λ λ λ λ1 2 1 2 0 1< ∈, , , .

En consecuencia, φ es convexa en el intervalo ( )0 1, (estrictamente convexa si la

derivada f ' es estrictamente monótona creciente).

176

Como f es continua se tiene que φ es continua en 0 y en 1 y por lo tanto convexa en

el intervalo [ ]0 1, , por lo cual podemos escribir

( )( ) ( ) ( ) ( )( )( ) ( ) ( )( ) ( ) ( )

f x y

f x f y

λ λ φ λ φ λ λ

λ φ λ φ

λ λ

+ − = = + −

≤ + −

= + −

1 1 1 0

1 1 0

1 ,

para todo [ ]λ ∈ ∈0 1, , , .x y U

En conclusión : f es convexa cuando la derivada f ' es monótona creciente y es

estrictamente convexa si f ' es estrictamente monótona creciente.

Hemos caracterizado las funciones convexas en términos de la primera

derivada. En el próximo y último teorema del presente trabajo, caracterizaremos las

funciones en términos de la segunda derivada.

Teorema 3.4.3 : (ver [17], pp. 100-101). Sean L un espacio vectorial normado, U un

subconjunto convexo y abierto de L y f U: → IR una función continuamente

diferenciable que tiene segunda derivada en cada punto de U. Entonces f es convexa

si y sólo si ( )f x' ' es definida no negativa para cada x U∈ . Además, si ( )f x' ' es

definida positiva sobre U, entonces f es estrictamente convexa.

Demostración : De acuerdo con el teorema 3.3.2, para cualesquiera x x Uo, ∈ ,

existe ( )s∈ 0 1, tal que

( ) ( ) ( )( ) ( )( )f x f x f x h f x sh h ho o o= + + +' ' ' , ,12

donde h x xo= − . Supongamos que ( )f x sho' ' + es definida no negativa. Entonces

es inmediato que

( ) ( ) ( )( ) ( )f x f x f x x xo o o≥ + −' .3 15

177

y aplicando el teorema 3.4.1 concluimos que f es convexa. Además, si ( )f x sho' ' +

es definida positiva entonces la desigualdad (3.15) es estricta y nuevamente aplicando

el teorema 3.4.1 obtenemos que f es estrictamente convexa.

Recíprocamente, si f es convexa entonces la función ( )g a bx : , → IR

definida por

( ) ( )g t f x t hx = + ,

para todo x U h L∈ ∈, fijo pero arbitrario, y con su dominio tal que x t h U+ ∈ si

y sólo si ( )t a b∈ , , es convexa. Aplicando la regla de la cadena tenemos

( ) ( )( )

( ) ( )( )

g t f x t h h

g t f x t h h h

x

x

'

"

'

' ' , .

= +

= +

Como gx es convexa, se verifica para todo ( )t a b∈ , que ( )g tx" .≥ 0 En particular

( )gx" ,0 0≥ luego ( )( )f x h h' ' , ≥ 0 . Dado que h es arbitrario, se concluye que

( )f x' ' es definida no negativa para cada x U∈ .

178

BIBLIOGRAFIA

[1] Abreu J., Monagas O., Ortíz J. R., Rivas S., Introducción a la teoría de la

optimización, tomo I, Universidad Nacional Abierta, Caracas, 1985.

[2] Bernstein F., Doetsch G., Zur Theorie der Konvexen Funktionen, Math. Ann. 76

(1915), 514-526.

[3] Blumberg H., On convex functions, Trans. Amer. Math. Soc. 29 (1919), 40-44.

[4] Courant R., John F., Introducción al cálculo y al análisis matemático, Vols. I y

II, Editorial Limusa, S.A., México 1984.

[5] Egleston H. G., Convexity, Cambridge University Press, London, 1966.

[6] González J. S., Cálculo II, Universidad Nacional Abierta, Caracas, 1989.

[7] González J. S., Cálculo III, Universidad Nacional Abierta, Caracas, 1992.

[8] González J., Ortega J., Cálculo V (Análisis Numérico), Universidad Nacional

Abierta, Caracas, 1984.

[9] Jensen J. L. W. V., Om Konvekse funktioner og uligheder imellem

middelvaerdier, Nyt. Tidsskrift for Mathematik 16 B (1905), 49-69.

179

[10] Jensen J. L. W. V., Sur les functions convexes et les inégalités entre les valeurs

moyennes, Acta Math. 30 (1906), 179-193.

[11] Kuczma M., An introduction to the theory of functional equations and

inequalities, Uniwersytet Slaski, Warzawa-Kraków-Katowice, 1985.

[12] Lipschutz S., Algebra Lineal, Serie de compendios Schaum, Libros McGraw-

Hill, México, 1971.

[13] Lipschutz S., Topología General, Serie de compendios Schaum, Libros

McGraw-Hill, México, 1978.

[14] Mohr E., Beitrag zur Theorie der Konvexen Funktionen, Math. Nachr. 8 (1952),

133-148.

[15] Orellana M., Torres E., Geometría, tomos I y II, Universidad Nacional Abierta,

Caracas, 1988.

[16] Pecarié J. E., Proschan F., Tong Y. L., Convex functions, partial orderings,

and statistical aplications, Academic Press, New York, 1992.

[17] Roberts A. W., Varberg D. E., Convex functions, Academic Press, New York,

1973.

convexas completo

Documents