métodos numéricos para las ecuaciones diferenciales ...€¦ · introducción a las ecuaciones...

250
Métodos Numéricos para las Ecuaciones Diferenciales. Apuntes de clase (en construcción...) Eliseo Chacón Vera Departamento de Matemáticas, Facultad de Matemáticas, Universidad de Murcia 26 de octubre de 2018

Upload: others

Post on 19-Apr-2020

12 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

Métodos Numéricospara las

Ecuaciones Diferenciales.Apuntes de clase (en construcción...)

Eliseo Chacón VeraDepartamento de Matemáticas,

Facultad de Matemáticas, Universidad de Murcia

26 de octubre de 2018

Page 2: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 2

Page 3: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

Índice general

1. Introducción a las Ecuaciones Diferenciales 71.1. ¿Qué son las ecuaciones diferenciales? . . . . . . . . . . . . . . . . 71.2. Ecuaciones Diferenciales Ordinarias . . . . . . . . . . . . . . . . . . 91.3. Problema de Cauchy o de valor inicial . . . . . . . . . . . . . . . . 91.4. Existencia y unicidad de solución . . . . . . . . . . . . . . . . . . . 16

1.4.1. Estudio cualitativo de las soluciones . . . . . . . . . . . . . 201.5. Ejemplos (I): Problemas de primer orden . . . . . . . . . . . . . . . 211.6. Ejemplos (II): Problemas de orden mayor que uno . . . . . . . . . . 281.7. Ejemplos (III): Problemas rígidos e inestables . . . . . . . . . . . . 32

1.7.1. Problemas rígidos: Ejemplos en sistemas . . . . . . . . . . . 331.7.2. Problemas rígidos: Ejemplos escalares . . . . . . . . . . . . 371.7.3. Influencia de la rigidez en datos iniciales . . . . . . . . . . . 431.7.4. Problemas inestables . . . . . . . . . . . . . . . . . . . . . . 43

1.8. Ejemplos (IV): Problemas oscilatorios . . . . . . . . . . . . . . . . . 481.9. Uso de variable compleja . . . . . . . . . . . . . . . . . . . . . . . . 501.10. Bancos de pruebas: problemas sencillos . . . . . . . . . . . . . . . 521.11. Conclusión sobre los ejemplos y objetivos . . . . . . . . . . . . . . . 53

2. Método de Euler explícito 552.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 552.2. Discretización y primeros conceptos . . . . . . . . . . . . . . . . . . 562.3. Método de Euler progresivo o explícito . . . . . . . . . . . . . . . . 582.4. Estimación del orden de convergencia a cero . . . . . . . . . . . . . 63

2.4.1. Uso de tablas . . . . . . . . . . . . . . . . . . . . . . . . . . 652.4.2. Recta de pendiente . . . . . . . . . . . . . . . . . . . . . . . 65

2.5. Convergencia de Euler explícito . . . . . . . . . . . . . . . . . . . . 662.5.1. Consistencia del esquema numérico . . . . . . . . . . . . . . 692.5.2. Estabilidad del esquema numérico . . . . . . . . . . . . . . . 712.5.3. Estimación de error usando la gráfica . . . . . . . . . . . . . 742.5.4. Estimación de error usando Taylor . . . . . . . . . . . . . . 782.5.5. Observaciones sobre la convergencia . . . . . . . . . . . . . 80

2.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

3

Page 4: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

4 Índice general

2.7. Convergencia Euler explicito en el caso contractivo . . . . . . . . . 982.7.1. Resumiendo . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

2.8. Aplicación en problemas disipativos . . . . . . . . . . . . . . . . . . 102

3. Euler progresivo en sistemas 1093.1. Consistencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1103.2. Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1133.3. Convergencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1153.4. Error para problemas lineales . . . . . . . . . . . . . . . . . . . . . 116

3.4.1. Análisis del error para sistemas . . . . . . . . . . . . . . . . 1183.4.2. Sistema lineal simétrico y disipativo . . . . . . . . . . . . . 119

4. Métodos de Euler implícito y de Crank-Nicolson 1274.1. Mejora en la estabilidad: Euler implícito . . . . . . . . . . . . . . . 128

4.1.1. Error local para Euler implícito . . . . . . . . . . . . . . . . 1354.2. Error global para Euler implícito . . . . . . . . . . . . . . . . . . . 1364.3. Mejora en el orden: Método de Crank-Nicolson . . . . . . . . . . . . 140

4.3.1. Error local para Crank-Nicolson . . . . . . . . . . . . . . . . 1424.4. Error global para Crank-Nicolson . . . . . . . . . . . . . . . . . . . 1434.5. Otras ideas para mejorar precisión . . . . . . . . . . . . . . . . . . 144

4.5.1. Métodos de Taylor . . . . . . . . . . . . . . . . . . . . . . . 1444.5.2. Uso de datos previos . . . . . . . . . . . . . . . . . . . . . . 147

5. Métodos de Runge-Kutta 1515.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1515.2. Métodos de Runge-Kutta explícitos . . . . . . . . . . . . . . . . . . 1545.3. Métodos de Runge-Kutta implícitos . . . . . . . . . . . . . . . . . . 1555.4. Forma general y tablero de Butcher . . . . . . . . . . . . . . . . . . 1565.5. Estudio del error local . . . . . . . . . . . . . . . . . . . . . . . . . 1595.6. Familias RKE de acuerdo al orden . . . . . . . . . . . . . . . . . . 160

5.6.1. Métodos RKE con S = 1 . . . . . . . . . . . . . . . . . . . . 1605.6.2. Métodos RKE con S = 2 . . . . . . . . . . . . . . . . . . . . 1605.6.3. Métodos de RKE con S = 3 . . . . . . . . . . . . . . . . . . 1645.6.4. Métodos de RKE con S = 4 . . . . . . . . . . . . . . . . . . 1665.6.5. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166

5.7. Estudio de la estabilidad: 0-estabilidad . . . . . . . . . . . . . . . . 1675.8. Convergencia de los métodos RKE . . . . . . . . . . . . . . . . . . 1705.9. Extensión a sistemas . . . . . . . . . . . . . . . . . . . . . . . . . . 1725.10. Estabilidad absoluta: A-estabilidad . . . . . . . . . . . . . . . . . . 1765.11. Efecto de la linealización . . . . . . . . . . . . . . . . . . . . . . . . 177

5.11.1. Precisión numérica . . . . . . . . . . . . . . . . . . . . . . . 1865.11.2. Estabilidad vs Precisión . . . . . . . . . . . . . . . . . . . . 187

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 4

Page 5: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

Índice general 5

5.12. Control del paso . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1895.13. Métodos de Runge-Kutta adaptativos: pares encajados . . . . . . . 191

5.13.1. RK adaptativo de Dormand-Prince 5(4) . . . . . . . . . . . 192

6. Introducción a las Ecuaciones en Derivadas Parciales 1956.1. Notación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1956.2. Ecuaciones diferenciales . . . . . . . . . . . . . . . . . . . . . . . . 1986.3. Leyes de conservación d = 1 . . . . . . . . . . . . . . . . . . . . . . 201

6.3.1. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2036.4. Leyes de conservación d > 1 . . . . . . . . . . . . . . . . . . . . . . 2056.5. Condiciones de contorno y dato inicial . . . . . . . . . . . . . . . . 207

7. La ecuación de difusión 2117.1. Decaimiento debido a la difusión . . . . . . . . . . . . . . . . . . . 2117.2. Diferencias finitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2137.3. Euler explícito en tiempo y diferencias centradas en espacio . . . . 215

7.3.1. Consistencia, estabilidad y convergencia . . . . . . . . . . . 2167.3.2. Uso de matrices . . . . . . . . . . . . . . . . . . . . . . . . . 2207.3.3. Ejemplos numérico . . . . . . . . . . . . . . . . . . . . . . . 222

7.4. Euler implícito y Crank-Nicolson . . . . . . . . . . . . . . . . . . . 2277.4.1. Euler implícito en tiempo diferencias centradas en espacio . 228

7.5. Semidiscretización: Método de líneas . . . . . . . . . . . . . . . . . 2307.6. Estudio unificado de la estabilidad . . . . . . . . . . . . . . . . . . 2337.7. Estudio de la consistencia . . . . . . . . . . . . . . . . . . . . . . . 235

7.7.1. Consistencia para Euler implícito . . . . . . . . . . . . . . . 2357.7.2. Consistencia para Crank-Nicolson . . . . . . . . . . . . . . . 235

7.8. Estudio unificado de la convergencia . . . . . . . . . . . . . . . . . 2377.9. Problema de contorno estacionario . . . . . . . . . . . . . . . . . . 239

7.9.1. Existencia de solución de los problemas discretos . . . . . . 2407.9.2. Convergencia . . . . . . . . . . . . . . . . . . . . . . . . . . 2417.9.3. Convergencia usando la norma ∥ · ∥∆x . . . . . . . . . . . . 2427.9.4. Convergencia usando la norma ∥ · ∥∞ . . . . . . . . . . . . . 243

7.10. Problema de transporte y difusión . . . . . . . . . . . . . . . . . . . 2447.11. Matrices tridiagonales y monótonas . . . . . . . . . . . . . . . . . . 246

7.11.1. Matrices simétricas definidas positivas . . . . . . . . . . . . 2467.11.2. Matrices tridiagonales . . . . . . . . . . . . . . . . . . . . . 2467.11.3. Matrices monótonas . . . . . . . . . . . . . . . . . . . . . . 247

5 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 6: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

6 Índice general

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 6

Page 7: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

Capítulo 1

Introducción a las EcuacionesDiferenciales

Resumen del tema

En este capítulo revisaremos algunos conceptos básicos de la teoría cuantitativay cualitativa de las ecuaciones diferenciales ordinarias. Veremos ejemplos sencillosque ilustren estos conceptos tanto con ecuaciones de primer, o mayor orden, comocon sistemas.

Principalmente hay que ver:

Notación y resultados de teoría básicos, estabilidad de las soluciones con res-pecto al dato inicial.

Ejemplos escalares de problemas expansivos, contractivos y oscilatorios.

Ejemplos básicos de sistemas y ecuaciones de orden superior.

Los ejemplos más complicados se pueden dejar para una segunda lectura. Siendolo más importante los aspectos cualitativos de los comportamientos de las solucionesasociadas a las ecuaciones.

1.1. ¿Qué son las ecuaciones diferenciales?La mayoría de los modelos matemáticos en cualquier campo científico, técnico,

sociológico, etc... estudian la evolución temporal y/o espacial de alguna cantidadde interés. Las derivadas con respecto a las distintas variables de las que dependeuna magnitud representan la velocidad de cambio de dicha magnitud con respectoa esas variables. Por lo tanto, este tipo de modelos matemáticos se puede describirmediante ecuaciones que involucran derivadas de la función buscada en las variablesespaciales y en la variable temporal. Estas ecuaciones se denoniman ecuacionesdiferenciales.

7

Page 8: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

8 Capítulo 1 Introducción a las Ecuaciones Diferenciales

El ejemplo más cercano nos lo podemos encontrar en las predicciones me-teorológicas que recibimos todos los dias para saber si va a hacer calor, va a llover,etc...es muy frecuente que la persona nos diga que sus predicciones son las que indi-can los modelos numéricos que manejan. Estos modelos pronostican la velocidad delaire, la temperatura, la humedad, etc...y su variación tanto temporal como espacial.Otro ejemplo puede ser un modelo matemático que represente el movimiento de unglobo que avanza en el aire mientras sufre deformaciones (dilataciones, contraccio-nes), etc... en su forma espacial.

Fácilmente se identifican dos grupos de ecuaciones diferenciales:

ecuaciones diferenciales ordinarias: se estudia sólo la evolución en tiempode una cantidad

ecuaciones diferenciales en derivadas parciales: se estudia la evoluciónen tiempo y en espacio de una cantidad

Una de las fuentes más comunes de ecuaciones diferenciales nos las encontramosen la física. Hemos visto que una ecuación diferencial ordinaria nos permite porejemplo describir la trayectoria de un objeto en términos de una ecuación en laforma

r′(t) = f(t, r(t)), r(0) = r0.

Si ahora permitimos que este objeto se deforme en sus dimensiones espaciales conel transcurso del tiempo, pensar por ejemplo en la deformación que sufre un ba-lón de fútbol en el saque de una falta, entonces las variaciones espaciales tambiénson importantes y pueden influir en la trayectoria final. Nos encontramos con elhecho de que ahora ya no sólo es r = r(t) si no r = r(t, x, y, z) y tenemos que te-ner en cuenta las variaciones espaciales, esto es las funciones rx, ry, rz, rxx, ryy, rzz, ...

También vamos a introducirnos en el mundo del modelado matemático yde la simulación numérica. Este campo de la ciencia a ganado una considera-ble importancia en las últimas décadas en todas las áreas de la ciencia y de lasaplicaciones industriales. Principalmente se ha revolucionado e impulsado enorme-mente desde el desarrollo de la computación a partir de la Segunda Guerra Mundial.

Esta situación, desde mediados del siglo XX, produce un ingente esfuerzo en eldiseño, análisis y aplicación de técnicas computacionales para obtener solucionespara las ecuaciones diferenciales, entre otros problemas de interés práctico.

Los avances computacionales forman ya parte fundamental de cualquier aspectode la vida moderna cotidiana en sus aspectos más dispares como son la predicciónmeteorológica, la aviación, la navegación, la automoción, medicina, imágen y sonidoen medios audiovisuales, etc...

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 8

Page 9: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.2. Ecuaciones Diferenciales Ordinarias 9

En este curso nos vamos a centrar en el estudio de las técnicas numéricas paraaquellos modelos que se pueden describir mediante la evolución temporal de unao varias cantidades. Nos encontramos entonces con lo que se conoce como ecuaciones(o sistemas de ecuaciones) diferenciales ordinarias; reduciremos la denominación deeste problema al acrónimo edo tanto en el caso escalar como vectorial.

El modelado matemático es el arte (o la ciencia dependiendo del punto devista) de representar (o aproximar) una realidad física en un modelo abstractoaccesible al estudio y al cálculo. La simulación numérica es el proceso que permitecalcular la solución del modelo en un computador y visualizar una aproximación ala realidad física. Este proceso se complementa con el contraste de los resultadosdel modelo con la realidad fisica representada.

Se puede entender el concepto de matemática aplicada como las matemáti-cas del modelado y de la simulación numérica. Desde este punto de vista, seencuentra en la intersección de muchas disciplinas científicas de una gran variedad.

Un modelo matemático es una representación o interpretación abstracta deuna realidad física que permite realizar un análisis y un cálculo. La simulaciónnumérica permite representar este modelo en un computador y simular una apro-ximación a la realidad física estudiada.

1.2. Ecuaciones Diferenciales OrdinariasIntroducimos notación, algunos resultados y múltiples ejemplos que servirán

durante el curso como ilustración.El problema de Cauchy asociado a una ecuación diferencial ordinaria

(edo) plantea la búsqueda de una función de una variable de la que se conoce cómocambia su derivada, es decir, su razón de cambio. Esto se deduce normalmente delmodelo que se está estudiando o representando.Observación 1 Una edo define una familia de soluciones o curvas.Observación 2 Si queremos una curva en particular tenemos que dar tantos da-tos extra de información como derivadas que aparecen en la ecuación.

1.3. Problema de Cauchy o de valor inicialSiendo I un intervalo de la recta real R, se busca una función u : I ⊂ R 7→

Rm, u(t) ∈ C1(I) tal que

(PC)

u′(t) = f(t, u(t)), t ∈ I,u(t0) = u0, t0 ∈ I

9 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 10: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

10 Capítulo 1 Introducción a las Ecuaciones Diferenciales

De manera explícita, en el caso de un sistema con m > 1, tenemos las ecuaciones

u′1(t) = f1(t, u1(t), u2(t), ..., um(t)),

u′2(t) = f2(t, u1(t), u2(t), ..., um(t)),

... ... ...u′m−1(t) = fm−1(t, u1(t), u2(t), ..., um(t)),

u′m(t) = fm(t, u1(t), u2(t), ..., um(t))

y el dato inicial

u1(t0) = u0,1, u2(t0) = u0,2, ..., um(t0) = u0,m

donde u0 = (u0,1, u0,2, ..., u0,m).

Algunas puntualizaciones son convenientes:

Cada fj depende de (t, u1, u2, ..., um) por lo que el sistema está acoplado.

Si fj depende sólo de (t, uj) nos encontramos con un sistema desacoplado.Cada ecuación es independiente de las demás.

El dato inicial viene dado por m constantes para obtener así solución única ynormalmente pondremos t0 = 0 para fijar ideas, aunque t0 = 0 en general.

Suponemos que f(t, u) : I × Rm 7→ Rm es una función continua en ambasvariables siendo I un intervalo real de alguna de las formas

I = [t0, t0 + T ], I = [t0, t0 + T ), I = [t0,+∞).

A la función f se la denomina función pendiente puesto que es la funciónque rige el comportamiento de u′ que, obviamente, es la pendiente de u(t).

Por simplicidad, a la variable independiente la denotamos por t y la llamamostiempo puesto que la mayoría de aplicaciones prácticas son aquellas en lasque la edo describe un proceso temporal (también puede darse el caso en elque no represente una variable temporal sino espacial, en este caso se puededenotar mejor por x).

Dejamos fuera de nuestro estudio ecuaciones de la forma F (t, u(t), u′(t)) = 0en donde no siempre es posible despejar u′(t) en términos del resto.

Cuando f(t, u) = f(u), es decir, f no depende de la variable temporal, enton-ces hablamos de una ecuación autónoma: la variación del estado u(t) sólodepende del propio estado u(t). El sistema se comporta de forma intemporal,permanente en tiempo.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 10

Page 11: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.3. Problema de Cauchy o de valor inicial 11

Observación 3 Se puede siempre convertir un problema no autónomo en uno autó-nomo a coste de aumentar en 1 la dimension del problema. Se usa la nueva variablevectorial z = (z1, z2) = (t, u), entonces la derivada es z′ = (1, f(t, u)). Luego paraF (z) = (1, f(z)) el sistema queda como

z′(t) = F (z(t)) ⇐⇒

z′1(t) = t′ = 1,z′2(t) = u′(t) = f(t, u).

Observación 4 Cuando u(t) representa una cantidad,

u′(t) < 0 implica pérdida de materia

u′(t) > 0 implica ganancia de materia

Es por esto por lo que en muchas aplicaciones a la función f se la denomina tambiéntérmino de reacción puesto que es el término que genera o destruye u. Podemostener entonces un término de reacción lineal como f(t, u) = u o un términode reacción no lineal como f(t, u) = 1 + u2. Es evidente que la forma generaldel término de reacción puede ser más complicada y depender también de formaexplícita del tiempo. Se usa la notación fuente ó sumidero cuando f > 0 ó f < 0respectivamente.

Campo de velocidadesUna ecuación diferencial de primer orden nos indica en cada punto (t, u) la pen-

diente de la curva solución que pasa por ese punto. El campo de velocidades, otambién campo de pendientes, nos indica la pendiente de cada trayectoria posi-ble. La importancia del campo de pendientes reside en la información cualitativaque aporta sobre la familia de soluciones sin conocerlas explícitamente.

Esta información nos permite considerar la solución continua u(t) no como unacurva aislada sino como parte de una familia de curvas generadas variando el datoinicial y que de manera continua (están una contigua a la otra) cubren una parte otodo el plano (t, u)

En cada punto (t⋆, u⋆) la pendiende de la curva que pasa por (t⋆, u⋆) es f(t⋆, u⋆).Luego si consideramos un segmento pequeño en sentido positivo para cada direcciónt1 > t⋆ e u1 > u⋆ entonces

u1 − u⋆

t1 − t⋆≈ f(t⋆, u⋆) ≈ tan(α)

donde α es el ángulo formado por la tangente.

Si f(t⋆, u⋆) > 0 tenemos un ángulo entre 0 y π/2 para la recta tangentea la curva mientras que si f(t⋆, u⋆) < 0 tenemos entonces un ánguloentre −π/2 y 0 para la recta tangente a la curva.

11 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 12: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

12 Capítulo 1 Introducción a las Ecuaciones Diferenciales

La ecuación de la recta tangente r = r(t) viene dada por

r ≡ y⋆ + (t− t⋆)f(t⋆, u⋆)

y un vector en (t⋆, u⋆) con la misma dirección es

u = (1, f(t⋆, u⋆)).

Si en cada punto (t⋆, u⋆) dibujamos un vector de componente OX dada por 1 y decomponente OY dada por f(t⋆, u⋆) generamos el campo de velocidades que repre-senta la edo.

En el computador, para construir un campo de velocidades se usa una parrillade puntos en el plano (tj, uj)j y en cada punto (t⋆, u⋆) de la parrilla se dibuja elvector normalizado a 1, es decir,

v =1

|u|(1, f(t⋆, u⋆)), |u| =

√1 + f(t⋆, u⋆)2.

Este proceso se puede aproximar de forma manual y sin ser muy preciso pero dandolemás importancia al sentido y la dirección que al valor exacto del vector usandosimplemente el vector (1, f(t⋆, u⋆)).

Ejemplo 1 En la Figura 1.1 se representa un sistema no autónomo, esto es, elcampo de pendientes cambia con el tiempo. En la Figura 1.2 se ve un sistemaautónomo, esto es (1, f(u)): ahora el campo de pendientes no cambia con el tiempo.En la Figura 1.3 y en la 1.4 podemos ver las respectivas trayectorias asociadas, ocurvas solución, a estos campos de pendientes.

Observación 5 Aparte de usar nuestra propia programación existen algunos re-cursos web para visualizar un campo de pendientes y las soluciones asociadas. Porejemplo:

http://www.math.rutgers.edu/∼sontag/JODE/A Java Applet for Studying Ordinary Differential Equations

http://www.aw-bc.com/ide/Interactive differential equations

http://math.rice.edu/∼dfield/dfpp.htmlAplicaciones JAVA dfield y pplane

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 12

Page 13: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.3. Problema de Cauchy o de valor inicial 13

Figura 1.1: Campo de velocidades no autónomo f(t, y) = −y + t2 + cos(t). Paracada valor de y (en el eje OY) el campo de velocidades cambia dependiendo deltiempo t (en el eje OX). Observar el comportamiento del campo de acuerdo a lasmagnitudes de las variables.

Figura 1.2: Campo de velocidades autónomo f(t, y) = cos(y). Para cada valor dey (en el eje OY) el campo de velocidades es siempre el mismo, luego no cambiadependiendo del tiempo t (en el eje OX).

13 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 14: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

14 Capítulo 1 Introducción a las Ecuaciones Diferenciales

Figura 1.3: Soluciones y campo de velocidades para f(t, y) = −y+ t2+ cos(t). Paracada valor de y el campo de velocidades cambia dependiendo del tiempo.

Figura 1.4: Soluciones y campo de velocidades para f(t, y) = cos(y). Para cadavalor de y el campo de velocidades es siempre el mismo.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 14

Page 15: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.3. Problema de Cauchy o de valor inicial 15

Orden de derivación mayor que unoLas ecuaciones del tipo

u(q) = φ(t, u, u′, u′′, ..., u(q−1)) (q > 1)

se pueden reescribir como sistemas de primer orden usando variables auxiliares.Ponemos Yj = u(j−1) para j = 1, 2, 3, ..., q y obtenemos las ecuaciones

Y ′1 = u′,

Y ′2 = u′′,

... ... ...Y ′q−1 = u(q−1)

Y ′q = φ(t, Y1, Y2, ..., Yq−1)

La reducción de un sistema de orden mayor que uno a un sistema de orden uno sesuele hacer siempre. En el caso del sistema de segundo orden existe la excepción,voluntaria y tradicional, sobre todo cuando no aparece la primera derivada, endonde se han diseñado métodos especiales. En todo caso la comparación sobre quees mejor o peor no está clara. Lo que sí que se tiene es una gran cantidad de softwaredisponible para sistemas de primer orden lo que conlleva un claro incentivo paraaplicar la reducción.

Observación 6 Método del factor integrante Nos va a ser muy útil recordaresta técnica para resolver ecuaciones lineales: Si queremos encontrar la solución de

u′(t) = λu(t) + g(t)

ponemosu′(t)− λu(t) = g(t)

y multiplicando por e−λ t llegamos a

(e−λ tu(t))′ = e−λ tg(t)

de donde integrando podemos llegar a la solución fácilmente.

Ejercicio 2 Aplicarlo a la desigualdad

u′(t) ≤ λu(t) + g(t)

15 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 16: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

16 Capítulo 1 Introducción a las Ecuaciones Diferenciales

1.4. Existencia y unicidad de soluciónBuscamos una función u : R 7→ R regular (de clase C1) solución del problema

de Cauchy

(PC)

u′(t) = f(t, u(t)), t ∈ [0, T ],u(0) = u0

donde f(t, u) : R× R 7→ R.

Definición 3 Una función cumple la condición de Lipschitz sobre la segunda va-riable de f(t, u) cuando

|f(t, x)− f(t, y)| ≤ Lf |x− y|, ∀x, y ∈ R, t ∈ [0, T ].

Interpretación geométrica:

Si se cumple la condición de Lipschitz

|f(t, x)− f(t, y)| ≤ Lf |x− y|, ∀x, y ∈ R, t ∈ [0, T ]

sobre la segunda variable de f(t, u) entonces la función es derivable conrespecto a u en casi todo punto y con derivada acotada mientras queen aquellos puntos donde no es derivable las derivadas laterales tienensaltos de discontinuidad finitos. Esto ocurre porque estamos diciendo

|f(t, x)− f(t, y)||x− y|

≤ Lf ∀x, y ∈ R, t ∈ [0, T ].

Por lo tanto, si hay derivada está acotada, y si no la hay los límiteslaterales existen y están acotados, aunque no coincidan.

Observación 7 Es más que continua pero menos que derivable. Aunque es derivableen casi todo punto.

Ejemplo 4 Una función en forma de dientes de sierra es Lipschitz pero no derivableen los picos o valles de la sierra.

Teorema 5 Si se cumple la condición de Lipschitz

|f(t, x)− f(t, y)| ≤ Lf |x− y|, ∀x, y ∈ R, t ∈ [0, T ]

podemos garantizar la unicidad de la solución.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 16

Page 17: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.4. Existencia y unicidad de solución 17

Dem: De hecho, si tenemos dos curvas solución

y′(t) = f(t, y(t)), z′(t) = f(t, z(t))

es inmediato que para t > t0

y(t)− z(t) = y(t0)− z(t0) +

∫ t

t0

f(s, y(s))− f(s, z(s))ds

luego si t > t0 y usamos que f es Lipschitz tenemos

∥y(t)− z(t)∥ ≤ ∥y(t0)− z(t0)∥+ L

∫ t

t0

∥y(s)− z(s)∥ds.

Si definimosg(t) = ∥y(t0)− z(t0)∥+ L

∫ t

t0

∥y(s)− z(s)∥ds

entonces tenemos

∥y(t)− z(t)∥ ≤ g(t) (1.1)

y g(t) cumple

g(t0) = ∥y(t0)− z(t0)∥, g′(t) = L∥y(t)− z(t)∥.

Pero, usando (1.1), tenemos que

L∥y(t)− z(t)∥ ≤ Lg(t).

Entonces g′(t) ≤ Lg(t) y multiplicando la desigualdad por el factor integrante

exp(−L(t− t0))

obtenemosd

dt(g(t) exp(−L(t− t0))) ≤ 0

de dondeg(t) ≤ g(t0) exp(L(t− t0)).

Pero como ∥y(t)− z(t)∥ ≤ g(t) llegamos a

∥y(t)− z(t)∥ ≤ ∥y(t0)− z(t0)∥eL(t−t0)

que implica la unicidad de soluciones. Observemos que

17 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 18: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

18 Capítulo 1 Introducción a las Ecuaciones Diferenciales

Figura 1.5: Familia de soluciones típicas del problema modelo y′(t) = a y(t) cona > 0 y a < 0

El paso de la estimación integral a la puntual se conoce como el Lema deGronwall.

No sólo hemos comprobado la unicidad, además hemos dado una acotaciónsobre la separación de las soluciones desde puntos iniciales distintos.

La acotación se abre exponencialmente conforme crece t debido a la funciónexponencial que aparece. Esta acotación es precisa en unos casos pero muypesimista en otros: Por ejemplo, para a > 0

• es precisa si tenemos y′(t) = a y(t)

• pero no lo es en el caso y′(t) = −a y(t).

En ambas situaciones L = a pero el primer caso las soluciones se expandende forma exponencial mientras que en el segundo se contraen de formaexponencial, ver Figura 1.5.

Si f ∈ C1 y usamos el TVM se puede ajustar mejor esta estimación ya que sitenemos dos curvas solución

y′(t) = f(t, y(t)), z′(t) = f(t, z(t))

es inmediato que para t > t0

y(t)− z(t) = y(t0)− z(t0) +

∫ t

t0

f(s, y(s))− f(s, z(s))ds

= y(t0)− z(t0) +

∫ t

t0

∂yf(s, ξs)(y(s)− z(s))ds

= y(t0)− z(t0) + ∂ξf(t⋆, ξ⋆)

∫ t

t0

(y(s)− z(s)ds

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 18

Page 19: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.4. Existencia y unicidad de solución 19

y entonces podemos tener en cuenta el signo de ∂ξf ( en el caso antes men-cionado es f(t, y) = −a y).Vemos entonces que es el comportamiento de ∂yf(s, ξs) en todo el intervalo[t0, t] lo que influye en la variación entre las curvas. De hecho, si usamos laderivada

y′(t)− z′(t) = ∂yf(t, ξt)(y(t)− z(t))

y el factor integrante obtenemos

y(t)− z(t) = e∫ tt0

∂yf(s,ξs)ds(y(0)− z(0))

de donde si ∂yf(s, ξs) < 0 hay contracción y si ∂yf(s, ξs) > 0 hay expansión.También podemos acotar

Lf = maxt,y

|∂yf(t, y)|

y recuperar un control global, aunque menos preciso.Como consecuencia, una condición de Lipschitz local viene a decir que tenemoscontrolada, en una banda (t, y) ∈ (t0, t1) × (ymin, ymax) la derivada ∂yf(t, y)por lo que existe un control en el comportamiento de las curvas vecinas a unadada.

Las condiciones que se imponen sobre la función pendiente son1. f(t, y) : R× R 7→ R es una función continua en ambas variables

2. Cumple la condición de Lipschitz|f(t, x)− f(t, y)| ≤ Lf |x− y|, ∀x, y ∈ R, t ∈ [0, T ]

sobre la segunda variable de f(t, y)

3. Controlamos además el crecimiento de f con respecto a la segunda variable,esto es,

|f(t, y)| ≤ Cf (1 + |y|), ∀y ∈ R, t ∈ [0, T ].

Entender esto como |f(t, y)| acotada si |y| < 1 y |f(t, y)| ≤ C|y| para |y| > 1.Esto quiere decir que se puede permitir un crecimiento de la pendiente a losumo lineal con respecto a la variable y.

Teorema 6 Teorema de existencia, unicidad. ComportamientoBajo las condiciones 1 y 2 hay existencia y unicidad de solución local en unsubintervalo de [0, T ]

Si controlamos además el crecimiento de f con respecto a la segunda variable,esto es, el punto 3, entonces tenemos garantizado la existencia y unicidad desolución en todo [0, T ], ver por ejemplo el libro de Arnold [1].

Si además f ∈ Cp entonces y ∈ Cp+1.

19 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 20: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

20 Capítulo 1 Introducción a las Ecuaciones Diferenciales

1.4.1. Estudio cualitativo de las solucionesObservación 8 Punto de equilibrio Dado el problema autónomo z′(t) = f(z(t))si para el valor constante z = c⋆ se cumple f(c⋆) = 0 entonces z(t) ≡ c⋆ es unasolución constante que se denomina un punto de equilibrio del sistema.

Como f(c⋆) = 0, usando el desarrollo de Taylor tenemos que

f(z) = f(c⋆) + (z − c⋆)f′(c⋆) + .... = (z − c⋆)f

′(c⋆) + ....

Finalmente, si suponemos para simplificar que c⋆ = 0 nos encontramos que para zcercano a c⋆ = 0

f(z) ≈ a z, (a = f ′(0))

luego la dinámica cerca del punto de equilibrio se puede estudiar viendo elproblema modelo

z′(t) = a z(t)

con solución z(t) = z0eat para valores z0 cercanos a z = 0. Si a > 0 todas las

soluciones se alejan del punto de equilibrio a gran velocidad, tenemos que el estadoestacionario z(t) = 0 es inestable. Por otro lado, si a < 0 todas las solucionesconvergen a gran velocidad hacia z(t) = 0 y se tiene que el estado estacionarioes estable, ver Figura 1.5.

Observación 9 Es posible extraer información sobre las soluciones sin necesidadde conocerlas explícitamente. Por ejemplo, si tenemos el modelo

y′(t) = f(y(t))

y sabemos sobre f que tiene un comportamiento como sigue

f(a) = 0, f(b) = 0,

f(y) > 0 a < y < b,

f(y) < 0 y ∈ R \ (a, b),

por ejemplo f(y) = (y−a) (b−y). Gracias a que las curvas solución no se pueden cor-tar podemos deducir fácilmente que hay dos puntos de equilibrio y1(t) ≡ a, y2(t) ≡ bsiendo uno estable y otro inestable.

Observación 10 La dependencia de la función pendiente f(t, u) con respecto a ues la que marca el comportamiento del sistema.

∂uf > 0 implica expansión local o problema inestable localmente

∂uf < 0 implica contracción local o problema estable localmente

∂uf = 0 sin cambios localmente

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 20

Page 21: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.5. Ejemplos (I): Problemas de primer orden 21

Observación 11 Se pueden hacer ejemplos de campos de vectores y obtener infor-mación sobre la solución teniendo en cuenta dos hechos fundamentales:

Dos curvas distintas no se pueden cruzar.

Si dos curvas se tocan tangencialmente entonces son la misma.

Los ejemplos pueden ser u′ = ±3u − 3t y también u′ = a (1 − u) o bien u′ =a (sin(t)− u) para a > 0.

1.5. Ejemplos (I): Problemas de primer ordenAlgunos ejemplos que provienen de ciencias experimentales:

Ejemplo 7 Modelo de poblaciones linealLa ecuación

d

dtu(t) = λu(t), t > 0,

u(0) = u0 > 0,

expresa un crecimiento proporcional a la población existente en cada instante ynos lleva a un crecimiento exponencial. Este problema se puede reescribir usandon(t) = u(t)/u0 como

n′(t) = λn(t), t > 0,

n(0) = 1.

Ejemplo 8 Modelo de poblaciones no linealEs interesante estudiar el comportamiento de estos modelos de población cuando elcrecimiento no es proporcional a la población sino a una potencia en torno a unode la misma. Esto es,

n′(t) = n(t)1+ϵ, t > 0,

n(0) = 1.

para algún ϵ ∈ R. En el caso ϵ > 0 existe un tiempo t⋆ < +∞ tal que n(t) → +∞cuando t → t⋆, se dice que la solución explota en tiempo finito. A este tiempot⋆ se llama tiempo finito de explosión. Aquí es

f(t, n) = n1+ϵ

y la condición 3 no se cumple.

21 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 22: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

22 Capítulo 1 Introducción a las Ecuaciones Diferenciales

Ejemplo 9 Si ponemos a ∈ (0, 1)

n′(t) = n(t)a, t > 0,

n(0) = 0.

no posee solución única ya que para cada c > 0 tiene por solución

nc(t) = 0, ∀t

pero también

nc(t) =

0, 0 < t ≤ c,

(1− a)1/(1−a)(t− c)1/(1−a), t > c.(1.2)

Aquí lo que falla es que

f(n) = na ⇒ f ′(n) = ana−1 = a1

n1−a

y entonces la función no es lipschitziana en ningún entorno de n = 0.

Ejemplo 10 Modelo de Verhulst o ecuación logísticaEl modelo de poblaciones lineal n′(t) = λn(t) tiene la contrariedad de predecir uncrecimiento exponencial ilimitado. Una mejora la constituye el modelo de Verhulstque tiene en cuenta la capacidad limitada del medio para sustentar la población.Consideramos el problema de valor inicial

d

dtn(t) = ε n(t)− σ n(t)2, t > 0,

n(0) = n0 > 0,(1.3)

donde ε, σ > 0 son números positivos dados. El problema (1.3) surge, por ejemplo,en ecología cuando se hace el análisis del desarrollo de una sóla especie que tieneacceso a recursos limitados.

Supongamos que n(t) es el tamaño de una población en el instante t. En elmodelo más sencillo de crecimiento de una población se supone un crecimientoproporcional al tamaño de la población,

d

dtn(t) = ε n(t), t > 0

donde la constante ε > 0 es la tasa de crecimiento: la variación neta depoblación por unidad de tiempo dividida por la población total en esemismo instante de tiempo. La solución de esta ecuación viene dada por

n(t) = n0eε t, t > 0.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 22

Page 23: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.5. Ejemplos (I): Problemas de primer orden 23

Esto da una población que crece de forma exponencial e ilimitada. Sin embargo, elcrecimiento de la población debe de estar limitado por los recursos del medio, locual, a su vez, implica que la rapidez de crecimiento debe de ser una función de lapoblación, es decir, la tasa de crecimiento debe depender de u:

1

n(t)n′(t) = F (n(t)).

Cuando la población es pequeña, habrá suficientes recursos, de modo que la rapidezde crecimiento será independiente de los recursos y por tanto, podremos decir que,aproximadamente, la tasa de crecimiento será constante, es decir, F (n) ≈ ε. Sinembargo, conforme la población crece, los recursos van desapareciendo y se produceun efecto inhibidor sobre el crecimiento de la población. Entonces, la tasa de cre-cimiento F (n) debe decrecer conforme n crece, de modo que, eventualmente, seaF (n) < 0. La función más sencilla que satisface estas condiciones es

F (n) = ε− σ n

donde σ > 0. Esto explica el modelo (1.3), que se conoce en ecología como ecuaciónlogística.

Como hemos notado, si el término no lineal σ n2 no se toma en cuenta en laecuación (1.3), entonces la población crece ilimitadamente. La situación es com-pletamente diferente si se conserva el término no lineal. Además, si n = 0 ó sin = ε/σ el segundo miembro de (1.3) se anula y tenemos dos soluciones constanteso estacionarias

n1(t) ≡ 0, n2(t) ≡ ε/σ.

Estas dos soluciones poseen una importancia particular y se denominan puntoscríticos, o como n′(t) ≡ 0, puntos de equilibrio.

Siempre y cuando n = 0 ó n = ε/σ podemos resolver la ecuación diferencialdel problema (1.3) de forma explícita usando técnicas de separación de variables yencontramos la expresión

n(t) =ε n0

σ n0 + (ε− σ n0) e−ε t

que sí que es válida para todo n0 > 0.Podemos observar de la Figura 1.6 que para cualquier n0 > 0, independien-

temente de lo pequeño que sea, al final se tiende siempre a la solución constanten1(t) ≡ ε/σ cuando t → +∞. A la razón ε/σ se le denomina nivel de saturación;una población que se inicia por debajo de este nivel no podrá sobrepasarlo nunca ysi hay sobrepoblación lleva a la eliminación de individuos hasta alcanzar el nivel desaturación.

Si examinamos la solución n(t) ≡ 0 resulta que si n0 = 0 es la entrada, datoinicial, de nuestro modelo, tendremos que n(t) ≡ 0 es la solución en todo tiempo,

23 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 24: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

24 Capítulo 1 Introducción a las Ecuaciones Diferenciales

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6−0.2

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

σ = 10

ε = 8

A(t)=ε / σ = 0.8

A(t) = 0

t

A

Figura 1.6: A′(t) = εA(t) − σ A(t)2, ε > 0, σ > 0. Varias soluciones típicas paradistintos valores de A0 así como las soluciones constantes A1(t) ≡ 0 y A2(t) ≡ ε/σ.

pero si cometemos un pequeño error y la entrada es n0 > 0, aunque pequeña, resultaque la solución n(t) se aleja asintóticamente en tiempo hacia ε/σ. Se dice entonces,y de forma natural, que la solución n(t) ≡ 0 es una solución inestable de (1.3),o que n = 0 es un punto crítico (de equilibrio) inestable.

Si consideramos ahora el caso de la solución n(t) ≡ ε/σ, si la entrada, datoinicial, es n0 = ε/σ, entonces la salida, la solución, será siempre n(t) = ε/σ. Sise comete un error en la entrada, la salida se aproximará asintóticamente a ε/σcuando t → +∞. Por lo tanto, decimos que la solución n(t) ≡ ε/σ es una soluciónasintóticamente estable de (1.3), o que n = ε/σ es un punto crítico (deequilibrio) estable.

Podemos dar a esto una interpretación biológica:Si queremos realizar un experimento libre de bacterias, en un medio enel que el desarrollo de las bacterias viene dado por (1.3). Entonces, a no serque eliminemos completamente la población de bacterias, no conseguiremosrealizar el experimento manteniendo la población de bacterias por debajo deunos mínimos menores que el valor ε/σ. El experimento no resultará seguro.

Si por otro lado estamos tratando de realizar un experimento mantenien-do un nivel de bacterias del orden de ε/σ podemos estar tranquilos deque, aunque de vez en cuando se eliminen bacterias por algún contaminante,la población no desaparecerá y tenderá en tiempo a aproximar el valor ε/σ.

Este comportamiento cualitativo es de gran interés aplicado y demuestradesde el punto de vista matemático que, en general, el valor asintótico de lasolución no depende de forma continua de los datos iniciales.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 24

Page 25: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.5. Ejemplos (I): Problemas de primer orden 25

Observación 12 La información presentada se ha conseguido resolviendo la ecua-ción, pero para problemas más complicados, para expresiones más elaboradas de(1.4), es significativo que el comportamiento asintótico, es decir, en relación conel comportamiento cuando t → +∞, a menudo puede determinarse sin un conoci-miento previo de la solución.

Por ejemplo, si tenemos el modelo

y′(t) = f(y(t))

y sabemos sobre f que tiene un comportamiento como sigue

f(a) = 0, f(b) = 0,

f(y) > 0 a < y < b,

f(y) < 0 y ∈ R \ (a, b),

por ejemplo f(y) = (y− a) (b− y). Podemos deducir fácilmente que hay dos puntosde equilibrio y1(t) ≡ a, y2(t) ≡ b y que el comportamiento de la solución es similaral del modelo logístico y tenemos un gráfico similar a la Figura 1.6. En el ejemploprevio tenemos

y′(t) = y(t)(ε− σ y(t)),y(0) = y0 > 0,

(1.4)

luego los puntos de equilibrio son y = 0 e y = ε/σ siendo el primero inestable y elsegundo estable.

Ejemplo 11 Modelo depredador-presa de Lotka-VolterraSupongamos que queremos aproximar el comportamiento de dos especies que inter-actuan entre sí siendo depredador D(t) y presa en un entorno P (t). Por ejemplo, laevolución de una población de insectos con respecto a la de pájaros. Normalmente,el comportamiento puede ser el siguiente:

Si crece la población de presas los depredadores aumentan porque tie-nen comida. Entonces empieza a decrecer la población de presas y losdepredadores van desapareciendo porque no tienen comida, con lo queaumentan las presas... y así volvemos a empezar el ciclo de la vida enel ecosistema.

Por lo tanto, nos encontramos con una evolución oscilatoria e interconectada paracada especie.

La interacción entre dos especies P (t) y D(t) se representa por el productode ambas cantidades P (t)D(t). Entonces, uno de los modelos más simples puede ser

25 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 26: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

26 Capítulo 1 Introducción a las Ecuaciones Diferenciales

el modelo de Lotka-Volterra dado por, ver por ejemplo Golub-Ortega [10] entremuchos otros,

d

dtP (t) = aP (t)− b P (t)D(t)

d

dtD(t) = −cD(t) + dP (t)D(t)

donde D(t) es la población de depredadores, P (t) es la población de presas en elinstante de tiempo t y los valores a, b, c, d son parámetros positivos del modelo.

Observación 13 Curioso es también como este modelo sirve para una relación depareja donde se modela el amor frente al desamor, o las dependencias afectivas. Sele da también el nombre de modelo de Romeo y Julieta.

En forma vectorial, poniendo X = (P,D) y

f(P,D) = aP − b P D, q(P,D) = −cD + dP D, F = (f, g)

se puede escribir comoX ′(t) = F (X(t)).

Se puede observar como los insectos P (t) tendrían un crecimiento exponencial si nohubiese depredadores mientras que los depredadores D(t) tendrían un decrecimientoexponencial:

d

dtP (t) = aP (t)

d

dtD(t) = −cD(t)

La idea presente es que la capacidad reproductiva de las presas es mucho más grandeque la de los depredadores, y estos últimos tienen crecimiento si hay presas. El efectode la interacción es negativo en las presas −b P (t)D(t) y positivo en los depredadores+dP (t)D(t) que es de donde sale el modelo, ver Figura 1.7.

Una herramienta de gran utilidad a la hora de estudiar sistemas dinámicos eslo que se conoce como plano de fases (se decribe la fase (x, y) del sistema). Elcomportamiento de las curvas paramétricas (x(t), y(t)) nos da información rele-vante sobre puntos de equilibrio estables e inestables así como de órbitasperiódicas y trayectorias no cerradas.

Se puede observar fácilmente que este modelo de Lotka-Volterra posee dos puntosestacionarios (P,Q) = (0, 0) que es inestable y (P,Q) = (c/d, a/b) que es muchomás interesante.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 26

Page 27: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.5. Ejemplos (I): Problemas de primer orden 27

0 1 2 3 4 5 6 7 8 9 100

1

2

3

4

0.5 1 1.5 2 2.5 3 3.5 40

0.5

1

1.5

2Plano de Fases

PresaDepredador

Figura 1.7: Solución típica del modelo de Lotka-Volterra así como algunas de lascurvas dentro de su plano de fases

Las ecuaciones de Lotka-Volterra no se pueden resolver de forma exacta y poreso también es útil la versión linealizada de estos modelos

d

dtP (t) = aP (t)− bD(t)

d

dtD(t) = −cD(t) + dP (t)

que sí que se puede resolver de forma exacta recurriendo a los autovectores y auto-valores de la matriz de coeficientes A = [a,−b ;−c, d]. ¿ Linealizada con respecto aqué punto?Observación 14 La consideración de un número genérico de m especies y1, ..., ymy las interacciones mutuas nos lleva con facilidad a un sistema de m ecuacionesdiferenciales no lineales.

y′1(t) = f1(t, y1(t), y2(t), ..., ym(t)),y′2(t) = f2(t, y1(t), y2(t), ..., ym(t)),... ... ...y′m−1(t) = fm−1(t, y1(t), y2(t), ..., ym(t)),y′m(t) = fm(t, y1(t), y2(t), ..., ym(t))

con dato inicialy1(t0) = y0,1, y2(t0) = y0,2, ..., ym(t0) = y0,m

donde y0 = (y0,1, y0,2, ..., y0,m). Por ejemplo, si ponemos y1 = P e y2 = Q entoncesel modelo anterior se escribe como

y′1(t) = a y1(t)− b y1(t)y2(t),y′2(t) = −c y2(t) + d y1(t)y2(t).

27 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 28: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

28 Capítulo 1 Introducción a las Ecuaciones Diferenciales

Ejemplo 12 Modelo de Lorenz o el efecto MariposaFue obtenido por Lorenz (1963) en sus estudios sobre meteorología. Consiste en elsistema no lineal

x′(t) = −c x(t) + c y(t),

y′(t) = a x(t)− y(t)− x(t)z(t),

z′(t) = b x(t)y(t)− b z(t),

en donde a, b y c son parámetros y las tres magnitudes x(t), y(t), z(t) son cantidadestermodinámicas obtenidas simplificando un modelo meteorológico. A pesar de sersimples, no disponen de una solución analítica en general y es un ejemplo de unsistema caótico en R3.

El efecto mariposa se puede observar cuando se visualizan soluciones calculadasy se observa que se mantienen rotando durante un tiempo en un ala y de repentesaltan hacia la otra ala donde también siguen rotando, ver Figura 1.8. El tiempo desalto entre alas es impredecible y soluciones distintas para datos iniciales distintosgeneran comportamientos similares pero con tiempos de saltos distintos. Por lo tantolas curvas solución son muy distintas pero generan la misma figura geométricade las dos alas. Esto ha contribuido a entender porqué es dificil una predicciónmeteorológica a largo tiempo. Además es el origen de la famosa frase pronunciadapor Lorenz:

el movimiento de las alas de una mariposa en Brasil pueden generar untornado en Texas dos semanas mas tarde.

1.6. Ejemplos (II): Problemas de orden mayor queuno

Los problemas vistos hasta ahora se consideran de primer orden pero muchasaplicaciones provienen de la Segunda Ley de Newton F = ma. Aquí F es lafuerza sobre un cuerpo de masa m que produce una aceleración a. La aceleraciónes la segunda derivada del vector de posición del cuerpo.

Si denotamos por x(t) la posición y ponemos g = F/m nos encontramos conuna ecuación donde aparece la segunda derivada, ya que a(t) = x′′(t), de la forma

x′′(t) = g(t, x(t), x′(t)).

La trasformación a una ecuación de primer orden se hace usando el par de incógnitas(x(t), v(t)) donde v(t) = x′(t) y escribiendo entonces el problema como

x′(t) = v(t),v′(t) = g(t, x(t), v(t)).

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 28

Page 29: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.6. Ejemplos (II): Problemas de orden mayor que uno 29

0 5 10 15 20 25 30 35 40−20

0

20

40

60Modelo de Lorenz

−15 −10 −5 0 5 10 15−15

−10

−5

0

5

10

15Efecto mariposa: Plano de Fases x−y

−15 −10 −5 0 5 10 150

10

20

30

40

50Efecto mariposa: Plano de Fases x−z

xyz

Figura 1.8: Modelo de Lorenz (1963) y el efecto mariposa (a = 28, c = 10, b = 8/3).

Tenemos un sistema u′(t) = f(t, u(t)) donde

u = (u1, u2)T = (x, v)T f(t, u) = (u2, g(t, u1, u2))

T

Ejemplo 13 Movimiento armónico simpleLa variación del ángulo que un péndulo forma con la vertical es lo único necesariopara conocer su movimiento. Si se llama este ángulo θ(t) entonces el modelo sedescribe por:

θ′′(t) = − sin(θ(t)), t > 0,θ(0) = θ0,θ′(0) = v0.

y como es una ecuación no lineal, usando Taylor para f(θ) = sin(θ) en torno aθ0 = 0 tenemos una aproximación a su movimiento (para unos datos iniciales tipo)dada por

θ′′(t) = −θ(t), t > 0,θ(0) = θ0,θ′(0) = v0.

En términos de un sistema de primer orden con las incógnitas u(t) = θ(t) y v(t) =θ′(t) queda como

d

dt

(u(t)v(t)

)=

(0 1−1 0

)(u(t)v(t)

).

29 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 30: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

30 Capítulo 1 Introducción a las Ecuaciones Diferenciales

y nos encontramos con autovalores complejos puros conjugados para la matriz A delsistema dados por σ(A) = i,−i y la solución general es una combinación linealreal de las funciones complejas ei t, e−i t.

Ejemplo 14 Cálculo de trayectorias (I): satélitesLa situación de un satélite viene determinada por su vector de posición r(t) ∈ R3,su velocidad v(t) ∈ R3 y su aceleración a(t) ∈ R3, donde

v(t) =d

dtr(t) = r′(t) ∈ R3, a(t) =

d

dtv(t) =

d2

dt2r(t) = r′′(t) ∈ R3.

La relación que liga entre sí estas magnitudes viene dada por la segunda Ley deNewton y si la fuerza se toma dependiente de la posición y de la velocidad llegamosa una ecuación diferencial ordinaria de segundo orden

d2

dt2r(t) = f(t, r(t), r′(t))

que suele venir complementada con la posición inicial r(0) = r0 y la velocidad inicialr′(0) = v0.

Para simplificar, podemos suponer que r(t) es un escalar, entonces tenemos laecuación

r(0) = r0,r′(0) = v0r′′(t) = f(t, r(t), r′(t)), t > 0

La ecuación se puede reescribir en términos de un sistema de primer orden renom-brando la derivada r′(t). Por ejemplo, usamos r(t) y v(t) = r′(t) y queda como

r′(t) = v(t), t > 0,v′(t) = f(t, r(t), v(t)), t > 0,

con (r(0), v(0)) = (r0, v0).

Ejemplo 15 Cálculo de trayectorias (II): balísticaLos problemas de balística tienen una larga historia en la computación científicay fueron la principal motivación del desarrollo de los computadores durante lasdos grandes guerras mundiales, principalmente la segunda, por la necesidad deconfeccionar tablas de tiro precisas.

Siguiendo el ejemplo descrito en el libro de Golub y Ortega [10] podemos consi-derar un caso simple del estudio de la trayectoria de un cohete que se lanza con unángulo de inclinación respecto al suelo, ver Figura 1.9. La trayectoria depende demuchos factores:

características del cohete y su propulsor

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 30

Page 31: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.6. Ejemplos (II): Problemas de orden mayor que uno 31

Figura 1.9: Trayectoria típica de un objeto

el arrastre producido por la densidad del aire

la fuerza de la gravedad

efectos del viento

etc...

Para poder realizar un modelo de este problema debemos simplificar la realidad. Sisuponemos que el cohete se mueve en un plano, es decir, no hay viento cruzado,y su posición viene descrita por las coordenadas x(t) e y(t) nos encontramos conunas ecuaciones derivadas de la segunda ley de Newton F = ma dadas por

x′′(t) =1

m(t)(T (t)− 0.5 cρ s v(t)2) cos(θ(t))− m′(t)

m(t)x′(t),

y′′(t) =1

m(t)(T (t)− 0.5 cρ s v(t)2) sin(θ(t))− m′(t)

m(t)y′(t)− g.

Aquí tenemos

v(t) = (x′(t)2 + y′(t)2)1/2 es el módulo de la velocidad del cohete

θ(t) = tan−1(y′(t)/x′(t)) es el ángulo del vector velocidad del cohete con lahorizontal, ver Figura 1.9.

m(t) la masa del cohete, que cambia conforme se consume el combustible

T (t) el empuje producido por el propulsor

0.5cρ s v(t)2 es la fuerza de arrastre sobre el cohete. Aquí ρ es la densidad delaire, s es la sección del cohete y c es un coeficiente de arrastre.

etc...

31 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 32: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

32 Capítulo 1 Introducción a las Ecuaciones Diferenciales

En el caso de un proyectil lanzado por un cañón nos encontramos con unasimplificación puesto que podemos suponer que la masa del proyectil es constante yque no hay empuje por el propulsor. Entonces las ecuaciones se simplifican como

x′′(t) =− cρ s v(t)2

2mcos(θ(t)),

y′′(t) =− cρ s v(t)2

2msin(θ(t))− g.

Siendo posible resolverse en algunas situaciones. Si se especifican los valores realistasde los parámetros las ecuaciones se convierten en irresolubles analíticamente.

Es más conveniente usar las variables (x(t), y(t), v(t), θ(t)). De acuerdo a lasexpresiones

x′(t) = v(t) cos(θ(t)), y′(t) = v(t) sin(θ(t))

derivando y sustituyendo en las ecuaciones para x′′(t) e y′′(t) se obtiene uno sistemade ecuaciones de primer orden dado por

x′(t) = v(t) cos(θ(t)),y′(t) = v(t) sin(θ(t)),

v′(t) =1

m(t)(T (t)− 0.5 cρ s v(t)2)− g sin(θ(t))− m′(t)

m(t)v(t),

θ′(t) =− g

v(t)cos(θ(t)).

Como se puede observar, hay una gran dificultad intrínseca en resolver este tipo deecuaciones.

1.7. Ejemplos (III): Problemas rígidos e inesta-bles

Muchos sistemas presentan soluciones o partes de las soluciones (por ejemplo,si la solución es una suma de funciones podemos estar hablando de un sumando)que tienen un comportamiento muy brusco con respecto al resto de la solución.

Si la solución, o alguna componente suya, desaparece o tiende a cerocon mucha más rapidez que el resto, o manifiesta un cambio brusco decomportamiento decimos que el problema es rígido.

Si la solución, o alguna componente suya, crece en magnitud con másrapidez que el resto y de una forma importante decimos que el problema esinestable.

Esto es una descripción, o definición, poco matemática pero aquí no se puede pre-cisar más debido a la subjetividad del fenómeno.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 32

Page 33: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.7. Ejemplos (III): Problemas rígidos e inestables 33

1.7.1. Problemas rígidos: Ejemplos en sistemasEjemplo 16 Consideremos el sistema lineal

x′1(t) = −298x1(t) + 99 x2(t),

x′2(t) = −594x1(t) + 197 x2(t).

La solución exacta es

x(t) = c1e−t

(13

)+ c2 e

−100 t

(12

)donde c1, c2 se fijan con el dato inicial. Esto es, tenemos dos partes en la solución,la correspondiente a e−t y la correspondiente a e−100 t y la solución se escribe como

x(t) = w1e−t + w2e

−100 t

para dos vectores w1, w2 ∈ R2. La parte con la función coeficiente e−100 t decrecemucho más rápido que la parte asociada a e−t.

Podemos describir esta situación en sistemas lineales de forma general. Supon-gamos que tenemos el sistema

x′(t) = Ax(t) + φ(t) ∈ Rm

y A tiene espectro σ(A) = λ1, λ2, ..., λm tal que Re(λj) < 0 para todo j =1, 2, ...,m. Entonces la solución se puede escribir como

x(t) =∑j

αjeλjtcj + Ψ(t)

donde Ψ(t) es una solución particular del problema. Si Re(λj) < 0 se tiene

eλjtcj → 0, t → +∞

y por lo tantox(t) ∼ Ψ(t), t → +∞.

A cada uno de los términos eλjtcj se le suele denominar modo transitorio (lentoo rápido) y al término Ψ(t) modo estacionario.

Si Re(λj) < 0 pero además |Re(λj)| >> 1 entonces el modo asociado decae muyrápido, es un modo transitorio rápido mientras que si |Re(λj)| ∼ 1 el modoasociado decae más lentamente y es un modo transitorio lento.

Si λ es el autovalor con la parte real negativa más pequeña en valor absoluto yλ es el autovalor con la parte real negativa más grande en valor absoluto, entoncesel modo asociado a λ es el más rápido y el asociado a λ el más lento. El cociente

Re(λ)

Re(λ)

33 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 34: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

34 Capítulo 1 Introducción a las Ecuaciones Diferenciales

se denomina razón de rigidez de la matriz A. Las dificultades prácticas surgencuando esta razón es muy grande puesto que se hace muy complicado seguir ycalcular de forma correcta todos los modos al mismo tiempo. Los que decaen másrápido requieren, en general, más esfuerzo que los que decaen más lento, aunqueestos sean los que realmente puedan importar.

Aparte de este ejemplo académico, existen muchas situaciones de gran importanciafísica, como por ejemplo las reacciones químicas, donde diferentes compuestos setransforman de acuerdo a diferentes escalas temporales, con frecuencia con distintosórdenes de magnitud, pensemos en explosiones o el encendido de una cerilla juntocon la difusión de compuestos químicos restantes en el explosivo.

Estos problemas empezaron a plantearse en la década de los 60 con el empujeen el modelado y cálculo efectivo en fenómenos físicos, químicos como reaccionesquímicas, dinámica de guiado de misiles, circuitos electrónicos, biomatemáticas,etc....Este empuje fue grandemente potenciado por el desarrollo de los computado-res...o incluso se puede pensar que el desarrollo de las capacidades de computaciónayudaron enormemente a este empuje.

Este tipo de problemas se denominan problemas rígidos (stiff, en inglés, raidesen francés) y son muy importantes por su presencia predominante en cualquiercampo de la ciencia.

Dos químicos, Curtis y Hirschfeld de la Universidad de Wisconsin publicaronen 1952 un trabajo en donde ya estudiaban este fenómeno desde el punto de vistacomputacional.

...En torno a 1960 las cosas cambiaron y todo el mundo se dió cuentaque el mundo estába lleno de problema rígidos.(G. Dahlquist 1985)

Una idea clara encontramos en la siguiente descripción

La esencia de la rigidez consiste en que la solución buscada varíadespacio pero existen perturbaciones que decaen o cambian rápidamen-te. La presencia de estas perturbaciones complican el cálculo efectivo dela solución buscada.

Las componentes de la solución que cambian más lentamente se suelen denominarmodos estacionarios o transitivos lentos en el sentido de que sus derivadas sonmucho más pequeñas que las derivadas de los modos transitivos rápidos, queson esas componentes de la solución con decaimiento rápido. La dificultad prácticareside en que nos encontramos forzados a describirlas o calcularlas todas al mismotiempo.

Ejemplo 17 Modelo de RobertsonLa cinética química estudia la evolución de la concentración de sustancias químicas

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 34

Page 35: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.7. Ejemplos (III): Problemas rígidos e inestables 35

sometidas a diversas reacciones. El modelo de Robertson (1966) ha llegado a ser muypopular en estudios numéricos y describe la reacción química entre tres compuestoscon distintias velocidades de reacción

A0.04−→ B (lenta)

B +B3·107−→ C +B (muy rápida)

B + C104−→ A+ C (rápida)

los números encima de las flechas indican la velocidad a la que se produce cadareacción. Este modelo lleva a las ecuaciones para las concentraciones dadas por

x′(t) = −k1 x(t) + k2 y(t)z(t),

y′(t) = k1 x(t)− k2 y(t)z(t)− k3 y(t)2,

z′(t) = k3 y(t)2.

Aquí x(t), y(t), z(t) son las concentraciones, k1 = 0.04, k2 = 104, k3 = 3 · 107 sonlas velocidades de reacción lenta, rápida y muy rápida y los valores iniciales sonx(0) = 1, y(0) = 0, z(0) = 0.

La función pendiente es

f(x, y, z) = (−k1 x+ k2 y z, k1 x− k2 y z − k3 y2, k3 y

2)

luego el único punto crítico es (x(t), y(t), z(t)) ≡ (1, 0, 0) ya que si z(t) es constanteentonces y(t), x(t) también lo son, esto es, el estado estacionario es (x′, y′, z′) = 0y de acuerdo al dato inicial debe ser (x(t), y(t), z(t)) ≡ (1, 0, 0), ∀t > 0.

Por otro lado, se conserva la materia en la reacción química, y eso se ve porque la suma de las tres magnitudes se mantiene siempre constante igual a uno

x(t) + y(t) + z(t) = 1

y además, se ve también que x(+∞) = z(+∞) = 0 siendo por lo tanto y(+∞) = 1,ver Figura 1.10. El estado estacionario se alcanza después de un largo periodo detiempo, como del orden de 106. La concentración y(t) alcanza rápidamente un estadocasi estacionario en un entorno de y′(t) = 0 el cual en en principio, usando quex(0) = 1 y z(0) = 0 se puede estimar mediante la aproximación 0.04 ≈ 3 107 y(t)2

que da y2(t) ≈ 3.65 10−5, y entonces lentamente va a cero otra vez, ver Figura 1.11.Como se puede ver por la Figuras 1.10 y 1.11, las magnitudes son muy dis-

tintas entre las tres concentraciones y el comportamiento inicial de la componentey presenta un salto brusco desde cero, análogo a la creación de una llama. Nosencontramos entonces con tres modos, uno lento, otro rápido y otro muy rápido.

Es difícil ahora enmarcar todas las posibles situaciones prácticas dentro de unamisma definición, pero sí que se pueden hacer intentos que capturan la idea de loque pasa

35 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 36: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

36 Capítulo 1 Introducción a las Ecuaciones Diferenciales

0 10 20 30 40 50 60 70 80 90 100−0.5

0

0.5

1

1.5

xyz

0 10 20 30 40 50 60 70 80 90 100

0.7

0.8

0.9

1

x

0 10 20 30 40 50 60 70 80 90 1000

2

4x 10

−5

y

0 10 20 30 40 50 60 70 80 90 1000

0.2

0.4

z

Figura 1.10: Modelo de Robertson (1963) para T = 100. Visualización de las tressoluciones juntas y por separado. Observar las diferencias en escala.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 36

Page 37: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.7. Ejemplos (III): Problemas rígidos e inestables 37

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10.996

0.998

1

1.002

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10

2

4x 10

−5

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10

2

4x 10

−3

x

y

z

Figura 1.11: Modelo de Robertson (1963). Comportamientos iniciales de las con-centraciones.

El sistema homogéneo se dice rígido si la razón de rigidez es muy gran-de.

Muy grande... ¿con respecto a qué?

El sistema no homogéneo se dice rígido si la razón de rigidez es muygrande cuando se compara con la razón de cambio del modo estacionario.

Se puede dar otras definiciones que, en el fondo, lo que hacen es caracterizar distintaspropiedades que pueden estar presentes o no.

Nos quedamos con esta idea:

Definición 18 El sistema se dice rígido en un intervalo de tiempo si en esteintervalo las curvas solución vecinas a la curva buscada se aproximan a esta a unavelocidad muy grande en comparación a la velocidad con la que la curva buscadacambia en este intervalo.

1.7.2. Problemas rígidos: Ejemplos escalaresLos problemas escalares también poseen soluciones con distintos modos.

37 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 38: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

38 Capítulo 1 Introducción a las Ecuaciones Diferenciales

Ejemplo 19 La ecuación de Dahlquist-Bjorck (1956 aprox.) es un ejemploacadémico del efecto de la rigidez. El modelo es

y′(t) = 100 (sin(t)− y(t)), 0 < t ≤ 3,y(0) = 0

y se puede ver como un caso particular del problemay′(t) = a (sin(t)− y(t)), t > 0,y(0) = y0

cuya solución es

y(t) = e−a ty0 +sin(t)− a−1cos(t) + a−1e−a t

1 + a−2.

Por lo tanto, para a >> 1 el modo transitorio exponencial asociado con e−a t decaemuy rápido. Aquí la solución se descompone en

modo rápido ∼ e−a ty0 +a−1e−a t

1 + a−2.

modo estacionario o lento ∼ sin(t)− a−1cos(t)

1 + a−2.

En las Figuras 1.12, 1.13 y 1.14 se ve el efecto de incrementar el valor de a enel decaimiento de las distintas soluciones. Este modo debe ser capturado bien porcualquier proceso de cálculo que se precie de funcionar. Aquí se tiene

f(t, y) = −a y + a sin(t) ⇒ ∂yf(t, y) = −a.

Se tiene el mismo resultado cualitativo con el ejemplo más simpley′(t) = a (1− y(t)), 0 < t,y(0) = y0

donde la solución exacta es y(t) = e−at(y0 − 1) + 1.Esto quiere decir que la dificultad fundamental la provoca el término −a y en

la función pendiente, o lo que es lo mismo, tener ∂yf(t, y) << 0. Observar quetenemos

f(t, y) = −a (sin(t)− y), f(t, y) = −a (1− y)

luego en ambos casos es∂yf(t, y) = −a y.

Observación 15 Observar también que una misma curva y(t) ≡ 1 puede estar enun campo de vectores muy simple como el dado por la ecuación y′(t) = 0 o en otrosmucho mas complicados como y′(t) = a (1− y(t))

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 38

Page 39: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.7. Ejemplos (III): Problemas rígidos e inestables 39

Figura 1.12: Soluciones y campo de velocidades de la ecuación de Dahlquist-Bjorckpara a = 5. Los valores iniciales en t0 = 0 son y0 = −0.5 : 0.1 : 2 (notacióna:h:b=a, a+h,a+2h,...).

Figura 1.13: Soluciones y campo de velocidades de la ecuación de Dahlquist-Bjorckpara a = 10. Los valores iniciales en t0 = 0 son y0 = −0.5 : 0.1 : 2.

39 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 40: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

40 Capítulo 1 Introducción a las Ecuaciones Diferenciales

Figura 1.14: Soluciones y campo de velocidades de la ecuación de Dahlquist-Bjorckpara a = 100. Los valores iniciales en t0 = 0 son y0 = −0.5 : 0.1 : 2.

Figura 1.15: Soluciones y campo de velocidades de la ecuación de Dahlquist-Bjorckpara a = 10 y distintos tiempos iniciales. Los valores iniciales en t0 = 0, t0 = 1 yt0 = 2 son y0 = −0.5 : 0.5 : 2.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 40

Page 41: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.7. Ejemplos (III): Problemas rígidos e inestables 41

Ejemplo 20 Un caso similar es la ecuación de Prothero-Robinsony′(t) = L (φ(t)− y(t)) + φ′(t), 0 < t,y(0) = y0

con solución exactay(t) = e−L t(y0 − φ(0)) + φ(t)

y otra vez el modo rápido e−L t para L >> 1 debe ser capturado correctamente. Elmodo estacionario es φ(t) y puede ser una función suave sin cambios bruscos, comopor ejemplo φ(t) = sin(t). También se tiene

f(t, y) = −Ly + Lφ(t) + φ′(t) ⇒ ∂yf(t, y) = −L.

Incluso en el caso en el que y0 = φ(0) donde aparentemente el modo rápido no estáen la solución, éste sí que se encuentra en todas las soluciones vecinas y se debetambién capturar como si estuvise presente para conseguir que no aparezca.

Ejemplo 21 Ecuación de Van der Pol El modelo de Van der Pol que apareceen la teoría de circuitos eléctricos x′′(t)− µ · (1− x(t)2) · x′(t) + x(t) = 0, t > 0,

x(0) = 1,d

dtx(0) = 0.

Una vez más, la ecuación se puede reescribir en términos de un sistema de primerorden usando las incógnitas u(t) = x(t) y v(t) = x′(t). Queda como

u′(t) = v, t > 0,v′(t) = µ (1− u2) v − u, t > 0,

con (u(0), v(0)) = (1, 0). Por ejemplo, en el caso µ = 6 observa la gráfica de x(t) enla Figura 1.16. Aquí hay cambios bruscos también aunque el sistema es más dificilde predecir.

Estos ejemplos nos motivan una definición para ecuación rígida donde lo impor-tante es el comportamiento de las soluciones. A pesar de eso, sigue siendo similar ala anterior definición:Definición 22 El sistema se dice rígido si hay componentes de la solución quedecaen mucho más rápido que otras.Incluso cuando no podemos comparar dos componentes de la solución puesto quesólo tenemos una, también nos podemos encontrar con rigidez. Por ejemplo,

y′(t) = −a y(t), 0 < t,y(0) = y0

también genera un comportamiento rígido si a >> 1. ¿Con respecto a qué compa-ramos aquí? Pues probablemente con respecto a la solución de la ecuación y′(t) = 0que es la función constante y(t) ≡ 1.

41 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 42: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

42 Capítulo 1 Introducción a las Ecuaciones Diferenciales

0 5 10 15 20 25 30 35 40−3

−2

−1

0

1

2

3Desplazamiento x(t) del oscilador de Van der Pol

x(t)

0 5 10 15 20 25 30 35 40−10

−5

0

5

10Velocidad dx(t)/dt del oscilador de Van der Pol

dx(t)/dt

−2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5−10

−5

0

5

10Plano de Fases del oscilador de Van der Pol

Figura 1.16: Solución ecuación de Van der Pol para µ = 6, x(0) = 1 y x′(0) = 0.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 42

Page 43: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.7. Ejemplos (III): Problemas rígidos e inestables 43

1.7.3. Influencia de la rigidez en datos inicialesAunque no tiene por que siempre ser así, podemos observar en los ejemplos

previos que los cambios en los datos iniciales son rápidamente anulados si estánafectados por los modos rápidos:

Ejemplo 23 En los problemasy′(t) = −a y(t), 0 < t,y(0) = y0

dondey(t) = y0e

−a t

o la ecuación de Dahlquist-Bjorcky′(t) = a (sin(t)− y(t)), t > 0,y(0) = y0

cuya solución es

y(t) = e−a ty0 +sin(t)− a−1cos(t) + a−1e−a t

1 + a−2

o la ecuación de Prothero-Robinsony′(t) = L (φ(t)− y(t)) + φ′(t), 0 < t,y(0) = y0

con solución exactay(t) = e−L t(y0 − φ(0)) + φ(t).

En todos estos casos se ve el valor inicial está afectado por el modo rápido dedecaimiento e−L t para L >> 1, luego si y0 = 0 o y0 = φ(0) la contribución del valorinicial y0 desaparece rápidamente.

1.7.4. Problemas inestablesComo ya hemos dicho, podemos entender por problemas inestables aquellos

problemas donde ligeras variaciones iniciales producen una gran diferencia en lassoluciones en un corto periodo de tiempo. También se pueden interpretar comoproblemas donde hay modos o componentes de la solución que aumentanmuy rápido.

Ejemplo 24 Los ejemplos vistos de Dahlquist-Bjorck o de Prothero-Robinson pasande ser rigidos a inestables si tomamos los coeficientes a y L negativos. En este caso∂yf >> 1 para valores grandes, lo que provoca la inestabilidad.

43 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 44: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

44 Capítulo 1 Introducción a las Ecuaciones Diferenciales

Figura 1.17: Campo repulsivo desde la solución y1/3(t) = t+ 1/3 .

Ejemplo 25 La ecuaciónd

dty(t) = 3 y − 3 t, t > 0,

y(0) = α,

tiene por soluciónyα(t) = (α− 1/3)e3t + t+ 1/3

que se descompone enmodo rápido ∼ (α− 1/3)e3t.

modo estacionario o lento ∼ t+ 1/3.

En el caso exacto de α = 1/3 tenemos que

y1/3(t) = t+ 1/3

algo muy razonable. Pero si α− 1/3 = 0 y pequeño tendremos

yα(t) = (α− 1/3) e3t + t+ 1/3

y el factor e3t amplifica de forma muy importante el valor α−1/3, ver Figura 1.17 yFigura 1.18. La situación cambia totalmente si f(t, y) = −3y−3t, aquí el problemapasa de ser inestable a ser rígido:

d

dtz(t) = −3 z − 3 t, t > 0,

z(0) = α,

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 44

Page 45: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.7. Ejemplos (III): Problemas rígidos e inestables 45

Figura 1.18: Campo repulsivo y soluciones incluyendo la solución z1/3(t) = t+ 1/3con datos iniciales empezando en t = 0 y en t = 1. Se observa como se alejan dez1/3(t).

tiene por soluciónzα(t) = (α− 1/3)e−3t − t+ 1/3

que se descompone enmodo rápido ∼ (α− 1/3)e−3t.

modo estacionario o lento ∼ −t+ 1/3.

Otra vez, en el caso exacto de α = 1/3 tenemos que

z1/3(t) = −t+ 1/3.

Si α− 1/3 = 0 pequeño o grande tendremos

zα(t) = (α− 1/3) e−3t + t+ 1/3

y ahora el factor e−3t reduce de forma muy rápida el valor de α − 1/3, ver Figura1.19. En el primer caso la trayectoria

y1/3(t) = t+ 1/3

es inestable, repele todas las trayectorias vecinas, mientras que en el segundo caso

z1/3(t) = −t+ 1/3

45 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 46: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

46 Capítulo 1 Introducción a las Ecuaciones Diferenciales

Figura 1.19: Campo contractivo de velocidades y soluciones hacia z1/3(t) = −t+1/3.Usando datos iniciales empezando en t = 0 y en t = 1 se observa como se contraenhacia de z1/3(t).

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 46

Page 47: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.7. Ejemplos (III): Problemas rígidos e inestables 47

es estable o atrae a todas las trayectorias. En estos dos casos tenemos

f(t, y) = ±3y − 3t

y por lo tanto la constante de Lipschitz asociada es Lf = 3. Esta constante nodistingue entre una situación estable y otra inestable. Esto viene caracterizado porel signo de ∂yf(t, y).

Observación 16 Se puede interpretar que cuando partes de la solución tienen unaestabilidad muy fuerte llegamos a la rigidez.

Ejemplo 26 La ecuación (Golub-Ortega [10])

y′′ − 10y′ − 11y = 0, y(0) = 1, y′(0) = −1

posee solución y(t) = e−t. Pero si usamos como dato inicial

y(0) = 1 + ϵ, y′(0) = −1

la solución esyϵ(t) = (1 +

11

12ϵ)e−t +

ϵ

12e11 t

entonces para cualquier ϵ > 0 independientemente de lo pequeño que sea tendremosun crecimiento muy fuerte de yϵ(t) para t > 0. Tenemos aquí dos modos muy dis-pares en la solución. Como consecuencia, pequeñas perturbaciones generan grandescambios a tiempo finito y resulta que y(t) = e−t se puede considerar como unasolución inestable.

También podemos escribir este problema en términos de un sistema de dosecuaciones lineales usando y1 = y e y2 = y′ para obtener

y′1 = y2,y′2 = 11y1 + 10y2

o bien en forma matriciald

dty(t) = Ay(t)

dondeA =

(0 111 10

)y entonces nos encontramos con autovalores para A dados por σ(A) = −1, 11luego la solución es una combinación lineal de e−t, e11 t. Tenemos entonces dosmodos uno dado por e−t que decae y uno que crece muy rápido dado por e11 t.

47 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 48: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

48 Capítulo 1 Introducción a las Ecuaciones Diferenciales

Figura 1.20: Dos soluciones inicialmente muy cercanas, una de ellas tiende a infinitoen tiempo finito mientras que la otra se estabiliza en cero.

Ejemplo 27 El siguiente ejemplo de Golub-Ortega [10] también es interesante yaque muestra una inestabilidad más fuerte

y′ = t y (y − 2), y(0) = y0.

Se tiene que f(t, y) = ty2 − 2ty luego f(t, y) ∼ ty2 para valores grandes de t e ypor lo que no se cumple la condición de crecimiento, a lo sumo lineal, de la funciónpendiente con respecto a y.

Aquí y(t) ≡ 0 e y(t) ≡ 2 son puntos estacionarios y la solución general es

y(t) =2 y0

y0 + (2− y0)et2 .

Si y0 < 2 entonces y(t) → 0 pero si y0 > 2 entonces hay explosión en tiempo finitode la solución, ver Figura 1.20 y Figura 1.21

1.8. Ejemplos (IV): Problemas oscilatoriosAunque la mayoría de sistemas físicos exhiben algún nivel de disipación, es-

to es, pérdida de masa, información etc...hay otros en donde este efecto no es elimportante, o simplemente no es así.

Estamos hablando por ejemplo del movimiento de planetas, satélites, etc....Las dificultades principales en este tipo de problemas son dos:

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 48

Page 49: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.8. Ejemplos (IV): Problemas oscilatorios 49

Figura 1.21: Soluciones y campo de velocidades del modelo dy/dt=t y (y-2)

se debe de calcular en un intervalo de tiempo muy grande, y ...

se debe conseguir mantener las trayectorias cerradas.

Los métodos que se adaptan bien a estas dificultades se llaman simplécticos (sim-pléctico significa preservar área).

Ejemplo 28 Movimiento armónico simpleYa sabemos que la ecuación que rige el movimiento de un péndulo (usando su ángulocon respecto a la vertical) es

θ′′(t) + θ(t) = 0, t > 0,θ(0) = 1, θ′(0) = 0.

La solución general es una combinación lineal de funciones trigonométricas y porlo tanto oscila.

Ejemplo 29 Cálculo de trayectorias (III): Sistema planetarioEl problema de N cuerpos es importante en campos tan dispares como astronomíay biología molecular (movimientos de moléculas). Las ecuaciones son

y′′i = G∑j =i

mjyj − yi

∥yj − yi∥3

donde yi(t) ∈ R3 describe la trayectoria del cuerpo i-ésimo, mi es su masa y G laconstante gravitacional. Introduciéndo la velocidad vi(t) = y′i(t) como nueva variable

49 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 50: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

50 Capítulo 1 Introducción a las Ecuaciones Diferenciales

se obtiene un sistema de primer orden de dimensión 6N siendo N el número decuerpos. Si cada cuerpo se mueve en un mundo 3d entonces el número de ecuacioneses 18N al ser cada una de ellas de tres componentes.

La figura 1.22 muestra la diferencia de resultados cuando se usa un métodoclásico no eficiente para resolver el problema (método no simpléctico) y cuando seusa uno bien adaptado a este tipo de problemas (método simpléctico).

En el caso de una partícula que orbita con respecto al origen, tenemosr(0) = r0,r′(0) = v0r′′(t) = −r(t)/|r(t)|3, t > 0

si se escribe en términos de las incógnitas r = (y1, y2) y r′ = (y3, y4) (aquí y3 e y4son las velocidades), nos encontramos con el sistema

y′1 = y3,y′2 = y4,y′3 = −y1/(y

21 + y22)

3/2,y′4 = −y2/(y

21 + y22)

3/2.

1.9. Uso de variable complejaSiendo t real y usando la derivada siempre con respecto a la variable real t se

pueden considerar λ, y(t) ∈ C y trabajar en el cuerpo de los números complejoscomo se hace en el de los reales. Se tiene la ventaja de poder usar la exponencialcompleja que simplifica operaciones algebraicas.

En este caso, la ecuación y′(t) = λ y(t), y(0) = y0 posee solución

y(t) = y0eλ t ∈ C, ∀t > 0

y equivale a un sistema de dos ecuaciones, una para la parte real y otra para laparte imaginaria. Simplemente se escribe y = u + iv y λ = a + i b y se obtienenambas ecuaciones.

Ejemplo 30 El problema del movimiento harmónico simple se reescribe muy fácil-mente en términos de la variable compleja z(t) = u(t) + iv(t) como

z′(t) = i z(t), z(0) = 1

con solución z(t) = eit. En general, el modelo

z′(t) = i ω z(t), z(0) = z0

con solución z(t) = z0 eiω t representa un oscilador con frecuencia (número de

vueltas por unidad de tiempo) ω. Se puede ahora observar fácilmente que, usando

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 50

Page 51: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.9. Uso de variable compleja 51

Figura 1.22: Trayectorias calculadas con un método clásico y con un método sim-pléctico. Las trayectorias cerradas no se calculan bien con el método clásico deEuler.

51 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 52: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

52 Capítulo 1 Introducción a las Ecuaciones Diferenciales

el valor absoluto de un número complejo c = a + i b, lo que equivale a la norma l2

del vector (a, b), que|z(t)| = |z0|

luego el movimiento es circular con radio dado por el dato incial.

Ejemplo 31 En el caso donde λ ∈ R la ecuación simplemente representa el mismoproblema escalar pero repetido en su parte real y en su parte compleja.

Por consiguiente, el problema modelo y′(t) = λ y(t) en C representa cualquier siste-ma lineal 2× 2 sobre el cuerpo de los reales R con autovalores distintos, después deun proceso de diagonalización, de una forma compacta y fácil así como el problematest real. Esquemáticamente

1. Si Re(λ) > 0 tenemos un problema inestable; con oscilaciones si Im(λ) = 0 osin oscilaciones cuando Im(λ) = 0.

2. Si Re(λ) < 0 tenemos un problema estable; con oscilaciones si Im(λ) = 0 osin oscilaciones cuando Im(λ) = 0.

3. Si Re(λ) = 0 tenemos un problema oscilatorio puro. Además,

d

dt(u(t)2 + v(t)2) = 0

luego la solución se encuentra en la familia de curvas u(t)2+v(t)2 = constanteen el plano (u, v).

1.10. Bancos de pruebas: problemas sencillosCuando estudiemos procesos de aproximación numérica usaremos modelos sim-

ples con soluciones conocidas y sobre los que observar el comportamiento de estosprocesos de aproximación numérica. Serán problemas triviales, pero cualquier es-quema numérico debe hacerlo bien en estos casos tan simples. El objetivo serátrasladar conclusiones a problemas más complicadas. Algunas ecuaciones modelopueden ser, por ejemplo:

1. y′(t) = 1, y(0) = 0: La solución exacta es y(t) = t.

2. y′(t) = 0, y(0) = 0: La solución exacta es y(t) = 0.

3. y′(t) = λ y(t), y(0) = 1, λ ∈ R: Usualmente λ < 0 tal que y(t) → 0, t → +∞y modela decaimiento o disipación. Si λ > 0 se modela expansión ya quey(t) → +∞, t → +∞.

4. y′(t) = i y(t), y(0) = 1, (i2 = −1): Modela fenómenos oscilatorios.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 52

Page 53: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

1.11. Conclusión sobre los ejemplos y objetivos 53

1.11. Conclusión sobre los ejemplos y objetivosLa mayoría de las ecuaciones diferenciales ordinarias no se pueden resolver por

las técnicas básicas analíticas que dan una solución explícita.Incluso cuando podemos, a veces resultan demasiado complicadas para ser de

utilidad. Por lo tanto, debemos de deducir información sobre el comportamientocualitativo y cuantitativo de las soluciones desde la propia ecuación.

Se debe además recurrir a procesos computacionales que generen aproximacionesa la solución exacta. Para ello calculamos valores puntuales de las curvas eintentaremos que sean próximos a los valores exactos de la curva solución.

En general, y como ya hemos visto, nos encontramos con situaciones y compor-tamientos muy variados en lo que se refiere a la solución continua.

Buscamos aproximar una curva concreta que está dentro de una fa-milia de curvas y nos podemos encontrar con

Soluciones expansivas... esto es nos lo hace difícil porque nos movemos deuna a otra debido a errores de cómputo y la expansión del sistema nos hacealejarnos mucho de la curva solución que buscamos

Soluciones contractivas... esto nos lo puede hacer fácil porque, aunquecambiemos de curva debido a los errores de cómputo, la propia familia desoluciones nos acerca a la curva buscada.

Soluciones oscilatorias Se debe capturar este tipo de movimiento. Esto llevaa lo que se conoce como métodos simplécticos y es de gran importancia enel seguimiento de órbitas de planetas o satélites.

Soluciones con comportamientos expansivos, contractivos u oscila-torios bruscos y repentinos... pueden necesitar una adaptación del cálculode forma dinámica, esto nos complica el trabajo bastante

Soluciones vectoriales con modos de velocidades muy distintas... sedeben calcular de manera simultánea y hay que evitar perder información delos modos rápidos.

Soluciones vectoriales con comportamientos expansivos, contracti-vos bruscos y repentinos, globales o por componentes...

Combinaciones de todo lo anterior

Para que un esquema sea bueno necesitará poder tener en cuenta estas situaciones.Esto nos llevará a los conceptos de estabilidad, precisión y convergencia.

53 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 54: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

54 Capítulo 1 Introducción a las Ecuaciones Diferenciales

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 54

Page 55: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

Capítulo 2

Método de Euler explícito

Resumen del tema

Introducimos notación y algunos resultados generales. Especialmente vemos condetalle el método de Euler explícito y los conceptos de estabilidad numérica y ordende convergencia.

2.1. IntroducciónLas ecuaciones diferenciales ordinarias se encuentran en cualquier campo de

la ciencia y la ingeniería. Por mucho esfuerzo que se ha realizado para encontrarsoluciones exactas sigue siendo necesario acudir a procesos de cálculo numérico paraobtener una solucion aproximada.

A veces, los métodos analíticos pueden dar la solución de una ecuación diferencialpero en la mayoría de los casos estas soluciones no son muy útiles y no se puedenaplicar. Incluso cuando se aplican la solución no sirve por ser complicada y requiereuna aproximación numérica. Por otro lado, el uso de la iteración de Picard tampoconos sirve desde el punto de vista práctico puesto que las integrales no se puedencalcular en general. Recordemos que esta iteración es

y0(t) ≡ y0, yn(t) = y0 +

∫ t

t0

f(s, yn−1(s)) ds, n ≥ 1

y tiene un uso más bien teórico.

El método de cálculo aproximado más simple es el método de Euler explícitoo progresivo. En este tema lo vamos a presentar con detalle puesto que contienelas ideas germinales de todos los demás métodos. Vamos por tanto a comparar unafunción continua, la solución, con unos valores discretos.

Para esto tenemos dos alternativas:

55

Page 56: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

56 Capítulo 2 Método de Euler explícito

1. podemos extender los valores discretos a una función continua, como por ejem-plo una poligonal. Esta es la prueba clásica de convergencia de la poligonalde Euler obtenida por Cauchy en torno a 1820 y que se puede ver en el librode Hairer, Norsett y Wanner [12].

2. restringir nuestra función solución incógnita a los mismos puntos donde es-tán calculados los valores discretos. Tomamos una partición del intervalo detiempo [0, T ] y en los puntos tj de esta partición calcularemos valores yj queaproximen a y(tj); este es el enfoque que vamos a seguir.

2.2. Discretización y primeros conceptosLa idea más usada es la de la discretización del intervalo de cálculo. Vamos

a introducir unos conceptos generales que ayuden:

como no podemos calcular indefinidamente, se fija T > 0 y nuestro intervalode cálculo va a ser [t0, t0 + T ] (con frecuencia será t0 = 0, pero no siempre).

introducimos una partición de [t0, t0 + T ], que suponemos uniforme parasimplificar, tn = t0 + nh para h = T/N con n = 0, 1, 2, ..., N y la llamaremosΠh, esto es,

Πh = t0 < t1 < ... < tN = t0 + T, tn = thn = t0 + nh, h = T/N.

Queremos comparar una función continua, la solución, en los puntos y(thn) con unosvalores discretos yhn calculados en los puntos de la discretización thn. Buscamos quesea

yhn ≈ y(thn)

y entonces podemos unir los puntos (thn, yhn) para formar una poligonal que aproximea la curva (t, y(t)).

Definición 32 Dada una familia de particiones Πhh>0 en el intervalo [t0, t0+T ],un método numérico para aproximar la solución del problema de Cauchy seráun procedimiento para generar una serie de valores yhn que aproximen a y(thn).

Hipótesis 1 Fijado un dato inicial tenemos existencia y unicidad de una solucióncontinua al problema de Cauchy.

Los valores puntuales calculados son los que nos van a servir como aproximación.Podemos entonces concretar

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 56

Page 57: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.2. Discretización y primeros conceptos 57

Definición 33 Convergencia: Diremos que el método es convergente cuando paracualquier solución u(t) del problema de Cauchy se cumple

max0≤n≤Nh

|u(thn)− uhn| → 0, h → 0+, h = T/N (h)

siendo thn = t0 + hn.

Observación 17 Los valores de h y de N (h) en el proceso al límite cuando h → 0cumplen N h = T . Podríamos escribir h = h(N) o bien N = N (h), pero no se suelehacer explícito para simplificar la notación. Por lo tanto,

h → 0+ ⇔ N → +∞,

cumpliendose N h = T . Estudiaremos el error normalmente en un punto fijo delintervalo que esté en las particiones,

t⋆ = thn = nh

de tal forma queh → 0+, n → +∞, n h = t⋆.

Observación 18 Los valores un se pueden interpolar o extrapolar para aproximaru(t) en puntos t que no están en la partición.

Observación 19 Los valores (tn, un) generados dependen también de h, por lotanto sería más correcto poner algo como (thn, u

hn). Mantenemos la notación original

(tn, un) para simplificar y no sobrecargar, aunque no debemos olvidar esto.

Observación 20 Tradicionalmente se usa el término integración para resolver elproblema de Cauchy y se usa el término cuadratura para aproximar integrales.

Observación 21 De momento usamos un paso constante, pero gran parte de lapotencia de los algoritmos modernos consiste en poder adaptar el paso conformese calcula la solución. Esto lo veremos más adelante.

Los métodos numéricos producen los valores unn de forma iterativa: El valor un+1

se calcula a partir de los valores u0, u1, ..., un−1 obtenidos previamente.

Métodos de un paso: Si para obtener un+1 sólo usamos la información entn decimos que es un método de un paso .

Métodos multipaso: Si para obtener un+1 usamos la información en puntosprevios, tn, tn−1, ..., decimos que es un método multipaso.

Vamos a realizar una primera aproximación a las ideas más populares, efectivas yrazonables de construir estos procesos iterativos. Supondremos que f(t, u), y por lotanto cualquier solución del problema de Cauchy, es tan regular como necesitemos.

57 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 58: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

58 Capítulo 2 Método de Euler explícito

2.3. Método de Euler progresivo o explícitoNuestros datos son (t0, u0) junto con la función f(t, u) que nos evalua la pen-

diente. Por lo tanto, podemos construir el valor f(t0, u0) que es la pendiente inicialde la curva solución en el punto (t0, u0); la recta tangente a la curva solución en elpunto (t0, u0) es

z0(s) ≡ u0 + (s− t0) f(t0, u0)

y tiene sentido entonces reemplazar el valor exacto u(t1) por el valor z0(t1) si ladistancia t1 − t0 no es muy grande. Esto es

u(t1) ≈ u0 + (t1 − t0) f(t0, u0)

Pongamos u1 = u0 + (t1 − t0) f(t0, u0), hemos entonces avanzado al punto (t1, y1) yya tenemos dos puntos que son próximos a puntos de la curva

(t0, u0), (t1, u1).

Partimos ahora de (t1, u1), podemos repetir el proceso construyendo la pendientef(t1, u1) la nueva recta tangente

z1(s) ≡ u1 + (s− t1) f(t1, u1)

y volver a progresar en el cálculo obteniendo una aproximación a u(t2) para unpunto t2 no muy alejado de t1 dada por z1(t2), esto es

y(t2) ≈ u1 + (t2 − t1) f(t1, u1)

Pongamos u2 = u1 + (t2 − t1) f(t1, u1), hemos entonces avanzado al punto (t2, u3) yya hemos generado tres puntos que sirven para construir una poligonal que va, enprincipio, ajustandose a la solución buscada

(t0, u0), (t1, u1), (t2, u2)

y así podemos continuar generando puntos, ver Figuras 2.1, 2.2 y 2.3.Por lo tanto, el esquema es: Dado un obtener

un+1 = un + h f(tn, un), n = 0, 1, 2, ...N − 1.

Este esquema fue introducida por Euler en torno a 1770, se denomina Métodode Euler progresivo o explícito y es el germen de todos los demás métodosnuméricos. El proceso de cálculo es muy fácilmente programable y en forma depseudo-código queda como:

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 58

Page 59: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.3. Método de Euler progresivo o explícito 59

Figura 2.1: Interpretación gráfica del método de Euler progresivo. Por defecto ypara visualizar mejor se unen los puntos calculados con un trazo continuo, pero elcómputo sólo genera los puntos (tn, un).

Figura 2.2: Método de Euler progresivo: normalmente terminamos en una trayec-toria distinta debido al proceso de cálculo aproximado. El cómputo sólo genera lospuntos (tn, un), pero para visualizar mejor se unen los puntos calculados con untrazo continuo.

59 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 60: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

60 Capítulo 2 Método de Euler explícito

Figura 2.3: Distintas aproximaciones a la solución exacta para distintos h diferen-ciadas por los símbolos ⋆, ×, .

Dados t0, T , N , y0, f(t, u)Calculamos h = T/NPara n = 0 hasta N − 1

calcular tn+1 = tn + hcalcular un+1 = un + h f(tn, un)

FinDibujar puntos (tn, un)

Observación 22 Los valores (tn, yn) generados dependen de h principalmente, porlo tanto sería más correcto poner algo como (thn, y

hn). Mantenemos la notación ori-

ginal (tn, yn) para simplificar y no sobrecargar, aunque no debemos olvidar esto.

Observación 23 El valor inicial yh0 no tiene porqué coincidir con y(t0) = y0,puede darse el caso donde y(t0) provenga de un valor experimental, o por ejemploy(t0) =

√π o incluso y(t0) = 1/3.... En general, hay un error inicial que no podemos

despreciar.

Observación 24 Debido a las imprecisiones o errores terminamos siempre en unacurva vecina a la buscada, ver la Figura 2.2.

Observación 25 Como es siempre N h = T , si hacemos más pequeño h enton-ces N = T/h crece y las soluciones calculadas con distintos h van cambiando sulocalización en [t0, t0 + T ], ver la Figura 2.3. Los límites cuando h → 0+ de las

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 60

Page 61: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.3. Método de Euler progresivo o explícito 61

expresiones que contienen el número de puntos totales N siempre implican el creci-miento N → +∞ manteniendose la razón N h = T constante. Podríamos escribirh = h(N) o bien N = N(h), pero no se suele hacer explícito para simplificar lanotación. Por lo tanto,

h → 0+ ⇔ N → +∞, con N h = T.

Si además nos queremos fijar en un punto t⋆ = t0 + nh, tenemos que tener la ideade un proceso de límite simultáneo y estacionario h → 0 y n → +∞ tal que elpunto t⋆ = t0 + nh permanece fijo.

Ejemplo 34 Se suele usar la expresión

lımh→0

(1 + h)n

pero no está muy bien escrita ya que se debe de entender que h y n estan ligadospor la relación nh = t⋆ − t0, si no fuese así el límite sería trivial. Se puede precisaren la forma

lımh→0, n→+∞hn=t⋆−t0

(1 + h)n

aunque resulta excesivamente cargada. Teniendo en cuenta esto, volvemos a la ex-presión original

lımh→0

(1 + h)n

y la entendemos en el contexto correcto por lo que hay que buscar el producto nhen la expresión o escribir un parámetro en términos del otro. Por ejemplo:

lımh→0

(1 + h)n = lımh→0

exp(n log(1 + h))

= lımh→0

exp(t⋆ − t0

hlog(1 + h)) = lım

h→0exp((t⋆ − t0)

log(1 + h)

h)

= exp(t⋆ − t0).

De forma alternativa

lımh→0

(1 + h)n = lımh→0

exp(n log(1 + h)) = lımn→+∞

exp(n log(1 +t⋆ − t0

n)) = exp(t⋆ − t0).

Aparte de la derivación geométrica que hemos hecho podemos también llegar a estemétodo por otras vías:

61 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 62: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

62 Capítulo 2 Método de Euler explícito

Fórmula de Taylor:Hacemos desarrollo de Taylor en torno al punto tn:

y(tn+1) = y(tn) + h y′(tn) +1

2h2y′′(ξn), tn < ξn < tn+1,

es decir,

y(tn+1) = y(tn) + h f(tn, y(tn)) +1

2h2y′′(ξn), tn < ξn < tn+1.

Si el valor de h es lo suficientemente pequeño podemos despreciar el términoque contiene h2 y aproximar

y(tn+1) ∼ y(tn) + h f(tn, y(tn)).

El valor l(tn;h) = 12h2y′′(ξn) es el residuo, o el error local, que surge

cuando se pretende que la solución continua cumpla el esquema numérico,o equivalentemente, se supone que se puede aplicar el esquema en el valorexacto, yn = y(tn)

l(tn;h) = y(tn+1)− y(tn) + h f(tn, y(tn))

o lo que es lo mismo

y(tn+1) = y(tn) + h f(tn, y(tn)) + l(tn;h).

Cuadratura numérica:Escribimos la edo entre tn y tn+1 en su forma integral y la aproximamos porla fórmula del punto izquierdo.

Ejemplo 35 Consideremos

y′ + y = 1, y(0) = 0 (2.1)

con solucióny(t) = 1− e−t

y el problema

y′ = y, y(0) = 1 (2.2)

con solucióny(t) = et.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 62

Page 63: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.4. Estimación del orden de convergencia a cero 63

Podemos entonces realizar una tabla con los errores de convergencia obtenidosusando el método de Euler y representando el valor

En = max0≤k≤n

|y(tk)− yk|

para n = 1/h con n = 16, 32, 64, .... en el intervalo de tiempo [0, 1]. Podremos verque el error decae por un factor de 2 cada vez que se divide entre 2 el parámetro h.Luego el método es de orden 1 en h

n = h−1 error en (2.7) error en (2.8)16 0.0118053 0.080353332 0.0058242 0.041291764 0.0028929 0.0209369128 0.0014417 0.0105428256 0.0007197 0.0052902512 0.0003595 0.00264981024 0.0001797 0.0013261

Veremos en teoría que el método de Euler explícito es de primer orden confirmandolos resultados de antes.

2.4. Estimación del orden de convergencia a ceroUna primera clasificación práctica es comprobar el orden del error que se produce

sobre problemas donde la solución es conocida, así se puede calcular el error. Nece-sitamos el concepto de orden de aproximación y usamos para ello la notación O(leer O grande).

Supongamos que h > 0 es nuestra variable y tenemos una función f(h) en unintervalo de la forma [0, h⋆) que converge a cero cuando h tiende a cero, esto es,lımh→0 f(h) = 0. La pregunta que nos interesa resolver es ¿Con qué velocidad decaea cero? El concepto fundamental aquí es el de orden de convergencia

Definición 36 Diremos que una función E(h) converge a cero con orden pcon respecto a h si converge a cero como hp, esto es

E(h) = O(hp), h → 0+

o lo que es lo mismo,lımh→0+

E(h)

hp= K = 0.

También equivale a la existencia de un entorno V (0) = (0, h0) y una constanteK > 0 tal que

|E(h)| ≈ K hp, ∀h ∈ (0, h0).

63 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 64: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

64 Capítulo 2 Método de Euler explícito

En nuestro curso vamos a usar esta definición para controlar los resultados numé-ricos que produce un cálculo.

Observación 26 La expresión analítica de E(h) no se conoce y sólo se tienen losvalores computacionales que se pueden obtener para casos concretos de h.

Ejemplo 37 sin(3h) = O(h) cuando h → 0.

Observación 27 En el casolımh→0+

E(h)

hp= 0

tenemos que E(h) converge a cero más rápido que hp. Entonces se escribe

E(h) = o(hp), h → 0+.

(leer o pequeña).

Definición 38 Convergencia y orden de convergencia: Diremos que un méto-do numérico es convergente cuando para cualquier solución y(t) del problemaCauchy se cumple

max0≤n≤Nh

|y(thn)− yhn| → 0, h → 0+, h = T/N (h)

siendo thn = t0 + hn. Si además

max0≤n≤N(h)

|y(h)n − y(thn)| = O(hp), h → 0+, h = T/N (h)

se dice que tiene un orden p de convergencia.

Observación 28 También es necesario que el error inicial |y(th0) − yh0 | tienda acero.

Observación 29 Como siempre es h → 0+ simplificaremos escribiendo O(hp) sinnecesidad de explicitar h → 0+.

Observación 30 Este resultado usa el límite h → 0+ pero desde el punto de vistade un cómputo práctico puede ocurrir que el valor h sea tan pequeño que resulteimpracticable.

Tenemos dos formas de estimar el error, usaremos la segunda por ser mas elegante.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 64

Page 65: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.4. Estimación del orden de convergencia a cero 65

2.4.1. Uso de tablasEn general, si el método es convergente de orden p > 0, el error es de la forma

E(h) ≈ C hp y entonces si dividimos h entre 2 y volvemos a calcular el error

E(h/2) ≈ c (h/2)p = C hp/2p ≈ E(h)/2p

por lo tanto, el error obtenido es el que teniamos antes pero dividido por 2p, estonos permite calcular p tomando logaritmos (el uso de 2 es arbitrario). La idea escombinar valores distintos de h y estimar los parámetros del error c y p. Por ejemplo,debe ser

E(h)

E(h/2)≈ 2p ⇒ p ≈ log

( E(h)

E(h/2)

)/ log(2).

Ejemplo 39 Supongamos que para valores distintos de h se ha obtenido con elcomputador la siguiente tabla de aproximaciones para las funciones f(h) y g(h):

h f(h) g(h)0.0625 0.0118053 0.08035330.03125 0.0058242 0.02129170.015625 0.0028929 0.00593690.0078125 0.0014417 0.0015428

Podemos entonces ver que al dividir por 2 el valor de h el valor de f(h) decae porun factor de 2 mientras que g(h) decae por un factor 4. Con esta información sepuede deducir, en principio, que

f(h) = O(h), g(h) = O(h2), h → 0.

Observación 31 Cuando los valores de los errores estén cerca del cero del compu-tador, ∼ 10−16, estos estudios dejan de ser válidos debido a los errores de redondeoo truncatura que realiza la máquina.

2.4.2. Recta de pendientePongamos Error(h) = C hp, entonces si hacemos cálculos para distintos valores

de h obtenemos los pares hj, Error(hj)j y si tomamos los hj en el rango adecuadopodemos ver claramente el efecto de cada uno de los términos de este error.

Se puede intentar hacer una gráfica con los valores hj, Error(hj)j e intentardeducir el comportamiento de una curva en la forma y = C xp pero el rango deescalas puede ser muy amplio (dependiendo del rango de h los valores del errorpueden pasar de 1010 a 10−14 por ejemplo). Por eso es mejor usar los logaritmos delerror, esto permite visualizar mejor los valores.

65 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 66: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

66 Capítulo 2 Método de Euler explícito

Teniendo en cuenta que

log(10) ≈ 2.3 ⇒ log(10±M) ≈ ±M ∗ 2.3

la magnitud de los errores (su logaritmo) se puede deducir de los valores en el ejeOY. En particular, tenemos que

log(10−15) ≈ −35

luego cuando en el eje OY alcanzamos aproximadamente el valor negativo −35 elerror es del orden de 10−15 y estamos cerca del cero del computador. Tomandoentonces logaritmos:

Error(h) ≈ C hp ⇒ log(Error(h)) ≈ p log(h)

y el orden p del error coincide con la pendiente de la recta sobre la que caenestos datos.

Como h = T N−1 también se puede usar Error(N) ≈ C N−p y obtener

log(Error(N)) ≈ −p log(N).

Es decir, los datos log(hj), log(Error(hj))j o los datos log(Nj), log(Error(Nj))jvisualmente deben de parecerse a una recta de pendiente p o −p respectivamente.

Ejemplo 40 En la Figura 2.4 se ven las rectas de pendientes para métodos deorden 1,2,3 y 4 visualizadas sobre OX positivo o negativo, dependiendo de escribirE(h) = C hp o E(N) = C N−p y tomar logaritmos. En la tercera gráfica se ve elefecto de trabajar con errores por debajo de la precisión del computador. Se ve comolas rectas para orden 3 y 4 pierden la pendiente antes que las de orden 1 y 2.Teniendo en cuenta que

log(10) ≈ 2.3 ⇒ log(10±M) ≈ ±M ∗ 2.3

la magnitud de los errores (su logaritmo) se puede deducir de los valores en el ejeOY. En particular, tenemos que

log(10−15) ≈ −35

luego cuando en el eje OY alcanzamos aproximadamente el valor negativo −35 elerror es del orden de 10−15 y estamos cerca del cero del computador.

2.5. Convergencia de Euler explícitoDefinición 41 Si yhnn es la solución obtenida por el esquema entenderemos porerror global en el tiempo thn como la diferencia

ehn = y(thn)− yhn.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 66

Page 67: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.5. Convergencia de Euler explícito 67

Figura 2.4: Rectas de pendientes para métodos de orden 1,2,3 y 4 visualizadas sobreOX positivo o negativo. En la tercera gráfica se ve el efecto de trabajar con errorespor debajo de la precisión del computador. Se ve como las rectas para orden 3 y 4pierden la pendiente antes que las de orden 1 y 2.

67 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 68: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

68 Capítulo 2 Método de Euler explícito

Figura 2.5: Interpretación gráfica del método de Euler explícito. Los trazos rectosse construyen con Euler mientras que la curva continua es la solución exacta. Encada vertical tn se ve el error local en el trazo grueso y el resto depende de aplicarel esquema en puntos originales distintos. Esta figura se conoce como el abanicode Lady Windermere, nombre dado por Gerhard Wanner [12] en los años 1980inspirado en la obra homónima de Oscar Wilde.

Vamos a caracterizar el error global cometido en términos del parámetro h quedefine la partición del intervalo temporal. Nuestro objetivo es conseguir un errorque dependa de h y que tienda a cero con h. La rapidez con la que lo haga conrespecto a h indica el orden del método.

No es evidente como estimar este error pero si nos fijamos en la Figura 2.5podemos tener una idea de como proceder. Cada error global en un instante tn sepuede representar por el segmento vertical que une yn con y(tn). Este segmentose puede descomponer en:

1. El trazo grueso vertical es el error de aplicar el esquema numérico en elpunto exacto y(tn) y se dice que es el error local que genera el esquema enun paso si no hay error inicial en ese paso.

2. El resto de segmentos de trazo fino surgen por aplicar el esquema numé-rico en puntos previos distintos. Todos estos segmentos se pueden controlarusando la estabilidad del esquema numérico.

Esta segunda parte es el error generado por el esquema cuando se empezó en puntosdistintos en algun paso previo. Por ejemplo, en la vertical t3 queremos estimar elerror y(t3) − y3. Entonces, el primer trazo grueso es el error cometido por lanzarel esquema desde y(t2) mientras que los dos segmentos restantes son la suma deerrores cometidos por realizaciones del esquema en puntos iniciales distintos.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 68

Page 69: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.5. Convergencia de Euler explícito 69

Por lo tanto, la calidad de la aproximación que hemos realizado depende de dosaspectos:

1. La propagación por el esquema numérico de los errores que se cometen encada paso de cálculo (la amplitud de esta propagación depende del métodonumérico usado y de la longitud h usada).

2. La talla de los errores locales cometidos en cada paso (se computan suponiendoque y(tn) por yn y dependen del método numérico usado)

estas dos nociones se denominan estabilidad y consistencia respectivamente yson fundamentales en todos los métodos numéricos para ecuaciones diferenciales.Vamos a describir estas ideas en términos matemáticos.

2.5.1. Consistencia del esquema numéricoSi en el punto y(tn) aplicamos el esquema, entonces nuestro resultado es

yn+1 = y(tn) + hf(tn, y(tn))

y el error cometido al aproximar en el punto tn + h = tn+1 es

y(tn+1)− yn+1 = y(tn+1)− y(tn)− hf(tn, y(tn)).

Este valor se llama error local y lo representamos por l(t⋆;h) para un puntocualquiera t⋆ + h con h > 0. Tenemos la definición general

Definición 42 Error de consistencia local en un punto t⋆ + h generado por elesquema numérico con paso h es el error que se comete al aplicar el esquema sobrela solución exacta, y(t⋆), en el punto t⋆, para aproximar el valor en t⋆+h, es decir,para aproximar el valor y(t⋆ + h).

En nuestro caso

l(t⋆;h) = y(t⋆ + h)− y(t⋆) + h f(t⋆, y(t⋆)).

Observación 32 En general, el error local se puede entender como lo que lefalta al esquema para que la solución exacta lo cumpla cuando se parte delvalor exacto.

El valor l(tn;h) = 12h2y′′(ξn) es el residuo, o el error local, y se puede interpretar

como el resultado de:

Suponer que se parte del punto exacto y se da un paso en el esquema, es decir,yn = y(tn) y entonces

l(tn;h) = y(tn+1)− y(tn) + h f(tn, y(tn)).

69 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 70: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

70 Capítulo 2 Método de Euler explícito

O lo que es lo mismo, pretender que la solución continua cumpla el esquemanumérico y ver el error que queda

y(tn+1) = y(tn) + h f(tn, y(tn)) + l(tn;h).

En este caso y gracias al desarrollo de Taylor tenemos

l(t⋆;h) =h2

2y′′(ξh⋆ ), ξh⋆ ∈ (t⋆, t⋆ + h).

Pero y′′(t) es la segunda derivada de la función que buscamos y, por lo tanto, esdesconocida, podemos solventar esta dificultad escribiendo y′′ en términos de f ysus derivadas:

y′′(t) = ft(t, y(t)) + f(t, y(t))fy(t, y(t))

Como estamos tomando f ∈ C1 si suponemos que la solución (t, y(t)) para t ∈[t0, t0 + T ] se encuentra en una región acotada R ⊂ R2 del plano (t, y) podemosdeterminar una constante

M = max(t,y)∈R

|ft(t, y) + f(t, y)fy(t, y)|

y entonces escribir para cualquier valor de t⋆

l(t⋆;h) ≤h2

2M = O(h2).

En general, se puede hablar del máximo de los errores locales en todo el intervalo[t0, t0 + T ] y en este caso es

l(h) = maxt

l(t, h) =h2

2M = O(h2), h → 0+.

Ejemplo 43 Se puede acotar una función solución del problema de Cauchy y susderivadas sin conocerla explícitamente. Por ejemplo

y′(t) = sin(ey(t)), t ∈ [0, 1], y(0) = 0.

ya nos dice que |y′(t)| ≤ 1. Además, como

y(t) = 0 +

∫ t

0

y′(s)ds

entonces |y(t)| ≤ t ≤ 1. Además, al derivar la ecuación

y′′ = cos(ey(t))ey(t)sin(ey(t))

de donde |y′′(t)| ≤ e.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 70

Page 71: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.5. Convergencia de Euler explícito 71

Observación 33 El valor preciso de esta acotación no interesa desde el punto devista práctico computacional.

Como aplicamos el esquema en cada punto tj de la partición y tenemos N puntoses razonable pensar que tendremos un error parecido al producto de N por l(h).Esto es lo que definimos ahora

Definición 44 Diremos que un esquema numérico es consistente cuando paracada partición, caracterizada por h, la suma de los errores locales tiende a cero:

N(h)−1∑j=0

l(t(h)j ;h) → 0, h → 0, (N (h) = T/h, t

(h)j = t0 + j h).

Si trabajamos con el error local máximo l(h) necesitamos entonces tener

N (h)l(h) → 0 h → 0

pero como N (h) = T/h esto implica de que debe ser

1

hl(h) → 0 h → 0

por lo que la consistencia de un esquema obliga a tener l(h) = O(h1+p), h → 0para algún valor p > 0, normalmente este p es un entero y en nuestro caso esp = 1.Para estimar el resto de errores usamos la estabilidad del esquema numérico.

2.5.2. Estabilidad del esquema numéricoDatos de partida distintos en un esquema numérico de cálculo generarán valores

finales distintos y debemos controlar esta desviación. Esto es lo que se denomina elestudio de la estabilidad del esquema numérico.

Supongamos que damos un paso con dos valores iniciales distintos

un+1 = un + h f(tn, un)

vn+1 = vn + h f(tn, vn)

entonces para ξn entre un y vn tenemos

un+1 − vn+1 = un − vn + h (f(tn, un)− f(tn, vn)) = (1 + h∂y(tn, ξn))(un − vn).

El factor que relaciona la diferencia en el paso n con la diferencia en el paso n+ 1es

|1 + h∂yf(tn, ξn)|.

71 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 72: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

72 Capítulo 2 Método de Euler explícito

Figura 2.6: Idea del comportamiento y de su desviación del método de Euler pro-gresivo cuando nos econtramos en sistemas contractivos o no.

Observación 34 Supongamos que ∂yf(tn, ξn) no es muy grande. Entonces

∂yf(tn, ξn) > 0 ⇒ 1 + h∂yf(tn, ξn) > 1.

Luego ∂yf > 0 es en principio malo puesto que amplifica el error previo mientrasque

∂yf(tn, ξn) < 0 ⇒ 1 + h∂yf(tn, ξn) < 1

y tener ∂yf < 0 es en principio bueno ya que ayuda a reducir errores.

Definición 45 Podemos decir que el carácter de la ecuación diferencial es

expansivo si ∂yf > 0

contractivo si ∂yf < 0

y como nuestro esquema numérico depende de f de una forma tan directa, podemosreproducir esta definición para el esquema, ver Figura 2.6

Definición 46 El esquema de Euler progresivo tiene un carácter

expansivo si ∂yf > 0

contractivo si ∂yf < 0

Vamos a ver la variación final en términos de la inicial. Si no tenemos mucho controlsobre ∂yf podemos simplemente acotarla y usar una desigualdad de tipo Lipschitz

|un+1 − vn+1| ≤ |un − vn|+ hLf |un − vn| = (1 + hLf )|un − vn|.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 72

Page 73: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.5. Convergencia de Euler explícito 73

Observación 35 A la desigualdad|un+1 − vn+1| ≤ (1 + hLf ) |un − vn|

se le denomina estimación de estabilidad.Iterando recursivamente llegamos a

|un+1 − vn+1| ≤ (1 + hLf )n+1 |u0 − v0|.

Como 1 + hLf > 1 siempre, no podemos hacer más que intentar compensar n y hya que siempre es tn = nh ≤ T . Por lo tanto, usamos que 1 + x ≤ ex para concluir

|un − vn| ≤ etn−t0λ |u0 − v0| ≤ eT λ |u0 − v0| n = 0, 1, 2, ..., N (2.3)que es la relación de estabilidad clásica y básica para el método de Euler explícito.Si |uh

0 − vh0 | → 0 entonces |uhn − vhn| → 0 para todo n = 0, 1, ...., N = T/h.

Observación 36 Aquí no nos hemos fijado en el signo de ∂yf . Luego es una esti-mación válida en cualquier caso pero también puede estar muy lejos del valor realque se quiere acotar si ∂yf es negativa.

Recordemos, se fija T > 0 y nuestro intervalo de cálculo va a ser [t0, t0 + T ].Introducimos una partición de [t0, t0+T ] que suponemos uniforme, para simplificar,tn = t0 + nh para h = T/N con n = 0, 1, 2, ..., N y la llamaremos Πh, esto es

Πh = t0 < t1 < ... < tN = t0 + T, tn = thn = t0 + nh, h = T/N.Vamos a comparar una función continua, la solución, en los puntos y(thn) con unosvalores discretos calculados en los puntos de la discretización yhn y buscamos quesea

yhn ≈ y(thn).

Estamos en disposición de estimar el error global en cada paso dado poren = y(tn)− yn.

Para simplificar, definimos el error global e = maxn |en| siendoen = y(tn)− yn, n = 0, 1, 2, .., N

y vamos a estudiar su comportamiento cuando reducimos el valor de h, o lo quees lo mismo, aumentamos N , pero manteniendo siempre hN = T . Recordemos ladefinición de convergenciaDefinición 47 Convergencia y orden: Diremos que el método es convergentecuando

max1≤n≤Nh

|y(thn)− yhn| → 0, h → 0+, h = T/N (h)

siendo thn = t0 + hn. Cuando además para p ≥ 1

max0≤n≤N(h)

|y(h)n − y(thn)| = O(hp), h → 0+

se dice que converge con orden p.

73 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 74: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

74 Capítulo 2 Método de Euler explícito

Figura 2.7: Avanzando el esquerma numérico desde punto inicial y0 distinto al datoy(t0) del problema de Cauchy.

2.5.3. Estimación de error usando la gráficaObservación 37 Añadir una poligonal a la Figura 2.5 por la parte inferior querepresente la solución generada por el esquema que inicia en y0 = y(t0) y suponerque la última vertical es tn+1. Por ejemplo, ver Figura 2.7 para el caso n = 4

De acuerdo a la Figura 2.5 vamos a acotar el error y(thn+1)−yhn+1 o, simplificando lanotación, y(tn+1) − yn+1. El primer error generado en el paso tn+1 aparece cuandosuponemos que y0 = y(0) y es el error producido por el esquema numérico alempezar en los puntos distintos y0 e y(0) (este error se puede visualizar como elprimer segmento de trazo fino empezando desde la parte inferior hacia arriba). Deacuerdo a la estabilidad del esquema numérico se acota por

(1 + hLf )n+1 |y0 − y(t0)|

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 74

Page 75: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.5. Convergencia de Euler explícito 75

A continuación, el siguiente segmento vertical proviene de aplicar el esquema nu-mérico en los dos primeros (de arriba a abajo) puntos iniciales en la vertical t1, sudistancia es el error local l(t1, h). Por lo tanto, el segundo segmento de trazo fino(de abajo a arriba) viene a estar controlado por

(1 + hLf )n |l(t1;h)|.

De forma análoga, el tercero por

(1 + hLf )n−1 |l(t2;h)|

y así sucesivamente. El último segmento, el de trazo grueso es simplemente el errorlocal l(tn;h). Por lo tanto, el error global y(tn+1)− yn+1 está acotado por

|y(tn+1)− yn+1| ≤ (1 + hLf )n+1 |y0 − y(t0)|+

n+1∑j=1

(1 + hLf )n−j+1|l(tj;h)|

donde se ve claramente que:

Podemos ver que el error total en el paso n está controlado por

la propagación por parte del esquema numérico del error inicial

(1 + hLf )n |y0 − y(t0)|

observar que el número de pasos donde este error aparece coincide con lapotencia n del factor 1+ hLf . Es decir, con el número de pasos que lleva esteerror introducido en el esquema.

La propagación por parte del esquema numérico de los errores lo-cales y su suma es

n+1∑j=1

(1 + hLf )n−j+1|l(tj;h)|,

observar también que el número de pasos donde este error aparece coincidecon la potencia n− j+1 del factor 1+ hLf . Es decir, con el número de pasosque lleva este error introducido en el cálculo del esquema.

La estabilidad del esquema numérico equivale a decir que todos los coeficientes(1 + hLf )

j para j = 1, 2, ..., N = T/h están uniformemente acotados de una formaindependiente de h, esto es,

(1 + hLf )j ≤ ejhLf ≤ eTLf .

75 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 76: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

76 Capítulo 2 Método de Euler explícito

Por otro lado, su acumulación N = T/h veces también debe de estarlo y para esose usa que l(h)/h = O(h) al menos.

Ahora debemos usar la consistencia del esquema numérico para controlarlos errores locales de una forma eficiente y que permita acotar su suma. Usando elmáximo de los errores locales tomamos

maxt

|l(t;h)| = l(h)

y en nuestro caso de Euler explícito sabemos que tenemos

l(h) = O(h2) = h2M

donde M = M(f) o M = M(y′′). Entonces

|y(tn+1)− yn+1| ≤ (1 + hLf )n+1 |y0 − y(t0)|+ l(h)

n+1∑j=1

(1 + hLf )n−j+1.

Hacemos la suma geométrica del segundo miembro, y usamos que 1 + hLf ≤ ehLf

para poder controlar h y n en términos del producto nh:

|y(tn+1)− yn+1| ≤ (1 + hLf )n+1|y0 − y(t0)|+

(1 + hLf )n+1 − 1

1 + hLf − 1l(h)

≤ (1 + hLf )n+1|y0 − y(t0)|+

(1 + hLf )n+1 − 1

hLf

l(h)

≤ eh(n+1)Lf |y0 − y(t0)|+eh(n+1)Lf − 1

Lf

l(h)

h

Observamos entonces como tenemos que poder controlar el valor h−1l(h), es decir, elvalor Nhl(h), las acumulaciones N = T/h = O(h1−1) veces del error de consistencialocal. Entonces, como en el caso de Euler explícito esto ocurre así, tenemos

|y(tn+1)− yn+1| ≤ e(tn+1−t0)Lf |y0 − y(t0)|+e(tn+1−t0)Lf − 1

Lf

hM

≤ eTLf |y0 − y(t0)|+eTLf − 1

Lf

hM

hemos usado nh = tn − t0 ≤ T y sirve para n = 0, 1, 2, ..., N − 1.Vemos aquí que la acumulación de errores locales ha generado un coeficiente

delante del máximo de los errores locales en la forma

etn+1Lf − 1

hLf

≤ eTLf − 1

hLf

= O(1

h), h → 0+

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 76

Page 77: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.5. Convergencia de Euler explícito 77

esto es razonable puesto que tomamos el mayor coeficiente y lo sumamos N veces,pero N ≈ h−1. Así que nos viene imprescindible y necesario el hecho de que elerror local máximo sea de la forma O(h1+p) con p > 0 para poder así controlar estecoeficiente. Finalmente, tenemos

|y(tn+1)− yn+1| ≤ eTLf |y0 − y(0)|+ eTLf − 1

Lf

hM.

Si|y0 − y(t0)| = |yh0 − y(t0)| ≤ K1 h

llegamos a

|y(tn+1)− yn+1| ≤ K h, n = 0, 1, 2, .., N − 1

dondeK = eTLfK1 +

eTLf − 1

Lf

M

esto es decir

|y(tn)− yn| = O(h), h → 0+, ∀n = 0, 1, 2, .., N.

Podemos entonces concluir que el método de Euler explícito converge con orden 1con respecto al parámetro h. Hemos probado

Teorema 48 Convergencia del método de Euler explícito Supongamos quef es globalmente Lipschitz con f ∈ C1, luego y ∈ C2. Si el error inicial e0 cumplee0 = O(h) entonces

en = O(h), n = 1, 2, ..., N.

Lo que es lo mismo, existe una constante C > 0 tal que

|en| ≤ C h, (h → 0+), n = 1, 2, ..., N

para N = T/h por lo que el método de Euler explícito converge con orden 1 conrespecto al parámetro h. La constante C es proporcional a eTLf por lo que es ex-tremadamente grande para valores moderados del producto TLf , aunque puede serprecisa.

Observación 38 Como

l(t⋆;h) =h2

2y′′(ξh⋆ ), ξh⋆ ∈ (t⋆, t⋆ + h)

va a ser imposible que el error del método de Euler sea mejor que O(h). Esto soloocurrirá si y′′(t) ≡ 0, es decir, si la solución buscada es de la forma y(t) = a t+ b.Entonces el método de Euler explícito es exacto en cada paso y los errores vendran delos datos iniciales o de las imprecisiones que se cometan en cada paso del cómputo.

77 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 78: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

78 Capítulo 2 Método de Euler explícito

2.5.4. Estimación de error usando TaylorSe obtiene el mismo resultado sin recurrir al esquema gráfico, pero sin olvidarlo,

usando el desarrollo de Taylor:

Teorema 49 El método de Euler explícito converge con orden 1 con respecto a h.

Dem: Tomemos una curva cualquiera dentro del campo de velocidades, w = w(t),esto es, la curva w(t) cumple

w′(t) = f(t, w(t)), w(t0) dado.

El esquema es:Dado y0 ≈ w(t0) obtener

yn+1 = yn + h f(tn, yn), n = 0, 1, 2, ...N − 1.

Sabemos que w ∈ C2([t0, t0 + T ]) ya que suponemos f ∈ C1 al menos. De acuerdoal desarrollo de Taylor tenemos

w(tn+1) = w(tn) + hw′(tn) +1

2h2w′′(ξn), tn < ξn < tn+1,

es decir,

w(tn+1) = w(tn) + h f(tn, w(tn)) +1

2h2w′′(ξn), tn < ξn < tn+1.

El valor l(tn;h) =12h2w′′(ξn) es el residuo, o el error local, que surge cuando se

pretende que la solución exacta cumpla el esquema numérico

w(tn+1) = w(tn) + h f(tn, w(tn)) + l(tn;h)

Si ponemos w⋆n+1 = w(tn) + h f(tn, w(tn)) entonces w(tn+1) = w⋆

n+1 + l(tn;h).En cada iteración tenemos

en+1 := w(tn+1)− yn+1 = w(tn) + hf(tn, w(tn)) +1

2h2w′′(ξn)− yn − hf(tn, yn).

Ya se puede agrupar como

en+1 := w(tn+1)− yn+1 = w(tn)− yn + hf(tn, w(tn))− f(tn, yn)+1

2h2w′′(ξn)

y acotar, pero también se puede escribir, siendo lo mismo pero con una interpreta-ción geométrica más clara,

en+1 := w(tn+1)− yn+1 = (w(tn+1)− w⋆n+1) + (w⋆

n+1 − yn+1)

de donde

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 78

Page 79: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.5. Convergencia de Euler explícito 79

w(tn+1)−w⋆n+1 representa el error producido por el esquema numérico en un

sólo paso

w⋆n+1 − yn+1 representa la propagación del error acumulado en el paso tn por

el esquema numérico de todos los errores previos generados por los errores deconsistencia locales.

Necesitamos la convergencia a cero de ambos sumandos.Observemos que

en+1 = en + hf(tn, w(tn))− f(tn, yn)+ l(tn;h)

y usando simplemente la propiedad de Lipschitz sobre f

|en+1| ≤ (1 + hLf ) |en|+ l(h)

donde l(h) = maxt0<tn<t0+T |ln| ≤ maxt0<t<t0+T |w′′(t)|h2/2 = O(h2). Entonces

|e1| ≤ (1 + hLf ) |e0|+ l(h)

luego

|e2| ≤ (1 + hLf ) |e1|+ l(h) ≤ (1 + hLf )2|e0|+ ((1 + hLf ) + 1)l(h)

y recursivamente llegamos a

|en+1| ≤ (1 + hLf )n+1|e0|+ (1 + (1 + hLf ) + (1 + hLf )

2 + ...+ (1 + hLf )n)l(h).

de donde fácilmente, usando la suma geométrica

|en+1| ≤ (1 + hLf )n+1|e0|+

(1 + hLf )n+1 − 1

(1 + hLf )− 1l(h),

es decir,

|en+1| ≤ (1 + hLf )n+1|e0|+

(1 + hLf )n+1 − 1

2Lf

maxt0<t<t0+T

|w′′(t)| h,

que se puede terminar de acotar como

|en+1| ≤ eL(tn+1−t0)|e0|+eLf (tn+1−t0) − 1

2Lmax

t0<t<t0+T|w′′(t)| h

cota creciente en cada tiempo de cálculo tn+1.Tomando la mayor de las cotas posible, es decir, para tn+1 = t0+T nos encontramoscon para 0 ≤ n ≤ N − 1 con

|en+1| ≤ eLT |e0|+eLT − 1

2Lmax

t0<t<t0+T|w′′(t)| h.

79 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 80: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

80 Capítulo 2 Método de Euler explícito

Observar que hasta aquí no se ha planteado ninguna restricción sobre hpuesto que se va a considerar el límite h → 0.

Al considerar el primer término también para tener convergencia necesitamosentonces |e0| → 0 para h → 0. Y si además |e0| ∼ C0 h, generamos un error tambiénproporcional a h. Así podemos respetar la potencia h que sale del segundo términoy concluir

|en| ≤ C h, 0 ≤ n ≤ N = T/h

luego el método es de orden uno. La constante C ∼ eTL sobreestima el error envarios ordenes de magnitud y no debe usarse en la práctica ya que puede ser de-masiado pesimista. Pero desde el punto de vista teórico ayuda a indicar el ordende convergencia. Observar que si no se respeta la potencia de h en el error inicial,por ejemplo, |e0| ∼ C0 h

1/2, no conseguimos que el error global sea O(h) puesto quetendremos algo como C0 h

1/2 + C1 h = O(h1/2).

Aquí observamos las dos fuentes de error que dependen de nosotros (una vezfijado el método numérico, en este caso Euler Explícito)

1. el error inicial |e0|,

2. la elección de h y por lo tanto de la porción de error O(h) generada por laacumulación de los errores locales.

Normalmente es el valor de h el que se fija e intentamos que el error sea descritoen términos de h. Por lo tanto, vamos a suponer que |e0| también depende de hy, observando el segundo término, parece razonable pedir, para alguna constanteC > 0 fija que sea

|e0| ≤ C h.

Esto es, que el error que cometamos esté controlado por h. Esto se abrevia usando

e0 = O(h), h → 0+

o diciendo que e0 converge a cero con orden 1 con respecto a h.

Corolario 50 Si e0 = O(h), h → 0+ entonces el método de Euler es de primerorden p = 1 con respecto al parámetro h > 0.

2.5.5. Observaciones sobre la convergenciaVarios puntos interesantes para la comprensión del resultado se pueden destacar.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 80

Page 81: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.5. Convergencia de Euler explícito 81

Observación 39 El uso de la constante de Lipschitz es la forma más usual depresentar el resultado de convergencia del método de Euler explícito. En el caso deun problema expansivo está ajustada a los cálculos mientras que en un problemadisipativo no distingue el decaimiento, la constante de Lipschitz es insensibleal signo. Realmente se usa una cota global de ∂yf y esta función puede variarmucho a lo largo de toda la región de cálculo (en el plano (t,y)).

Cuando ∂yf < 0 se puede usar 0 < 1 + h ∂yf < 1 para h lo suficientementepequeño y mejorar la estimación de error. Aunque no merece la pena el esfuerzo yse sigue usando |1+h ∂yf | ≤ 1+hLf obteniendo también convergencia en el límiteh → 0+. Esto da una cota de error que puede denominar, de forma despectiva, comoperteneciente a la era pre-computacional por los valores impracticables que sepueden generar en las constantes que aparecen. En todo caso, el camino es simpley, de forma coloquial podemos decir que como se trabaja poco, se recibe poco.

Si, por ejemplo, Lf = 10 y T = 3 el valor e30 ≈ 1013 no es manejable desdeel punto de vista práctico. Además, si e0 ≈ 10−4 (que puede ser razonable) resultaque la amplificación sólo de este error es e30|e0| ≈ 109. Por esto, se dice que es unaestimación de la era precomputacional: Si h → 0+ el método converge, pero deacuerdo a la estimación del error obtenido, el valor necesario de h para realizar unacomputación efectiva no es practicable.

Si por ejemplo, suponemos |e0| ≈ h tenemos para n = 0, 1, 2, ..., N − 1

|en+1| ≤ eTLf h+MeTLf − 1

Lf

h = O(h) h → 0+

luego de forma aproximada se tiene |en| ≈ eTLfh. Luego, para un error total menorque, por ejemplo, 10−3 con los datos anteriores debe ser h < 10−310−13 = 10−16 quees prácticamente el cero del computador.

Observación 40 Hemos perdido una potencia de h en el error local máximo debidoa la acumulación de errores locales. Esto tiene sentido puesto que cada error locales proporcional a h2 y necesitamos tomar desde t = t0 a t = t0 + T un número depasos igual a N = T/h cada uno de ellos de longitud h. Entonces la acumulaciónde N valores, cada uno de ellos proporcional a h2, esto es, O(h2), genera un errorglobal O(N h2) y como N = T/h nos quedamos con una contribución final al errorde la forma O(h). Esta acotación se consigue gracias a la estimación de esta-bilidad que tenemos a nuestra disposición ya que permite mantener las constantesde amplificación bajo control, aunque sean muy grandes.

Observación 41 Observar que si ∂yf ≤ 0 entonces tenemos una mejor estimaciónya que

en+1 = (1 + h∂yf)en + l(tn;h)

y si |1 + h∂yf | < 1, es decir,

h < 2/max|∂yf | (2.4)

81 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 82: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

82 Capítulo 2 Método de Euler explícito

entonces|en+1| ≤ |en|+ l(h)

|en+1| ≤ |e0|+1

2max

t0<t<t0+T|w′′(t)| h.

La restricción sobre h (2.4) se denomina de estabilidad.

Al ser el error de la forma E(h) ≈ C h si, por ejemplo, dividimos h entre 2 ycalculamos en una partición más fina entonces para el error tenemos

E(h

2) ≈ C

h

2≈ E(h)

2.

Por lo tanto, el error obtenido es el que teniamos antes pero dividido por 2.

Observación 42 Dos partes en la acotación del error :

El primer sumando contiene el efecto del error inicial. Este error se amplifi-ca debido a que se hace un cálculo iterativo

(1 + hLf )n+1|w(t0)− yh0 | ≤ e(tn+1−t0)Lf |w(t0)− yh0 | ≤ eTLf |w(t0)− yh0 |.

El segundo término contiene el efecto del residuo en cada paso. Estos residuosse acumulan y van apareciendo debido a que la solución exacta buscada, w(t)no cumple con el esquema numérico planteado (le sobra el residuo)

(1 + hLf )n+1 − 1

2Lf

maxt0<t<t0+T

|w′′(t)| h ∼ eTLfh

Se ve claramente que este término no aparece si w′′ ≡ 0 y que si buscamos unacurva solución z(t) distinta a la curva w(t) el valor constante delante de h cam-bia puesto que aparecerá maxt0<t<t0+T |z′′(t)| en vez de maxt0<t<t0+T |w′′(t)|.Aunque esto no cambia el orden uno de conveergencia.

El equilibrio óptimo en términos de potencias de h se da cuando |w(t0)−yh0 | =O(h) puesto que el segundo sumando no se puede mejorar y es O(h).

Esto quiere decir que el esfuerzo en aproximar el error inicial es suficientecon que sea igual al del orden del método usado, en este caso O(h).

Observación 43 Cuando w′′(t) ≡ 0 (w(t) = a+b t) entonces la solución particularbuscada w(t) cumple el esquema de forma exacta, esto es,

w(tn+1) = w(tn) + h f(tn, w(tn)), ∀n ≥ 0.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 82

Page 83: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.5. Convergencia de Euler explícito 83

Por lo tanto, si tomamos y0 = w(t0) entonces yn+1 = w(tn+1) para todo n ≥ 0. Encambio, si y0 = w(t0) sólo nos queda la primera parte de la estimación de error ytenemos la acotación

|w(tn+1)− yn+1| ≤ (1 + hLf )n+1|w(t0)− y0| ≤ e(tn+1−t0)Lf |w(t0)− y0|.

Esto equivale a lanzar el esquema desde dos puntos iniciales distintos w(t0) e y0 yestimar cuanto se alejan entre sí los valores obtenidos.

Podriamos exigir |w(0)−y0| muy pequeño en relación con h (por ejemplo O(h2)),pero cuando aparece el otro término de error no podemos mejorar la potencia unosobre h y será esta la que mande, ya que O(h2) +O(h) = O(h).

Observación 44 Si el error inicial es cero |w(t0)− y0| = 0 tendremos

|en+1| ≤ Cn+1 h

donde

Cn+1 =(1 + hLf )

n+1 − 1

2Lmax

t0<t<t0+T|w′′(t)| ≤ e(tn+1−t0)Lf − 1

2Lf

maxt0<t<t0+T

|w′′(t)|

crece conforme se avanza en tiempo, puede tener un valor máximo dado por (usando1 + x ≤ ex)

C = maxt0<t<t0+T

|w′′(t)| eLfT − 1

2Lf

y depende de

del campo de velocidades presente a través de Lf cota superior de ∂yf(t, y)

de la curva solución buscada dentro de este campo mediante w′′(t)

de la longitud del intervalo de tiempo pedido T

y finalmente del esquema numérico usado que lo amalgama todo generando elerror local en cada punto.

Resumiendo, cuando el error inicial es cero

|en| ≤ C h = O(h).

Si además, en el caso muy particular de tener w′′ = 0 tendremos en = 0 paracualquier n ya que el esquema será exacto si partimos del dato incial exacto.

83 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 84: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

84 Capítulo 2 Método de Euler explícito

Observación 45 El error local o residuo: El error l(tn;h) =12h2y′′(ξn) que le que-

da a la solución continua cuando se quiere cumplir con ella el esquema numérico

y(tn+1) = y(tn) + h f(tn, y(tn)) + l(tn;h)

es el que marca el orden del método: error local O(h2) implica error global O(h).Más adelante buscaremos esquemas donde este residuo sea más pequeño, esto es,tenga una potencia de h más grande. En general, el residuo tendrá la forma

l(h) ∼ C hp+1

donde C es una constante que dependerá de derivadas de alto orden de la funciónsolución exacta buscada y el exponente p + 1 marcará el orden p. La razón delp + 1 para quedarnos en p es que nos hará falta una potencia de h para controlarlas acumulaciones durante los N pasos de los errores que provienen del residuo, yrecordemos que N ∼ h−1. Por esto, si el residuo es O(hp+1) el error del método seráO(hp).

Observación 46 El uso exclusivo de la constante de Lipschitz tanto parael caso expansivo como contractivo es la forma más usual de presentar elresultado de convergencia del método de Euler explícito. En el caso de un problemaexpansivo está ajustada a los cálculos mientras que en un problema disipativo nodistingue el decaimiento, la constante de Lipschitz es insensible al signo. Porlo tanto, en esta demostración de convergencia se pueden encontrar mejores cotassuperiores si cuando se usa el Teorema del Valor Medio y nos encontramos con∂yf < 0.

2.6. EjemplosQue un método sea convergente con orden p quiere decir que su error global

está acotado en la forma O(hp) para todas las soluciones regulares del campo. Yademás no se puede mejorar. El error local que se comete es O(hp+1) y no menor,entiéndase, no se puede mejorar en la forma O(hq+1) con q > p.

Se puede describir como que para cualquier función w(t) solución de un campode velocidades con la regularidad suficiente, si denotamos por Ew(t)(h) el errorcometido se cumple siempre

Ew(t)(h) ≤ O(hp), ∀w(t) solución suficientemente regular.

Además, existe al menos una solución regular w(t) y C = 0 tal que

Ew(t)(h) = C hp ⇒Ew(t)(h)

hp+1=

C

h→ +∞

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 84

Page 85: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.6. Ejemplos 85

es decir donde no se puede hacer más grande la potencia p.Esta regla sólo se ve alterada en el caso particular y raramente posible donde

se busque la solución que anula el residuo local l(t;h) en todo punto. En ese casoparticular la solución buscada satisface de forma exacta el esquema numérico y elerror es de hecho cero. Exceptuando este caso, siempre tendremos O(hp).

Podemos observar que el error de truncatura en el método de Euler dependede y′′(t). Por lo tanto, si esta función es distinta de cero debemos de esperar queel error sea del orden del indicado por este error de truncatura. En caso contrario,y′′(t) ≡ 0 lo que tenemos es que la solución buscada es una curva lineal y el métodola reproduce de forma exacta si empieza en el valor exacto y(t0).

Vamos a necesitar el siguiente resultado técnico fácilmente comprobable:

Lema 1 La función

f(x) =log(1 + x)

x, x > −1

cumplelog(1 + x)

x= 1− x

2+O(x2), x → 0.

Esto se ve fácilmente ya que mediante un desarrollo de Taylor bastante sencillo

1

1 + x= 1− x+ x2 +O(x3), |x| < 1.

Integrando la igualdad entre 0 y x y dividiendo por x se llega al resultado.

Observación 47 Tenemos que

eTLf h ≤ ϵ ⇒ h < e−TLf ϵ

luego conseguir que esta estimación de error sea de utilidad práctica para obtenererrores pequeños implica tener h extremada y exponencialmente pequeño. Esto llevaa valores de n muy grandes.

Ejemplo 51 Caso donde la estimación de error SI es ajustada: Sea f(t, y) =λ y con λ > 0. Entonces Lf = ∂yf(tn, ξn) = λ. La solución exacta es y(t) = eλ t

si usamos y(0) = 1; el esquema de Euler explícito en un intervalo [0, T ] usando Npuntos y tomando h = T/N es

yn+1 = yn + hλ yn

para n = 0, 1, 2, ..., N − 1, o lo que es lo mismo,

yn+1 = (1 + hλ) yn

85 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 86: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

86 Capítulo 2 Método de Euler explícito

recursivamente queda como

yn = (1 + hλ)n, 0 ≤ n ≤ N.

Podemos calcular el error en t = nh

eλt − (1 + hλ)n = eλt − en log(1+hλ) = eλt − enhλ log(1+hλ)/(hλ)

= eλt − etλ log(1+hλ)/(hλ).

pero sabemos quelog(1 + x)

x= 1− x

2+O(x2), x → 0.

de donde para h lo suficientemente pequeño, tenemos

eλt − (1 + hλ)n = eλt − etλ(1−hλ/2+O(h2λ2)) = eλt − etλ−thλ2/2+tO(h2λ3)

= eλt(1− e−thλ2/2+O(h2λ3)) ≈ eλt(thλ2/2)

es decir, para t = nh

eλt − (1 + hλ)n ≈ 1

2eλt tλ2 h = K h, h → 0+, (K =

1

2eλt tλ2).

Luego en el caso f(t, y) = λy > 0 con λ > 0 resulta que la estimación de error esajustada y la constante, así como el error, ambos crecen de forma expo-nencial, siendo esto correcto.

Si nos fijamos en un intervalo [0, T ] tendremos si t = nh que

eλt − (1 + hλ)n ≤ 1

2eλT Tλ2 h, ∀n = 0, 1, 2, ..., N = T/h

luego para t fijo necesitamos h exponencialmente pequeño y n exponencialmentegrande si queremos tener un error pequeño en eλt − (1 + hλ)n. Así que, inclusocuando es correcta, puede ser inútil desde el punto de vista práctico ya que el errorque se comete con el método de Euler explícito en estos casos puede ser muy grande.

Ejemplo 52 Caso donde la estimación NO es ajustada: Sea f(t, y) = −λ ycon λ > 0. Entonces Lf = λ. pero ∂yf(tn, ξn) = −λ. La solución exacta es y(t) =e−λ t; el esquema de Euler explícito en un intervalo [0, T ] usando N puntos y tomandoh = T/N es

yn+1 = yn − hλ yn

para n = 0, 1, 2, ..., N − 1, o lo que es lo mismo,

yn+1 = (1− hλ) yn

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 86

Page 87: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.6. Ejemplos 87

recursivamente queda como

yn = (1− hλ)n, 0 ≤ n ≤ N.

La estimación de error en t = nh nos dice

|e−λt − (1− hλ)n| ≈ C eλt h, h → 0+.

Pero podemos calcular el error en t = nh (y0 = 1): Supongamos h < 1/λ paragarantizar 0 < 1− hλ < 1. Entonces

e−λt − (1− hλ)n = e−λt − en log(1−hλ) = e−λt − e−nhλ log(1−hλ)/(−hλ)

= e−λt − e−tλ log(1−hλ)/(−hλ).

de donde para h lo suficientemente pequeño, tenemos

e−λt − (1− hλ)n ≈ e−λt − e−tλ(1−hλ/2) = e−λt − e−tλ+thλ2/2

= e−λt(1− ethλ2/2) ≈ e−λt(−thλ2/2)

es decir,

e−λt − (1− hλ)n ≈ −1

2e−λt tλ2 h, h → 0+.

Luego en el caso f(t, y) = −λy > 0 con λ > 0 resulta que el error decrece de formaexponencial mientras que la estimación de error obtenida usando la constante deLipschitz crece de forma exponencial. Por lo tanto, aquí la estimación de error estotalmente inservible.

Observación 48 Si para h > 0 fijo se quiere que el cálculo yn = (1 − hλ)n separezca a y(tn) = e−λtn, en el sentido de que decaiga puesto que así lo hace e−λtn,tenemos que exigir h < 2/λ y esto es la restricción de estabilidad sobre h.

Observación 49 En el caso y(tn) = eλtn no hace falta imponer ninguna restricciónsobre h puesto que los valores, tanto continuos eλtn, como discretos (1+hλ)n, crecende forma exponencial.

Observación 50 Estos dos ejemplos se pueden comprobar computacionalmente conel siguiente pseudo-código cambiando el valor de λ de acuerdo a la situaciónbuscada

Dados t0, T , N , y0 = 1, f(t, y) = λ ∗ yCalculamos h = T/Nt = 0 : h : T ;Para n = 0 hasta N − 1

87 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 88: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

88 Capítulo 2 Método de Euler explícito

calcular yn+1 = yn + hλ ynFin//Constante de error en cada t(n) usandocte = max(exp(t)− y)/h;Dibujar puntos (t, cte)

Ejemplo 53 Se va a considerar el límite h → 0 pero se debe calcular con h fijoy positivo. Para este método no vale cualquier valor de h. Es interesante observarcomo se comporta el esquema numérico para un valor fijo de h puesto que sabemosque hay convergencia cuando h → 0. Pero esto es la teoría y necesitamos el aspectopráctico de la implementación en el computador del esquema. Volvamos al problemadonde sabemos que la solución exacta

y(t) = e−λt, t > 0

tiene un comportamiento decreciente de manera uniforme y rápida, cuanto másgrande λ más rápido. Sabemos que

yn = (1− hλ)n, n ≥ 0

Los valores calculados sólo reproducen el comportamiento cuantitativamente si 0 <h < 2/λ puesto que entonces

|1− hλ| < 1

yyn = (1− hλ)n, n ≥ 0

decae, aunque se pueden producir oscilaciones decrecientes que no es lo que hacela solución exacta. Si pedimos además que sea 0 < h < 1/λ sí que obtenemos elcomportamiento cuantitativo y cualitativo de decaimiento sin oscilaciones puestoque

0 < 1− hλ < 1

y se garantiza un decaimiento uniforme de un valor inicial positivo, tal y como haceel problema continuo, ver Figura 2.8. Evidentemente, en el caso h > 2/λ los valorescalculados divergen de los buscados. Resumiendo, tenemos tres situaciones

1. h > 2/λ los valores calculados divergen aunque su crecimiento está controladopor C h donde C ∼ eLfT , cota nada útil pero matemáticamente cierta.

2. 0 < h < 2/λ los valores calculados reproducen el comportamiento cuantitati-vamente pero hay oscilaciones,

3. 0 < h < 1/λ los valores calculados reproducen el comportamiento cuantitativay cualitativamente.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 88

Page 89: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.6. Ejemplos 89

Figura 2.8: Euler explícito para y′ = −λ y con λ = 32. Aproximaciones generadasde acuerdo a h > 2/λ, 0 < h < 2/λ ó 0 < h < 1/λ. Por defecto y para visualizarmejor se unen los puntos calculados con un trazo continuo, pero el cómputo sólogenera los puntos.

89 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 90: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

90 Capítulo 2 Método de Euler explícito

Ejemplo 54 Euler explícito no es O(h2) Para ver que el error no es O(h2), esdecir, no hay convergencia como h2 a cero, veamos el siguiente ejemplo. Aquíla segunda derivada es no nula y los cálculos se hacen a mano de forma simple:

w′(t) = t, w(0) = 0

con soluciónw(t) = t2/2.

Si tomamos como valor de inicio y0 = 0 y con tn = nh entonces se tiene que

y1 = y0 + ht0 = 0,

y2 = y1 + ht1 = h2,

y3 = y2 + ht2 = h2(1 + 2),...

yn = h2(1 + 2 + ...+ (n− 1)),

es decir,yn = t2n/2−

tn2h

de dondey(tn)− yn =

tn2h.

Para ver entonces la convergencia en un punto, ponemos t = tn fijo y se realiza ellímite para h → 0 y n → +∞ tal que hn = t fijo. Esto se representa por lımhn=t,esto es, hacemos h → 0 y n → +∞ tal que hn = t fijo. Entonces resulta que

lımhn=t

(y(tn)− yhn) = lımhn=t

th

2=

t

2lımhn=t

h = 0.

pero evidentemente

lımhn=t

y(tn)− yhnh

=t

2= 0

luego y(tn)− yhn = O(h) pero y(tn)− yhn = O(h2).

Observación 51 Sólo si w′′(t) ≡ 0 el orden lo marca el error inicial: En el méto-do de Euler explícito el residuo es proporcional a la segunda derivada. Por lo tanto,el orden se mejora si w′′(t) ≡ 0 y sólo en este caso. Pero no sólo es que se mejora...sino que en este caso es exactamente cero y la solución buscada cumple el esquemade forma exacta si se empieza en el valor exacto.

Si w′′(t) ≡ 0w(tn+1) = w(tn) + h f(tn, w(tn))

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 90

Page 91: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.6. Ejemplos 91

y si empezamos en y0 = w(t0) el esquema es exacto ya que

y1 = y0 + h f(t0, y0) = w(t0) + h f(t0, w(t0)) = w(t1).

Luego de hecho el error es cero y cero es O(hp) para cualquier p ≥ 0. Tomemos elcaso

w′(t) = 1, w(0) = 0

donde f(t, y) ≡ 1, luego Lf = 0, y con solución

w(t) = t.

Si tomamos como valor de arranque y0 = 0 entonces el esquema es yn+1 = yn + hy fácilmente se tiene que

y1 = 0 + h 1 = h = t1, y2 = h+ h 1 = 2h = t2, . . . , yn = nh = tn

y en un punto concreto, si ponemos t = tn fijo resulta que

w(t)− yn = 0.

Si ahora tomamos como valor de inicio y0 = α = 0 entonces fácilmente se tiene que

yn = α + nh = α + tn

y en un punto concreto, si ponemos t = tn fijo resulta que

w(t)− yn = α.

Por lo tanto, el error inicial, si existe, debe de ser del mismo orden que el delmétodo. Por ejemplo, si α =

√h se tiene que y0 =

√h → 0 pero no lo hace con

la rapidez que nos marca el método de Euler y la aproximación usada no es buena,estropea el orden de convergencia del esquema. Se tiene

E(h) = O(h1/2) = O(h).

Ejemplo 55 Experimento numérico: Vamos a comprobar computacionalmente queel método de Euler es de primer orden con un par de problemas donde la segundaderivada no se anula. Consideremos

y′(t) = −y(t) + 1, y(0) = 0 (2.5)

con solucióny(t) = 1− e−t

91 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 92: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

92 Capítulo 2 Método de Euler explícito

y el problema

y′(t) = y(t), y(0) = 1 (2.6)

con solucióny(t) = et.

Podemos entonces realizar una tabla con los errores obtenidos

En = maxk≤n

|y(tk)− yk|

para n = 1/h con n = 16, 32, 64, .... (duplicandose) en el intervalo de tiempo [0, 1].Vemos que los errores decaen por un factor de 2, confirmando numéricamente elorden 1 en h.

n = h−1 error en (2.5) p error en (2.6) p16 0.0118053 −−− 0.0803533 −−−32 0.0058242 1.019 0.0412917 0.960564 0.0028929 1.0095 0.0209369 0.97974128 0.0014417 1.0047 0.0105428 0.98978256 0.0007197 1.0023 0.0052902 0.9948512 0.0003595 1.0014 0.0026498 0.99741024 0.0001797 1.0004 0.0013261 0.9987

Un par de resultados auxiliares de tipo técnico nos hacen falta:

Lema 2 Si para A,B > 0 constantes independientes de n los números ξn > 0 paran = 0, 1, 2, ... cumplen

ξn+1 ≤ Aξn +B, n = 0, 1, 2, ...N − 1,

entonces comprobar que

ξn ≤ An ξ0 + En(A)B, n = 1, 2, ...N,

dondeEn(A) =

An − 1

A− 1, si A = 1, En(A) = n, si A = 1.

Cuando A = 1 + δ con δ > 0 comprobar que

ξn ≤ An ξ0 +en δ − 1

δB, n = 1, 2, ...N.

Dem: Lo dejamos como ejercicio, pero ya lo hemos usado en la prueba de conver-gencia de Euler.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 92

Page 93: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.6. Ejemplos 93

Lema 3 Para h → 0 y n → +∞ tal que hn = t fijo se cumple

(1− hL)n ∼ e−tL, es decir, lımhn=t(1− hL)n = e−tL

(1 + hL)n ∼ etL, es decir, lımhn=t(1 + hL)n = etL

donde lımhn=t representa h → 0 y n → +∞ tal que hn = t fijo.

Dem: Ejercicio.

Ejemplo 56 Cálculo explícito: Para f(t, y) = 1000 (1− y) = −1000y + 1000 tene-mos

yn+1 = yn + h 1000(1− yn) = (1− h1000)yn + 1000h, n ≥ 1

Entonces si y0 = 1 se reproduce la solución w(t) ≡ 1. >si y0 = 1 que ocurre? Viendola recurrencia formada

yn = (1− h1000)ny0 +(1− 1000h)n − 1

−1000h1000h

es decir

yn = (1− h1000)ny0 − (1− 1000h)n + 1 = (1− h1000)n(y0 − 1) + 1

luego la diferencia entre la solución constante w ≡ 1 y la calculada es

yhn − 1 = (1− h1000)n(y0 − 1)

y vemos como se amplia, en este caso, se reduce, el error inicial.Entonces para cada t = nh tendremos en el límite

lımhn=t

(yhn − 1) = e−1000t(y0 − 1).

Luego cuanto mayor sea t = hn más rápido se aproxima el cálculo hacia la soluciónestacionaria en el límite lımhn=t, esto es, cuando disminuimos h aumentando n talque t = nh está fijo. Esto reproduce lo que el sistema continuo hace en el límitepero también lo hace fijado h tal que h < 2/1000 puesto que en este caso es

|1− h1000| < 1

y el cálculo discreto decae a 1 de forma rápida, esta es la restricción de estabi-lidad en este caso.

Por otro lado, los campos f(t, y) = ±1000 (1− y) poseen una solución de equili-brio w(t) ≡ 1 y el campo de vectores es muy contractivo o expansivo dependiendodel signo. En todo caso, al usar Euler explícito con y0 = 1 se reproduce de formaexacta la solución w(t) ≡ 1.

93 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 94: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

94 Capítulo 2 Método de Euler explícito

Ejemplo 57 Cálculo explícito: Si f(t, y) = −1000 (1− y) = 1000y− 1000 tenemos

yn+1 = yn + h (−1000(1− yn)) = (1 + h1000)yn − 1000h, n ≥ 1.

otra vez no hay problema si y0 = 1 pero si y0 = 1 tenemos

yn = (1 + h1000)ny0 −(1 + 1000h)n − 1

1000h1000h

es deciryn = (1 + h1000)n(y0 − 1) + 1

y vemos como se amplia, en este caso sí, el error inicial. Entonces para cada t =nh tendremos en el límite

lımhn=t

(yhn − 1) = e1000t(y0 − 1)

con lo que la solución buscada que empieza en y0 = 1 se aleja bruscamente dela estacionaria conforme avanza el tiempo por muy cerca que esté y0 de 1. Estoreproduce lo que el sistema continuo hace. Por otro lado, para cualquier valor deh > 0 fijo tenemos que 1 + h1000 > 1 por lo que también reproduce en discreto elefecto continuo.

Una misma curva puede estar en campos de velocidades totalmente distintos:

Ejemplo 58 Cálculo explícito: Un caso muy sencillo es

w′(t) = 0, w(0) = 1

con soluciónw(t) ≡ 1.

Aquí se tiene que f(t, y) = 0 y en cada punto (t, y) hay una pendiente cero. Sitomamos como valor de inicio y0 = 1 entonces fácilmente yn = 1 = w(tn) paracualquier n. En este caso la aplicación de Euler explícito es trivial

yn+1 = yn + h 0 = yn.

Ejemplo 59 Un problema estable: Consideremos y′(t) = atan(y(t)), y(0) = y0,ver Figura 2.9, entonces f(t, y) = f(y) = atan(y) luego ∂yf(y) = (1 + y2)−1 ≤1 y Lf = 1. Podemos además estimar y′′(t) derivando la ecuación y obtenemos∥y′′∥∞ ≤ π/2. La aproximación de la solución del problema mediante el método deEuler explícito genera una estimación de error en un intervalo de tiempo [0, T ] dadapor

|en| ≤ eT |e0|+π

4(eT − 1)h.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 94

Page 95: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.6. Ejemplos 95

Figura 2.9: Soluciones para dy/dt=atan(y). Se observa la apertura cónica de lassoluciones.

Si T = 1 y queremos limitar el error a un valor 0.001 tendremos que tomar h y elerror inicial |e0| tales que

e1|e0|+π

4(e1 − 1)h ≤ 0.001.

por ejemplo, e0 = 0 nos da h < 0.00074. Si fijamos un intervalo de cálculo másgrande, la restricción sobre el parámetro h empeorará sustancialmente. Pero nopodemos mejorar esta cota y deberiamos buscar un método con un orden mayor.

Ejemplo 60 Un problema muy inestable: Consideremosd

dty(t) = 10 y + 11 t− 5 t2 − 1, 0 < t ≤ 3,

y(0) = 0,

que tiene por solución y(t) = t2/2− t como se comprueba fácilmente. Las solucióngeneral cuando y(0) = y0 es

y(t) = y0e10t + t2/2− t.

que incluye y(t) = t2/2− t si y0 = 0. En la Figura 2.10 se ven las soluciones y cómola solución para y0 = 0 queda oculta por la gran variación que producen aquellas enlas que y0 = 0.

Aquí tenemos que f(t, y) = 10 y + 11 t − 5 t2 − 1 por lo que la constante deLipschitz para f(t, y) con respecto a la segunda variable es L = 10.

95 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 96: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

96 Capítulo 2 Método de Euler explícito

Figura 2.10: Campo de soluciones para dy/dt=10 y + 11 t− 5 t2 − 1. Las solucionesson y(t) = y0e

10t+t2/2−t. Incluye y(t) = t2/2−t pero no se ve por la gran variaciónproducida en las otras soluciones.

Por otro, como y(t) = t2/2 − t resulta que y′′(t) = 1. Por último, si tomamosy0 = 0 de tal forma que el error inicial es cero, tenemos la estimación de error

|y(tn)− y(h)n | ≤ h

2

e30 − 1

10, n = 1, 2, ...N (h)

donde recordemos que hN (h) = T = 3 y tn = nh para n = 1, 2, ..., N (h). Entoncessi queremos que sea, por ejemplo,

|y(tn)− y(h)n | ≤ 0.01, n = 1, 2, ...N (h)

estamos forzados a plantear

h

2

e30 − 1

10≤ 0.01 ⇒ h <

1

5 (e30 − 1)≈ 1.87... · 10−14.

Pero esto genera una restricción inabordable, prácticamente h ≈ 0. Rebajar elintervalo de cálculo tampoco ayuda mucho. Por ejemplo si T = 1, tenemos entonces

h

2

e10 − 1

10≤ 0.01 ⇒ h <

1

5 (e10 − 1)≈ 9.08... · 10−6.

Ahora resulta que esto plantea una restricción h ≈ 10−5. Entonces tenemos quetomar entorno a 105 = 100.000 puntos en la partición del intervalo [0, 1] y esto estodavia muy costoso en términos de memoria de computador.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 96

Page 97: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.6. Ejemplos 97

Pequeñas variaciones en el dato inicial pueden ser también muy importantesen el cálculo. Si aplicamos el método de Euler progresivo pero ahora hemos tomadoy(h)0 = ϵ > 0 para ϵ pequeño, quizás por accidente. Entonces tenemos la estimación

de error

|y(tn)− y(h)n | ≤ e30ϵ+h

2

e30 − 1

10, n = 1, 2, ...N (h)

donde recordemos que hN (h) = T = 3 y tn = nh para n = 1, 2, ..., N (h). Ahoratrabaja en nuestra contra también el término

e30ϵ ≈ 1013ϵ.

Entonces, hacer pequeño este término sólo será posible para una elección de ϵ prác-ticamente igual al cero de la máquina

1013ϵ ≤ 0.01 ⇔ ϵ ≤ 10−15.

Observación 52 Una alternativa puede ser trabajar con un método de mayororden. En este caso el error local máximo y el error de convergencia son menores.Supongamos que tenemos un método de cuarto orden y que la estimación de errores similar, entonces para T = 1 y si, por ejemplo, hemos obtenido un error localmáximo l(h) = h4+1 ocurre

h4 e10 − 1

10≤ 0.01 ⇒ h <

( 10

100 (e10 − 1)

)1/4

= 0.046...

luego tenemos un valor de h más razonable gracias a la raiz cuarta.En cuanto al error en el dato inicial, sólo podremos mejorar si tenemos el mismo

orden en el error inicial.

Ejemplo 61 Problema rígido: La estimación de error nos dice lo mismo parael problema

d

dty(t) = −10 y + 11 t− 5 t2 − 1, 0 < t ≤ 3,

y(0) = 0,

pero el aspecto práctico computacional es totalmente distinto. El campo de solucionesse ve en la Figura 2.11 y todas las trayectorias se contraen en una.

Observación 53 Como consecuencia de estos ejemplos, un resultado teórico no sedebe usar para estimaciones prácticas del error sin pensar si es ajustado o no.

En lenguaje de la “Matemática Pura”, si LT está acotado también lo está eLT .Pero cuando tenemos que dar números y hacer cálculos... por ejemplo 50 no es un

97 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 98: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

98 Capítulo 2 Método de Euler explícito

Figura 2.11: Campo de soluciones para dy/dt=−10 y+11 t−5 t2−1. Las solucionesahora son y(t) = (y0+11/50)e−10t−t2/2+6t/5−11/50. Incluye y(t) = −t2/2+6t/5.

número grande, pero no parece muy correcto decir que e50 esté acotado. Algunosnúmeros son

e10 ∼ 22026.466, e50 ∼ 5.185 · 1021

Podemos decir que este tipo de acotaciones pertenecen a la era pre-computacionaló clásica, vamos a ver acotaciones más finas que se pueden denominar como de laera computacional ó moderna.

Vamos a terminar mejorando el resultado de convergencia visto para el caso deEuler explicito en este tipo de problemas:

2.7. Convergencia Euler explicito en el caso con-tractivo

Vamos a ver el resultado para el problema y′ = −ay con a > 0. Podemos usartambién y′ = −ay + b pero no cambia nada.

Teorema 62 Convergencia Euler explícito en el caso contractivo y′ = −ay cona > 0.

Dem: Al igual que en la prueba normal, llegamos a

en+1 = en + hf(tn, w(tn))− f(tn, yn)+ l(tn;h)

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 98

Page 99: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.7. Convergencia Euler explicito en el caso contractivo 99

pero f(t, y) = −ay + b implica que ∂yf(t, y) = −a luego

en+1 = (1− ha) en + l(h)

y si tomamos h < 1/a entonces 1 > 1− ha > 0 y tenemos en particular que

|en+1| < |en|+ l(h).

Esto ya mejora la estimación entre errores globales en el caso general que seríatomando la constante de Lipschitz como L = |∂yf(t, y)| = a sin observar el signonegativo delante de a y haciendo

|en+1| < (1 + ha)|en|+ l(h).

Luego aquí el signo importa!. Por lo tanto, usando con detalle esta situación tenemospara h < 1/a

|en+1| < (1− ha)|en|+ l(h)

donde 1 > 1−ha > 0 y siendo l(h) = maxt0<tn<t0+T |l(tn;h)| ≤ maxt0<t<t0+T |w′′(t)|h2/2y recursivamente llegamos a

|en+1| ≤ (1− ha)n+1|e0|+(1− ha)n+1 − 1

(1− ha)− 1l(h),

es decir,

|en+1| ≤ (1− ha)n+1|e0|+1− (1− ha)n+1

amax

t0<t<t0+T|w′′(t)| h,

Entonces, como (1− ha)n ≈ e−ta que se puede terminar de acotar como

|ehn| ≤ e−athn|eh0 |+1

amax

t0<t<t0+T|w′′(t)| h.

En este caso, se tiene también orden uno en potencia de h si el error inicial es O(h),pero se observa que todas las constantes involucradas decaen exponencialmente oestan acotadas.

|en| ≤ C h, 0 ≤ n ≤ N = T/h

luego el método es de orden uno pero en este caso la constante mayor que se en-cuentra no crece exponencialmente sino que está acotada por 1. De hecho, en cadapaso la constante de error es más pequeña y ayuda a que el error global acumuladovaya decreciendo. Tenemos una demostración matemática útil y coherente conlos resultados prácticos.

99 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 100: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

100 Capítulo 2 Método de Euler explícito

Ejemplo 63 Si volvemos a considerar los problemasy′ + y = 1, y(0) = 0 (2.7)

con solucióny(t) = 1− e−t

yy′ = y, y(0) = 1 (2.8)

con solucióny(t) = et.

La Figura 2.12 muestra los errores en [0, 2] calculados con h = 2/2048 = 1/1024para ambos ejemplos. Podemos ver como para el problema (2.8) de solución y(t) = et,el menor error es justo al principio, de hecho el peor error es siempre el previo yluego crece, el crecimiento del error parece ser exponencial. Por otro lado, para elproblema (2.7) de solución y(t) = 1 − e−t, el peor error ocurre cerca del principioy luego decae. Estos resultados concuerdan con el análisis de convergencia másdetallado que hemos visto.Observación 54 En los ejemplos ya vistos

y′(t) = −10 y + 11 t− 5 t2 − 1,y(0) = 0,

y′(t) = −100 y,y(0) = 1,

tiene sentido el uso del TVM puesto que se captura el signo negativo que tiene∂yf(t, y). Pero debemos de observar que en los problemas

y′(t) = 10 y + 11 t− 5 t2 − 1,y(0) = 0,

y′(t) = 100 y,y(0) = 1,

el resultado que se obtiene es el mismo que si se usa la condición de Lipschitz. Porlo tanto, aunque la estimación tenga esos factores eTL, realmente es la situaciónpráctica que aparece, el error crece muy rápido por que el sistema es expansivo, verFigura 2.6. Podemos estimar los errores para estos problemas y ver como el aspectopráctico concuerda con el teórico

Como conclusión podemos decir que es en el caso ∂yf(t, y) << 0 donde esrealmente interesante usar el TVM puesto que se es capaz de capturar un com-portamiento decreciente de la solución y esto no se consigue con la constante deLipschitz. Este tipo de problemas se dice que son disipativos o contractivos y sucaracterística principal es que las trayectorias del campo de velocidades se contraenen tiempo.

Suelen aparecer con frecuencia en aplicaciones físicas debido a la presencia delrozamiento o viscosidad de los medios físicos que hacen que la energía se disipe ylas trayectorias decaigan a cero o se contraigan. Ejemplos como los visualizados enla Figura 2.6 son representativos de estas situaciones.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 100

Page 101: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.7. Convergencia Euler explicito en el caso contractivo 101

Figura 2.12: Comportamiento del error con el método de Euler en [0, 2] para h =2/2048 para los problemas (2.7) y (2.8) respectívamente.

101 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 102: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

102 Capítulo 2 Método de Euler explícito

2.7.1. ResumiendoObservaciones sobre Euler explicito:

Cota de error en un intervalo de longitud T de la forma K h con K ≈ eTLf

siendo Lf = maxt,y |∂yf(t, y)|. Por lo tanto, si h → 0 el error tiende a cero(aunque le costará llegar por culpa de la gran magnitud de K).

En los casos donde ∂yf(t, y) < 0 podemos obtener cotas con constantes quedecaen en tiempo pero necesitamos restringir el valor de h en una formaque depende del problema en cuestión. Esta es una restricción conocida porrestricción de estabilidad.

2.8. Aplicación en problemas disipativosLa solución ya vista del problema y′(t) = −10 y + 11 t− 5 t2 − 1 es

y(t) = (y0 + 11/50)e−10t − t2/2 + 6t/5− 11/50

mientras que la solución en z′ = −10 z es

z(t) = z0e−10t.

En ambos problemas tenemos la misma restricción h < 2/10 para tener cálculosestables y que den lugar a convergencia.

Si nos fijamos en la solución z(t) = z0e−10t como patrón, vemos que lo que hace

falta en la solución ligeramente más complicada y(t) = (y0 + 11/50)e−10t − t2/2 +6t/5 − 11/50 es la capacidad de calcular bien la parte que corresponde a e−10t.Escribamos

y(t) = (y0 + 11/50)e−10t − t2/2 + 6t/5− 11/50 = F (t) + S(t)

dondeF (t) = (y0 + 11/50)e−10t, S(t) = −t2/2 + 6t/5− 11/50.

La parte F (t) decae muy rápidamente mientras que S(t) permanece:

F (t) es el modo transitorio rápido y

S(t) el modo transitorio lento o estacionario.

Vemos por tanto que si el problema es rígido

en el caso particular del esquema de Euler explícito es la ne-cesidad de calcular bien el modo rápido lo que impone la res-tricción sobre h. Esta restricción se mantiene durante todo elintervalo incluso cuando ya el valor del modo rápido casi hadesaparecido

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 102

Page 103: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.8. Aplicación en problemas disipativos 103

Estas situaciones son muy frecuentes, nos encontramos sistemas en donde lasolución del problema representa procesos que se desarrollan a velocidades muydistintas: hay escalas temporales muy diferentes.

Veamos algunos ejemplos bien conocidos y como se aplica el método de Eulerexplícito a ellos

Ejemplo 64 Ecuación de Dahlquist-Bjorck. Este ejemplo fue propuesto entorno a 1974

y′(t) = 100 (sin(t)− y(t)), 0 < t ≤ 3,y(0) = 0.

posee como solución

y(t) = e−100 ty0 +sin(t)− 100−1cos(t) + 100−1e−100 t

1 + 100−2

y el modo transitorio exponencial e−100 t decae muy rápido. Este modo debe sercapturado bien por el método explícito y esto nos lleva a un valor de h excesivamentepequeño. Se puede ver en las Figuras 2.13 y 2.14 el comportamiento del método deEuler explícito en comparación con el método de Euler implícito que veremos enel tema siguiente. Aquí es ∂yf = −100 y debemos de usar h < 2/100 en Eulerexplícito, luego si trabajamos en [0, 3] debe ser

N > 3 ∗ 100/2 = 150

para que Euler explícito funcione bien.

Ejemplo 65 Ecuación de Prothero-Robinson: parecido al ejemplo anterior,y′(t) = L (φ(t)− y(t)) + φ′(t), 0 < t,y(0) = y0

la solución exacta esy(t) = e−L t(y0 − φ(0)) + φ(t)

y otra vez el modo rápido e−L t para L >> 1 debe ser capturado correctamente. Aquíφ(t), es el modo estacionario, y puede ser una función suave sin cambios bruscos.

Incluso en el caso en el que y0 = φ(0) y aparentemente el modo rápido noestá presente en la solución, sí que se encuentra en todas las soluciones vecinasy se debe también capturar como si estuviese presente, ver Figura 2.15. Cualquiermínima diferencia con la solución exacta que se busca es amplificada por la ecuacióncontinua y lanzada fuera de la curva buscada. Para la Figura 2.16 el dato en t = 0para las curvas que caen sobre la fase transitoria está muy lejos de y0 = 1. De hecho,esta “lluvia de curvas” se ha obtenido usando tiempos iniciales t0 = 0.5, 1, 1.5 yvalores y(t0) cercanos al valor de la fase transitoria en estos tiempos.

103 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 104: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

104 Capítulo 2 Método de Euler explícito

0 0.5 1 1.5 2 2.5 30

0.2

0.4

0.6

0.8

1Dahlquist−Bjorck ejemplo (f(t,y)=−100(sin(t)−y). Euler implicito, N= 140

0 0.5 1 1.5 2 2.5 3−2

−1

0

1

2x 10

6Dahlquist−Bjorck ejemplo (f(t,y)=−100(sin(t)−y). Euler explicito, N= 140

0 0.5 1 1.5 2 2.5 30

0.2

0.4

0.6

0.8

1Dahlquist−Bjorck ejemplo (f(t,y)=−100(sin(t)−y). Euler implicito, N= 150

0 0.5 1 1.5 2 2.5 30

0.5

1

1.5Dahlquist−Bjorck ejemplo (f(t,y)=−100(sin(t)−y). Euler explicito, N= 150

Figura 2.13: Cálculo de la solución del problema de Dahlquist-Bjorck usando Eulerexplícito y Euler implícito con N = 140 y N = 150

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 104

Page 105: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.8. Aplicación en problemas disipativos 105

0 0.5 1 1.5 2 2.5 30

0.2

0.4

0.6

0.8

1Dahlquist−Bjorck ejemplo (f(t,y)=−100(sin(t)−y). Euler implicito, N= 160

0 0.5 1 1.5 2 2.5 30

0.5

1

1.5Dahlquist−Bjorck ejemplo (f(t,y)=−100(sin(t)−y). Euler explicito, N= 160

Figura 2.14: Cálculo de la solución del problema de Dahlquist-Bjorck usando Eulerexplícito y Euler implícitocon N = 160

0 0.5 1 1.5 2 2.5 3−1

−0.5

0

0.5

1Prothero−Robinson Euler implicito, N= 130

0 0.5 1 1.5 2 2.5 3−2

−1

0

1

2x 10

11 Prothero−Robinson Euler explicito, N= 130

0 0.5 1 1.5 2 2.5 3−1

−0.5

0

0.5

1Prothero−Robinson Euler implicito, N= 150

0 0.5 1 1.5 2 2.5 3−1

−0.5

0

0.5

1Prothero−Robinson Euler explicito, N= 150

Figura 2.15: Euler Explícito e implícito sobre la ecuación de Prothero-Robinson

105 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 106: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

106 Capítulo 2 Método de Euler explícito

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5−4

−2

0

2

4Prothero−Robinson Euler implicito, N= 150

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5−5

0

5Prothero−Robinson Euler explicito, N= 150

Figura 2.16: Comportamiento de las curvas vecinas a la fase transitoria. Cálculoposible con Euler implícito pero imposible con Euler explícito. La “lluvia de curvas”se ha obtenido usando tiempo inicial t0 = 0.5, 1, 1.5 y valores y(t0) cercanos al valorde la fase transitoria en estos tiempos.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 106

Page 107: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

2.8. Aplicación en problemas disipativos 107

Observación 55 Es como marchar por una senda en una cumbre muyestrecha y con mucha pendiente, cualquier paso en falso te lanza muyabajo. Al contrario que estar en una senda en un valle muy estrecho, pormucho que te des contra la pared no te sales del desfiladero

Observación 56 Podemos ver como la rigidez es también un concepto de eficiencia.Con un simple método de Euler explícito podemos obtener la solución pero necesi-tamos reducir mucho el parámetro de discretización y por consiguiente aumentamosmucho la carga de trabajo computacional. Por lo tanto, no se es eficiente.

107 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 108: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

108 Capítulo 2 Método de Euler explícito

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 108

Page 109: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

Capítulo 3

Euler progresivo en sistemas

Vamos a generalizar al caso vectorial muchos de los conceptos ya vistos. En estecaso la solución representa tantas curvas como ecuaciones y estas curvas evolucionanen tiempo de una forma relacionada entre sí. Podemos aplicar el método de Eulerprogresivo de una manera natural.

Tenemos y′(t) = f(t, y(t)) ∈ Rm con m > 1, para t > 0 y con y(0) = y0 ∈ Rm.De manera explícita tenemos las ecuaciones

y′1(t) = f 1(t, y1(t), y2(t), ..., ym(t)),y′2(t) = f 2(t, y1(t), y2(t), ..., ym(t)),... ... ...y′m−1(t) = fm−1(t, y1(t), y2(t), ..., ym(t)),y′m(t) = fm(t, y1(t), y2(t), ..., ym(t)),

y puesto que cada fj depende de (t, y1, y2, ..., ym) el sistema está acoplado. Vamosa suponer f ∈ C1, entonces acotando el Jacobiano de f con respecto a la variablevectorial y, nos encontramos con la condición de Lipschitz, que vamos a suponerglobal,

∥f(t, y)− f(t, z)∥ ≤ L ∥y − z∥

donde ∥ · ∥ es una norma cualquiera en Rm. Esto permite tener garantizado existen-cia, unicidad siendo además la solución y de clase C2. El método de Euler progresivopara aproximar la solución en el intervalo [t0, t0 + T ], o bien [0, T ], es simplemente

yn+1 = yn + h f(tn, yn), n = 0, 1, 2, ..., N − 1 (N = T/h)

y se describe explícitamente para yn = (y1n, y2n, ..., y

mn ) y f = (f 1, f 2, ..., fm) como:

109

Page 110: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

110 Capítulo 3 Euler progresivo en sistemas

Dado y0 = (y10, y20, ..., y

m0 ) ∈ Rm calcular yn+1 para n ≥ 0 como

y1n+1 = y1n + h f 1(tn, y1n, y

2n, ..., y

mn ),

y2n+1 = y2n + h f 2(tn, y1n, y

2n, ..., y

mn ),

...ymn+1 = ymn + h fm(tn, y

1n, y

2n, ..., y

mn ).

Observación 57 Usar un valor de h distinto para cada ecuación no nos sirve yaque generaria valores en puntos distintos para cada ecuación y tendriamos que hacerprocesos de interpolación. Esto llevaría a más errores acumulados en el cálculo.A continuación prácticamente repetimos los pasos dados en el caso escalar. Defini-mos el error global e = maxn ∥en∥ siendo

en = y(tn)− yn, n = 0, 1, 2, .., N

y vamos a estudiar su comportamiento cuando reducimos el valor de h, o lo que eslo mismo, aumentamos N , pero manteniendo siempre hN = T .Definición 66 Convergencia: Diremos que el método es convergente cuando

max0≤n≤Nh

∥y(thn)− yhn∥ → 0, h → 0+, h = T/N (h)

siendo thn = t0 + hn.

Observación 58 Podemos tomar una norma cualquiera ∥ · ∥ en Rm puesto que ladimensión m esta fija y todas son equivalentes en Rm. En todo caso nos será másútil la norma 2 dada por ∥y∥2 =

√∑mj=1 y

2j .

3.1. ConsistenciaEl Método de Euler explícito o progresivo (Forward Euler) consiste en

construir la secuencia de valores

dado yh0 ∈ Rm,

yhn+1 = yhn + h f(thn, yhn) ∈ Rm, n = 0, 1, ..., Nh − 1,

o con una notación más ligera

dado y0 ∈ Rm,

yn+1 = yn + h f(tn, yn) ∈ Rm, n = 0, 1, ..., N − 1. (3.1)

Vamos a suponer que el error inicial ∥y(t0)− yh0∥ tiende a cero cuando h → 0+.La consistencia del esquema numérico, por decirlo de una forma coloquial, es lo

que le falta a la solución verdadera para cumplir el esquema numérico. Se obtieneinsertando la solución continua dentro del esquema numérico.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 110

Page 111: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

3.1. Consistencia 111

Definición 67 Para cualquier t⋆ ∈ [t0, t0 + T ] fijo y h > 0, se llama error local,o de consistencia local, en t⋆ + h a la cantidad

l(t⋆;h) = y(t⋆ + h)− y(t⋆)− h f(t⋆, y(t⋆)). (3.2)

Mide el grado en el que la solución exacta cumple con el esquema numérico usadoen un punto determinado t⋆ + h.

Observación 59 También es el error que se comete cuando se aplica el método enun paso de longitud h empezando con el valor exacto y(t⋆).

En el caso m = 1 ya hemos visto, usando el desarrrollo de Taylor, que tenemos

y(t+ h) = y(t) + hy′(t) +1

2h2y′′(ξ), t < ξ < t+ h

de donde usando la ecuación diferencial

y(t+ h) = y(t) + hf(t, y(t)) +1

2h2y′′(ξ).

En el caso m > 1 debemos de trabajar cada componente por separado. Si y =(y1, y2, ..., ym) para m > 1 tenemos para cada j = 1, 2, ...,m la existencia de valorest < ξj < t+ h tales que

yj(t+ h) = yj(t) + h(yj)′(t) +1

2h2(yj)′′(ξj),

de donde

yj(t+ h) = yj(t) + hf j(t, y1(t), y2(t), ..., ym(t)) +1

2h2(yj)′′(ξj), j = 1, 2, 3, ...,m

y ahora podemos trabajar acotando el error en cada componente. Vamos a usar lanotación compacta

y(t+ h) = y(t) + hf(t, y(t)) +1

2h2y′′(ξ)

donde se debe de entender que y′′(ξ) es el vector de conponentes (yj)′′(ξj), esto es,

y′′(ξ) = ((y1)′′(ξ1), ..., (yj)′′(ξj), ..., (y

m)′′(ξm))

Definición 68 Se llama error de consistencia global para el valor h a lacantidad

l(h) = maxt

|l(t;h)| = 1

2h2 ∥y′′∥∞,[0,T ] = O(h2). (3.3)

111 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 112: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

112 Capítulo 3 Euler progresivo en sistemas

Sabemos que la acumulación de errores locales tiene un precio y terminaremos conun error O(h).

Es también usual comparar con la ecuación diferencial misma, tenemos entonceslo que se llama el error de truncatura

Definición 69 Para cualquier t⋆ ∈ [t0, t0 + T ] fijo y h > 0, se llama error detruncatura local en t⋆ + h a la cantidad τ(t⋆;h) dada por

τ(t⋆;h) =y(t⋆ + h)− y(t⋆)

h− f(t⋆, y(t⋆)). (3.4)

Es lo que se ha truncado la ecuación diferencial ordinaria usando el esquema nu-mérico.

Observación 60 Es evidente que l(t⋆;h) = h τ(t⋆;h) o lo que es lo mismo,

τ(t⋆;h) =1

hl(t⋆;h).

Usando el desarrollo de Taylor de la solución exacta, para cada componente existeξj⋆ ∈ (t⋆, t⋆ + h) tal que

τ(t⋆;h) =1

2h y′′(ξ⋆).

Definición 70 Se llama error de truncatura global para el valor h a lacantidad

τ(h) = maxt

|τ(t;h)| = 1

2h ∥y′′∥∞ = O(h). (3.5)

Definición 71 Se dice que el método es consistente con la ecuación diferencialsi la suma de los errores de consistencia locales tiende a cero cuandoh → 0+, esto es,

N−1∑n=0

l(tn;h) → 0, h → 0+.

Si usamos l(h) para controlar cada error de truncatura local nos encontramos conque sumamos N veces l(h), esto es,

N−1∑n=0

l(tn;h) ≤N−1∑n=0

l(h) = l(h)N

Como N = T/h podemos garantizar que el método es consistente si

l(h)T

h= τ(h)T → 0, h → 0+

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 112

Page 113: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

3.2. Estabilidad 113

o lo que es lo mismo, siτ(h) → 0, h → 0+.

Es razonable entonces simplificar la definición de consistencia como

Definición 72 Se dice que el método es consistente cuando el error de trun-catura global tiende a cero, esto es

τ(h) → 0, h → 0+.

o bienl(h) = h1+a, a > 0.

El método de Euler es consistente puesto que τ(h) = O(h) → 0, h → 0+.

3.2. EstabilidadEn general, la consistencia no es suficiente para garantizar la convergencia, ne-

cesitamos también el concepto de estabilidad. En el método de Euler la estabilidadestá garantizada por construcción puesto que, cuando menos, siempre disponemosde la constante de Lipschitz para obtener una desigualdad de estabilidad que rela-cione una desviación del cálculo debido a una variacion en los datos.

Podemos repetir exactamente el proceso en el caso de una ecuación (m = 1).Supongamos que tenemos dos realizaciones del método de Euler debidas a puntosiniciales distintos, esto es:

dado y0,

yn+1 = yn + h f(tn, yn), n = 0, 1, ..., N − 1,

y si variamos el comienzo,

dado z0 = y0,

zn+1 = zn + hf(tn, zn), n = 0, 1, ..., N − 1.

La condición de Lipschitz sobre f garantiza la estabilidad del esquema numéricopuesto que:

yn+1 − zn+1 = yn − zn + h [f(tn, yn)− f(tn, zn)], n = 0, 1, ..., N − 1.

Entonces, para n = 0, 1, ..., N − 1 y una norma en Rm cualquiera

∥yn+1 − zn+1∥ ≤ (1 + hLf )∥yn − zn∥.

113 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 114: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

114 Capítulo 3 Euler progresivo en sistemas

Tenemos entonces∥y1 − z1∥ ≤ (1 + hLf )∥y0 − z0∥∥y2 − z2∥ ≤ (1 + hLf )∥y1 − z1∥

...∥yN − zN∥ ≤ (1 + hLf )∥yN−1 − zN−1∥

de donde podemos aplicar una recurrencia y obtener∥yn+1 − zn+1∥ ≤ (1 + hLf )∥yn − zn∥

≤ (1 + hLf )2∥yn−1 − zn−1∥ ≤ .... ≤ (1 + hLf )

n+1∥y0 − z0∥y usando (1 + x) ≤ ex junto con el hecho de que (n + 1)h ≤ T obtenemos paran = 0, 1, ..., N − 1

∥yn+1 − zn+1∥ ≤ eT Lf∥y0 − z0∥.Lo hemos usado pero no le hemos prestado la suficiente atención, de hecho aquítodo depende de h y hemos obtenido para n = 1, ..., N (h)

∥y(h)n − z(h)n ∥ ≤ eT Lf∥y(h)0 − z(h)0 ∥.

De donde si h → 0+ y ∥y(h)0 − z(h)0 ∥ → 0 resulta que

max0≤n≤N(h)

∥y(h)n − z(h)n ∥ → 0.

Esto es la estabilidad del esquema numérico. Como estamos hablando del compor-tamiento cuando h → 0+, vamos a concretar mejor la definición.Definición 73 Un esquema se dice 0-estable (leer como cero-estable) si existeuna constante C > 0 y un valor h⋆ > 0 tal que para todo h ∈ (0, h⋆) y cualquiern = 0, 1, 2, ..., N (h), (N (h)h = T )

|y(h)n − z(h)n | ≤ C |y(h)0 − z(h)0 |.

Por lo tanto, silımh→0+

|y0 − z0| = |yh0 − zh0 | → 0 ⇒ lımh→0+

maxn

|yhn − zhn| → 0.

Hemos visto que el método de Euler explícito es 0-estable tanto en el casovectorial como escalar. El nombre viene de que se permite h → 0+.Observación 61 Volvemos a encontrarnos con cotas de estabilidad de tipo expo-nencial que no tienen porque ser las más ajustadas. Por otro lado parece que hacerh → 0+ puede anular el conjunto de la acotación superior con cualquier constantepor muy grande que esta sea, pero esto es teoría y en la práctica se tienen quecomputar valores yn con un h > 0 fijo que no puede ser tan pequeño comouno quiera. Esto ocasiona graves dificultades como ya veremos más adelante. Comoconsecuencia, se intoducen también otros conceptos distintos para la estabilidad conrespecto a h.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 114

Page 115: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

3.3. Convergencia 115

3.3. ConvergenciaEstudiemos ahora el error en = y(tn)− yn. Suponemos f ∈ C1 y que posee una

constante de Lipschitz global Lf , o lo que es lo mismo, una acotación global parala matriz de primeras derivadas de f con respecto a las variables y1, ..., ym, es decir,su Jacobiano Jyf con respecto a la variable vectorial y. Tenemos entonces

1. solución única al problema de Cauchy con regularidad C2,

2. el método de Euler explícito es consistente y

3. el método de Euler explícito es 0-estable.

Veamos que esto nos basta para probar la convergencia. Tenemos la ecuación

yn+1 = yn + h f(tn, yn) ∈ Rm, n = 0, 1, ..., N − 1.

y para t⋆ = tn existen ξjn ∈ (tn, tn + h) para j = 1, 2, ..,m tal que

y(t⋆ + h) = y(t⋆) + h f(t⋆, y(t⋆)) +1

2h2 y′′(ξn).

Entonces

en+1 = en + h[f(tn, y(tn))− f(tn, yn)] +1

2h2 y′′(ξn). (3.6)

de donde usando la condición de Lipschitz o el Teorema del Valor Medio

∥en+1∥ ≤ (1 + hLf )∥en∥+ hτ(h), n = 0, 1, ..., N − 1.

A partir de aquí todo es como en el caso m = 1: Por inducción y usando que(1 + x) ≤ ex llegamos a

∥en+1∥ ≤ (1 + hLf )n+1∥e0∥+ hτ(h)

(1 + hLf )n+1 − 1

(1 + hL)− 1

≤ e(n+1)hLf∥e0∥+ τ(h)e(n+1)hLf − 1

L, n = 0, 1, 2, ..., N − 1

siendo siempre (n + 1)h ≤ T . Si queremos uniformizar los coeficientes delante de∥e0∥ y de τ(h) podemos usar

∥ehn+1∥ ≤ eTL∥eh0∥+ τ(h)eTL − 1

L, n = 0, 1, ..., Nh − 1.

por lo que si ∥eh0∥ → 0 y τ(h) → 0 cuando h → 0+ garantizamos que ∥ehn+1∥ → 0cuando h → 0+ y que el método es convergente.

Otra vez

115 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 116: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

116 Capítulo 3 Euler progresivo en sistemas

gracias a la 0-estabilidad, o a que f es globalmente Lipschitz que es lo mismoen este caso, podemos controlar los errores de acumulación que se generan encada paso debidos al error inicial ∥eh0∥, aunque sea en términos de la constanteeT L.

nos va a hacer falta tener consistencia para usar τ(h) → 0

y aunque sea obvio, necesitamos que el error inicial tienda a cero ∥e(h)0 ∥ → 0

Observación 62 En este caso, sabemos cual es el valor de τ(h) y podemos escribir

∥en+1∥ ≤ eTL∥e0∥+ ∥y′′∥∞eTL − 1

2Lh, n = 0, 1, ..., N − 1.

Hemos probado

Teorema 74 Convergencia del método de Euler explícito. Caso generalm ≥ 1 con f Lipschitz: Supongamos que f ∈ C1 y cumple una condición deLipschitz global. Entonces el método de Euler explícito es 0-estable, consistente y siel error inicial e(h)0 cumple ∥e(h)0 ∥ ≤ C0 h, (h → 0+) para alguna constante C0 > 0entonces existe una constante C > 0 tal que

∥e(h)n ∥ ≤ C h, (h → 0+), n = 1, 2, ..., N (h)

para N (h) = T/h, esto es, h → 0+, N (h) → +∞, hN (h) = T. La constante C esproporcional a eTL por lo que es extremadamente grande para valores moderados delproducto TL.Como consecuencia, el método de Euler es de primer orden con respecto alparámetro h > 0.

Observación 63 Nos hemos apoyado en el hecho de que el método de Euler es0-estable y además consistente

0-estabilidad + consistencia ⇒ convergencia

El recíproco es también cierto.

3.4. Error para problemas linealesYa sabemos que la constante de Lipschitz es insensible al signo. En esta sección

vamos a dar una estimación del error para el método de Euler explícito que tengaen cuenta este hecho y sea más ajustada a los resultados numéricos de la prácticacuando el sistema sea disipativo.

Por otro lado, debemos de modificar la noción de desaparición de modos rápidosy llegada a una curva transitoria, típica del caso escalar en los problemas disipativos,y ahora hablaremos de contracción de las curvas entre sí, esto es,

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 116

Page 117: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

3.4. Error para problemas lineales 117

Definición 75 Un sistema es disipativo cuando todas las curvas tienden a estarcada vez más cercanas. En caso contrario se llama sistema expansivo.Vamos a seguir la idea vista en el tema anterior para la estabilidad de ecuaciones ysistemas de acuerdo a su naturaleza disipativa o contractiva. Lo hemos hecho en elcaso m = 1, pero la idea usada no se extiende de manera trivial al caso m > 1 yaque el Teorema del Valor Medio se debe de aplicar a cada componente en el casovectorial. Tenemos que trabajar un poco más duro ahora. Por eso sólo lo vamosa ver en el caso de un sistema lineal. Esto ya introduce algunas ideas nuevas alrespecto.

Supongamos que y′ = Ay donde A ∈ Rm×m es una matriz constante. Entoncesf(t, y) = Ay, esto es

f 1(t, y1, y2, ..., ym) = a11y1 + a12y

2n + ...+ a1my

m

f 2(t, y1, y2, ..., ym) = a21y1 + a22y

2n + ...+ a2my

m

...fm(t, y1, y2, ..., ym) = am1y

1 + am2y2n + ...+ ammy

m.

El estudio de sistemas lineales de coeficientes constantes es inmediato cuandola matriz es diagonalizable. Supongamos que A es una matriz cuadrada m × m ytenemos el sistema lineal

y′(t) = Ay(t), t > 0,y(0) = y0 ∈ Rm

Aquí la solución para t ≥ 0 es y(t) = eAty0 donde eAt es la matriz exponencial. Parasimplificar vamos a suponer que A es diagonalizable en Rm×m (ocurre igual siaparecen autovalores complejos y tenemos que diagonalizar en Cm×m pero intenta-mos simplificar la presentación) tendremos Λ = V −1AV con Λ = diagλ1, ..., λmy estamos admitiendo que V ∈ Rm×m; usando z = V −1y llegamos al problemadesacoplado

z′(t) = Λ z(t), t > 0 ⇔ z′j(t) = λj zj(t), j = 1, 2, ..,mz(0) = V −1 y0 = z0

y deshaciendo el cambio de variables

y(t) =m∑j=1

cj eλjt vj (3.7)

siendo los cj tales qued∑

j=1

cj vj = y0 ⇔ V c = y0.

Por lo tanto, la solución es básicamente una combinación lineal de las funciones eλjt

y está determinada por los autovalores de la matriz A, o lo que es lo mismo, por suespectro.

117 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 118: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

118 Capítulo 3 Euler progresivo en sistemas

3.4.1. Análisis del error para sistemasSi denotamos por A(j, :) la fila j de la matriz A y suponemos que y lo tomamos

como vector columna, entonces también se puede describir cada entrada del sistemacomo

(yj)′(t) = A(j, :) · y(t) =m∑s=1

aj,sys(t), j = 1, 2, ..,m.

Por otro lado, tenemos que si Ar es la potencia r de A entonces

y′(t) = A · y(t) ⇒ y′(t) = A · y′ = A2y(t) ⇒ y(r(t) = Ar · y(t)

de donde para cada componente yj

(yj)(r(t) = Ar(j, :)y(t)

siendo Ar(j, :) la fila j de la matriz potencia Ar. Entonces el desarrollo de Taylorpara una componente j cualquiera tiene la forma

yj(t+ h) = yj(t) + hA(j, :) · y(t) + h2

2A2(j, :) · y(t) + ....+

hr

r!Ar(j, :) · y(ξj)

donde ξj ∈ (t, t + h). En el caso de aplicar el método de Euler nos interesa el casor = 2 y tenemos entonces

yj(t+ h) = yj(t) + hA(j, :) · y(t) + h2

2A2(j, :) · y(ξj)

donde ξj ∈ (t, t+ h). Unificamos esto en notación vectorial y matricial como

y(t+ h) = y(t) + hA · y(t) + h2

2A2 : y(ξ)

donde entendemos que A2 : y(ξ) es un vector cuyas componentes vienen dadas por

(A2 : y(ξ))j = A2(j, :) · y(ξj).

Después de estas observaciones volvamos a la aplicación del método de Euler explí-cito. Se describe para n = 0, 1, ..., N (h) − 1 como

yhn+1 = yhn + hAyhn = (Im + hA) yhn

donde Im ∈ Rm×m es la matriz identidad. Como y(thn+1) = y(thn + h), tenemos

y(thn + h) = y(thn) + hA · y(thn) +h2

2A2 : y(ξhn)

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 118

Page 119: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

3.4. Error para problemas lineales 119

luego

y(thn+1) = (Im + hA)y(thn) +h2

2A2 : y(ξhn)

de donde el error es (quitamos h para no cargar notación)

y(tn+1)− yn+1 = (Im + hA)(y(tn)− yn) +h2

2A2 : y(ξn)

y entonces

∥y(tn+1)− yhn+1∥ ≤ ∥Im + hA∥∥y(thn)− yhn∥+h2

2∥A2∥∥y(ξhn)∥.

3.4.2. Sistema lineal simétrico y disipativoEl caso más interesante y frecuente en las aplicaciones es cuando A es simétrica

con autovalores reales negativos, extensión vectorial natural de la situaciónescalar f(t, y) = −λy con λ > 0. Por la expresión (3.7) sabemos que

∥y(t)∥ → 0, t → +∞.

Como A es diagonalizable vía una matriz ortogonal, A = V TΛV , y se tiene ∥A∥2 =∥Λ∥2 siendo Λ = diag(−λ1,−λ2, ...,−λm) la matriz con los autovalores de A en ladiagonal. Por lo tanto, la norma ∥ · ∥2 es la adecuada para tratar con esta situación.

Tenemos que

∥y(tn+1)− yn+1∥2 ≤ ∥Im + hA∥2∥y(tn)− yn∥2 +h2

2∥A2∥2∥y(ξn)∥2

de donde usando que V es unitaria podemos poner

∥Im + hA∥2 = ∥V V T + hV AV T∥2 = ∥Im + hΛ∥2

y conseguir

∥y(tn+1)− yn+1∥2 ≤ ∥Im + hΛ∥2∥y(tn)− yn∥2 +h2

2∥Λ2∥2∥y(ξn)∥2.

Como ∥Λ∥2 = maxj|λj| cuando Λ = diag(λ1, λ2, ..., λm), tenemos fácilmente que

∥y(tn+1)− yhn+1∥2 ≤ maxj

|1− hλj|∥y(thn)− yhn∥2 +h2

2max

jλ2j∥y(ξhn)∥2.

Por lo tanto, si tenemos

−λ1 < −λ2 < ... < −λm < 0.

119 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 120: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

120 Capítulo 3 Euler progresivo en sistemas

Usando h < 2/λ1, entonces −1 < 1− hλ1 de donde

−1 < 1− hλ1 < 1− hλ2 < ... < 1− hλm < 1

y además, si h < 1/λ1 entonces

0 < 1− hλ1 < 1− hλ2 < ... < 1− hλm < 1

y se tiene0 < max

j|1− hλj| = 1− hλm < 1.

Por lo tanto, si h < 1/λ1

∥y(tn+1)− yn+1∥2 ≤ (1− hλm)∥y(tn)− yn∥2 +h2

2λ21max

t∥y(t)∥2.

Vemos el papel fundamental de los autovalores de una matriz en el control delesquema numérico. Iterando cuando h < 1/λ1 tenemos

∥y(tn+1)− yn+1∥2 ≤ (1− hλm)∥y(tn)− yn∥2 +h2

2λ21max

t∥y(t)∥2

de donde para 1− hλm ∈ (0, 1)

∥y(tn+1)−yn+1∥2 ≤ (1−hλm)n+1∥y(t0)−y0∥2+

1− (1− hλm)n+1

1− (1− hλm)

h2

2λ21max

t∥y(t)∥2

es decir

∥y(tn+1)−yn+1∥2 ≤ (1−hλm)n+1∥y(t0)−y0∥2+

1− (1 + hλm)n+1

hλm

h2

2λ21max

t∥y(t)∥2

o bien

∥y(tn+1)− yn+1∥2 ≤ (1− hλm)n+1∥y(t0)− yh0∥2 +

λ1

λm

λ1maxt ∥y(t)∥2

2h.

se puede observar como la razón de rigidez de la matriz A

λ1

λm

también aparece en la estimación de convergencia. Sabemos que si

λ1

λm

>> 1

tenemos modos en la solución con velocidades muy distintas.Hemos demostrado el siguiente resultado de convergencia más detallado:

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 120

Page 121: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

3.4. Error para problemas lineales 121

Teorema 76 Convergencia del método de Euler explícito para y′ = Ay conA simétrica definida negativa: Supongamos que los autovalores reales de A son−λ1 < −λ2 < ... < −λm < 0 y pongamos

RA =λ1

λm

> 1

la razón de rigidez de la matriz A. Entonces para h ∈ (0, 1/λ1) se tiene la estimaciónde error

∥en+1∥2 ≤ (1− hλm)n∥e0∥2 + λ1RA

maxt ∥y(t)∥22

h.

para n = 0, 1, 2, ..., Nh − 1 Por lo tanto, otra vez tenemos convergencia incluso si elerror inicial no tiende a cero. Además, vemos explícitamente la restricción sobre hy la influencia de la rigidez del sistema RA en la convergencia del esquema.Si el error inicial es O(h) el esquema es O(h) y además las constantes decaenayudando a la convergencia cuando se alcanza el regimen h < h⋆ para h⋆ dependiendode los autovalores de A.

También se ve que el esquema numérico reproduce el comportamiento continuo yaque si h < 2/λ1

∥yn+1∥2 ≤ maxj

|1− hλj|∥yn∥2 ≤ (maxj

|1− hλj|)n∥y0∥2 → 0.

puesto que 0 < maxj|1− hλj| < 1.

Observación 64 Como normalmente no se conoce λ1 puede estimar un valor paraλ1 usando el método de Euler y viendo el h más grande que garantiza el decaimientoen esta norma ∥ · ∥2.

El estudio del caso vectorial m > 1 para un problema no-lineal necesita herramientasteóricas más potentes.

Observación 65 En el caso en donde A no sea diagonalizable, tenemos entoncesque admitir la existencia de autovalores repetidos y complejos y sabemos que lasolución es una combinación lineal de funciones de la forma

tr et a cos(b t), tr et a sin(b t), (a = Re(λj), b = Im(λj)),

donde r es la multiplicidad de a+ ib.Entonces el comportamiento de la solución se plantea en términos de las partes

reales de los autovalores λj. En general tenemos para las soluciones

convergencia a cero si maxjRe(λj) < 0

121 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 122: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

122 Capítulo 3 Euler progresivo en sistemas

acotación si maxjRe(λj) ≤ 0 y aquellos autovalores con Re(λj) = 0 sonsimples.

Observación 66 Cuando A es simétrica positiva definida, SPD es la abreviatu-ra más común y en inglés, entonces A es diagonalizable Λ = V −1AV con Λ =diagλ1, ..., λm con V ∈ Rm×m y todos los autovalores son reales positivos. Por lotanto, si −A es simétrica positiva definida, todos los autovalores de A son negativosy tenemos un sistema disispativo y′ = Ay.

Esto es interesante puesto que muchas veces se suele escribir el problema en laforma

y′ +By = 0

y si B es SPD el sistema es disipativo (aquí B juega el papel de −A).

Ejemplo 77 Para t > 0 consideramos el sistema lineal de edosx′1(t) = −298x1(t) + 99 x2(t),

x′2(t) = −594x1(t) + 197x2(t).

con dato inicial x1(0) = −1/2 y x2(0) = 1/2 y sobre el intervalo temporal [0, 3]. Lamatriz tiene autovalores −1 y −100 y se ven en la Figura 3.1 los cálculos usandoEuler explícito y Euler implícito (se verá en el tema siguiente). El valor óptimo paraEuler explícito es h < 0.02 o bien N > 150 para poder obtener convergencia perocon oscilaciones. Si usamos la restricción h < 0.01, o bien N > 300, lo que indicaun autovalor máximo negativo en torno a −100.

Ejemplo 78 Euler progresivo en x′(t) = Dx(t), (t > 0), x(0) = (1, 1, 1)′ donde

D =

−1 0 00 −2 00 0 −100

genera los resultados que se pueden ver en la Figura 3.2. Para cada experimentonumérico se presenta el cálculo global en [0, 10] y una visualización local de losresultados en [0, 4] o en [0, 2] para observar su comportamiento inicial. El valor deh óptimo (convergencia sin oscilaciones) para Euler explícito es h < 0.01, o bienN > 1000, lo que indica un autovalor máximo negativo en torno a −100.

Normalmente, las matrices no se presentan en formato diagonal. Si modificamosaleatoriamente la matriz D usando una transformacion que preserve los autovalorespara así esconderlos, esto es ponemos A = X−1DX para X una matriz 3 × 3 nosingular, nos encontramos con resultados similares. Tomemos

A =

3771.9348 1783.3507 5811.5749−753.93982 −359.78508 −1160.3972−2280.9485 −1076.2151 −3515.1497

.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 122

Page 123: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

3.4. Error para problemas lineales 123

0 0.5 1 1.5 2 2.5 3−1

0

1

2

3

4

5Sistema Stiff 2D (f(t,y)=(−298*x+99*y,−594*x+197*y) Euler implicito, N= 100

0 0.5 1 1.5 2 2.5 3−6

−4

−2

0

2

4x 10

30 Sistema Stiff 2D (f(t,y)=(−298*x+99*y,−594*x+197*y) Euler explicito, N= 100

0 0.5 1 1.5 2 2.5 3−1

0

1

2

3

4

5Sistema Stiff 2D (f(t,y)=(−298*x+99*y,−594*x+197*y) Solucion exacta

x1x2

x1x2

x1=exactax2=exacta3*exp(−t)−3*exp(−100t)

0 0.5 1 1.5 2 2.5 3−1

0

1

2

3

4

5Sistema Stiff 2D (f(t,y)=(−298*x+99*y,−594*x+197*y) Euler implicito, N= 150

0 0.5 1 1.5 2 2.5 3−5

0

5

10Sistema Stiff 2D (f(t,y)=(−298*x+99*y,−594*x+197*y) Euler explicito, N= 150

0 0.5 1 1.5 2 2.5 3−1

0

1

2

3

4

5Sistema Stiff 2D (f(t,y)=(−298*x+99*y,−594*x+197*y) Solucion exacta

x1x2

x1x2

x1=exactax2=exacta3*exp(−t)−3*exp(−100t)

0 0.5 1 1.5 2 2.5 3−1

0

1

2

3

4

5Sistema Stiff 2D (f(t,y)=(−298*x+99*y,−594*x+197*y) Euler implicito, N= 200

0 0.5 1 1.5 2 2.5 3−2

0

2

4

6

8Sistema Stiff 2D (f(t,y)=(−298*x+99*y,−594*x+197*y) Euler explicito, N= 200

0 0.5 1 1.5 2 2.5 3−1

0

1

2

3

4

5Sistema Stiff 2D (f(t,y)=(−298*x+99*y,−594*x+197*y) Solucion exacta

x1x2

x1x2

x1=exactax2=exacta3*exp(−t)−3*exp(−100t)

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

0

2

4

6

Sistema Stiff 2D (f(t,y)=(−298*x+99*y,−594*x+197*y) Euler implicito, N= 200

x1x2

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

0

2

4

6

Sistema Stiff 2D (f(t,y)=(−298*x+99*y,−594*x+197*y) Euler explicito, N= 200

x1x2

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

0

2

4

6

Sistema Stiff 2D (f(t,y)=(−298*x+99*y,−594*x+197*y) Solucion exacta

x1=exactax2=exacta3*exp(−t)−3*exp(−100t)

Figura 3.1: Cálculos sobre el intervalo temporal [0, 3] y visualizaciones cercanas alorigen de los resultados. Valor óptimo para Euler explícito es h < 0.02 o bien N >150 para poder obtener convergencia pero con oscilaciones. Si usamos la restricciónh < 0.01 entonces necesitamos N > 300 y obtenemos convergencia sin oscilaciones.

123 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 124: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

124 Capítulo 3 Euler progresivo en sistemas

Figura 3.2: Euler explícito para sistema lineal diagonal 3x3 con autovalores−100,−2,−1. El valor de h óptimo (convergencia sin oscilaciones) para Euler ex-plícito es h < 0.01 (N > 1000 al ser T = 10), lo que indica un autovalor máximo entorno a −100. Se presentan los cálculos globales en [0, 10] y una visualización localen [0, 4] o en [0, 2] para ver el comportamiento inicial.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 124

Page 125: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

3.4. Error para problemas lineales 125

cuyo espectro es −99.997625, −1.0088944, −1.9934603. Los resultados se puedenver en la Figura 3.3. También aquí para cada experimento numérico se presenta elcálculo global en [0, 10] y una visualización local de los resultados en [0, 4] o en [0, 2]para observar su comportamiento inicial. El valor de h óptimo (convergencia sinoscilaciones) para Euler explícito es h < 0.01 (N > 1000 al ser T = 10).

125 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 126: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

126 Capítulo 3 Euler progresivo en sistemas

Figura 3.3: Euler explícito para sistema lineal 3x3 con autovalores−99.997625, −1.0088944, −1.9934603. El valor de h óptimo (convergenciasin oscilaciones) para Euler explícito es h < 0.01 o bien N > 1000. Se presentan loscálculos globales en [0, 10] y una visualización local en [0, 4] o en [0, 2] para ver elcomportamiento inicial.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 126

Page 127: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

Capítulo 4

Métodos de Euler implícito y deCrank-Nicolson

Resumen del tema

Primera lectura:

Estudio de método de Euler implícito

Estudio de método de Crank-Nicolson

Sistemas: caso lineal

Sólo hay un parámetro en el método de Euler explícito que nos dice como el algo-ritmo va a trabajar en un intervalo de longitud T . Este parámetro es representadopor h o por N con la relación entre ambos hN = T y la descripción

1. h la talla del paso a avanzar por el intervalo

2. N el número de puntos para subdividir el intervalo.

Tradicionalmente se usa h. Desde el punto de vista de la programación es mejorusar N para plantear la longitud de vectores donde se almacenan los valores delcálculo.

Sobre h hemos realizado dos restricciones, una para buscar una precisión deseaday otra, simplemente, porque si no se hace los valores calculados oscilan con amplitudcada vez mayor y divergen dentro del crecimiento exponencial, pero no son estables:

1. Restricción por precisión: Reducimos h para obtener precisión, esto es, siE(h) = C h es el error y buscamos E(h) < ε entonces tenemos que tomarh < εC−1.

2. Restricción de estabilidad: Reducimos h para conseguir que el métodono produzca oscilaciones crecientes en los problemas disipativos, por ejemploh < 2/a en el caso f(t, y) = −a y.

127

Page 128: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

128 Capítulo 4 Métodos de Euler implícito y de Crank-Nicolson

A veces la segunda restricción es más exigente que la primera, sobre todo en loscasos disipativos en donde sabemos que la constante C depende del tiempo y decaecon el tiempo por lo que ayuda a reducir el error. Eso no es natural ni bueno y esculpa del esquema de cálculo (Euler explícito) escogido.

Además de lo comentado anteriormente, otras dificultades han quedado al des-cubierto:

1. Tener un orden de convergencia uno, esto es O(h), en el error para el métodode Euler no tiene fuerza suficiente para competir con las constantes quesurgen en los problemas expansivos ya que estas constantes crecen de maneraexponencial. Por lo tanto, mayor precisión sería bueno.

2. En los problemas disipativos las constantes de la estimación de error podemosmejorarlas pero necesitamos restringir el valor de h de una forma quepuede ser excesiva. El no hacerlo nos lleva a situaciones donde el cálculo sehace inestable (ver Figuras 4.1, 4.2 y 4.3) y por lo tanto inservible. Luego unamejor estabilidad, esto es una menor restricción sobre h, sería bueno.

3. La predicción inicial de la pendiente f(tn, yn) es manifiestamente mejorable.En el mismo subintervalo [tn, tn+1] la pendiente en el final f(tn+1, yn+1)puede cambiar mucho con respecto a f(tn, yn) tanto en el caso expansivocomo en el contractivo.

Como consecuencia, resulta que el método de Euler explícito es mejorable al menosen dos sentidos

1. mayor precisión: mejorando el error local, pasando de O(h2) a O(hp+1) conp > 1. Esto llevará a un error global O(hp) con p > 1.

2. mejor estabilidad: buscar mejoras en la restricción de estabilidad sobre h.

Vamos a elaborar mejor la predicción de la dirección de avance inicial entiempo.

4.1. Mejora en la estabilidad: Euler implícitoEn este segundo aspecto tenemos una solución sencilla que funciona bien sobre

todo en el caso de un sistema disipativo. En estos casos se pasa de pendientesextremadamente grandes a prácticamente nulas.

Ejemplo 79 En el problema tipo w′(t) = −aw(t) con w(0) = 1 y a >> 1 lasolución es w(t) = e−at y la pendiente en t = 0 es w′(0) = −a mientras que ent = 1 es w′(1) = −a/ea. Vemos que | − a| >> | − a/ea| y gráficamente se observaque usar la pendiente −a para avanzar nos va a llevar muy lejos de la solución sino llevamos cuidado.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 128

Page 129: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

4.1. Mejora en la estabilidad: Euler implícito 129

El método de Euler implícito aplicado en el intervalo [0, T ] consiste tomaruna partición con h = T/N y avanzar de acuerdo a

yn+1 = yn + h f(tn+1, yn+1), n = 0, 1, 2, ..., N (h) − 1.

Se interpreta geométricamente como avanzar en la dirección dada por la pendientef(tn+1, yn+1) que hay en (tn+1, yn+1). No se usa ahora para avanzar la dirección dadapor la pendiente f(tn, yn) que hay en (tn, yn).

Esto supone una mejora si la pendiente decae fuertemente desde tn a tn+1, esdecir, si |y′(tn)| >> |y′(tn+1)|.

Ejemplo 80 La importancia de usar el método implícito se ve cuando se aplica alproblema test

d

dty(t) = −λ y(t), 0 < t < T,

y(0) = 1,

para λ >> 1. Si usamos el método de Euler explícito en una partición uniformese obtienen los valores

yn+1 = (1− λh)n+1, n = 0, 1, 2, ..N − 1, (N = T/h).

Sabemos que si1

λ< h <

2

λ

hay decaimiento pero es oscilatorio, comportamiento que no está presente en lasolución verdadera, y si h > 2λ−1 se tiene crecimiento en la solución aproximadalo que es totalmente contrario a la curva buscada. Por lo tanto, se reproduce elcomportamiento cuantitativo y cualitativo de decaimiento uniforme sólo si

0 < 1− λh < 1 ⇔ λh < 1 ⇔ h <1

λ

y esta condición puede ser muy restrictiva si λ >> 1 ya que h = T/N , luego tambiéninfluye la longitud del intervalo de cálculo. La restricción clave se puede ver como

N > T λ

o lo que es lo mismo en este caso (f(t, y) = −λ y)

N > T |∂yf(t, y)|.

Recordamos otra vez que el producto de la longitud del intervalo de integración porla derivada de la función pendiente con respecto a la segunda variable es el valor

129 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 130: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

130 Capítulo 4 Métodos de Euler implícito y de Crank-Nicolson

importante que marca la estabilidad intrínseca del problema. Cuanto mayor sea esteproducto mayor N , esto es, más puntos, hay que tomar en el intervalo [0, T ].

Por otro lado, si usamos el método de Euler implícito, obtenemos la recu-rrencia

(1 + λh)yn+1 = yn, n = 0, 1, 2, ..., N − 1

de dondeyn+1 = (1 + λh)−(n+1), n = 0, 1, 2, ..., N − 1

y por lo tanto, el comportamiento cualitativo se puede reproducir para cualquier valorde h > 0 (ver Figuras 4.1, 4.2 y 4.3) y la restricción de estabilidad ha desaparecido.

Observación 67 Nuestro problema de partida, y′(t) = f(t, y(t)) es no lineal engeneral, luego una aproximacion no lineal funciona mejor que una lineal. Además,¡no hay mejoras a coste cero!

La solución a la segunda dificultad planteada al principio de este tema parece simplesi no fuese porque nos hemos encontrado con la necesidad de resolver una ecuaciónque en general es no lineal.

Seguimos la misma idea de avanzar por una linea recta una distancia h, pero envez de tomar f(tn, yn) como pendiente de salida para avanzar de tn a tn+1 tomamosla pendiente en el punto de llegada f(tn+1, yn+1). Esto presenta la dificultad deresolver un problema implícito en cada paso del proceso iterativo, a saber, para y0dado buscamos y1 que es la solución de la ecuación

z = y0 + h f(t1, z),

y en general, yn+1 se obtiene como la solución de

z = yn + h f(tn+1, z)

Resolvemos para z y entonces yn+1 = z.La función de iteración para la ecuación de punto fijo es z = G(z) donde

G(z) = yn + h f(tn+1, z)

y por lo tantoG(z)−G(w) = h

[f(tn+1, z)− f(tn+1, w)

]luego una primera aproximación para garantizar solución es tener en cuenta que

|G(z)−G(w)| ≤ Lf h |z − w|

y tendremos que usar h < 1/Lf para que converja, lo que obliga a tener h muypequeño si Lf >> 1. Pero normalmente, se resuelve este tipo de problemas medianteel método de Newton para obtener la solución de F (z) = 0, donde

F (z) = z − yn − h f(tn+1, z).

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 130

Page 131: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

4.1. Mejora en la estabilidad: Euler implícito 131

Figura 4.1: Euler explícito con h = 0.1 comparado con Euler implícito para λ = 100.El valor de h óptimo para Euler explícito es h < 0.01.

131 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 132: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

132 Capítulo 4 Métodos de Euler implícito y de Crank-Nicolson

Figura 4.2: Euler explícito con h = 0.0125 comparado con Euler implícito paraλ = 100. El valor de h óptimo para Euler explícito es h < 0.01.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 132

Page 133: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

4.1. Mejora en la estabilidad: Euler implícito 133

Figura 4.3: Euler explícito con h = 0.008 comparado con Euler implícito paraλ = 100. El valor de h óptimo para Euler explícito es h < 0.01.

133 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 134: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

134 Capítulo 4 Métodos de Euler implícito y de Crank-Nicolson

Ejemplo 81 Observar la diferencia entre Euler explícito e implícito cuando seaplican al problema de crecimiento de población limitado

d

dty(t) = y(t) (1− y(t)), t > 0,

y(0) = y0 > 0,(4.1)

Si f(t, y) es lineal en la variable y no hay dificultad puesto que cuando

f(t, y) = a(t) y + b(t)

entonces se puede despejar yn+1 limpiamente:

yn+1 = yn + h (a(tn+1)yn+1 + b(tn+1)) ⇒ yn+1 =yn + h b(tn+1)

1− h a(tn+1).

El esquema de cómputo queda como (N = T/h)

yn+1 =1

1− h a(tn+1)yn +

h b(tn+1)

1− h a(tn+1), n = 0, 1, 2, ..N − 1 (4.2)

y sólo nos debemos de preocupar de buscar h > 0 tal que 1− h a(tn+1) = 0 en cadapaso. Esto se tiene garantizado para cualquier valor de h > 0 si a(t) = ∂yf(t, y) < 0o, lo que es lo mismo, si el sistema es disipativo. En particular,

1. si a(t) ≥ 0 y tomamos amax = maxt a(t) está claro que con h < (amax)−1 se

tiene que 1− h a(tn+1) ≥ 1− h amax > 0 y el esquema está bien definido.

2. si a(t) cambia signos repetimos la idea pero ahora con amax = maxt |a(t)|.

3. si −B ≤ a(t) ≤ −b < 0 para valores positivos 0 < b < B entonces

1− h a(t) ≥ 1 + hb > 1 > 0, ∀h > 0

y no hay que hacer ninguna restricción.

Observación 68 Es en este último caso donde se encuentra la gran ventaja deusar este método implícito, ya que no plantea ninguna restricción sobre h encomparación con el uso del método explícito. Además, el coeficiente delante de ynen (4.2) es menor que uno, lo que respeta la dinámica del problema continuo.

Observación 69 Cualquier proceso iterativo para resolver el problema no lineal

z = yn + h f(tn+1, z)

se empieza en z0 = yn + h f(tn+1, yn) que ya es bastante cercano al punto buscadoyn+1. Como consecuencia, las restricciones teóricas usuales estos métodos iterativosse relajan bastante en la práctica computacional.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 134

Page 135: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

4.1. Mejora en la estabilidad: Euler implícito 135

Observación 70 Veremos que Euler explícito y Euler implícito poseen cotas deerror similares. Pero son mejores en el caso de Euler implícito sobre todo cuandoel problema es contractivo.

Observación 71 La restricción sobre h para resolver los problemas no lineales noes importante ya que las restricciones por precisión y por estabilidad sonmas fuertes usualmente.

Si el sistema es expansivo los dos métodos dan similares cotas de error ysuele ser más preciso Euler implícito.

Si el sistema es disipativo, esto es, ∂uf(t, u) < −b < 0, los dos métodos dancotas de error similares pero con Euler implícito la restricción de estabilidadsobre h no existe.

Si el problema es lineal, suele ser mejor usar Euler implícito en cualquiercaso.

4.1.1. Error local para Euler implícitoUsualmente se presenta el esquema como

dado y0,

yn+1 = yn + h f(tn+1, yn+1), n = 0, 1, ..., N − 1

pero puede ser más interesante y claro hacerlo de la siguiente forma:

Dado y0, para n = 0, 1, ..., N − 1

1. obtener z tal que z = yn + h f(tn+1, z)

2. definir y(tn+1) = z y repetir

De momento suponemos que el esquema permite el cálculo de yn+1 en cada paso.Para ver el error local en un punto generico fijo t⋆ suponemos, como siempre quepartimos del dato exacto (t⋆, y(t⋆)) y aplicamos el esquema de cálculo. Entonces,tenemos z tal que

z = y(t⋆) + h f(t⋆ + h, z)

y construimos

l(t⋆;h) = y(t⋆ + h)− z = y(t⋆ + h)− y(t⋆)− h f(t⋆ + h, z)

135 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 136: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

136 Capítulo 4 Métodos de Euler implícito y de Crank-Nicolson

El desarrollo de Taylor con respecto al punto (t⋆, y(t⋆)) siendo los incrementos(h, h f(t⋆ + h, z)) y usando f , ft, etc... cuando se evalua en el punto (t⋆, y(t⋆)), nospermite escribir:

f(t⋆ + h, z) = f(t⋆ + h, y(t⋆) + h f(t⋆ + h, z))

= f + hft + h f(t⋆ + h, z)fy +O(h2)

= f + hft + h [f + hft + h f(t⋆ + h, z) +O(h2)]fy +O(h2)

= f + (hft + hffy) + h2ftfy + h2f(t⋆ + h, z)fy +O(h2)fy +O(h2)

donde hemos desarrollado otra vez f(t⋆ + h, z) en el segundo sumando. Entonces,hemos comprobado que

f(t⋆ + h, y(t⋆) + h f(t⋆ + h, z)) = y′(t⋆) + hy′′(t⋆) +O(h2)

y el término O(h2) no se puede eliminar en general. Como consecuencia, para algunpunto intermedio t⋆ < ξh⋆ < t⋆ + h se tiene

l(t⋆;h) = hy′(t⋆) +h2

2!y′′(t⋆) +

h3

3!y′′′(ξh⋆ )− h(y′(t⋆) + hy′′(t⋆) +O(h2))

= −h2

2!y′′(t⋆) +O(h3) = O(h2)

luego como con Euler explícito

l(t⋆;h) = y(t⋆ + h)− z = O(h2).

Observación 72 Se puede intentar ser muy preciso en los desarrollos de Taylorque acabamos de hacer. Pero realmente no importa la forma exacta del coeficientede la potencia h2 sino saber que en algún caso no es cero. Esto se puede averiguarsimplente usando el problema modelo y′(t) = ay(t) donde el error local se puedeobtener de forma explícita y se ve que este coeficiente no es cero. Con que setenga para un caso ya sirve para poder decir que no se puede mejorar la expresionl(h) = O(h2), es decir, no se puede tener l(h) = O(h2).

Observación 73 Propiedades interesantes del problema modelo y′(t) = ay(t) sonque su solución y(t) = eat tiene todas las derivadas no nulas y que f(t, y) = a ytiene nulas todas sus derivadas parciales salvo fy.

4.2. Error global para Euler implícitoPara estudiar el error global, tomamos ahora en+1 = y(tn+1) − yn+1 donde

yn+1 = z con z dado porz = yn + hf(tn+1, z).

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 136

Page 137: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

4.2. Error global para Euler implícito 137

Igual que hemos hecho en el caso de Euler explícito, tenemos que

y(tn+1)− yn+1 = y(tn+1)− z + z − z

= l(tn;h) + z − z

= O(h2) + z − z

Para comparar z y z nos vamos a sus definiciones:

z − z = y(t⋆) + h f(t⋆ + h, z)− (yn + hf(tn+1, z))

= y(t⋆)− yn + h [f(tn+1, z)− f(tn+1, z)].

Tomando valor absoluto y usando la estimación de Lipschitz para la función ftenemos

|z − z| ≤ |y(tn)− yn|+ hLf |z)− z|

de donde si 1− hLf > 0 entonces

(1− hLf )|z − z| ≤ |y(tn)− yn|

y finalmente

|z − z| ≤ 1

1− hLf

|y(tn)− yn|

Usandolo en la estimación para y(tn+1)− yn+1 tenemos |

|y(tn+1)− yn+1| ≤ O(h2) +1

1− hLf

|y(tn)− yn|

es decir, si en = |y(tn)− yn| entonces |

en+1 ≤ 1

1− hLf

en +O(h2)

y la convergencia se obtiene de manera similar al caso de Euler explícito.

Ejercicio 82 Terminar la prueba de convergencia en el caso general f = f(t, y).

Ejemplo 83 Vamos a estudiar el caso más interesante que es f(t, u) = −au cona > 0. Entonces

en+1 = u(tn+1)− un+1 = u(tn)− hau(tn+1) + l(h2)− un − haun+1

reordenando términos

en+1 = u(tn)− un − ha(u(tn+1)− un+1) +O(h2)

= en − ahen+1 +O(h2)

137 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 138: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

138 Capítulo 4 Métodos de Euler implícito y de Crank-Nicolson

de donde(1 + ha)en+1 = en +O(h2).

en+1 =1

1 + haen +O(h2).

y vemos que podemos seguir el mismo análisis que con Euler implícito y sin restric-ción alguna sobre h. Como el factor de amplificación es K(h) = (1+ha)−1 tenemosuna gran ventaja para este tipo de problemas ya que se reduce el error en cada paso,el factor de amplificación K(h) es menor que 1. La desventaja es que sigue siendoun método de primer orden.

Es el momento de recuperar los ejemplos vistos en el tema anterior sobre proble-mas rígidos en donde comparábamos Euler explícito e implícito. Estos problemasson lineales por lo que para usar Euler implícito hay que trabajar con la fórmuladada por la ecuación (4.2) adaptada a cada caso.

Ejemplo 84 Ecuación de Dahlquist-Bjorck. (1974)y′(t) = 100 (sin(t)− y(t)), 0 < t ≤ 3,y(0) = 0.

posee como solución

y(t) = e−100 ty0 +sin(t)− 100−1cos(t) + 100−1e−100 t

1 + 100−2

y el modo transitorio exponencial e−100 t decae muy rápido. Este modo debe sercapturado bien por el método explícito y esto nos lleva a un valor de h excesivamentepequeño. Se puede ver en la Figura 4.4 el comportamiento del método de Eulerexplícito en comparación con el método de Euler implícito. Aquí es ∂yf = −100 ydebemos de usar h < 2/100 en Euler explícito, luego si trabajamos en [0, 3] debe ser

N > 3 ∗ 100/2 = 150

para que Euler explícito funcione bien.

Ejemplo 85 Ecuación de Prothero-Robinson: parecido al ejemplo anterior,y′(t) = L (φ(t)− y(t)) + φ′(t), 0 < t,y(0) = y0

la solución exacta esy(t) = e−L t(y0 − φ(0)) + φ(t)

y otra vez el modo rápido e−L t para L >> 1 debe ser capturado correctamente. Aquíφ(t) puede ser una función suave sin cambios bruscos y es el modo estacionario.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 138

Page 139: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

4.2. Error global para Euler implícito 139

0 0.5 1 1.5 2 2.5 30

0.2

0.4

0.6

0.8

1Dahlquist−Bjorck ejemplo (f(t,y)=−100(sin(t)−y). Euler implicito, N= 140

0 0.5 1 1.5 2 2.5 3−2

−1

0

1

2x 10

6Dahlquist−Bjorck ejemplo (f(t,y)=−100(sin(t)−y). Euler explicito, N= 140

0 0.5 1 1.5 2 2.5 30

0.2

0.4

0.6

0.8

1Dahlquist−Bjorck ejemplo (f(t,y)=−100(sin(t)−y). Euler implicito, N= 150

0 0.5 1 1.5 2 2.5 30

0.5

1

1.5Dahlquist−Bjorck ejemplo (f(t,y)=−100(sin(t)−y). Euler explicito, N= 150

0 0.5 1 1.5 2 2.5 30

0.2

0.4

0.6

0.8

1Dahlquist−Bjorck ejemplo (f(t,y)=−100(sin(t)−y). Euler implicito, N= 160

0 0.5 1 1.5 2 2.5 30

0.5

1

1.5Dahlquist−Bjorck ejemplo (f(t,y)=−100(sin(t)−y). Euler explicito, N= 160

Figura 4.4: Cálculo de la solución del problema de Dahlquist-Bjorck usando Eulerexplícito y Euler implícito

139 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 140: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

140 Capítulo 4 Métodos de Euler implícito y de Crank-Nicolson

Incluso en el caso en el que y0 = φ(0) y aparentemente el modo rápido no estápresente en la solución, sí que se encuentra en todas las soluciones vecinas y sedebe también capturar como si estuviese presente, ver Figura 4.5. Para la Figura4.6 el dato en t = 0 para las curvas que caen sobre la fase transitoria está muylejos de y0 = 1. De hecho, esta “lluvia de curvas” se ha obtenido usando tiempoinicial t0 = 0.5, 1, 1.5 y valores y(t0) cercanos al valor de la fase transitoria en estostiempos.

Observación 74 Podemos ver como la rigidez es también un concepto de eficien-cia. Con un simple método de Euler explícito podemos obtener la solución peronecesitamos reducir mucho el parámetro de discretización e incrementar por lo tan-to el trabajo computacional a realizar (¡como lo hace el computador parece que nocuesta... pero sí!)

4.3. Mejora en el orden: Método de Crank-NicolsonUsualmente se presenta el esquema como

dado y0,

yn+1 = yn +h

2

[f(tn, yn) + f(tn+1, yn+1)

], n = 0, 1, ..., N − 1.

pero puede ser más interesante y claro hacerlo de la siguiente forma:

Dado y0, para n = 0, 1, ..., N − 1

1. obtener z tal que z = yn +h2

[f(tn, yn) + f(tn+1, z)

],

2. definir y(tn+1) = z y repetir

Se puede interpretar de varias formas:

antes de avanzar en una dirección dada, observar y promediar dos posibles,esto es, promedio de pendientes, la del principio y la del final.

Aplicar la fórmula de los trapecios a la expresión integral del problema deCauchy.

Como se hizo antes, podemos garantizar la existencia de solución a cada paso si laecuación para z

z = yn +h

2

[f(tn, yn) + f(tn+1, z)

]es resoluble. Esto queda garantizado para una iteración de punto fijo si

h

2|fy(tn+1, y)| < 1

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 140

Page 141: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

4.3. Mejora en el orden: Método de Crank-Nicolson 141

0 0.5 1 1.5 2 2.5 3−1

−0.5

0

0.5

1Prothero−Robinson Euler implicito, N= 130

0 0.5 1 1.5 2 2.5 3−2

−1

0

1

2x 10

11 Prothero−Robinson Euler explicito, N= 130

0 0.5 1 1.5 2 2.5 3−1

−0.5

0

0.5

1Prothero−Robinson Euler implicito, N= 150

0 0.5 1 1.5 2 2.5 3−1

−0.5

0

0.5

1Prothero−Robinson Euler explicito, N= 150

Figura 4.5: Euler Explícito e implícito sobre la ecuación de Prothero-Robinson

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5−4

−2

0

2

4Prothero−Robinson Euler implicito, N= 150

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5−5

0

5Prothero−Robinson Euler explicito, N= 150

Figura 4.6: Comportamiento de las curvas vecinas a la fase transitoria. Cálculoposible con Euler implícito pero imposible con Euler explícito. El dato en t = 0para las curvas que caen sobre la fase transitoria está muy lejos de y0 = 1.

141 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 142: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

142 Capítulo 4 Métodos de Euler implícito y de Crank-Nicolson

y de forma más general, si Lf = maxt,y |fy(t, y)| tenemos garantizada la solución si

h < 2/Lf .

Observación 75 La restricción práctica sobre h es menos severa con estos métodosimplícitos en general. Usamos Newton en vez de el método de las aproximacionessucesivas y cuando el problema es rígido la convergencia es bastante rápida.

4.3.1. Error local para Crank-NicolsonDe momento suponemos que el esquema permite el cálculo de yn+1 en cada paso.

Para ver el error local en un punto generico fijo t⋆ suponemos, como siempre quepartimos del dato exacto (t⋆, y(t⋆)) y aplicamos el esquema de cálculo. Entonces,tenemos z tal que

z = y(t⋆) +h

2[f(t⋆, y(t⋆)) + f(t⋆ + h, z)].

Observemos que también es

z = y(t⋆) +h

2y′(t⋆) +

h

2f(t⋆ + h, z).

Construimos ahora

l(t⋆;h) = y(t⋆ + h)− z = y(t⋆ + h)− y(t⋆) +h

2[f(t⋆, y(t⋆)) + f(t⋆ + h, z)]

= y(t⋆ + h)− y(t⋆)−h

2y′(t⋆)−

h

2f(t⋆ + h, z)

=h

2y′(t⋆) +

h

2y′′(t⋆) +O(h3)− h

2f(t⋆ + h, z)

Tenemos que

f(t⋆ + h, z) = f(t⋆ + h, y(t⋆) +h

2y′(t⋆) +

h

2f(t⋆ + h, z))

El desarrollo de Taylor con respecto al punto (t⋆, y(t⋆)) siendo los incrementos

(h,h

2y′(t⋆) +

h

2f(t⋆ + h, z)) y usando f , ft, etc... cuando se evalua en el punto

(t⋆, y(t⋆)), nos permite escribir:

f(t⋆ + h, z) = f(t⋆ + h, y(t⋆) +h

2y′(t⋆) +

h

2f(t⋆ + h, z))

= f + hft + h2y′(t⋆) +

h

2f(t⋆ + h, z)fy +O(h2)

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 142

Page 143: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

4.4. Error global para Crank-Nicolson 143

y si reiteramos el desarrollo en la expresión de f(t⋆ + h, z) llegamos a

f(t⋆ + h, y(t⋆) + h f(t⋆ + h, z)) = y′(t⋆) + hy′′(t⋆) +O(h2)

luegoh

2f(t⋆ + h, z)) =

h

2y′(t⋆) +

h2

2y′′(t⋆) +O(h3)

y como consecuencia,

l(t⋆;h) =h

2y′(t⋆) +

h

2y′′(t⋆) +O(h3)− h

2f(t⋆ + h, z)

=h

2y′(t⋆) +

h

2y′′(t⋆) +O(h3)− h

2y′(t⋆)−

h2

2y′′(t⋆)−O(h3) = O(h3)

luego hemos ganado una potencia en el orden del error local

l(t⋆;h) = y(t⋆ + h)− z = O(h3), h → 0.

Esto va a implicar un error global de orden 2 en h. Hemos mejorado un orden laprecisión tomando más información de forma adecuada.

4.4. Error global para Crank-NicolsonSe procede como con el método de Euler implícito.

Ejercicio 86 Realizar la prueba de convergencia en el caso general f = f(t, y).

Ejemplo 87 En el caso simple de y′ = −ay con a > 0 tenemos

en+1 = en +h

2(−aen + (−aen+1)) +O(h3),

de donde

(1 + ha/2)en+1 = (1− ha/2)en +O(h3),

luego tenemos la estimación para el error

|yn+1 − y(tn+1)| ≤ K(h) |yn − y(tn)|+O(h3)

siendo K(h) =1− ha/2

1 + ha/2, por lo que −1 < K(h) < 1. Esto es una gran ventaja para

este tipo de problemas ya que reduce el error en cada paso, el factor de amplificaciónK(h) es menor que 1. Una desventaja de este método, es que para valores grandesde a se tiene |K(h)| ∼ 1, lo que puede producir oscilaciones.

143 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 144: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

144 Capítulo 4 Métodos de Euler implícito y de Crank-Nicolson

Ejemplo 88 Si tenemos el sistema lineal y′ = Ay entonces

1. el método de Euler explícito genera el esquema

yn+1 = (Im + hA)yn

2. el método de Euler implícito genera el esquema (recordemos que en generalnunca hay que calcular explícitamente la inversa de una matriz)

(Im − hA)yn+1 = yn

3. Crank-Nicolson genera el esquema

yn+1 = yn +h

2Ayn +

h

2Ayn+1

luego(Im − h

2A)yn+1 = (Im +

h

2A)yn.

4. Heun genera el esquema

yn+1 = yn +h

2Ayn +

h

2A(yn + Ayn)

luegoyn+1 = (Im + hA+

h2

2A2)yn.

En el caso A simétrica definida negativa, esto es, diagonalizable con todos susautovalores negativos, se puede estudiar la restricción de estabilidad en la norma∥ · ∥2 de estos métodos en términos de los autovalores de una manera muy cómoda.

4.5. Otras ideas para mejorar precisión4.5.1. Métodos de Taylor

La extensión de la idea analítica encontrada en el método de Euler en cuantoal desarrollo de Taylor es trivial y nos lleva a lo que se conoce como métodos deTaylor. Estos métodos tiene mayor orden de aproximación a la derivada que Eulerexplícito.

La dificultad que encontramos es la necesidad de calcular derivadas su-cesivas de la función pendiente y esto hace que estos métodos no se usen enla práctica. En todo caso, es pedagógico su comprensión y por eso los mostramoslevemente.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 144

Page 145: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

4.5. Otras ideas para mejorar precisión 145

El método de Euler explícito se puede entender como una aproximación al desa-rrollo de Taylor

y(tn+1) = y(tn) + hy′(tn) +1

2h2y′′(ξn), ξn ∈ (tn, tn+1)

donde se elimina el término con la potencia h2 y se usa y′(tn) = f(tn, y(tn)) paraescribir el esquema

yn+1 = yn + hf(tn, yn).

Se interpreta como avanzar desde tn a tn + h por la línea recta

r(s) = yn + (s− tn)f(tn, yn)

es decir,r(s) = yn + (s− tn)y

′(tn)

donde y′(tn) se aproxima por f(tn, yn).De la misma forma, podemos también usar un desarrollo con más términos y

escribir

y(tn+1) = y(tn) + hy′(tn) +1

2h2y′′(tn) +

1

3!h3y′′′(ξn), ξn ∈ (tn, tn+1).

y entonces usar un polinomio para avanzar desde tn a tn + h de orden mayor queuno (dos en este caso):

p(s) = yn + (s− tn)y′(tn) +

1

2(s− tn)

2y′′(tn)

y ahora tenemos que reemplazar y′(tn) por f(tn, yn) y la segunda derivada y′′(tn)por la derivacion de f(t, y(t)) con respecto a y(t).

Si usamos la derivación en cadena

y′(t) = f(t, y(t)) ⇒ y′′(t) = ft(t, y(t)) + f(t, y(t))fy(t, y(t))

generamos el esquema

yn+1 = yn + hf(tn, yn) +1

2h2ft(tn, yn) + f(tn, yn)fy(tn, yn)

eliminando la potencia h3. Aquí tendremos un error local O(h3) y tenemos unmétodo con un error global de orden 2.

Ejemplo 89 Tomemos, y′(t) = (1− 2t)y(t)y(0) = 1

145 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 146: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

146 Capítulo 4 Métodos de Euler implícito y de Crank-Nicolson

con solución y(t) = exp(0.25− (t− 0.5)2). Entonces

f(t, y) = (1− 2t)y

de donde

ft = −2y, fy = (1− 2t) ⇒ ft + ffy = −2yn + (1− 2tn)(1− 2tn)yn

y el esquema nos queda como

yn+1 = yn + h(1− 2tn)yn +1

2h2−2 + (1− 2tn)

2yn

con un error local de orden h3. Éste es un método de Taylor de orden 2.

Siguiendo esta misma idea podemos desarrollar métodos de orden p cualquierausando el desarrollo de Taylor de orden p

y(tn+1) = y(tn) + hy′(tn) +1

2h2y′′(tn) + ...+

1

p!hpy(p(tn) +

1

(p+ 1)!hp+1y(p+1(ξn)

y donde ξn ∈ (tn, tn+1). Entonces el esquema queda, usando la notación obvia, como

yn+1 = yn + hy′n +1

2h2y′′n + ...+

1

p!hpy(pn

con un error proporcional a hp+1, sólo tenemos que obtener y(jn = y(j(tn).

En cuanto a la estabilidad de estos métodos, sólo necesitamos condiciones se-mejantes a la condición de Lipschtz para f(t, y) en las distintas derivadas parcialesde f(t, y) que surgen y condiciones de acotación sobre la función. Por lo demás,podemos concluir:

Teorema 90 El método de Taylor de orden p converge con orden p.

El método generado es eficaz en tanto en cuanto sea fácil calcular las derivadasde f pero esto no suele ser así. Además, cuando lo es, hay que construir el métodode forma específica para cada problema. Esta es la razón por lo que no se usa confrecuencia.

En todo caso es útil recordar las derivaciones siguientes:

y(N(t) = (∂t + f(t, y(t)) ∂y)Nf(t, y(t)), N = 1, 2, ....

o abreviadamente,

y(N(t) = (∂t + f ∂y)Nf, N = 1, 2, ....

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 146

Page 147: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

4.5. Otras ideas para mejorar precisión 147

4.5.2. Uso de datos previosSiguiendo la idea del desarrollo de Taylor, escribimos el error local para Euler

explícito como:y(t+ h)− y(t)

h= f(t, y(t)) +

l(t;h)

h

luegoy(t+ h)− y(t)

h≈ y′(t)

con l(t;h) = O(h2), h → 0. Podemos entonces buscar otro desarrollo de Taylorpara y′(t) que haga lo mismo pero con menor error. Por ejemplo, si nos apoyamosen los puntos t− 2h, t− h y +h podemos escribir

y(t+ h) = y(t) + hy′(t) +h2

2y′′(t) +

h3

3!y′′(t) +

h4

4!y′′(t) + ...

y(t− h) = y(t)− hy′(t) +h2

2y′′(t)− h3

3!y′′(t) +

h4

4!y′′(t) + ...

y(t− 2h) = y(t)− 2hy′(t) + 4h2

2y′′(t) +−8

h3

3!y′′(t) + 16

h4

4!y′′(t) + ...

una combinación lineal de coeficientes a, b, c nos da

a y(t+ h) + b y(t− h) + c y(t− 2h) = (a+ b+ c) y(t) + (a− b− 2c)hy′(t)

+ (a+ b+ 4c)h2

2y′′(t) + (a− b− 8c)

h3

3!y′′(t) + ...

Entonces simplemente una elección de parámetros tal que

a+ b+ 4c = 0

nos deja con un orden al menos O(h3) a la hora de aproximar y′(t). Por ejemplo,a = 2, b = −6, c = 1 nos da

2 y(t+ h)− 6 y(t− h) + y(t− 2h) = −3 y(t)− 6hy′(t)− 12h3

3!y′′(t) + ...

de donde

2y(t+ h) + 3y(t)− 6y(t− h) + y(t− 2h)

6h= −y′(t) +O(h2), h → 0.

Dados y0, y1, y2 este esquema trabaja como

1

3yn+1 +

1

2yn − yn−1 +

1

6yn−2 = hf(tn, yn), n ≥ 3

y tiene un error local mejor que el de Euler explícito.

147 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 148: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

148 Capítulo 4 Métodos de Euler implícito y de Crank-Nicolson

Debemos de observar que no es la única elección y hay muchas más alternativasdadas por

a+ b+ 4c = 0 ⇒ c = −a+ b

4

y entonces escojer a y b tal que a− b− 2c = (3a− b)/2 = 0 y

a y(t+ h) + (a+ b+ c) y(t)− b y(t− h) + c y(t− 2h) = (a− b− 2c)hy′(t)

+ (a− b− 8c)h3

3!y′′(t) + ...

Pero no podemos confiarnos a cualquier esquema. Hemos introducido el esquema

1

3yn+1 +

1

2yn − yn−1 +

1

6yn−2 = hf(tn, yn), n ≥ 3

y tiene un error local mejor que el de Euler explícito, aunque necesita tres valorespara empezar. Si lo aplicamos al ejemplo

y′(t) = 2 t (1 + y(t)2), y(0) = 0

cuya solución es y(t) = tan(t2) y empezamos con valores exactos nos econtramoscon la situación de la Figura 4.7 y vemos que reducir el valor de h sólo empeora lasituación.

Esto es debido a que el polinomio p(z) = 13z3 + 1

2z2 − z + 1

6asociado al uso de

los valores yn, yn−1, yn−2 e yn−3 tiene raices de módulo mayor que uno. Sabiendoque r1 = 1 es una raiz el resto se obtienen con facilidad y son r2 ≈ −2.686... yr3 ≈ 0.186.... Se reproduce el mismo fenómeno con la simple y′(t) = 0 con y(0) = 1si tomamos y0 = y1 = 1 e y2 = 1 + 10−13 por ejemplo. Luego no es debido a laecuación diferencial ordinaria que usamos sino al esquema numérico. Básicamentese necesita que las raices de este polinomio sean de módulo menor que uno. Unestudio más detallado de este tipo de métodos nos lleva a los métodos de multipaso.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 148

Page 149: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

4.5. Otras ideas para mejorar precisión 149

Figura 4.7: Método con error local de orden 3 pero inestable, reducir h incrementala inestabilidad.

149 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 150: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

150 Capítulo 4 Métodos de Euler implícito y de Crank-Nicolson

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 150

Page 151: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

Capítulo 5

Métodos de Runge-Kutta

Resumen del tema

Primera lectura:

interpretación geométrica

Conceptos de estabilidad numérica, precisión y orden de convergencia.

5.1. IntroducciónLos métodos de Runge-Kutta se pueden interpretar geométricamente como una

extensión del método de Euler progresivo.Ahora se pretende ajustar mediante un promedio la mejor pendiente por la que

avanzar desde un punto t al punto t+ h. Tienen la característica de que se generancálculos no lineales puesto que se anidan evaluaciones de la función pendiente. Estosmétodos fueron desarrollados en torno a 1900 por los matemáticos alemanes CarlDavid Tomé Runge y Martin Wilhelm Kutta.

Conceptualmente, esta es una mejora muy notable puesto que:

tiene en cuenta el campo de soluciones y las distintas curvas vecinas a labuscada, no sólo la solución que se busca.

Por otro lado, la nolinealidad es una propiedad intrínseca del problema. Por loque es muy razonable que esta nolinealidad aparezca en el método numérico.

Observación 76 Ni el método de Euler implícito ni el método de Crank-Nicolsonpertenecen a la familia de métodos de Runge-Kutta explícitos, pertenecen a la deRunge-Kutta implícitos y también a la de métodos multipaso implícitos.

Vamos a ver varios ejemplos de métodos de tipo Runge-Kutta. El primero de ellosya lo hemos estudiado antes y se incluye porque es una reinterpretacion.

151

Page 152: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

152 Capítulo 5 Métodos de Runge-Kutta

1. Método de Heun de orden 2: Tomamos la pendiente inicial

k1 = f(tn, yn)

y luego avanzamos en esa dirección hasta llegar al punto final del intervalodonde volvemos a tomar una nueva muestra para la pendiente:

k2 = f(tn + h, yn + hk1).

Con los dos valores k1 y k2 terminamos haciendo un promedio

k =1

2k1 +

1

2k2

siendo esta la dirección de avance definitiva

yn+1 = yn + h k.

También se puede entender siguiendo la misma idea que en el método deCrank-Nicolson, pero evitando la dificultad de resolver un problema implícitomediante la aproximación de yn+1 por la expresión

y⋆ = yn + hf(tn, yn)

para luego avanzar definitivamente con

yn+1 = yn +h

2f(tn, yn) + f(tn+1, y⋆).

Este método es de orden 2 con respecto a h.

2. Regla del punto medio: Tomamos la pendiente inicial

k1 = f(tn, yn)

y luego avanzamos en esa dirección hasta llegar al punto medio del intervalodonde volvemos a evaluar la pendiente como muestra.

k2 = f(tn +h

2, yn +

h

2k1).

Con los dos valores k1 y k2 terminamos haciendo un promedio que simplementeconsiste en usar el valor k2

k = 0 k1 + 1 k2 = k2

siendo esta la dirección de avance definitiva

yn+1 = yn + h k.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 152

Page 153: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.1. Introducción 153

También se puede interpretar como que usamos el punto medio del intervalopara aproximar: tomamos

y⋆ = yn +h

2f(tn, yn)

y escribimosyn+1 = yn + hf(tn +

h

2, y⋆).

Este método es de orden 2 con respecto a h.

3. El método de Heun de orden 3: se avanza desde tn hasta tn + h/3 con lapendiente k1 y se genera k2. Luego desde tn hasta tn+2h/3 con la pendiente k2y se genera k3. Finalmente se toma el promedio para avanzar definitivamentea tn + h

k1 = f(tn, yn) (primera pendiente)

k2 = f(tn +1

3h, yn +

1

3hk1) (segunda pendiente)

k3 = f(tn +2

3h, yn +

2

3hk2) (tercera pendiente)

yn+1 = yn + h(1

4k1 +

3

4k3) (uso de pendiente promedio)

Este método es de orden 3 con respecto a h.

4. Finalmente el ejemplo más popular es este método conocido como Runge-Kutta clásico de orden 4: se avanza desde tn hasta tn+h/2 con la pendientek1 y desde tn también hasta el mismo punto tn + h/2 pero ahora con lapendiente k2. Luego avanzamos hasta tn + h con k3 y finalmente se toma elpromedio para avanzar definitivamente a tn + h

k1 = f(tn, yn),

k2 = f(tn +h

2, yn +

h

2k1),

k3 = f(tn +h

2, yn +

h

2k2),

k4 = f(tn + h, yn + h k3),

yn+1 = yn +h

6(k1 + 2 k2 + 2 k3 + k4).

La popularidad de este último método provienen de la era pre-computacional(antes de los años 50) puesto que los coeficientes son sencillos y además tieneorden 4. Esto fue decisivo para su extensión como el más usado ya que loscálculos se hacían a mano.Este método es de orden 4 con respecto a h.

153 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 154: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

154 Capítulo 5 Métodos de Runge-Kutta

La forma más general de un método de Runge-Kutta consiste en tomar S mues-tras de pendientes k1, k2, .., kS y promediarlas para generar una nueva dirección deavance. En esta nueva dirección se da el paso definitivo.

1. Dado y0 ≈ y(t0), para 0 ≤ n ≤ N − 1

2. Construir las pendientes k1, k2, .., kS y obtener la pendiente promedio

k =S∑

i=1

bi ki

siendo b1 + b2 + ...+ bS = 1.

3. Dar el paso definitivo en esta dirección promedio generada

yn+1 = yn + hk.

Al número de muestras S obtenidas se le llama etapas del método y los valoreski siguen la misma idea de promediar pendientes. Veamos como se hace

5.2. Métodos de Runge-Kutta explícitosSupongamos que partimos del valor k1 = f(tn, yn). En la etapa i = 2, 3, ..., S

construimos la pendiente ki usando las pendientes k1, k2, ..., ki−1 como sigue: Toma-mos una pendiente promedio dada por

ki =i−1∑j=1

αi,jkj

donde αi,1 + αi,2 + .. + αi,i−1 = 1 son arbitrarios. Por ejemplo, si i = 2 entoncessimplemente k2 = k1, si i = 3 entonces k3 = α3,1k1 + α3,2k2 para α3,1 + α3,2 = 1,etc...

Entonces avanzamos desde tn y por la dirección ki una longitud cih, esto es,usamos la recta

ri(x) = yn + (x− tn)ki

y tomamos muestra en tn + cih:

yn+ci = ri(tn + cih) = yn + cihki = yn + h

i−1∑j=1

ciαi,jkj.

Usando la notación ai,j = αi,jci, j = 1, 2, 3, .., i− 1 lo podemos escribir como

yn+ci = yn + h

i−1∑j=1

ai,jkj

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 154

Page 155: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.3. Métodos de Runge-Kutta implícitos 155

siendo evidente que

ai1 + ai2 + ....+ ai,i−1 = ci(αi,1 + αi,2 + ..+ αi,i−1) = ci, i = 2, 3, .., S − 1

Entonces calculamos la pendiente en este nuevo punto

ki = f(tn + cih, yn+ci),

o lo que es lo mismo, sabiendo que c1 = 0,

k1 = f(tn, yn),

ki = f(tn + cih, yn + h(ai1k1 + ai2k2 + ....+ ai,i−1ki−1)), i = 2, ..., S.

Observación 77 El adjetivo explícito se refiere a la forma de cálcular de las pen-dientes kj entre sí. La pendiente kj se calcula en función de los valores ya conocidoski para i < j.

5.3. Métodos de Runge-Kutta implícitosLa misma idea se puede generalizar haciendo que los valores k1, k2, ..., kS depen-

dan todos entre sí. La dependencia entre las pendientes ahora no es explícita.

Observación 78 El adjetivo implícito se refiere a la forma de cálcular de las pen-dientes kj. La pendiente kj se calcula en función todos los valores ki sean estosconocidos o no.

En cada etapa i para i = 1, 2, ..., S construimos una pendiente promedio dada por

ki =S∑

j=1

αi,jkj =i−1∑j=1

αi,jkj +S∑

j=i−1

αi,jkj

donde tomamos αi,1 + αi,2 + . . . + αi,S = 1 arbitrarios, observar que el segundosumando es la novedad e incluye los valores kj para j ≥ i.

Ahora, continuamos igual que en el caso explícito. Avanzamos por la direcciónki y desde tn una longitud cih. Esto es, usamos la recta

ri(x) = yn + (x− tn)ki

y el valor tomado nuevo es

yn+ci = ri(tn + cih) = yn + cihki

que se puede reescribir como

yn+ci = yn + h

S∑j=1

ai,jkj

155 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 156: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

156 Capítulo 5 Métodos de Runge-Kutta

donde ai,j = αi,jci, i, j = 1, 2, 3, .., S. Entonces, para ser coherentes con nuestrodesarrollo, queremos tener

ki = f(tn + cih, yn+ci),

o lo que es lo mismo,

ki = f(tn + cih, yn + h(ai1k1 + ai1k2 + ....+ aiSkS)), i = 1, 2, ..., S.

Otra vez, se tiene que

ai1 + ai1 + ....+ aiS = ci(αi,1 + αi,2 + ..+ αi,S) = ci, i = 1, 2, ..., S.

El cálculo de las pendientes ki se hace mediante la resolución de una ecuación depunto fijo en general no lineal de dimensión S en la forma

K = F (K).

También puede ocurrir que la dependencia implícita no sea muy fuerte. Por ejemplo,en el caso donde sólo se usa aii nos encontramos con S ecuaciones no linealesdesacopladas

ki = f(tn + ci h, yn + hi−1∑j=1

aij kj + haii ki), i = 1, 2, .., S

(separamos la suma en la parte conocida h∑i−1

j=1 aij kj y la parte desconocida paraki) es decir, para cada ki tenemos que resolver una ecuación de punto fijo que sóloinvolucra a ki:

ki = gi(ki).

Aquí el esfuerzo computacional es menor y estos métodos se denominan métodossemi-implicitos.

5.4. Forma general y tablero de ButcherResumiendo, la forma más general de un método de Runge-Kutta consiste

en tomar S muestras de pendientes k1, k2, .., kS y promediarlas para avanzar en lanueva dirección obtenida. Esto es,

1. Dado y0 ≈ y(t0), para 0 ≤ n ≤ N − 1

2. Construir las pendientes k1, k2, .., kS definidas por

ki = f(tn + cih, yn + h(ai1k1 + ai2k2 + ....+ aiSkS)), i = 1, 2, ..., S

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 156

Page 157: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.4. Forma general y tablero de Butcher 157

siendoS∑

j=1

aij = cj, i = 1, 2, ..., S

y obtener la pendiente promedio

k =S∑

i=1

bi ki

siendo b1 + b2 + ...+ bS = 1.

3. Dar el paso definitivo en esta dirección promedio generada

yn+1 = yn + hk.

Los coeficientes ai,j, ci, bi determinan completamente el método de Runge-Kutta y normalmente se recolectan en lo que se conoce como matriz o tablerode Butcher (introducido por John Butcher en los años 60 [4].)

En el caso explícito el tablero queda como

0 0 0 . . . 0 0c2 a2,1 0 . . . 0 0c3 a3,1 a3,2 0 . . . 0... ... ... . . . . . . 0cS aS,1 aS,2 . . . aS,S−1 0

b1 b2 . . . bS−1 bS

es decir, en la formac A

b

donde A es una matriz cuadrada S×S con ceros en la diagonal y en la parte superiora la diagonal. De acuerdo a esto, los ejemplos del comienzo se pueden describir comosigue:

Ejemplo 91 El Método de Heun de orden 2 es

k1 = f(tn, yn)

k2 = f(tn + h, yn + hk1)

yn+1 = yn +h

2(k1 + k2)

luego su tablero es0 0 01 1 0

1/2 1/2

157 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 158: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

158 Capítulo 5 Métodos de Runge-Kutta

En el caso de la regla del punto medio:

k1 = f(tn, yn)

k2 = f(tn + h/2, yn + h/2k1)

yn+1 = yn + hk2

y su tablero es0 0 01/2 1/2 0

0 1

En el método de Heun de orden 3:

k1 = f(tn, yn)

k2 = f(tn +1

3h, yn +

1

3hk1)

k3 = f(tn +2

3h, yn +

2

3hk2)

yn+1 = yn + h(1

4k1 +

3

4k3)

su tablero es0 0 0 01/3 1/3 0 02/3 0 2/3 0

0 1/4 3/4

y finalmente para el método Runge-Kutta clásico de orden 4 dado por

k1 = f(tn, yn),

k2 = f(tn +h

2, yn +

h

2k1),

k3 = f(tn +h

2, yn +

h

2k2),

k4 = f(tn + h, yn + h k3),

yn+1 = yn +h

6(k1 + 2 k2 + 2 k3 + k4).

su tablero es0 0 0 0 01/2 1/2 0 0 01/2 0 1/2 0 01 0 0 1 0

1/6 2/6 2/6 1/6

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 158

Page 159: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.5. Estudio del error local 159

mientras que en el caso semi-implícito el tablero queda comoc1 a1,1 0 0 . . . 0 0c2 a2,1 a2,2 0 . . . 0 0c3 a3,1 a3,2 a3,3 0 . . . 0... ... ... . . . . . . . . . 0... ... ... . . . . . . 0 0cS aS,1 aS,2 . . . . . . aS,S−1 aS,S

b1 b2 . . . . . . bS−1 bS

es decir, en la formac A

b

donde A es una matriz cuadrada S×S con ceros en la parte superior a la diagonal.Estos esquemas son los métodos clásicos dentro de la familia general de méto-

dos de Runge-Kutta. Los primeros métodos explícitos aparecieron en 1895 y hastalos años 1960 aproximadamente sólo se consideraron métodos explícitos. Se handesarrollado también métodos implícitos en los valores de k1, .., kS puesto que, aun-que son computacionalmente mas costosos, se encuentran mejor adaptados a losproblemas rígidos.Observación 79 Se dice que son métodos de un paso ya que se avanza desdetn a tn+1

Observación 80 Siempre son métodos de un paso explícitos con respecto alvalor buscado yn+1. Pueden no serlo con respecto a las pendientes k1, k2, ..., kS.

5.5. Estudio del error localPor construcción son todos métodos consistentes. Efectivamente, usando el desa-

rrollo de Taylor en torno al punto (t, y(t))

ki = f(t+ cih, y(t) + h(ai1k1 + ....+ aiSkS)) = f(t, y(t)) +O(h) = y′(t) +O(h)

luego gracias a la restricciónb1 + b2 + ...+ bS = 1,

tenemos

l(t;h) = y(t+ h)− y(t)− hS∑

i=1

bi ki(t, y(t);h)

= h y′(t) +O(h2)− h(S∑

i=1

bi y′(t)−O(h))

= h y′(t)− h y′(t) +O(h2) = O(h2).

159 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 160: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

160 Capítulo 5 Métodos de Runge-Kutta

luego el error local o de consistencia es siempre al menos O(h2).La idea ahora es usar los parámetros y el número de etapas para aumentar el

orden local o de consistencia del método

5.6. Familias RKE de acuerdo al ordenRecordemos que un método convergente se dice que tiene orden de convergencia

p si su error local tiene orden p+ 1.

5.6.1. Métodos RKE con S = 1

En el caso S = 1 reduce la matriz de Butcher a la situación trivial

0 01

que representa el método de Euler explícito. Sabemos que es de orden 1 y hayejemplos donde este error es exactamente 1.

5.6.2. Métodos RKE con S = 2

En este caso tenemos como matriz de Butcher

0 0 0c2 a2,1 0

b1 b2

con c2 = a2,1 y b1 + b2 = 1. Por lo tanto tenemos

k(t, y;h) = b1 k1 + b2 k2,

k1 = k1(t, y(t)) = f(t, y(t)) = y′(t),

k2 = k1(t, y(t);h) = f(t+ c2 h, y(t) + h c2 k1).

El error local resulta ser

l(t;h) = y(t+ h)− y(t)− h b1 k1(t, y(t);h) + b2 k2(t, y(t);h)

Podemos entonces escribirlo como

l(t;h) = y(t+ h)− y(t)− h b1 y′(t)− h b2 k2

Usando el desarrollo de Taylor para y(t+ h) respecto a t obtenemos

y(t+ h)− y(t) = h y′(t) +h2

2y′′(t) +

h3

3y′′′(t) +O(h4)

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 160

Page 161: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.6. Familias RKE de acuerdo al orden 161

de donde

l(t;h) = h y′(t) +h2

2y′′(t) +

h3

3!y′′′(t) +O(h4)− h b1 y

′(t)− h b2 k2.

Recordemos que desarrollo de Taylor de una función de dos variables se puededescribir de forma simbólica como

f(t+ h, y + k) =∑n≥0

1

n!h∂t + k∂yn f(t, y).

Vamos a desarrollar por Taylor k2 = f(t + h c2, y(t) + h a21 f(t, y(t))) en el punto(t, y(t)). Abreviaremos usando f = f(t, y(t)), ∂tf = ft, ∂ttf = ftt, .... y también quec2 = a2,1. Entonces tenemos

k2 = f(t, y(t)) + hc2ft + y′(t)fy

+1

2!h2c22ftt + 2h c2h a21 ffty + h2 a221 f

2fyy+O(h3)

= y′(t) + hc2y′′(t) +

h2c222

ftt + 2f fty + f 2fyy) +O(h3)

usando que y′(t) = f(t, y(t)) y entonces y′′(t) = ft + f fy. Por lo tanto, tenemos

l(t;h) = h y′(t) +h2

2y′′(t) +

h3

3!y′′′(t) +O(h4)

−b1h y′(t)− h b2 y

′(t)− h2 b2 c2 y′′(t)

−h3b2c22

2ftt + 2f fty + f 2fyy) +O(h4)

usando que b1 + b2 = 1 el término h y′(t) se anula y nos queda

l(t;h) = (1

2− b2 c2) y

′′(t)h2 + [1

6y′′′(t)− b2c

22

2ftt + 2f fty + f 2fyy]h3 +O(h4).

Si forzamos c2b2 = 1/2 el término h y′′(t) también se anula nos queda

l(t;h) = h3[1

6y′′′(t)− c2

4ftt + 2f fty + f 2fyy] +O(h4) h → 0.

luego tenemos

l(t;h) = O(h3) h → 0.

Observación 81 ¿Podemos mejorar esto para cualquier solucion de cualquier pro-blema de Cauchy? Es decir, ¿Podemos tener l(t;h) = O(h4) h → 0 para cualquiersolucion de cualquier problema de Cauchy? La respuesta es que no. Es decir, el co-eficiente de la potencia h3 no se anula en general. Sólo necesitamos encontrar una

161 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 162: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

162 Capítulo 5 Métodos de Runge-Kutta

solución de un problema de Cauchy donde no se pueda conseguir esto. Es decir,sólo hay que encontrar un ejemplo donde

1

6y′′′(t)− c2

4ftt + 2f fty + f 2fyy = 0

y tendremos que no se puede mejorar a O(h4), es decir, el error local en este casose mantiene proporcional a O(h3).

Los casos triviales son normalmente bastante para aclarar estas situaciones.Por ejemplo, tomamos f(t, y) = y de donde la solucion es y(t) = et y entoncesy′′′(t) = et. Como f(t, y) = y tenemos que fy = 1 y ftt+2f fty+f 2fyy = 0 entonces

l(t;h) =1

6et h3 +O(h4) h → 0.

También podemos usar f(t, y) = a y + b con la solución exacta y(t) = −b/a.Luego el mayor orden posible con S = 2 del error local es 3, lo que nos da un

error global 2.

Por lo tanto, para cualquier solución lo suficientemente regular se garantiza que elerror global de este método decae como O(h2) cuando h → 0 y existe al menos unasolución donde el decaimiento del error no es más rápido que O(h2) cuando h → 0.Por lo tanto el orden de convergencia 2 no es mejorable.

Una familia de métodos de orden 2

Nos encontramos entonces con una completa familia de métodos de Runge-Kuttaexplícitos (RKE) de orden 2 caracterizada por las restricciones sobre los parámetros

b1 + b2 = 1, c2 b2 = 1/2, (c2 = a2,1).

Evidentemente, como tomamos siempre la restricción

b1 + b2 = 1

entoncesc2 b2 = 1/2 ⇒ orden 2

c2 b2 = 1/2 ⇒ orden 1

Si usamos γ = c2 (sabemos que 0 < γ ≤ 1 por ser γh la longitud que avanzamosdentro de [tn, tn+1]) encontramos que básicamente sólo hay un parámetro y el restoestá en función de γ. Por ejemplo,

b2 = 1/(2γ), b1 = 1− 1/(2γ), a2,1 = γ

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 162

Page 163: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.6. Familias RKE de acuerdo al orden 163

Por lo tanto, aparece una familia infinita de métodos de Runge-Kutta explícitosde orden 2 que depende de un sólo parámetro. El tablero de Butcher es

0 0 0γ γ 0

1− 1/(2γ) 1/(2γ)

Ejemplo 92 Si γ = 1 se conoce como método de Heun de segundo orden

dado y0

yn+1 = yn + h f(tn, yn),

yn+1 = yn +h

2

(f(tn, yn) + f(tn+1, yn+1)

), n = 0, 1, ..., N − 1.

También se puede escribir como

dado y0

yn+1 = yn + h 12k1 +

1

2k2, n = 0, 1, ..., N − 1,

dondek1 = f(tn, yn), k2 = f(tn + h, yn + h k1)

y el tablero de Butcher es0 0 01 1 0

1/2 1/2

Ejemplo 93 Vemos aquí un método de dos etapas y con orden 1 ya que no cumplelas restricciones. Es una aproximación al método de Euler implícito dada por

yn+1 = yn + h f(tn + h, yn + h f(tn, yn))

que se entiende mejor si se escribe como

k1 = f(tn, yn), k2 = yn + h k1

y despuésyn+1 = yn + h k2

luego se puede ver como querer resolver el problema no lineal del esquema de Eulerimplícito mediante una iteración de punto fijo y realizar sólo una iteración. Eltablero de Butcher es

0 0 01 1 0

0 1

163 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 164: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

164 Capítulo 5 Métodos de Runge-Kutta

Ejemplo 94 En general, si γ = 1 y θ ∈ (0, 1) tenemos la familia de esquemas

yn+1 = yn + h(θ f(tn, yn) + (1− θ) f(tn + h, yn + h f(tn, yn))).

con tablero de Butcher0 0 01 1 0

θ 1− θ

que se pueden mirar como una linealización del caso más general e implícito

yn+1 = yn + h(θ f(tn, yn) + (1− θ) f(tn+1, yn+1)).

Aquí tenemos c = 1 y b1 = θ luego y sólo tenemos orden dos cuando θ = 1/2, en elresto de casos es orden 1.

Ejemplo 95 Si γ = 1/2 tenemos la versión explícita de la regla del punto medio

yn+1 = yn + h f(tn +h

2, yn +

h

2f(tn, yn))

y sí que tenemos orden 2 ya que b2 = 1 y b1 = 0 y el tablero de Butcher

0 0 01/2 1/2 0

0 1

5.6.3. Métodos de RKE con S = 3

Las mismas ideas pero un uso más intensivo de los desarrollos de Taylor. Parael tablero de Butcher

0 0 0 0c2 a21 0 0c3 a31 a32 0

b1 b2 b3

las restricciones que se obtienen sobre los parámetros son

b1 + b2 + b3 = 1,

b2c2 + b3c3 = 1/2,

b2c22 + b3c

23 = 1/3,

b3c2a3,2 = 1/6.

Tenemos cuatro ecuaciones y seis incógnitas, por lo tanto aparecen dos familiasinfinitas de métodos de RK explícitos de orden 3. Se puede observar también porlos desarrollos de Taylor que este es el mayor orden posible con S = 3.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 164

Page 165: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.6. Familias RKE de acuerdo al orden 165

Ejemplos típicos son el método de Heun de tercer orden

k1 = f(tn, yn)

k2 = f(tn +1

3h, yn +

1

3hk1)

k3 = f(tn +2

3h, yn +

2

3hk2)

yn+1 = yn + h(1

4k1 +

3

4k3).

En el siguiente método se observa la posibilidad de usar coeficientes negativos.Se pueden interpretar como usar −k1 en vez de k1 en el cálculo de la pendientepromedio entre k1 y k2: k3 = −k1 + 2k2.

k1 = f(tn, yn)

k2 = f(tn +1

2h, yn +

1

2hk1)

k3 = f(tn + h, yn − h k1 + 2h k2)

yn+1 = yn + h(1

6k1 +

4

6k2 +

1

6k3)

la matriz de Butcher en este caso es

0 0 0 01/2 1/2 0 01 −1 2 0

1/6 4/6 1/6

Un último ejemplo lo constituye el método de Nystrom, cuya matriz de Butcheren este caso es

0 0 0 02/3 2/3 0 02/3 0 2/3 0

1/4 3/8 3/8

y a partir de aquí el método se escribe como

yn+1 = yn + h(1

4k1 +

3

8k2 +

3

8k3)

k1 = f(tn, yn)

k2 = f(tn +2

3h, yn +

2

3hk1)

k3 = f(tn +2

3h, yn +

2

3h k2)

165 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 166: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

166 Capítulo 5 Métodos de Runge-Kutta

5.6.4. Métodos de RKE con S = 4

Ya vemos que la técnica estandard para derivar estos métodos consiste en hacerdesarrollos de Taylor y forzar el mayor numero de coeficientes de potencias de h ceroen el desarrollo de Taylor de y(t+ h) en torno a t. Un desarrollo similar nos lleva alas condiciones para obtener métodos de cuarto orden, que no nos molestamos enescribir.

El ejemplo clásico de Runge-Kutta explícito de orden 4 con 4 etapas es

yn+1 = yn +h

6(k1 + 2 k2 + 2 k3 + k4)

k1 = f(tn, yn)

k2 = f(tn +1

2h, yn +

1

2hk1)

k3 = f(tn +1

2h, yn +

1

2hk2)

k4 = f(tn + h, yn + h k3)

y la matriz de Butcher en este caso es

0 0 0 0 01/2 1/2 0 0 01/2 0 1/2 0 01 0 0 1 0

1/6 2/6 2/6 1/6

Tener coeficientes sencillos y alto orden fue decisivo para su extensión como el másusado en la era pre-computacional, esto es, cuando había que hacer los cómputos amano.

5.6.5. ResumenHemos obtenido

si S = 1 existe un sólo método explícito de orden 1

si S = 2 existe una familia infinita que depende de un parámetro de métodosexplícitos de orden 2

si S = 3 existe una familia infinita que depende de dos parámetros de métodosexplícitos de orden 3

si S = 4 existe una familia infinita que depende de dos parámetros de métodosexplícitos de orden 4

Observación 82 Varias puntualizaciones son interesantes aquí

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 166

Page 167: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.7. Estudio de la estabilidad: 0-estabilidad 167

El resultado para S = 4 indica algún tipo de anomalía en la generalizacióndel estudio del orden.

Los términos de error ya no son simples sino que incluyen expresiones com-plicadas con derivadas de orden alto de la función f.

Se hace uso de los desarrollos de Taylor de forma intensiva. Estos desarrolloscambian cuando se aplica a funciones vectoriales, por ejemplo, el Teorema delValor Medio ya cambia en el caso vectorial. Esto indica que la extensión alcaso vectorial no va a ser directa.

Estudio de métodos RK explícitos de alto ordenHemos construido métodos de S etapas con orden S para S = 1, 2, 3, 4. Es

natural preguntarse si esta pauta se mantiene para S ≥ 5. La respuesta a estapregunta se debe a John Butcher en torno a 1960 y es negativa [4]. El siguienteresultado presenta una relación entre el orden de un método y las etapas:

Teorema 96 El orden de un método de Runge-Kutta explícito de S etapas no puedeser mayor que S. Tampoco existe un método de Runge-Kutta explícito de S etapasque tenga orden S para S ≥ 5.

En particular, para ordenes entre 1 y 10 el mínimo número Smin de etapasrequeridas para obtener un método con ese mismo orden se muestra en la siguientetabla

orden 1 2 3 4 5 6 7 8Smin 1 2 3 4 6 7 9 11

entonces se puede observar que 4 es el número máximo para el que el ordencoincide con las etapas. Para más de 4 etapas ya el orden es más pequeño que elnúmero de etapas. Por lo tanto, es como decir que el esfuerzo en la construcción delmétodo se ve recompensado si S ≤ 4 pero ya no para S ≥ 5. Esta es una respuestamás a la popularidad de los métodos de cuatro etapas y de entre ellos el clásicocuyos coeficientes son más fáciles.

5.7. Estudio de la estabilidad: 0-estabilidadHemos visto la consistencia de los métodos y sabemos que todos son consistentes

puesto que cumplen al menosl(h) = O(h2).

Veamos ahora la estabilidad. Como ya hemos visto, un aspecto fundamental es lapropagación de errores a lo largo de los distintos pasos que tengamos que hacer,esto es la estabilidad del método.

167 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 168: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

168 Capítulo 5 Métodos de Runge-Kutta

Dado y0 para calcular en [t0, t0 + T ] con h = T/N (h) consideramos el esquema

yn+1 = yn + h∑S

i=1 bi ki(tn, yn;h), 0 ≤ n ≤ N (h) − 1

junto con su perturbación: dados z0,

zn+1 = zn + h[∑S

i=1 bi ki(tn, zn;h) + δ(h)n ], 0 ≤ n ≤ N (h) − 1.

Definición 97 Decimos que el método es 0-estable (leer cero-estable) cuandofijado el intervalo de cálculo [t0, t0 + T ] y particiones de talla h con h = T/N , si laperturbación cumple |δ(h)n | ≤ ϵ para ϵ > 0, entonces existe una constante C(T, f) yh0 > 0 tal que para todo h < h0 se cumple

|z(h)n − y(h)n | ≤ C ϵ+ |z0 − y0|, 1 ≤ n ≤ N = T/h.

Observación 83 Generalizamos mediante el uso del término extra δ(h)n el concepto

ya visto de estabilidad, antes usabamos δ(h)n = 0, pero no afecta la idea básica

Esta es una propiedad fundamental del método numérico que nos permite amorti-guar los errores que se introducen en cada paso del cálculo.

Observación 84 Hablamos del comportamiento cuando h → 0+.

Teorema 98 Todos los métodos de Runge-Kutta explícitos son cero estables.

Dem: Para esto sólo tenemos que garantizar que la expresión

Φf (t, y;h) =S∑

i=1

bi ki(t, y;h)

cumple una condición de Lipschitz con respecto a su segundo argumento de ma-nera uniforme para h < h0 si es preciso. Esto es, para todo h < h0 se tiene MΦf

independiente de h tal que

|Φf (t, z;h)− Φf (t, y;h)| ≤ MΦf|z − y|.

Esto se deduce de la condición de Lipschitz satisfecha por f(t, y) de forma inductiva.

Ejemplo 99 La cero estabilidad para el Método de Euler progresivo

Φ(t, y;h) = f(t, y)

se obtiene de la condición de Lipschitz para f con respecto a la segunda variable, esdecir, MΦf

= Lf .

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 168

Page 169: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.7. Estudio de la estabilidad: 0-estabilidad 169

Ejemplo 100 Para el método de Heun se sigue igual: veamos

Φ(t, y;h) =1

2f(t, y) + f(t+ h, y + h f(t, y))

entonces, si |f(t, y)− f(t, z)| ≤ Lf |y − z|

|Φ(t, y;h)− Φ(t, z;h)| ≤ 1

2|f(t, y)− f(t, z)|

+1

2|f(t+ h, y + hf(t, y))− f(t+ h, z + hf(t, z))|

≤ Lf

2|y − z|+ Lf

2|y + hf(t, y)− z − hf(t, z)|

≤ Lf |y − z|+hL2

f

2|y − z| = (Lf +

hL2f

2)|y − z|.

Entonces, para cualquier h0 > 0 fijamos MΦf= Lf +h0 L

2f/2 y tenemos que MΦf

≥Lf + hL2

f/2 por lo que

|Φ(t, y;h)− Φ(t, z;h)| ≤ (Lf +hL2

f

2)|y − z| ≤ MΦf

|y − z|, h ≤ h0.

Teorema 101 Todos los métodos de Runge-Kutta explícitos son cero estables

Dem: Ponemos w(h)n = z

(h)n − y

(h)n para n = 0, 1, ..., N (h). Entonces

w(h)n+1 = w(h)

n + hΦf (tn, z(h)n ;h)− Φf (tn, y

(h)n ;h)+ h δ

(h)n+1.

Supongamos que |δ(h)n+1| ≤ ϵ, entonces aplicando la propiedad de Lipschitz que cum-ple Φf tenemos

|w(h)n+1| ≤ |w(h)

n |+ hMΦf|w(h)

n |+ h ϵ = (1 + hMΦf)|w(h)

n |+ h ϵ, n ≥ 0.

Una sencilla recursión nos da

|w(h)n+1| ≤ (1 + hMΦf

)|w(h)n |+ h ϵ ≤ (1 + hMΦf

)2|w(h)n−1|+ (1 + hMΦf

)h ϵ+ h ϵ

≤ (1 + hMΦf)3|w(h)

n−2|+ (1 + hMΦf)2h ϵ+ (1 + hMΦf

)h ϵ+ h ϵ

≤ ... ≤ (1 + hMΦf)n+1|w(h)

0 |+ h ϵ

n∑i=0

(1 + hMΦf)i

Usando ahora que 1 + hMΦf≤ ehMΦf y la expresión para una suma geométrica de

razón 1 + hMΦfobtenemos que

|w(h)n+1| ≤ eh(n+1)MΦf |w(h)

0 |+ h ϵ(1 + hMΦf

)n+1 − 1

1 + hMΦf− 1

≤ eT MΦf |w(h)0 |+ ϵ

eT MΦf − 1

MΦf

, n = 0, 1, 2, ...N − 1.

169 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 170: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

170 Capítulo 5 Métodos de Runge-Kutta

Si además también se tiene |w(h)0 | ≤ ϵ entonces para n = 0, 1, 2, ...N − 1

|w(h)n+1| ≤ C ϵ

siendo C = eTMΦf +(eTMΦf −1)M−1Φf

y ϵ el parámetro que acota a las perturbacionesy al error inicial.

Observación 85 El caso δn = 0 es el efecto provocado por el error inicial

|w(h)n+1| ≤ eT MΦf |w(h)

0 |, n = 0, 1, 2, ...N − 1.

Observación 86 Las constantes que garantizan la estabilidad dependen de T y deMΦf

de manera exponencial. Por lo que pueden empeorar de manera muy importan-te. Este resultado cubre un gran espectro de situaciones, por lo tanto es razonableque la estimación sea muy general y tengamos las constantes eTM como ya vimosen el caso de los métodos simples de Euler. Estas estimaciones se podrían mejo-rar con información sobre las derivadas de Φf . Un estudio más fino usando elTeorema del Valor Medio puede dar mejores cotas de error, pero nos llevaa usar el Teorema del Valor Medio para funciones de más de una variable y loscálculos se complican en exceso.

5.8. Convergencia de los métodos RKERecordemos que la forma más general de un método de Runge-Kutta ex-

plícito de S etapas es

1. Dado y0 ≈ y(t0), para 0 ≤ n ≤ N − 1

2. Construir las pendientes k1, k2, .., kS definidas por

ki = f(tn + cih, yn + h(ai1k1 + ai2k2 + ....+ aii−1ki−1)), i = 1, 2, ..., S

siendo c1 = ai,j = 0 para j = 1...S y

i−1∑j=1

aij = cj, i = 2, ..., S,

obtener la pendiente promedio

k =S∑

i=1

bi ki

siendo b1 + b2 + ...+ bS = 1.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 170

Page 171: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.8. Convergencia de los métodos RKE 171

Figura 5.1: Interpretación gráfica del error global para un método de un paso cual-quiera. Los trazos rectos se construyen con el método mientras que la curva continuaes la solución exacta. En cada vertical tn se ve el error local en el trazo grueso y elresto depende de aplicar el esquema en puntos originales distintos.

3. Dar el paso definitivo en esta dirección promedio generada

yn+1 = yn + hΦf (t, y;h)

siendo

Φf (t, y;h) =S∑

i=1

bi ki(t, y;h).

Tenemos entonces la misma estructura que con el método de Euler explícito, salvoque hemos reemplazado la dirección de avance f(t, y) por Φf (t, y;h). Pero sobreΦf (t, y;h) tenemos una condición de Lipschitz global para h < h0 y tenemos tambiénun error local de consistencia al menos O(h2). Por lo tanto, la misma demostraciónnos da la convergencia con orden al menos O(h). En este caso además podemostener ordenes mayores dependiendo de la elección del número de etapas S y de loscoeficientes.

Aparte del argumento analítico se puede otra vez interpretar geométricamentemediante el uso del abanico de Lady Windemere, ver Figura 5.1.

Teorema 102 Todos los métodos de Runge-Kutta explícitos son convergentes conorden al menos uno. Además, si un método de Runge-Kutta es consistentecon orden O(hp) entonces converge con orden p siempre que el error inicialtambién sea O(hp).

171 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 172: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

172 Capítulo 5 Métodos de Runge-Kutta

Observación 87 Es claro que hemos reemplazado y′(t) = f(t, y(t)) por la expresión

yn+1 − ynh

=∑S

i=1 bi ki, n ≥ 0

luego queremos

yn+1 − ynh

≈ y′(tn) (5.1)

y también

S∑i=1

bi ki ≈ f(tn, y(tn)). (5.2)

Observación 88 También se pide que el error inicial |y(th0)− yh0 | tienda a cero.

Observación 89 Este resultado usa h → 0+ por lo que no se preocupa de laposibilidad de que el valor h sea tan pequeño que resulte impracticable. Ya hemoshablado de esto, la reducción del parámetro h puede ser para

conseguir mayor precisión o

simplemente para que el método no se desestabilize.

Una clasificación más cercana a la práctica la ofrece el concepto de estabilidadabsoluta o A-estabilidad que ya veremos más adelante.

5.9. Extensión a sistemasDesde el punto de vista práctico la extensión de los esquemas de Runge-Kutta

explícitos a sistemas es un aspecto trivial consistente en repetir las ecuacionespara cada incógnita del sistema de manera ordenada. Por ejemplo, si tenemosun sistema de dos ecuaciones

x′(t) = f(t, x(t), y(t))

y′(t) = g(t, x(t), y(t))

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 172

Page 173: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.9. Extensión a sistemas 173

y queremos aplicar el método clásico de Runge-Kutta explícito de orden 4 con 4etapas dado por

wn+1 = wn +h

6(k1 + 2 k2 + 2 k3 + k4)

k1 = f(tn, wn)

k2 = f(tn +1

2h,wn +

1

2hk1)

k3 = f(tn +1

2h,wn +

1

2hk2)

k4 = f(tn + h,wn + h k3)

entonces debemos de calcular como sigue:

kx1 = f(tn, xn, yn)

ky1 = g(tn, xn, yn)

kx2 = f(tn +1

2h, xn +

1

2hkx1, yn +

1

2hky1)

ky2 = g(tn +1

2h, xn +

1

2hkx1, yn +

1

2hky1)

kx3 = f(tn +1

2h, xn +

1

2hkx2, yn +

1

2hky2)

ky3 = g(tn +1

2h, xn +

1

2hkx2, yn +

1

2hky2)

kx4 = f(tn + h, xn + hkx3, yn + hky3)

ky4 = g(tn + h, xn + hkx3, yn + hky3)

y entonces

xn+1 = xn +h

6(kx1 + 2 kx2 + 2 kx3 + kx4)

yn+1 = yn +h

6(ky1 + 2 ky2 + 2 ky3 + ky4).

La notación compacta vectorial mimetiza exactamente el caso de una ecuación.Ponemos

X = (x, y)⋆, F (t,X) = (f(t, x, y), g(t, x, y))⋆ = (f(t,X), g(t,X))⋆

donde ⋆ es traspuesta. Entonces el sistema se escribe como

X ′(t) = F (t,X(t))

173 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 174: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

174 Capítulo 5 Métodos de Runge-Kutta

y el método se escribe como

Xn+1 = Xn +h

6(K1 + 2K2 + 2K3 +K4)

K1 = F (tn, Xn)

K2 = F (tn +1

2h,Xn +

1

2hK1)

K3 = F (tn +1

2h,Xn +

1

2hK2)

K4 = F (tn + h,Xn + hK3)

con la notación obvia para Kj = (kxj, kyj)⋆.

En la obtención de estos métodos siempre se supuso además que el problemaera escalar y que nada importante ocurre cuando pasamos al caso de sistemas. Peroen este caso, los desarrollos de Taylor nos llevan al Jacobiano y a otros entes demayor orden. La dificultad intrínseca en estos objetos matemáticos fue simplificadagracias a la introducción de la Teoría de árboles por parte de John C. Butcheren torno a 1960. Esta teoría relaciona la forma en la que se van construyendo lassucesivas derivadas con aspectos de la teoría de grafos que simplifican el estudio.

Se esperaba que cuando se obtuviese un método de orden p para un problemaescalar, este orden se mantuviese en el caso vectorial. Pero de la Teoría de Butcherse deduce que no es así, siendo este un resultado que sorprendió a la comunidadcientífica en este campo cuando se dio a conocer. También hay que mirar con cuidadolas ecuaciones autónomas escalares, esto es, para m = 1.

Un método de RK de orden p en el caso escalar m = 1 puede tenerorden menor que p en el caso de sistemas m > 1.

vamos a recopilar una serie de resultados sin demostración:

Teorema 103 Todo método de RK de orden p = 1, 2, 3, 4 en el caso m = 1 seextiende a un método del mismo orden en el caso de sistemas, m > 1.

Teorema 104 Consideremos las siguientes hipótesis

A el método RK tiene orden p para y′(t) = f(t, y(t)) con m > 1.

B el método RK tiene orden p para y′(t) = f(t, y(t)) con m = 1.

C el método RK tiene orden p para y′(t) = f(y(t)) con m = 1.

Tenemos entonces

Si 1 ≤ p ≤ 3 entonces A ⇐⇒ B ⇐⇒ C

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 174

Page 175: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.9. Extensión a sistemas 175

Si p = 4 entonces A ⇐⇒ B ⇒ C pero C ⇏ B.

Si p ≥ 5 entonces A ⇒ B ⇒ C pero C ⇏ B y B ⇏ A.

Ejemplo 105 El siguiente método de Runge-Kutta de cuatro etapas

k1 = f(tn, yn)

k2 = f(tn +1

2h, yn +

1

2h k1),

k3 = f(tn − h, yn +1

2h k1 −

3

2h k2),

k4 = f(tn + h, yn +4

3h k2 −

1

3h k3),

yn+1 = yn +h

6(k1 + 4 k2 + k4),

posee orden 4 cuando se aplica a problemas autónomos pero orden 3 si se aplicaa problemas no autónomos, esto es, sus coeficientes no cumplen las restriccionesadecuadas para obtener orden máximo correspondiente a cuatro etapas.

Este efecto se puede ver sobre los problemas:

1. para t ∈ [0, 3] y con dato inicial y(0) = 1 los dos problemas escalares

(I) y′(t) =√

y(t), (II) y′(t) =y(t)

1 + t/2

tienen la misma solución y(t) = (1+ t/2)2. Cuando se aplica al problema (II)resulta ser de orden 3, pero si se aplica al problema (I) es de orden 4.

2. También con dato inicial y(0) = 1 sobre los dos problemas escalares

(I) y′(t) = y(t), (II) y′(t) = t y(t)

se presenta orden 4 en (I) y orden 3 en (II).

Ejemplo 106 y(t) = (t+ 1)2 es solución de

y′(t) = 2 (t+ 1), y(0) = 1

y dey′(t) = 2y(t)/(t+ 1), y(0) = 1.

Se puede ver que el método de Heun es exacto cuando se aplica a la primera ecuaciónpero no lo es cuando se aplica a la segunda.

175 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 176: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

176 Capítulo 5 Métodos de Runge-Kutta

5.10. Estabilidad absoluta: A-estabilidadUn campo continuo tiene comportamientos localmente distintos. Para simplificar

hacemos un estudio local del problema continuo y para ello linealizamos un campocualquiera usando el desarrollo de Taylor de primer orden. Los puntos interesantesa estudiar son los puntos de equilibrio.

Entonces reemplazamos nuestro campo original por el aproximado y observamoscomo se comporta el esquema numérico en el problema aproximado. Esto nos sirvepara clasificar la estabilidad del esquema. Este análisis sólo se puede hacer conrelativa facilidad para ecuaciones lineales, pero es suficiente para empezar a ver laspropiedades de estabilidad numérica de un esquema de cálculo.

Supongamos tenemos el campo autónomo dado por f(y) usando desarrollo deTaylor cerca de un punto de equilibrio z⋆ = 0 (para simplificar)

f(y) ∼ −a y

donde a = −fy(0) . Entonces, localmente, podemos trabajar con los problemaslineales

y′(t) = −a y(t), t > 0

El concepto de estabilidad numérica es importante sólo en el caso donde hay decai-miento de la solución o de parte de ella. Y principalmente cuando este decaimientoes brusco (problemas rígidos). Por lo tanto, nos vamos a fijar en el caso a > 0.Aquí sabemos que la solución exacta es y(t) = e−at y decae exponencialmente pa-ra a > 0: se dice que es una edo estable. En el caso a < 0 la solución creceexponencialmente: se dice que es una edo inestable.

Cualquier método numérico para aproximar las soluciones deun campo de vectores debe reproducir soluciones aproximadassimilares.

Los esquemas numéricos se clasifican no sólo por su orden de convergencia sinotambién sus propiedades de estabilidad.

Es evidente que la 0-estabilidad al ser un concepto que cuando se satisfacesólo necesita h → 0 no se preocupa de lo que ocurre para un valor de h fijo. Laestabilidad absoluta indica la restricción necesaria para reproducir uncomportamiento cualitativo de la solución.

El concepto de A-estabilidad o estabilidad absoluta nos permite clasifi-car los métodos determinando el intervalo de valores de h donde el método no sedesestabiliza y converge para el problema modelo y′ = −λ y. Usamos

y′(t) = −λ y(t), t > 0

y(0) = 1

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 176

Page 177: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.11. Efecto de la linealización 177

y se observa cual es la restricción que el esquema numérico impone sobre h parapoder reproducir el comportamiento |y(t)| → 0 de la solución continua. Es decir,queremos asegurarnos de que si la solución continua decae a cero cuando t crecetambien lo hace la discreta.Ejemplo 107 Para Euler explícito tenemos

yn = (1− hλ)n, n = 0, 1, 2, ..., N = T/h

luego necesitamos0 < h < 2/λ

que garantiza −1 < 1 − hλ < 1 para tener que los valores de |yn| decaen y con0 < h < 1/λ obtenemos decaimiento sin oscilaciones.

Otra lectura de esta restricción es: dado un intervalo de cálculo [0, T ] necesitamosun número de puntos N suficiente para una partición uniforme tal que N > Tλ

2, es

decir,0 < T/N < 2/λ ⇔ N >

2.

5.11. Efecto de la linealizaciónEquilibrando esfuerzos, podemos linealizar Crank-Nicolson y obtener una apro-

ximación al valor yn+1 usando Euler explícito. A continuación, usarlo en la fórmulade los trapecios, esto es

dado y0

yn+1 = yn + hf(tn, yn),

yn+1 = yn +h

2

(f(tn, yn) + f(tn+1, yn+1)

), n = 0, 1, ..., N − 1,

este método se conoce como método de Heun y pertence a la familia de losmétodos de Runge-Kutta explícitos de una etapa. Se puede ver que su error locales también O(h3) haciendo desarrolllos de Taylor, aunque ahora si que necesita unarestricción para h en el caso y′ = −λ y:

Recordemos que el método de Heun queda como

k1 = f(tn, yn)

k2 = f(tn + h, yn + hk1)

yn+1 = yn +h

2(k1 + k2)

La aplicación al problema test (λ > 0)d

dty(t) = −λ y(t), 0 < t < T,

y(0) = 1,

177 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 178: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

178 Capítulo 5 Métodos de Runge-Kutta

genera

k1 = −λ yn

k2 = −λ (yn + h(−λ yn)) = −λ yn + hλ2yn = yn(−λ+ hλ2)

y comoyn+1 = yn +

h

2(k1 + k2)

entoncesyn+1 = yn +

h

2(−λyn + yn(−λ+ hλ2))

de dondeyn+1 = (1− hλ+

h2

2λ2) yn = (1− hλ+

h2

2λ2)n+1.

Conseguir que sea|1− hλ+

h2

2λ2| < 1

nos lleva a observar el polinomio p(z) = 1− z + z2/2 que tiene el mínimo en z = 1con valor p(1) = 1/2 y cumple p(0) = p(2) = 1. Por lo tanto, no tiene ceros en larecta real y 0 < p(z) < 1 sólo se obtiene si 0 < z < 2. Luego es hλ < 2 y h < 2/λla restricción de estabilidad para Heun. Además, tenemos

1/2 < 1− hλ+h2

2λ2 < 1, ∀h < 2/λ.

Por lo tanto, la consecuencia de eliminar el aspecto implícito del proble-ma genera restricciones sobre h para trabajar en problemas disipativos.Luego tiene peores propiedades de estabilidad absoluta que Crank-Nicolson.

Ejemplo 108 Recordemos que el método de Heun de orden 2 es

k1 = f(tn, yn)

k2 = f(tn + h, yn + hk1)

yn+1 = yn +h

2(k1 + k2)

La aplicación al problema test (λ > 0)d

dty(t) = −λ y(t), 0 < t < T,

y(0) = 1,

genera

k1 = −λ yn

k2 = −λ (yn + h(−λ yn)) = −λ yn + hλ2yn = yn(−λ+ hλ2)

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 178

Page 179: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.11. Efecto de la linealización 179

y comoyn+1 = yn +

h

2(k1 + k2)

entoncesyn+1 = yn +

h

2(−λyn + yn(−λ+ hλ2))

de dondeyn+1 = (1− hλ+

h2

2λ2) yn = (1− hλ+

h2

2λ2)n+1.

Conseguir que sea|1− hλ+

h2

2λ2| < 1

nos lleva a observar el polinomio p(z) = 1− z + z2/2 que tiene el mínimo en z = 1con valor p(1) = 1/2 y cumple p(0) = p(2) = 1. Por lo tanto, no tiene ceros en larecta real y 0 < p(z) < 1 sólo se obtiene si 0 < z < 2. Luego es hλ < 2 y h < 2/λla restricción de estabilidad para Heun. Además, tenemos

1/2 < 1− hλ+h2

2λ2 < 1, ∀h < 2/λ.

Definición 109 Diremos que el esquema es incondicionalmente A-estable(incondicionalmente absolutamente estable), cuando al aplicarlo al problemamodelo

y′(t) = −λ y(t), 0 < t < T,

y(0) = 1,

para cualquier λ > 0 y en cualquier intervalo de tiempo T > 0, la solución discretagenerada decae en valor absoluto.

En caso contrario, el esquema es condicionalmente A-estable, a la restric-ción sobre h se le llama restricción de estabilidad absoluta. Al intervalo dondese cumple intervalo de estabilidad absoluta.

Ejemplo 110 Recordemos que el método de Runge-Kutta de orden 4 clásicoes

yn+1 = yn +h

6(k1 + 2 k2 + 2 k3 + k4)

k1 = f(tn, yn)

k2 = f(tn +1

2h, yn +

1

2hk1)

k3 = f(tn +1

2h, yn +

1

2hk2)

k4 = f(tn + h, yn + h k3)

179 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 180: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

180 Capítulo 5 Métodos de Runge-Kutta

Figura 5.2: Polinomio p(z) = 1 − z + z2/2 − z3/6 + z4/24 y su restricción paragarantizar 0 < p(z) < 1.

La aplicación al problema test (λ > 0)d

dty(t) = −λ y(t), 0 < t < T,

y(0) = 1,

genera, siguiendo la misma idea que con el método de Heun de orden 2,

yn+1 = (1− hλ+h2

2λ2 − h3

3!λ3 +

h4

4!λ4)n+1.

Conseguir que sea|1− hλ+

h2

2λ2 − h3

3!λ3 +

h4

4!λ4| < 1

nos lleva a observar el polinomio p(z) = 1− z + z2/2− z3/6 + z4/24 para z = hλ.Igual que con Heun, vemos, Figura 5.2, que 0 < p(z) < 1 sólo si z < z⋆ =2.785... aproximadamente. Luego también aquí, a pesar de haber aumentado el orden,tenemos una restricción de estabilidad que cumplir:

hλ < 2.785...,⇒ h < 2.785.../λ.

Hemos visto que Euler explícito es de primer orden y Euler implícito también loes. Para ecuaciones no lineales el método de Euler es fácil de aplicar pero no así elmétodo de Euler implícito. >Cuál es su ventaja entonces? Lo vamos a ver ahora:

Consideremos para a > 0 (esto es, ∂yf < 0)

y′(t) = −a y(t) t ∈ [0, T ]

y(0) = 1.

La solución exacta es y(t) = e−at y usamos un valor de T cualquiera. Entoncesh = T/N , tenemos tn = hn para n = 0, 1, 2, .., N y usando el método de Eulerexplícito tenemos

yn = (1− a h)n, n ≥ 0.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 180

Page 181: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.11. Efecto de la linealización 181

En el caso a > 0 los valores calculados sólo reproducen el comportamiento cuanti-tativamente si

0 < h < 2/a

puesto que entonces|1− h a| < 1

yyn = (1− h a)n → 0, n ≥ 0

aunque se pueden producir oscilaciones decrecientes que no es lo que hace la soluciónexacta. Si pedimos además que sea 0 < h < 1/a sí que obtenemos el comportamientocuantitativo y cualitativo de decaimiento sin oscilaciones puesto que

0 < 1− h a < 1

y se garantiza un decaimiento uniforme de un valor inicial positivo, tal y como haceel problema continuo, ver Figura 5.3. Evidentemente, en el caso h > 2/a los valorescalculados divergen de los buscados. Resumiendo, tenemos tres situaciones

1. h > 2/a los valores calculados divergen oscilando. Esto es la inestabilidadnumérica

2. 1/a < h < 2/a los valores calculados reproducen el comportamiento cuanti-tativamente pero no cualitativamente. Hay oscilaciones que sobrepasanlos valores buscados pero decaen. Esto no es inestablidad numérica perotampoco es físicamente aceptable, así que es mejor evitarlo.

3. 0 < h < 1/a los valores calculados reproducen el comportamiento cuantitativay cualitativamente, aunque falta por fijar el nivel de error.

Se dice en este caso que Euler explícito es condicionalmente estable.Por otro lado, si usamos el método de Euler implícito entonces

yn =1

(1 + h a)n, n ≥ 0

y los valores calculados siempre reproducen el comportamiento (recordemos que su-ponemos a > 0) cuantitativamente independientemente del valor de h usado, aunqueno sean lo suficientemente precisos. Se dice en este caso que Euler implícito esincondicionalmente estable.

Observación 90 Factor de amplificación: Hemos visto que la solución de va-rios esquemas y para este problema lineal se puede expresar como

yn+1 = G(ah) yn.

181 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 182: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

182 Capítulo 5 Métodos de Runge-Kutta

A G(ah) se lama el factor de amplificación y la solución en el paso final será

yN = G(ah)N y0.

Por lo tanto, para tener un comportamiento de los valores yn que decaigan comohace la solución continua e−at necesitamos

|G(ah)| < 1

y esta es la condición para tener estabilidad numérica: queremos tener un factorde amplificación tal que se reproduzca la dinámica del campo de soluciones, estoes, si las soluciones decaen se debe tener un factor de amplificación menor que unoen módulo.

Si cumplimos esto para cualquier valor de h el método es incondicionamenteestable

si hace falta restringir h, esto es, h < h⋆ para algún valor h⋆ finito, entoncesel método es condicionalmente estable

Tener |G(ah)| < 1 se puede descomponer en dos casos: En el caso

−1 < G(ah) < 0

se admiten oscilaciones que decaen y en el caso

0 < G(ah) < 1

la solución numérica decae sin oscilar, que es lo que debe ocurrir.Para el problema test en el caso de Euler explícito tenemos

G(ah) = 1− ha, (h⋆ = 2/a)

mientras que para Euler implícito

G(ah) =1

1 + ha, (h⋆ = +∞).

Fácilmente se ve que para Crank-Nicolson es

G(ah) =1− ha/2

1 + ha/2, (h⋆ = +∞)

mientras que para el Runge-Kutta clásico de cuarto orden es

G(ah) = 1− ah+a2h2

2!− a3h3

3!+

a4h4

4!, (h⋆ ∼ 2.785/a)

aquí h⋆ se calcula con el computador. Por lo tanto, el análisis de estabilidad numéricareside en calcular este valor G(ah) y ver las condiciones para tener |G(ah)| < 1.

Observar que en todos los casos, se obtiene una aproximación a e−ah = e−a(tn+1−tn)

que es la solución exacta cuando vamos de tn a tn+1.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 182

Page 183: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.11. Efecto de la linealización 183

Resumiendo, en general, para un campo y′ = f(t, y) dado y un esquema numéricoque podemos representar por yn+1 = G(ah)yn. El análisis de estabilidad numéricadel esquema sigue los pasos:

Determinar G(ah)

Determinar condiciones para que |G(ah)| < 1.

Observación 91 El factor de amplificación G(ah) es característico del métodonumérico pero no tiene nada que ver con su error local ni con su orden.

Esto solo se puede hacer para problemas lineales por lo complicado que resulta enlos no lineales.

En el caso general, supongamos tenemos el campo

y′(t) = f(t, y(t))

y queremos estudiarlo en torno a un punto (t0, y0). Usando desarrollo de Taylor setiene que

f(t, y) = f(t0, y0) + ft(t0, y0)(t− t0) + fy(t0, y0)(y − y0) + .....

entonces, olvidándonos de terminos de orden mayor que uno tenemos

f(t, y) ∼ −a y + b(t)

donde a = −fy(t0, y0) y b(t) = f(t0, y0) + ft(t0, y0)(t− t0)− fy(t0, y0)y0 es el resto.Entonces, localmente, podemos trabajar con el problema lineal

y′(t) = −a y(t) + b(t).

Usando el factor integrante eat la solución exacta de este problema continuo es

y(t) = e−aty0 + e−at

∫ t

0

easb(s) ds = e−aty0 +

∫ t

0

e−a(t−s)b(s) ds.

Se puede aproximar aun más si suponemos que b es constante y entonces tenemosque la solución se calcula con facilidad y es

y(t) = e−aty0 +b

a(1− e−at).

entonces nos fijamos que en el caso estable a > 0, esto es fy(t0, y0) < 0, repetimosla dinámica del caso y′ = −a y sólo que trasladada a la linea solución establey(t) ≡ b/a. Esta es la razón por la que el término importante es el primero y esdonde el esquema numérico debe tener el comportamiento estable.

183 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 184: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

184 Capítulo 5 Métodos de Runge-Kutta

Ejemplo 111 En la ecuación de Dahlquist-Bjorck esy′(t) = 100 (sin(t)− y(t)), 0 < t < 3,y(0) = 0

se cumple f(t, y) = 100 (sin(t) − y) luego ∂yf = −100 y el análisis de estabilidadpara Euler explícito nos pide h < 2/100, y como T = 3 y h = T/N entonces debeser N > 150. Valores menores generan oscilaciones en el cálculo discreto.

Igual ocurre con el ejemplo de Prothero-Robinson donde f(t, y) = L (φ(t)− y)+φ′(t) y ∂yf(t0, y0) = −L o en el ejemplo f(t, y) = −3y+3t donde ∂yf(t0, y0) = −3.

Observar que si fijamos la longitud del intervalo T , entonces también podemoshacer que el número de puntos de la partición intervenga. Como h = T/N y pedimosh < 2/a entonces debemos tener N > a/(2T ) para estabilidad numérica en el casode Euler explícito. En todo caso, es la razón h = T/N la que debe cumplir larestricción de estabilidad numérica.

Observación 92 Sólo interesa hacer este estudio en los problema rígidos, es decir,en donde hay decaimientos exponenciales en la solución o parte de ella. El estudiode la estabilidad numérica no es importante si la edo ya es de por síinestable.

Ejemplo 112 El campo f(t, y) = f(y) = 1000 (1−y) posee una solución de equili-brio w(t) = 1 y el campo de vectores es muy contractivo. Al usar Euler explícito cony0 = 1 se reproduce de forma exacta la solución w(t) ≡ 1. Si aplicamos el métodoa f(t, y) = 1000 (1− y) = −1000y + 1000 tenemos que el punto crítico es y⋆ = 1 yque ∂yf(1) = −1000 la linealización da

z′(t) = −1000 z(t)

y necesitamos h < 2/1000 para que el esquema sea numéricamente estable. Esto esimportante cuando y0 = 1.

Se puede ver de forma explícita en los cálculos manuales ya que tenemos

yn+1 = yn + h 1000(1− yn) = (1− h1000)yn + 1000h, n ≥ 1

y la diferencia entre la solución constante w ≡ 1 y la calculada es

yhn − 1 = (1− h1000)n(y0 − 1)

con lo que tenemos un factor de amplificacion G(1000h) = 1−h1000 y |G(1000h)| <1 sólo si h < 2/1000.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 184

Page 185: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.11. Efecto de la linealización 185

Figura 5.3: Restricción de estabilidad: Euler explícito para y′ = −a y con a = 32.Aproximaciones generadas de acuerdo a h > 2/a, 0 < h < 2/a ó 0 < h < 1/a. Pordefecto y para visualizar mejor se unen los puntos calculados con un trazo continuo,pero el cómputo sólo genera los puntos.

185 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 186: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

186 Capítulo 5 Métodos de Runge-Kutta

5.11.1. Precisión numéricaObservemos ahora el error global cometido usando Euler explícito en nuestro

problema modelo y′ = −a y:

y(tn+1) = y(tn) + h y′(tn) +1

2y′′(ξn)h

2 = y(tn)− h a y(tn) +Rn

donde Rn = 12y′′(ξn)h

2, mientras que el esquema es

yn+1 = yn − h a yn.

Entonces si consideramos el error global en = y(tn)− yn resulta que

en+1 = (1− h a) en +Rn, n ≥ 0.

Luego el error global en el paso n+ 1 es la suma de dos términos:

la amplificación del error global en el paso n por el factor G(ah) = 1− h a

el residuo Rn ∼ Cte h2 del esquema numérico en el paso n

En general, para cualquier método vamos a tener cuando se hace la convergenciahacia la solución de y′ = −a y que

en+1 ≤ |G(h a)| en + l(h), n ≥ 0.

Luego si |G(h a)| > 1 tendremos un incremento de los errores previos. En el casoa < 0 esto no se puede evitar y es coherente con la dinámica expansiva del campo desoluciones mientras que si a > 0 nos encontramos con la restricción de estabilidadque hemos visto antes sobre h.

Por otro lado, como conocemos la solución exacta w(t) = e−at, el residuo Rn =12w′′(ξn)h

2 viene dado porRn =

1

2a2e−a ξnh2

y está naturalmente acotado si a > 0 por (e−at ≤ 1)

Rn ≤ 1

2a2h2

y si a < 0 por (e−at = e|a|t ≤ e|a|T )

Rn ≤ 1

2a2e|a|Th2,

por lo que tener un residuo pequeño equivale a controlar este valor. En el primercaso puede ser fácil mientras que en el segundo hay que controlar el crecimientoexponencial a2e|a|T .

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 186

Page 187: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.11. Efecto de la linealización 187

Como consecuencia, obervamos que si el sistema es inestable (a < 0) ten-dremos que bajar más el valor de h para controlar el residuo que si esestable (a > 0).

Nos hemos encontramos entonces con la necesidad de restringir h por un doblemotivo en general y finalmente, tendremos que conseguir un error global pequeñoque es lo que buscamos:

restricción por estabilidad para conseguir factor de amplificación menorque uno cuando la dinámica sea contractiva, podemos escribir esta restriccióncomo h ≤ he

restricción por precisión para conseguir un residuo Rn pequeño. Estodepende del método numérico. El residuo tiene la forma Rn ≤ Cte hp+1 parap ≥ 1 donde Cte depende de la solución buscada y sus derivadas, del campode velocidades, del intervalo temporal etc...Por lo tanto, cuanto más grandep mejor será el control sobre Rn. Podemos describir esta restricción comoh ≤ hp.

Si queremos que el error global se mantenga pequeño necesitamos entonces ambascosas y tendremos que imponer

h < mınhe, hp.

A nosotros nos interesa que el método sea preciso. Entonces si he << hp no estamoshaciendo un buen negocio ya que predomina la restricción por estabilidad sobre lade precisión. Por ejemplo, si usamos Euler implícito en el campo y′ = −a y paraa > 0 sólo debemos preocuparnos de la precisión y esto es bueno.

Observación 93 Los métodos numéricos son herramientas ajustables me-diante algunos parámetros (en nuestro caso, sólo hay un parámetro que es h, o N).Dado un campo de vectores, elegimos un método para determinar una curva buscadadentro de este campo de vectores y ajustamos el paso h para tener el error deseado.La facilidad del proceso dependerá del método elegido.

5.11.2. Estabilidad vs PrecisiónLa restricción por estabilidad lleva a que el método numérico funcione y empiece

a ser útil. Pero ahora falta la precisión, ya que los resultados no tienen por que serprecisos. Al usuario le interesa que la restricción predominante sea la producida porla precisión antes que por la estabilidad. Luego lo mejor sería que no tuviesemosque preocuparnos por la estabilidad y sólo por la precisión, pero conseguir esto noes fácil.

1. ¿De qué depende la restricción de precisión? Principalmente de

187 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 188: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

188 Capítulo 5 Métodos de Runge-Kutta

El método numérico usado determina la forma del error local.La regularidad de la solución buscada determina el tamaño de la derivadaque aparece en el error local, pero esto suele ser desconocido.La precisión buscada por el usuario.

2. ¿De qué depende la restricción de estabilidad? Principalmente de

el problema de valor inicial al que le aplicamos el método numéricopero las propiedades de rigidez suelen ser desconocidas aunquesospechadas.el método numérico usado.

3. ¿Qué restricción es más fuerte? >La impuesta por la precisión o la impuestapor la estabilidad?

Depende del método usado y del problema de valor inicial al que le apli-camos el método numérico.

4. ¿Qué hacer en la práctica?

Buscar un equilibrio entre usar un método numérico con buenas pro-piedades de estabilidad y lo suficientemente preciso. Esto nos defenderáde campos de soluciones con rigideces y comportamientos bruscos. Nor-malmente los métodos de cuarto orden ofrecen un buen balance.

Ejemplo 113 Supongamos que tenemos el problema

y′(t) = L (φ(t)− y(t)) + φ′(t), y(0) = y0.

La solución exacta esy(t) = e−L t(y0 − φ(0)) + φ(t)

Si L << 0 dos soluciones continuas cualesquiera se separan muy rápidamentedebido al factor

e−L t(y0 − φ(0))

y el problema de valor inicial es muy inestable.Entonces cualquier método numérico propagará errores con mucha rapidez ynecesitaremos una restricción de he bastante fuerte. Tan pequeña debe serla elección de he que puede hacer el método inservible desde el punto devista práctico. En particular Euler explícito tiene un factor G = 1 − hL =1 + h|L| >> 1 luego siempre amplifica los errores. Por otro lado, para Eulerimplícito G = (1 + hL)−1 y sólo se tiene que garantizar que 1 + hL = 0.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 188

Page 189: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.12. Control del paso 189

Pero el problema principal está en la precisión para el error local o de trun-catura puesto que la segunda derivada es

y′′(t) = L2 e|L| t(y0 − φ(0)) + φ′′(t) ≈ L2 e|L| t.

Por lo tanto, si los valores de φ′′(t) son moderados lo que manda es

y′′(t) ≈ L2 e|L| t

y no se puede controlar con valores moderados de h.

Si L >> 0 dos soluciones continuas cualesquiera se unen muy rápidamenteen la trayectoria φ(t) debido al factor

e−L t(y0 − φ(0))

y el problema de valor inicial es muy estable.Para Euler explícito necesitamos h < 2/L inviable prácticamente. Mientrasque Euler implícito no tiene ninguna restricción. Incluso lo hará mejor cuantomayor sea L.Por otro lado, la segunda derivada es

y′′(t) = L2 e−L t(y0 − φ(0)) + φ′′(t) ≈ L2 (y0 − φ(0)) + φ′′(t)

y como L > 0 entonces

y′′(t) ≈ L2 (y0 − φ(0)) + φ′′(t)

y el error local se puede controlar con valores moderados de h siempre y cuandoφ′′(t) sea moderada. Así que la restricción por precisión depende sobre todode la solución buscada, lo que es razonable.

Si L ≈ 0 entonces las curvas solución son mas o menos paralelas en intervalosde tiempo moderados y ambas restricciones serán lo exigente que sea la soluciónbuscada, ahora L no es importante.

5.12. Control del pasoEn los códigos profesionales mejor que fijar un paso h constante, se ajusta un

paso variable de forma automática para conseguir un error determinado.Un esquema de un paso con paso variable se describe como

yn+1 = yn + hnΦf (tn, yn;h), n = 0, 1, 2, .. (5.3)

189 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 190: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

190 Capítulo 5 Métodos de Runge-Kutta

y el truco está aquí en poder tomar hn lo más grande posible como para manteneruna precisión predeterminada.

Una forma habitual de conseguir esto es mediante el uso de dos métodos de ordendistinto: En cada paso se realizan unos cálculos que generan dos aproximaciones: Laprimera de orden p y la segunda de orden r con r > p. Con estas dos aproximacionesse puede estimar el error de consistencia del método de orden p localmente. Deacuerdo con esta estimación del error, se modifica el paso.

Supongamos que tenemos el método generado por Φf de orden p y el generadopor Ψf de orden r con r > p. Entonces se tenemos valores

wn+1 = wn + hΦf (t, wn;h), n = 0, 1, 2, ..., N − 1 (5.4)

y

vn+1 = vn + hΨf (t, vn;h), n = 0, 1, 2, ..., N − 1. (5.5)

Siendo y(t) la curva exacta que queremos aproximar, los errores de consistencialocales son

y(t+ h) = y(t) + hΦ(t, y(t);h) + lΦf(t;h), (5.6)

y

y(t+ h) = y(t) + hΨ(t, y(t);h) + lΨf(t;h), (5.7)

siendolΦf

(t;h) ≈ K1 hp+1, lΨf

(t;h) ≈ K2 hr+1.

Suponiendo ahora que los valores generados con el método de mayor orden sonlo suficientemente precisos, entonces podemos pensar que vn+1 ≈ y(tn+h) de dondeel error local del primer método se puede estimar como

y(tn+1)− wn+1 ≈ vn+1 − wn+1.

Entonces podemos tomar vn+1 − wn+1 como aproximación al error de consistencialocal, o bien, (vn+1 − wn+1)/h como aproximación al error de truncatura local. Sitomamos

τΦf(h) ≈ K1 h

p

tenemosτΦf

(h) ≈ vn+1 − wn+1

h.

Dada una tolerancia ϵ > 0 siτΦf

(h) < ϵ

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 190

Page 191: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.13. Métodos de Runge-Kutta adaptativos: pares encajados 191

aceptamos el paso h y pasamos al punto t+h usando wn+1 o incluso vn+1. Por otrolado, si

τΦf(h) > ϵ

rechazamos este h, tomamos un h más pequeño y repetimos el cálculo. Observemosque

τΦf(qh) ≈ qpK1 h

p ≈ qpτΦf(h)

entones buscamosqp|vn+1 − wn+1|

h< ϵ

es decir,q <

( h ϵ

|vn+1 − wn+1|)1/p

.

Tomando un factor de seguridad, 0.9 por ejemplo, aproximamos q como

q = 0.9( h ϵ

|vn+1 − wn+1|)1/p

y repetimos el proceso avanzando de t a t+ qh.

5.13. Métodos de Runge-Kutta adaptativos: pa-res encajados

Se pretende que los cálculos de Φf y de Ψf en cada paso sean parecidos paraahorrar así coste computacional. Una forma de abordar este problema es usando elconcepto de los pares encajados.

Dado un método de Runge-Kutta de orden p con tablero

c Ab

si tenemos otro método con las mismas etapas pero con otro orden r > p

c Aβ

podemos calcular sin mucho coste adicional. Por ejemplo, tenemos

0 0 01 1 0

wn+1 1 0vn+1 1/2 1/2

191 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 192: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

192 Capítulo 5 Métodos de Runge-Kutta

es decir, avanzamos con Euler explícito y estimamos con Euler mejorado. Se diceque un par encajado es de orden p(q) si se avanza con un método de orden p y seestima con uno de orden q > p (también se puede avanzar con el método de ordenmás alto, esto ya es opcional).

Ejercicio 114 Construir pares encajados 1(2) de dos etapas.

Ejercicio 115 Hallar todos los pares encajados 2(3) en la forma

0 0 0 01 1 0 01/2 a31 a32 0wn+1 b1 b2 0

vn+1 b1 b2 b3

Existen varias familias de pares encajados, se suelen conocer por los nombres delos investigadores que los estudiaron. Por ejemplo están las familias de métodos deFehlberg, las de Dormand-Prince, las de Cash y Carp, etc...Veamos uno de elloscomo muestra:

5.13.1. RK adaptativo de Dormand-Prince 5(4)Siendo la idea general común, los detalles técnicos pueden cambiar de una familia

a otra dependiendo del criterio con el que se ha desarrollado la familia de métodos.El método Dormand–-Prince tiene siete etapas, pero sólo usa seis evaluaciones

de función por paso ya que la último etapa de un paso se evalúa en el mismo puntoque el primero del paso siguiente. Corresponde a un metodo de 7 etapas de orden5 que contiene a uno de orden 4, genera por tanto un método RK4(5). Dormand yPrince escogieron los coeficientes de su método para minimizar el error de la soluciónde quinto orden y tiene buenas propiedades en cuanto a predicción de error. Poresa razón, el método de Dormand–-Prince es más adecuado cuando la solución deorden superior se usa para continuar la integración, una práctica conocida comointerpolación local. Dormand-–Prince es el método principal de resolución de EDOsen MATLAB.

Se basa en el siguiente desarrollo:

k1 = f(t, y)

ki = f(t+ cih, y + h

i−1∑j=1

ai,jkj), i = 2, ..., 6, 7

y la fórmula que avanza desde t con orden 5 viene dada por

y5(t+ h) = y(t) + h7∑

j=1

βjkj

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 192

Page 193: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

5.13. Métodos de Runge-Kutta adaptativos: pares encajados 193

mientras que la que avanza con orden 4 es

y4(t+ h) = y(t) + h

7∑j=1

bjkj.

En particular, la estrategia en esta familia de métodos consiste dar el paso definitivocon el método de orden superior y5(t + h) y usar y4(t + h) para estimar el errorde truncatura local para el método de quinto orden (usamos y4(t + h) como valorexacto):

τ5(h) =y5(t+ h)− y4(t+ h)

h=

7∑j=1

(bj − βj)kj.

Como suponemos que τ5(h) ∼ K h5 tenemos que

τ5(h)

τ5(s h)∼ 1

s5

y si queremos que sea τ5(s h) < ϵ, entonces debe ser

s < (ϵ

τ5(h))1/5 =

( ϵ∑7j=1(bj − βj)kj

)1/5Finalmente, se toma

s = 0.9 ∗ ( ϵ

τ5(h))1/5 (5.8)

y además, para evitar pasos muy largos,

0.1 ≤ s ≤ 10. (5.9)

Resumiendo, dado ϵ > 0, si τ5(h) < ϵ entonces aceptamos el valor de h e inclusopodemos tomar un paso más grande para realizar el siguiente cálculo, por ejemplo,h := 10h, el propio código lo ajustará. En el caso donde τ5(h) > ϵ entonces tomamosun nuevo valor de h como h := s h de acuerdo a (5.8) y a (5.9), con cuidado de nopasarnos de t0 + T . Volvemos a calcular entonces.

193 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 194: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

194 Capítulo 5 Métodos de Runge-Kutta

El tablero de coeficientes de Dormand-Prince es el siguiente:

0 0 0 0 0 0 0 01

5

1

50 0 0 0 0 0

3

10

3

40

9

400 0 0 0 0

4

5

44

45−56

15

32

90 0 0 0

8

9

19372

6561−25360

2187

64448

6561−212

7290 0 0

19017

3168−355

33

46732

5247

49

176− 5103

186560 0

135

3840

500

1113

125

192

2187

6784

11

840

wn+1(bi)5179

576000

7571

16695

393

640− 92097

339200

187

2100

1

40

vn+1(βi)35

3840

500

1113

125

192−2187

6784

11

840

aquí la primera fila determina el método de orden 4 mientras que la segunda el deorden 5. Denotaremos este método como RK-DP5(4)

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 194

Page 195: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

Capítulo 6

Introducción a las Ecuaciones enDerivadas Parciales

Para una introducción completa y general también se puede releer la del temaprimero de este curso.

6.1. NotaciónSea Ω ⊂ Rd un conjunto abierto con frontera ∂Ω y denotemos por n el vector

normal exterior a Ω.Para una función u : Ω → R la derivada parcial en notación multi-índice es

Dαu(x) =∂|α|u

∂α1x1 ∂

α2x2 ...∂

αdxd

donde α = (α1, α2, ..., αd) ∈ Nd, es decir, αi ≥ 0 entero y denotamos por |α| =α1 + α2 + α3 + .... + αd. También podemos poner ∂xi

u = uxi. Cuando además hay

una dependencia del tiempo

u = u(t, x) : [0,+∞)× Ω → R

se pueden mezclar derivadas en variables espaciales y el tiempo pero suelen pre-dominar las derivadas primer o segundo orden por tener mayor significación fisica,como por ejemplo velocidad, aceleración, desplazamientos espaciales, etc...

Operadores diferenciales importantes son

el vector gradiente

∇u = Du = (ux1 , ux2 , ..., uxd).

En el caso escalar es simplemente la derivada ∇u = Du = ux = u′.

195

Page 196: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

196 Capítulo 6 Introducción a las Ecuaciones en Derivadas Parciales

la derivada direccional∂u

∂v= v · ∇u = v1 ∂x1u+ v2 ∂x2u+ ...+ vd ∂xd

u,

que representa la razón de cambio en la dirección dada por v.

En el caso escalar v = v y tenemos ∂u∂v

= v u′ luego es una amplificacion demódulo |v| y signo el de v de la derivada u′.

Cuando tenemos una región acotada Ω donde se puede definir un vector nor-mal en la frontera n entonces tenemos la derivada normal

∂u

∂n= n · ∇u = n1 ∂x1u+ n2 ∂x2u+ ...+ nd ∂xd

u,

que es un caso particular de la derivada direccional.La derivada normal es especialmente útil cuando se usa para representar larazón de cambio en la frontera de una región con vector normal n en sufrontera.En el caso escalar n = ±1, ya que el dominio será un intervalo, y tenemos∂u∂n

= ±u′.

La divergencia de un campo vectorial u = (u1, u2, ..., ud)

div(u) = ∂x1u1 + ∂x2u2 + · · ·+ ∂xdud

En el caso escalar u es un escalar u y tenemos div(u) = u′; luego es simple-mente la derivada y representa el movimiento (crecimiento, decrecimiento oestacionario).

El operador Laplaciano para una función escalar

∆u = ux1,x1 + ux2,x2 + ...+ uxd,xd

que en el caso escalar es simplemente uxx(x) = u′′(x) y sabemos que representala curvatura (concavidad o convexidad) de la función u(x).

Recordemos dos resultados fundamentales

Teorema 116 Teorema de la divergencia: si u vectorial y q escalar∫∂Ω

u · n q =

∫Ω

div(u)q +

∫Ω

u · ∇q

luego si q ≡ 1 ∫∂Ω

u · n =

∫Ω

div(u).

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 196

Page 197: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

6.1. Notación 197

este resultado nos da una interpretación física del operador divergencia en términosde lo que sale y entra por la frontera de cualquier dominio Ω de acuerdo al campode vectores dado por u. En particular, observando que

u · n sobre ∂Ω

indica la proyección del vector u en la dirección normal exterior n en la frontera dela región Ω dada, entonces ∫

∂Ω

u · n

se entiende como la suma de todas las contribuciones en cada elemento de área dela superficie de la región. Por lo tanto, en promedio se puede entender que

Si div(u) > 0 es un campo expansivo: las trayectorias salen de cualquierregión acotada más de lo que entran

Si div(u) < 0 es un campo contractivo: las trayectorias entran a cualquierregión acotada más de lo que salen.

Si div(u) = 0 es un campo conservativo: las trayectorias entran y salen decualquier región acotada por igual. Se dice que es un campo incompresible,por ejemplo, las trayectorias de un fluido como el agua forman un campoincompresible, no se puede comprimir el agua.

Corolario 117 Observar que en el caso de dimensión uno, d = 1 y Ω = (a, b) elTeorema de la divergencia coincide con la Regla de Barrow puesto que el vectornormal es n = 1 en x = b y n = −1 en x = a

u(b)− u(a) =

∫ b

a

u′(x)dx.

Entonces u′(x) > 0 implica que u(b) > u(a), u′(x) < 0 que u(b) < u(a) y si u′(x) = 0tendremos u(b) = u(a).

Teorema 118 Teorema de integración por partes de Green: Si u y v sonfunciones escalares entonces∫

∂Ω

∂u

∂nv =

∫Ω

∆u v +

∫Ω

∇u · ∇v.

También aquí si v ≡ 1 tenemos que∫∂Ω

∂u

∂n=

∫Ω

∆u

197 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 198: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

198 Capítulo 6 Introducción a las Ecuaciones en Derivadas Parciales

y el operador Laplaciano puede medir la razón de cambio de la magnitud u a través dela frontera de cualquier dominio Ω donde está la materia u. En particular, teniendola idea de que

∂u

∂n∼ u(fuera)− u(dentro)

y que el sentido natural de expansión es de más a menos

∆u > 0 la función es convexa y el sentido de cambio es hacia dentro enpromedio ya que hay más fuera que dentro

∆u < 0 la función es cóncava y el sentido de cambio es hacia fuera enpromedio ya que hay más dentro que fuera

∆u = 0 hay un equilibrio en los intercambios.

6.2. Ecuaciones diferencialesEn general, diremos que una ecuación en derivadas parciales es una ecuación que

define a una función u(t, x1, .., xd) usando sus derivadas y puede ser por lo tantouna expresión en la forma

F (t, x, u, ut, ut,x1 , ....) = 0.

Se define el orden de la edp como el orden de derivación más alto que aparece enla ecuación.

Una ecuación en derivadas parciales debe de venir acompañada con algunascondiciones extra que se suelen llamar condiciones de contorno o condicionesiniciales.

Una regla aproximada es que necesitamos tantas condiciones o datos auxiliarescomo derivadas aparecen en la ecuación.

Veamos algunos ejemplos muy básicos pero ilustrativos:

Ejemplo 119u′ = 1

con solución general u(x) = x+ c necesita un dato que fije c. Por ejemplo, en x = 0poner u(0) = c. Así es un problema de valor inicial. Otro ejemplo puede ser

u′′ = 0, t > 0

con datos iniciales u(0) = u0, u′(0) = v0.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 198

Page 199: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

6.2. Ecuaciones diferenciales 199

Ejemplo 120 Laplaciano y su interpretación física o geométrica: en d = 1

u′′ = 1

con solución general u(x) = x2 + c1 x+ c2 necesita dos datos para fijar c1 y c2. Lanaturaleza del problema también depende del tipo de datos que se dan.Por ejemplo, si ponemos

u(0) = 1; u′(0) = 2

volvemos a tener un problema de valor inicial pero si usamos

u(0) = u(1) = 0

tenemos entonces un problema de valor de contorno. En este último caso, segenera la función convexa u(x) = 0.5x (x−1) y se puede ver como su forma coincidecon las interpretaciones que se han dado del Laplaciano. También puede ser

u′′ = 1, u(0) = 0, u′(1) = α

con soluciónu(x) = 0.5x2 + (α− 1)x

y coincide con una curva que está en x = 0 en la posición 0 mientras que en x = 1tiene tangente α todo bajo la restricción u′′ = 1 que implica que la curva debe serconvexa. Por lo tanto podemos ver como el mínimo de la parábola es en x = 1−α ytenemos trasladandose por el eje OX con valor fijo en x = 0 a u(0) = 0 y cumpliendoque u′(1) = α manteniendo su caracter convexo.

Este problema se generaliza bastante bien al caso d = 2 aunque aquí el dominiode cálculo es mucho más importante y las dificultades se abren haciendo imposibleuna solución analítica en la mayoria de los casos: Tenemos entonces u = u(x, y)definida en Ω y el operador de Laplace es

∆u = ux,x + uy,y

por lo que la ecuación anterior se escribe como

∆u = 1.

Pero ahora Ω ⊂ R2 por lo que su geometría y la frontera juega un papel decisivo.Por ejemplo, si Ω = x2 + y2 < 1 entonces el análogo al primer ejemplo es

∆u = 1, Ω

u = 0, ∂Ω.

De manera excepcional, aquí la solución se puede obtener de forma fácil, usando laintuición, y es

u(x, y) =1

4(x2 + y2 − 1)

199 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 200: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

200 Capítulo 6 Introducción a las Ecuaciones en Derivadas Parciales

pero en general esto no es posible. Si además queremos hacer algo similar al segundoejemplo, debemos entonces partir la frontera en dos trozos y tener algo como

∆u = 1, Ω,

u = 0, ΓD,∂u

∂n= α, ΓN ,

en donde ∂Ω = ΓD ∪ ΓN . Observemos que el análogo a la derivada en la fronteradel dominio cuando hay varias dimensiones se toma como ∂u

∂n.

Esto nos ha introducido la diferencia entre problema de valor inicial y proble-ma de contorno. Cuando tenemos una variable que juega el papel del tiempo yotras que hacen el de la posición espacial nos encontramos con una ecuacion enderivadas parciales dependiente del tiempo. Es la diferencia entre un problema di-námico (dependiendo del tiempo) y otro estático (que no depende del tiempo). Engeneral, hablaremos de:

Problemas estacionarios: todas las variables son espaciales y se describensituaciones de equilibrio frecuentes en mecánica y elasticidad.

Problemas evolutivos: hay una variable temporal y el resto son variablesespaciales. Se describen situaciones que cambian en tiempo como movimientosde ondas, difusión de calor o energía, dinámica de poblaciones con cambiosglobales sin direcciones espaciales o con direcciones espaciales.

Ejemplo 121 Los problemas de contorno son más delicados pues podemos no tenerunicidad de soluciones. Por ejemplo

u′′(x) = u(x)

tiene por solución u(x) = A cos(x) +B sin(x) entonces imponer u(0) = A y u(π) =−A nos lleva a tener infinitas soluciones ya que sin(0) = sin(π) = 0. Por otro lado,imponer u(0) = A y u(π) = C = −A no tiene solución.

Ejemplo 122 Para c una constante la ecuación

ut(t, x) + cux(t, x) = 0, t > 0, x ∈ R

es una edp conocidad como ecuación de transporte y para cualquier función f(z)resulta que

u(t, x) = f(x− ct)

es solución de la misma. Por ejemplo, si f(z) = sin(z) entonces u(t, x) = sin(t−cx)es la solución del problema

ut(t, x) + cux(t, x) = 0, t > 0, x ∈ Ru(0, x) = sin(x), x ∈ R

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 200

Page 201: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

6.3. Leyes de conservación d = 1 201

La visualización de u(t, x) = sin(t− cx) en el espacio txu nos dice que la soluciónes la traslación con velocidad constante c del valor inicial u0(x).

También desde el punto de vista físico se tiene una interpretación muy fácil:tenemos ut = −c ux (y si c > 0 por ejemplo) entonces si ux < 0 hay crecimiento deu en el sentido positivo de la x luego hay transporte hacia la derecha mientras quesi ux > 0 hay decrecimiento de u en el sentido positivo de la x lo que es coherentecon el transporte hacia la derecha de la cantidad u. Esto es, si c > 0 tenemos unaonda que viaja de izquierda a derecha.

Ejemplo 123 Para k > 0 una constante la ecuación

ut − k uxx = 0, t > 0, x ∈ R

es una edp conocidad como ecuación de difusión o del calor. Aquí la soluciónexacta ya no es simple. Pero también desde el punto de vista físico se tiene unainterpretación:

Tenemos ut = k uxx. Supongamos que u(t, x) representa un perfil de calor quesabemos que se propaga de más a menos. Entonces, si uxx > 0 (convexa) haycrecimiento de u ya que hay más calor en el entorno que en el propio punto (t, x)mientras que si uxx < 0 (concava) hay decrecimiento de u ya que hay menos caloren el entorno que en el propio punto (t, x). El valor de k > 0 indica el coeficiente dedifusión del medio, si es más o menos rápida la difusión depende del medio dondese realiza.

Observación 94 Mientras que y′(t) = f(t, y(t)) representa una familia de curvas,una edp, como por ejemplo, ut + aux = 0 representa una familia de superficies.Escogiendo los datos se fija la curva o superficie.

6.3. Leyes de conservación d = 1

La mayoría de las ecuaciones fundamentales que aparecen en la naturaleza y enlas ciencias provienen de una ley de conservación: principio por el cual

la velocidad con la que una cantidad cambia en una región dada debeser igual a la velocidad con la que entra menos la velocidad a la quesale más la velocidad de creación y/o destrucción de la propia cantidaddentro de la región.

Ejemplos evidentes de leyes de conservación se encuentran en todos los ámbitos:estudios demográficos, de fluidos, reacciones químicas, etc...Matemáticamente lasleyes de conservación se traducen a ecuaciones diferenciales que son las que gobier-nan el proceso en tiempo. Vamos a formular una ley de conservación en 1D:

Supongamos que tenemos una sustancia descrita por:

201 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 202: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

202 Capítulo 6 Introducción a las Ecuaciones en Derivadas Parciales

una densidad u = u(t, x) por unidad de volumen que depende de la variableespacial x ∈ R y temporal t > 0,

esta cantidad está confinada en un tubo de area sección A y se mueve por laregión se difunde, se transporta, etc..., de forma continua.

en cada sección etiquetada con la abcisa x = x⋆ la cantidad se mantieneuniforme.

Nos vamos entonces a fijar en el tramo de tubo que va desde x = a a x = b cona < b para ver como cambia la sustancia con el tiempo. El volumen espacial queconsideramos es A(b − a). Si en el tiempo t la cantidad fuese constante en cadasección x entonces, u(t, x) = u(t) y la cantidad total sería

densidad de cantidad por volumen total = u(t)A(b− a)

Pero si suponemos que en el tiempo t cambia en cada sección x entonces tenemospor unidad de volumen Adx una cantidad

densidad de cantidad por unidad de volumen = u(t, x)Adx

de donde en total desde x = a a x = b

cantidad total =

∫ b

a

u(t, x)Adx = A

∫ b

a

u(t, x)dx.

Denotamos por Φ(t, x), que puede ser Φ(t, x, u), el flujo: velocidad a la quese traspasa una sección de la cantidad u en la sección x, por unidad de area y detiempo, esta función vendrá dada por la física del proceso. Si n es el vectornormal exterior entonces tenemos flujo hacia el exterior si

Φ(t, x) · n > 0

y flujo hacia el interior siΦ(t, x) · n < 0.

En el caso escalar n = −1 a la izquierda y n = 1 a la derecha. Entonces, porejemplo, hay salida por la izquierda si Φ(x) < 0 y salida por la derecha si Φ(x) > 0

Suponiendolo constante por sección transversal tendremos que la cantidad queentra por unidad de area es

AΦ(t, a)

y la que sale esAΦ(t, b)

por lo tanto, el flujo total en [a, b] vendrá dado por la expresión

flujo total a través de la frontera = AΦ(t, a)− AΦ(t, b)

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 202

Page 203: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

6.3. Leyes de conservación d = 1 203

y si la razón de creación o destrucción de u viene dada por una función f(t, x), quepuede ser f(t, x, u), entonces la razón de cambio en la sección [a, b] es∫ b

a

f(t, x)Adx = A

∫ b

a

f(t, x)dx.

La ley de conservación nos dice entonces que

d

dt

∫ b

a

u(t, x)Adx = AΦ(t, a)− AΦ(t, b) +

∫ b

a

f(t, x)Adx

o biend

dt

∫ b

a

u(t, x)dx = Φ(t, a)− Φ(t, b) +

∫ b

a

f(t, x)dx.

Si las funciones que intervienen son regulares tendremos, usando el Teorema de ladivergencia en dimensión uno y permutando derivada con integral,∫ b

a

Φx(t, x)dx = Φ(t, b)− Φ(t, a),d

dt

∫ b

a

u(t, x)dx =

∫ b

a

ut(t, x)dx

de donde ∫ b

a

ut(t, x)dx = −∫ b

a

Φx(t, x)dx+

∫ b

a

f(t, x)dx

y de aquí ∫ b

a

ut(t, x) + Φx(t, x)− f(t, x)dx = 0.

Suponiendo que esto se cumple en cualquier segmento [a, b] y que las funciones sonregulares, tenemos la ecuación diferencial en derivadas parciales

ut(t, x) + Φx(t, x) = f(t, x), ∀x ∈ I, ∀t > 0

donde se puede identificar el término de flujo Φx(t, x) y el término fuente o dereacción f = f(t, x).

6.3.1. EjemplosSi el flujo sigue una ley de difusión estandard, esto equivale a decir quela materia se mueve de donde hay más a donde hay menos, que es la leymás común en la mayoría de los fenómenos. Esto depende de la derivada yde su signo. De más a menos implica ux < 0 luego la dirección del flujo escontraria a este signo. Además, podemos medir la resistencia del medio porun coeficiente k > 0: a mayor k más rápido es la difusión. Luego el flujo esopuesto a k ux(x, t) puesto que se propaga cuando ux < 0.

203 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 204: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

204 Capítulo 6 Introducción a las Ecuaciones en Derivadas Parciales

Esto se llama la Ley de difusión, Ley de Fick o Ley de Fourier (depen-diendo del campo de la ciencia donde se ha trabajado) entonces

Φ(t, x, u) = −k ux(x, t)

y tendremos la ecuación del calorut(t, x)− k uxx(t, x) = f(t, x), ∀x ∈ I, ∀t > 0

propotipo de ecuación parabólica.

Si el flujo es proporcional a la materia existente hay un transporte o convección(convección es sinónimo de transporte)

Φ(t, x) = c u(t, x)

entonces tenemos la ecuación de transporteut(t, x) + c ux(t, x) = f(t, x), ∀x ∈ I, ∀t > 0.

propotipo de ecuación hiperbólica.

Si al mismo tiempo que tenemos un transporte hay una difusión entronces elflujo es

Φ(t, x) = c u− k ux

y tenemos la ecuación de convección difusiónut + cux − k uxx = f(t, x), ∀x ∈ I, ∀t > 0.

Si también tenemos que la densidad depende de su propia cantidad, por ejem-plo un reactante en continua producción o extinción, entonces por ejemplo enel caso más simple de tener una reacción lineal

f(t, x) = λu

donde λ > 0 implica extinción de u y λ < 0 implicará destrucción de u.Tenemos entonces la ecuación de convección difusión reacción

ut + cux − k uxx = λu, ∀x ∈ I, ∀t > 0.

La Ley de Fisherut − k uxx = f(t, x, u), ∀x ∈ I, ∀t > 0.

generaliza el modelo de población al caso donde hay una difusión espacial

f(t, x) = λu(1− u

K)

donde λ > 0 implica extinción de u y λ < 0 implicará destrucción de u.Tenemos entonces la ecuación de Fisher

ut + cux − k uxx = λu(1− u

K), ∀x ∈ I, ∀t > 0.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 204

Page 205: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

6.4. Leyes de conservación d > 1 205

Cuando la solución alcanza el estado estacionario, ut = 0, podemos tener laecuación de difusión

−uxx = f(x, u), ∀x ∈ I.

Observación 95 Si no hay dependencia espacial, u = u(t), recuperamos los mode-los de edos que ya conocemos. Por ejemplo, la ecuación de convección difusiónreacción

ut + cux − k uxx = λu, ∀x ∈ I, ∀t > 0.

se reduce a la reacciónut = λu, ∀t > 0

y la ecuación de Fisher

ut + cux − k uxx = λu(1− u

K), ∀x ∈ I, ∀t > 0.

aut = λu(1− u

K), ∀t > 0.

Ejemplo 124 Un caso muy importante es cuando el transporte de u es una funciónno lineal de u y entonces

Φ(t, x, u) = φ(u)− k ux.

Esto genera el modelo

ut + φ′(u)ux − k uxx = f(t, x, u), ∀x ∈ I, ∀t > 0

y en el caso φ′(u) = u tenemos la versión 1D de las ecuaciones de Navier-Stokesque rigue el movimiento de un fluido, más conocida como ecuación de Burgers.Este es el modelo fundamental de la dinámica de fluidos que muestra elacoplamiento entre convección y difusión.

6.4. Leyes de conservación d > 1

Pensemos que en una región espacial Ω ⊂ Rd (d = 1, 2, 3, ...) ocupada por unadeterminada materia, por ejemplo: un fluido, aire, agua, etc...con una determina-da propiedad de que queremos estudiar, por ejemplo, una densidad, temperatura,concentración de contaminante, etc... ...Dada cualquier subdominio ω ⊂ Ω ⊂ Rd

entonces la ley de conservación es

La velocidad de cambio de una materia en w viene dada en términos dela cantidad de esta materia que entra y sale por la frontera de w y lacantidad que se produce o destruye dentro del dominio de interés w.

205 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 206: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

206 Capítulo 6 Introducción a las Ecuaciones en Derivadas Parciales

En términos matemáticos esto lo podemos describir como

d

dt

∫ω

u dx = −∫∂ω

Φ · n dσ +

∫ω

f(x) dx (6.1)

Aquí, tenemos que u = u(x, t) es la cantidad de materia que estamos observandodentro de w, Φ es el flujo a través de la frontera ∂ω y f es la fuente o sumidero quese encuentra presente en ω.

El hecho de que esto se tenga que cumplir para cualquier subdominio ω nos llevaa una relación puntual como una ecuación diferencial en derivadas parciales de laforma

∂tu+ div(Φ)− f = 0, ∀x ∈ Ω. (6.2)

La función de flujo Φ y la fuente f tienen que ser determinadas de acuerdo al modelofísico que se pretende estudiar.

Ley de difusión: Por ejemplo, en la difusión del calor o un contaminante,nos encontramos con la Ley de Fourier-Fick. Se plantea la hipótesis de queel flujo es proporcional al gradiente de la densidad y en el sentido de mayor amenor densidad:

Φ = −k∇u(x, t) (6.3)

en donde k > 0 es la conductividad térmica del medio, a mayor valor másfácil la conducción, y puede ser k = k(x, t). Cuando por simplicidad tomamosk ≡ cte nos encontramos con la ecuación del calor evolutiva

∂tu− k∆u = f(t, x), ∀x ∈ Ω (6.4)

y si nos interesa el caso estacionario u(x, t) = u(x) entonces tendremos laecuación

−∆u = f, ∀x ∈ Ω. (6.5)

Ley de difusión y transporte: Hemos supuesto que la propagación se haceen un medio que está estacionario, pero podría ocurrir que el medio fuese unfluido que se moviese con velocidad V (t, x) (el viento reinante). Entonces elflujo sería una suma de la difusión, como antes, y de la convección o transporte,realizada por el fluido

Φ = −k∇u(x, t) + V (t, x)u(x, t), (6.6)

usando cálculo diferencial básico,

div(Φ) = −∇k · ∇u(x, t)− k∆u(x, t) + div(V )u(x, t) + (V · ∇)u

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 206

Page 207: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

6.5. Condiciones de contorno y dato inicial 207

nos podemos encontrar con la ecuación de convección y difusión

∂tu(t, x)− k∆u(t, x) + (V − ∇k) · ∇u+ div(V )u(x, t) = f(x, t),

Aquí vemos que si simplificamos k ≡ cte entonces

∂tu(t, x)− k∆u(t, x) + V · ∇u = −div(V )u(x, t) + f(x, t),

y si el campo es expansivo, div(V ) > 0 se contribuye a que la materia se pierda,se vaya de la región, mientras que si el campo es contractivo, div(V ) < 0, secontribuye a la ganancia de materia.Finalmente, si div(V ) = 0 el viento reinante no influye en la pérdida o ganaciade materia y tenemos la versión simplificada de la ecuación de conveccióny difusión

∂tu(t, x)− k∆u(t, x) + V · ∇u = f(t, x),

6.5. Condiciones de contorno y dato inicialEstas ecuaciones son válidas en todo el dominio de cálculo Ω y debemos de

suplementar otras relaciones como son

una condición inicial, que describe el estado inicial de la magnitud. Estacondición se escribe como u(x, 0) = u0(x) y se puede pensar como el dato quehay que dar debido a la existencia de la derivada ∂tu(x, t) en la ecuación.

una condición de contorno, que describe que es lo que ocurre en la fronteradel dominio de cálculo. Dependeran de la ecuación y se podrán pensar comoasociadas a las derivadas espaciales que aparezcan en la ecuación.

Por convención, se toma el instante inicial t = 0, y se impone un dato inicialconocido

u(x, 0) = u0(x).

El tipo de condición de contorno depende del problema que se está estudiando.Podemos distinguir dos tipos principales:

condición de contorno de tipo Dirichlet: Si la función u tiene un valorpredeterminado en todo el contorno tendriamos un dato

u(x, t) = d(x, t), ∀x ∈ ∂Ω, t > 0.

condición de tipo Neumann: Si existe un flujo conocido de la cantidad ua través de la frontera de la región entonces la condición se puede plantearcomo

∂u

∂n= n · ∇u = g(x, t), ∀x ∈ ∂Ω, t > 0.

207 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 208: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

208 Capítulo 6 Introducción a las Ecuaciones en Derivadas Parciales

condición de tipo Fourier o Robin: Esta es una situación intermedia enla que el flujo através de la frontera del dominio es proporcional al salto demateria entre el exterior y el interior

∂u

∂n+ αu = g(x, t), ∀x ∈ ∂Ω, t > 0,

donde α > 0 es una constante positiva.

Estas condiciones se pueden dar en distintas partes del contorno y hablamos decondiciones de contorno de tipo mixtas.

Uno de los pasos claves en la modelización es la elección de las condiciones decontorno. Si escogemos condiciones de tipo Dirichlet y tomamos un coeficiente dedifusión constante k(x) ≡ k tendremos entonces el problema de Cauchy (debidoal dato inicial)

∂tu(x, t)− k∆u(x, t) = f(x, t), ∀x ∈ Ω, t ∈ [0, T ], (6.7)u(t, x) = 0, ∀x ∈ ∂Ω, t > 0, (6.8)

u(t = 0, x) = u0(x), ∀x ∈ Ω. (6.9)

Dibujar el cono temporal [0, T )× Ω para tener una visual sencilla.Las ecuaciones (7.1)-(7.2)-(7.3) constituyen un ejemplo de ecuación en derivadas

parciales equipada con condiciones de contorno y valor inicial. Estas ecuacionestambién son un ejemplo de lo que se conoce como un modelo de difusión puestoque modela la difusión por el dominio Ω de la cantidad genérica u. De aquí provienela tradición de trabajar con el operador −∆ en vez de ∆.

En general, podemos dar las expresiones generales para el problema de Cauchy(debido al dato inicial)

∂tu+ F (t, x, u, ux, ...) = 0, ∀x ∈ Ω, t ∈ [0, T ], (6.10)u(t = 0, x) = u0(x), ∀x ∈ Ω. (6.11)

o bien si es de segundo orden en tiempo

∂ttu+ F (t, x, u, ux, ...) = 0, ∀x ∈ Ω, t ∈ [0, T ], (6.12)u(t = 0, x) = u0(x), ∀x ∈ Ω, (6.13)u(t = 0, x) = v0(x), ∀x ∈ Ω. (6.14)

Dibujar el cono temporal [0, T )× Ω para tener una visual sencilla.

Observación 96 El Objetivo más importante a nivel científico es resolver las ecua-ciones de Navier-Stokes de los fluidos

∂tu(t, x) + u · ∇u− k∆u+∇p(t, x) = f(x, t), ∀x ∈ Ω, t > 0, (6.15)div(u) = 0, ∀x ∈ Ω, t > 0, (6.16)u(0, x) = u0(x), ∀x ∈ Ω. (6.17)

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 208

Page 209: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

6.5. Condiciones de contorno y dato inicial 209

que incluye todos los efectos antes mencionados, por ejemplo, el propio campo vec-torial define el viento reinante V = u, y algunos más.

209 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 210: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

210 Capítulo 6 Introducción a las Ecuaciones en Derivadas Parciales

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 210

Page 211: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

Capítulo 7

La ecuación de difusión

Uno de los pasos claves en la modelización es la elección de las condiciones decontorno. Si escogemos condiciones de tipo Dirichlet y tomamos un coeficiente dedifusión en el medio constante ν(x) ≡ ν. Tendremos entonces el problema decontorno y de valor inicial (debido al dato inicial)

ut(t, x)− ν∆u(t, x) = f(t, x), ∀x ∈ Ω, t ∈ [0, T ], (7.1)u(t, x) = φ(x), ∀x ∈ ∂Ω, t > 0, (7.2)

u(t = 0, x) = u0(x), ∀x ∈ Ω. (7.3)

7.1. Decaimiento debido a la difusiónVamos a ver como también estamos modelando una propiedad característica de

la difusión como es su decaimiento.

Fijemos ideas, tomemos el caso Ω = (a, b) con datos homogéneos. La ecuaciónqueda como

ut(t, x)− ν uxx(t, x) = 0, ∀x ∈ (a, b), t ∈ [0, T ], (7.4)u(t, a) = 0, ∀t > 0, (7.5)u(t, b) = 0, ∀t > 0, (7.6)u(0, x) = u0(x), ∀x ∈ [a, b]. (7.7)

Se puede interpretar como que no hay fuentes de calor y que en los extremos hay unaislante que anula la temperatura. Vamos a comprobar como entonces la tempera-tura tiende a extinguirse. El cálculo que vamos a hacer se conoce como método dela energía y consiste en estimar la energia total que se representa en cada instantet por:

∥u(t)∥L2(a,b) =(∫ b

a

u(t, x)2 dx)1/2

211

Page 212: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

212 Capítulo 7 La ecuación de difusión

Teorema 125 La solución del problema (7.4)-(7.5)-(7.6)-(7.7) verifica

∥u(t)∥L2(a,b) ≤ e−ν(b−a)−1 t∥u0∥L2(a,b), ∀t > 0.

Dem: Lo primero que podemos ver es que para cada t la función u(t, x) está con-trolada por su derivada espacial al ser cero en sus extremos:

u(x, t)− u(a, t) =

∫ x

a

ux(t, x) dx ≤ (

∫ x

a

12 dx)1/2)(

∫ x

a

ux(t, x)2 dx)1/2

≤ (b− a)1/2(

∫ x

a

ux(t, x)2 dx)1/2,

de donde como u(t, a) = 0

u(t, x)2 ≤ (b− a)

∫ b

a

ux(t, x)2 dx

y entonces integrando en x y observando que el segundo término es una constante∫ b

a

u(t, x)2 dx ≤ (b− a)2∫ b

a

ux(t, x)2 dx.

Por lo tanto,∥u(t)∥L2(a,b) ≤ (b− a)∥ux(t)∥L2(a,b), ∀t > 0.

Por otro lado, usando la ecuación

ut = ν uxx ⇒ uut = ν u uxx

de donde integrando x ∈ [a, b] tenemos

1

2

∫ b

a

∂tu2(t, x) dx = ν

∫ b

a

(uux)x − u2x dx

= ν(uux)x=bx=a − ν

∫ b

a

u2x dx

= −ν

∫ b

a

u2x dx

de donde se obtiene

d

dt

∫ b

a

u2(t, x) dx = −2 ν

∫ b

a

ux(t, x)2 dx

es decir,

d

dt∥u(t)∥2L2(a,b) = −2 ν∥ux(t)∥2L2(a,b) ≤ −2 ν (b− a)−1∥u(t)∥2L2(a,b)

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 212

Page 213: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.2. Diferencias finitas 213

de donded

dt∥u(t)∥2L2(a,b) + 2 ν (b− a)−1∥u(t)∥2L2(a,b) ≤ 0

y multiplicando por el factor e2 ν (b−a)−1 t tenemos

d

dte2 ν (b−a)−1 t∥u(t)∥2L2(a,b) ≤ 0

de donde∥u(t)∥L2(a,b) ≤ e−ν(b−a)−1 t∥u0∥L2(a,b)

y tenemos un decaimiento exponencial de la solución. Más rápido cuanto más grandesea ν > 0. Luego el calor se difunde exponencialmente hasta desaparecer. Esteresultado también es cierto en dimensión espacial mayor que uno.

7.2. Diferencias finitasVamos a fijarnos en el problema modelo para ir introduciendo conceptos que son

generales. Nuestro problema de valor inicial y de contorno en el caso Ω = (a, b) es

ut(t, x)− ν uxx(t, x) = f(t, x), ∀x ∈ (a, b), t ∈ [0, T ], (7.8)u(t, a) = r(t), ∀t > 0, (7.9)u(t, b) = s(t), ∀t > 0, (7.10)u(0, x) = u0(x), ∀x ∈ [a, b]. (7.11)

Pongamos Ω = [0, T ]× [a, b]. Entonces buscamos una función u : [0, T ]× [a, b] → Rque sea una solución de este problema. Vamos a generar una parrilla de puntos en Ωdesde una partición de [0, T ] y otra de [a, b]. Dados enteros N ≥ 1 y d ≥ 1 tomamos

∆t =T

N, ∆x =

b− a

d+ 1

y construimos las particiones

0 = t0 < t1 < .... < tN = T, a = x0 < x1 < .... < xd < xd+1 = b

que nos ayudan a construir la parrilla de puntos

Ω∆t,∆x = (tn, xj); tn = n∆t, xj = j∆x

Al conjunto Ω∆t,∆x lo llamamos dominio computacional y nos sirve para aproxi-mar a Ω cuando ∆t → 0 y ∆x → 0 rellenándolo. Queremos buscar valores discretosque aproximen a los valores exactos

vnj ∼ u(tn, xj)

213 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 214: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

214 Capítulo 7 La ecuación de difusión

A los valores en el instante de tiempo tn los llamamos nivel temporal n.Observar que como u(t, a) = r(t) y u(t, b) = s(t) son datos conocidos y hemos

escogido la partición de forma que vn0 y vnd+1 sean datos del problema

vn0 = r(tn), vnd+1 = s(tn), ∀n ≥ 0.

También son datos los valores en el nivel de tiempo n = 0 puesto que u(0, x) = u0(x)luego

v0j = u0(xj), ∀j = 0, 1, ..., d+ 1.

Por lo tanto, nuestras incógnitas son los valores

vnj n=1,...,Nj=1,...,d

o bien, para cada nivel temporal n, los valores incógnita son

vnj j=1,...,d.

Nuestro objetivo es que cuando ∆t,∆x → 0 entonces Ω∆t,∆x rellena Ω y queremosque en el límite estacionario cuando ∆t,∆x → 0 y n, j → ∞ tal que n∆t = t yj∆x = x se cumpla

lımn∆t=t,j∆x=x

vnj = u(t, x).

Veamos como empezar: tenemos que aproximar la solución en un punto interiorde Ω∆t,∆x, pongamos (tn, xj) donde n ≥ 1 y 1 ≤ j ≤ d. Sólo tenemos la ecuación ysabemos que

ut(tn, xj) = νuxx(t

n, xj)

pero las derivadas se pueden aproximar por valores puntuales de la función usandoTaylor. Para la derivada temporal tenemos

u(t+∆t, x)− u(t, x)

∆t= ut(t, x) +

∆t

2utt(ξ, x) = ut(t, x) +O(∆t)

donde ξ ∈ (t, t + ∆t) y para la segunda derivada espacial, desarrollando hasta lacuarta derivada,

u(t, x+∆x)− 2u(t, x) + u(t, x−∆x)

∆x2= uxx(t, x) +

∆x2

12uxxxx(t, δ) = uxx(t, x) +O(∆x2)

donde δ ∈ (x, x+∆x).Estas son las diferencias finitas que nos sirven para poder aproximar las de-

rivadas que aparecen en la ecuación por valores nodales de la función que buscamos.

Tenemos ahora varias opciones a explorar y vamos a ver primero la más sencilla

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 214

Page 215: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.3. Euler explícito en tiempo y diferencias centradas en espacio 215

7.3. Euler explícito en tiempo y diferencias cen-tradas en espacio

La primera idea es fijarnos en los datos que tenemos en el nivel tn para avanzaral nivel tn+1, esto es, seguir la idea de Euler explícito. Veremos que el decaimientoexponencial de las solución nos plantea una restricción severa sobre ∆t, al igualque ocurre con las ecuaciones diferenciales ordinarias cuyas soluciones poseen undecaimiento exponencial.

Haciendo desarrollo de Taylor en torno a un punto interior en el nivel de tiempoconocido, (tn, xj), y avanzando hacia el siguiente nivel de tiempo, (tn + ∆t, xj),tenemos

u(tn+1, xj)− u(tn, xj)

∆t= ut(t

n, xj) +∆t

2utt +

∆t2

6uttt + ...

u(tn, xj+1)− 2u(tn, xj) + u(tn, xj−1)

∆x2= uxx(t

n, xj) +∆x2

12uxxxx + ...

de donde

f(tn, xj) = ut(tn, xj)− ν uxx(t

n, xj) =u(tn+1, xj)− u(tn, xj)

∆t

− νu(tn, xj+1)− 2u(tn, xj) + u(tn, xj−1)

∆x2

+ O(∆t) +O(∆x2)

o abreviadamente, poniendo unj = u(tn, xj), fn

j = f(tn, xj)

un+1j − un

j

∆t− ν

unj+1 − 2un

j + unj−1

∆x2− fn

j +O(∆t) +O(∆x2) = 0.

Eliminando los términos O(∆t)+O(∆x2) tenemos la posibilidad de construir valoresvnj que cumplan

vn+1j − vnj∆t

− νvnj+1 − 2vnj + vnj−1

∆x2= fn

j , n ≥ 0, j = 1, ..., d

con la esperanza de que vnj ∼ unj = u(tn, xj). Además, imponemos los datos co-

nocidos por el dato inicial v0j = u0j y por los datos de contorno vn0 = rn junto a

vnd+1 = sn.Aquí se puede ver que lo único que no se conoce es el valor vn+1

j para j = 1, 2, 3, ..., dya que todo el nivel n se puede dar por conocido usando los datos. Por lo tanto, esun cálculo explícito y se puede despejar y escribir como

vn+1j = µ vnj+1 + (1− 2µ) vnj + µ vnj−1 +∆tfn

j , j = 1, , ..., d n ≥ 0,

215 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 216: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

216 Capítulo 7 La ecuación de difusión

en donde

µ = ν∆t

∆x2se llama el número de Courant

y para los casos j = 1 y j = d usamos los valores conocidos en los extremos. Por lotanto, nuestro esquema de cálculo queda como sigue:

Dados v0j = u0j para j = 0, ..., d + 1 y los valores vn0 = un

0 = r(tn) = rn, vnd+1 =und+1 = s(tn) = sn para cualquier n ≥ 0, se plantea obtener para cada nivel temporal

n ≥ 0 los valores

vn+1j = µ vnj+1 + (1− 2µ)vnj + µ vnj−1 +∆tfn

j , j = 1, 2, ..., d.

Observar que para el cálculo de vn+11 y de vn+1

d usamos los valores de contorno vn0 =y vnd+1. Esto es, lo escribimos por una mayor claridad,

vn+11 = µ vn2 + (1− 2µ)vn1 + µ rn +∆tfn

1 ,

vn+1j = µ vnj+1 + (1− 2µ)vnj + µ vnj−1 +∆tfn

j , j = 2, ..., d− 1

vn+1d = µ sn + (1− 2µ)vnd + µ vnd−1 +∆tfn

d .

Al realizar los cálculos indicados por este esquema descubriremos que la calidad delos resultados depende del factor µ. Veremos que la solución es estable sólo paravalores suficientemente pequeños de µ y entonces podemos decir que el esquema escondicionalmente estable.

7.3.1. Consistencia, estabilidad y convergenciaPara simplificar, vamos a fijarnos en el caso donde f(t, x) = 0 y los datos de

contorno son cero, es decir, en el caso homogéneo.

∂tu(t, x)− ν uxx(t, x) = 0, ∀x ∈ (a, b), t ∈ [0, T ], (7.12)u(t, a) = 0, ∀t > 0, (7.13)u(t, b) = 0, ∀t > 0, (7.14)u(0, x) = u0(x), ∀x ∈ [a, b]. (7.15)

La generalización al caso no homogéneo es fácil y se deja como ejercicio al lector.En todo caso, se harán algunas observaciones cuando convenga.

1.- Consistencia

Definimos el error de truncatura local como el error que se comete al reem-plazar la ecuación diferencial por el cociente incremental.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 216

Page 217: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.3. Euler explícito en tiempo y diferencias centradas en espacio 217

Definición 126 Si u(t, x) es la solución de la ecuación diferencial entonces sedefine el error de truncatura local como

T∆t,∆x(x, t) =u(t+∆t, x)− u(t, x)

∆t− ν

u(t, x+∆x)− 2u(t, x) + u(t, x−∆x)

∆x2

Usando la edp ut − νuxx = 0 sabemos que

T∆t,∆x = max(t,x)

|T∆t,∆x(x, t)| = O(∆t) +O(∆x2).

Definición 127 Consistencia de un esquema: Un método se dice consistentesi su error de truncatura máximo T∆t,∆x tiende a cero cuando los parámetros dediscretización así lo hacen.

Por lo tanto, el método es consistente de orden 1 con respecto a ∆t y de orden2 con respecto a ∆x.

Observación 97 Para el caso f = 0 se usa

T∆t,∆x(x, t) =u(t+∆t, x)− u(t, x)

∆t− ν

u(t, x+∆x)− 2u(t, x) + u(t, x−∆x)

∆x2− f(x, t)

y como ut − νuxx = f se obtiene igual

T∆t,∆x(x, t) = O(∆t) +O(∆x2)

2.- Estabilidad

Nos fijamos en dos cálculos ligeramente distintos e intentamos controlarlos me-diante los datos. Recordemos que para facilitar la presentación trabajamos conf = 0 y datos de contorno también cero.

Para el nivel temporal n = 0 tenemos v0j = u0j , j = 0, 1, .., d + 1 (u0

j = u(0, xj)el dato inicial) y datos de contorno vn0 = 0, vnd+1 = 0. Se calculan para n ≥ 0 losvalores en el nivel n+ 1

vn+1j = µ vnj+1 + (1− 2µ)vnj + µ vnj−1, j = 1, 2, ..., d.

Supongamos ahora unos datos ligeramente distintos,

w0j = u0

j + ϵ0j , wn0 = 0 + δn0 , w

nd+1 = 0 + δnd+1

donde|ϵ0j |, |δn0 |, |δnd+1| ≤ ϵ,

es decir, tenemos controlada la perturbación por algún ϵ > 0. Se calculan para n ≥ 0los valores en el nivel n+ 1 dados por

wn+1j = µwn

j+1 + (1− 2µ)wnj + µwn

j−1, j = 1, 2, ..., d.

217 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 218: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

218 Capítulo 7 La ecuación de difusión

La diferencia znj = vnj − wnj cumple

zn+1j = µ znj+1 + (1− 2µ)znj + µ znj−1, n ≥ 0, j = 1, 2, ..., d.

y además en los datos conocidos |znj | ≤ ϵ. Por lo tanto, si medimos

∥zn∥∞ = maxj=0,1,...,d,d+1

|znj | = max maxj=1,...,d

|znj |, ϵ

y tomamos µ ≤ 1/2 entonces 1− 2µ ≥ 0 y podemos observar aplicando la desigual-dad triangular que

|zn+1j | ≤ µ|znj+1|+ (1− 2µ)|znj |+ µ|znj−1|

≤ (µ+ (1− 2µ) + µ)∥zn∥∞ = ∥zn∥∞.

luego para cada n ≥ 0

maxj=1,...,M

|zn+1j | ≤ ∥zn∥∞ = max max

j=1,...,M|znj |, ϵ

por lo quemax max

j=1,...,d|zn+1

j |, ϵ ≤ ∥zn∥∞ = max maxj=1,...,d

|znj |, ϵ

de donde∥zn+1∥∞ ≤ ∥zn∥∞, n = 0, 1, 2, ...

y por lo tanto, obtenemos la estabilidad por tener la acotación con respecto a losdatos iniciales

∥zn∥∞ ≤ ∥z0∥∞, n = 0, 1, 2, ...

Observemos que aquí el factor de amplificación con respecto a la norma en elnivel inicial es 1.

Observación 98 En el caso de Euler explícito aplicado a y′ = λ y para λ < 0tenemos

yn+1 = (1 + hλ)yn

de donde si |1+hλ| < 1 (restricción de estabilidad análoga a la de µ ≤ 1/2) tambiénes cierto que

|yn+1| ≤ |yn|, n ≥ 0

de donde|yn| ≤ |y0|, n ≥ 0

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 218

Page 219: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.3. Euler explícito en tiempo y diferencias centradas en espacio 219

3.- Consistencia y Estabilidad implica Convergencia

Teorema 128 Para µ = ν∆t

∆x2mantenido constante, si se cumple la restricción

µ ≤ 1/2 el método de Euler explícito en tiempo y diferencias centradas en espacioes convergente. El orden de convergencia es 1 con respecto al parámetro temporal∆t y orden 2 con respecto al parámetro espacial ∆x (la restricción µ ≤ 1/2 obligaa tener ∆t ≤ 1

2ν∆x2).

Dem: Consideremos el error enj = u(tn, xj)− vnj . Sabemos en cada nivel de tiempon ≥ 0 el esquema es

vn+1j = µvnj+1 + (1− 2µ)vnj + µvnj−1, j = 1, 2, ..., d.

y por otro lado, la solución exacta cumple

u(tn+1, xj) = µu(tn, xj+1) + (1− 2µ)u(tn, xj) + µu(tn, xj−1) + ∆tO(∆t) +O(∆x2).

Entonces,

en+1j = µenj+1 + (1− 2µ)enj + µenj−1 +∆tO(∆t) +O(∆x2).

para µ ≤ 1/2 se cumple 1− 2µ ≥ 0 luego por la estabilidad tenemos que

|en+1j | ≤ µ+ (1 + 2µ) + µ ∥en∥∞ +∆tO(∆t) +O(∆x2)

= ∥en∥∞ +∆tO(∆t) +O(∆x2)

de donde

∥en+1∥∞ ≤ ∥en∥∞ +∆tO(∆t) +O(∆x2)

e iterando

∥e1∥∞ ≤ ∥e0∥∞ +∆tO(∆t) +O(∆x2)∥e2∥∞ ≤ ∥e1∥∞ +∆tO(∆t) +O(∆x2) ≤ ∥e0∥∞ + 2∆tO(∆t) +O(∆x2)∥e3∥∞ ≤ ∥e2∥∞ +∆tO(∆t) +O(∆x2) ≤ ∥e0∥∞ + 3∆tO(∆t) +O(∆x2)

luego

∥en∥∞ ≤ ∥e0∥∞ + n∆tO(∆t) +O(∆x2).

Pero como n∆t ≤ T siempre, tenemos (usando que T O(∆t) = O(∆t) y queT O(∆x2) = O(∆x2))

∥en∥∞ ≤ ∥e0∥∞ +O(∆t) +O(∆x2)

219 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 220: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

220 Capítulo 7 La ecuación de difusión

por lo que si el error inicial cumple ∥e0∥∞ = O(∆t)+O(∆x2) tenemos convergenciade orden 1 en tiempo y de orden 2 en espacio.

Como además, estamos pidiendo que sea ∆t ≤ 1

2ν∆x2 observamos que ∆t de-

pende de ∆x y podemos decir que es de orden 2 en el parámetro de discretiza-ción espacial. Pero debemos ser conscientes de si el paso de tiempo es de la forma∆t ∼ 1

ν∆x2 entonces esto representa avanzar en tiempo muy despacio y es bastante

restrictivo. Esto proviene del decaimiento exponencial en tiempo de las solucionesy del hecho de que usamos un método explícito para avanzar en tiempo.

Observación 99 Aquí la truncatura es T∆t,∆x = O(∆t) + O(∆x2) y lo que hacefalta es que lım∆t,∆x→0 T∆t,∆x = 0. En este caso se cumple y el método es consistente.

Observación 100 Tenemos en los métodos numéricos para edos un sólo parámetro,h = ∆t y un método M = M(h) (de forma genérica) que nos construye unaaproximación a la solución. En las edps suele haber más de un parámetro, aquítenemos dos, ∆t para el tiempo y ∆x para el espacio, luego el esquema dependede dos parámetros M = M(∆t,∆x) y además puede ser necesario ligarlos entre sí,como ya hemos visto.

Observación 101 Se puede observar la analogía con el error de truncatura localen el caso de las ecuaciones diferenciales ordinarias:

T (t;h) =1

hl(t;h)

donde l(t;h) es el error de consistencia local. Tenemos consistencia de orden p sil(h) = O(hp+1), o bien, T (h) = O(hp).

7.3.2. Uso de matricesSe puede repetir el estudio del método Euler usando notación matricial. Esto va

a permitirnos simplificar notación y nos abrirá la puerta a otra forma de trabajar.Poniendo para simplificar los valores del contorno cero, tenemos que

vn+11 = µ vn2 + (1− 2µ) vn1 ,

vn+12 = µ vn3 + (1− 2µ) vn2 + µ vn1 ,

vn+13 = µ vn+1

4 + (1− 2µ) vn3 + µ vn+12 ,

. . . = . . . ,

vn+1d = (1− 2µ) vnd + µ vnd−1

Entonces para Ad = tridiag(−1, 2,−1) ∈ Rd×d, si ponemos

PEx = tridiag(µ, 1− 2µ, µ) = Id − µAd

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 220

Page 221: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.3. Euler explícito en tiempo y diferencias centradas en espacio 221

el esquema de cálculo es

V n+1 = PExVn = P n+1

Ex V 0, n ≥ 0

con el significado obvio de V n = (vn1 , vn2 , ..., v

nd ) ∈ Rd.

La estabilidad se puede estudiar fácilmente como sigue: Dados V 0 ∈ Rd y W 0 =V 0 + ϵ ∈ Rd (se sobreentiende ϵ = (ϵ1, ϵ2, ..., ϵd) ∈ Rd) tenemos que comparar loscálculos

V n+1 = PExVn = P n+1

Ex V 0

conW n+1 = PExW

n = P n+1Ex W 0

de dondeV n+1 −W n+1 = P n+1

Ex ϵ, n ≥ 0.

El uso de la norma vectorial ∥v∥∞ = maxj=1,...,d |vj| induce la norma matricial

∥P∥∞ = maxi

d∑

j=1

|pij|, si P = (pij)

y entonces∥V n −W n∥∞ ≤ ∥PEx∥n∞ϵ

donde ahora ϵ := ∥ϵ∥∞ abusando de la notación. Entonces, para µ ≤ 1/2

∥PEx∥∞ = maxi

|µ|+ |1− 2µ|+ |µ| = µ+ 1− 2µ+ µ ≤ 1

y cumplimos con la estabilidad ya que

∥V n −W n∥∞ ≤ ϵ, ∀n ≥ 0.

Por lo tanto, el análisis de estabilidad se ha repetido y de una forma más compacta.El estudio de la convergencia también se ve fácil

V n+1 = PExVn, n ≥ 0

mientras que usando el error de truncatura podemos escribir para la solución exactaUn

Un+1 = PExUn +∆tO(∆t) +O(∆x2), n ≥ 0

donde ahora O(∆t) y O(∆x2) representan los vectores de los errores de truncatu-ra en cada nodo de la partición y dependen de las derivadas de la solución quesuponemos lo suficientemente regular y acotadas en el dominio de cálculo.

Por la linealidad del esquema, si En = V n − Un restamos ambas ecuaciones ytenemos

En+1 = PExEn +∆tO(∆t) +O(∆x2), n ≥ 0.

221 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 222: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

222 Capítulo 7 La ecuación de difusión

Iterando, tenemos que

E1 = PExE0 +∆tO(∆t) +O(∆x2),

E2 = PExE1 +∆tO(∆t) +O(∆x2) = P 2

ExE0 + PEx + IM∆tO(∆t) +O(∆x2)

E3 = PExE2 +∆tO(∆t) +O(∆x2)

= P 3ExE

0 + P 2Ex + PEx + IM∆tO(∆t) +O(∆x2)

de donde se observa fácilmente la recurrencia

En = P nExE

0 + P n−1Ex + ...+ P 2

Ex + PEx + IM∆tO(∆t) +O(∆x2).

Como ya hemos visto, si µ ≤ 1/2 se cumple ∥P nEx∥∞ ≤ ∥PEx∥n∞ ≤ 1 para todo

n ≥ 0, luego obtenemos

∥En∥∞ ≤ ∥E0∥∞ + n∆tO(∆t) +O(∆x2).

de donde

∥En∥∞ ≤ ∥E0∥∞ +O(∆t) +O(∆x2), ∀n ≥ 0.

7.3.3. Ejemplos numéricoEjemplo 1: solución analítica exacta

Consideremos el problema

ut(t, x)− uxx(t, x) = 0, ∀x ∈ (0, 1), t > 0,

u(t, 0) = φ0(t), ∀t > 0,

u(t, 1) = φ1(t), ∀t > 0,

u(0, x) = u0(x), ∀x ∈ [0, 1].

con datosφ0(t) = 0, φ1(t) = 0, t > 0

u0(x) = sin(πx), x ∈ [0, 1].

Entonces la solución exacta es

u(t, x) = e−π2t sin(πx), x ∈ [0, 1]

y se observa un decaimiento exponencial de la solución. Podemos realizar una tablacon los errores obtenidos para la solución exacta en un tiempo positivo fijo T > 0.Vamos a evaluar el error en el tiempo final y contrastar la reducción esperada de

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 222

Page 223: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.3. Euler explícito en tiempo y diferencias centradas en espacio 223

acuerdo al orden precicho por la teoría. La norma en la que medimos el error en elnivel temporal n es

∥en∥∆x =(∆x

d+1∑j=0

|unj − u(tn, xj)|2

)1/2

.

Ponemos µ = 0.4 y entonces ∆t = µ∆x2 con ∆x = (1−0)/(d+1). Podemos ver unsegundo orden de convergencia claramente. También es de destacar que no podemosusar un T muy grande por ser ∆t cada vez más pequeño lo que nos obliga a hacermuchas iteraciones.

d error en T = 0.0220 0.0005...40 0.00013...80 3.4...e− 5160 8.6...e− 06

Ejemplo 2: solución analítica exacta

Consideremos el problema

ut(x, t)− uxx(x, t) = 0, ∀x ∈ (0, 1), t > 0,

u(t, 0) = φ0(t), ∀t > 0,

u(t, 1) = φ1(t), ∀t > 0,

u(0, x) = u0(x), ∀x ∈ [0, 1].

con datosφ0(t) = 0, φ1(t) = e−π2t/4, t > 0

u0(x) = sin(0.5πx) + 0.5 sin(2πx), x ∈ [0, 1].

Entonces la solución exacta es

u(t, x) = e−π2t/4 sin(0.5πx) + 0.5 e−4π2t sin(2πx), x ∈ [0, 1].

En la Figura 7.1 se puede ver la solución y el error para T = 1 y d = 20 puntosespaciales. Usamos µ = 0.5 y µ = 0.509. Se observa el deterioro de la solución paraµ > 0.5. En la Figura 7.2, extraida del libro de Iserles [16] pag. 354, se puede verla evolución temporal del error en [0, 1] usando d = 20 puntos espaciales internos.Usamos µ = 0.5 y µ = 0.509. Se observa el deterioro de la solución para µ > 0.5.En la Figura 7.3, también extraida del libro de Iserles [16] pag. 355, se puede verla evolución temporal del error en [0, 1] usando d = 20, 40, 80, 160 puntos espacialesinteriores y µ = 0.4.

223 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 224: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

224 Capítulo 7 La ecuación de difusión

Figura 7.1: Solución y error para T = 1 y usando d = 20 puntos espaciales interiores.Usamos µ = 0.5 y µ = 0.509. Se observa el deterioro de la solución para µ > 0.5.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 224

Page 225: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.3. Euler explícito en tiempo y diferencias centradas en espacio 225

Figura 7.2: Figura extraida del libro de Iserles [16] pag 354, donde se aprecia laevolución temporal del error en [0, 1] con d = 20 puntos espaciales. Usamos µ = 0.5y µ = 0.509. Se observa el deterioro de la solución para µ > 0.5.

Figura 7.3: Figura extraida del libro de Iserles [16] pag 355, donde se aprecia laevolución temporal del error en [0, 1] usando d = 20, 40, 80, 160 puntos espaciales yµ = 0.4.

225 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 226: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

226 Capítulo 7 La ecuación de difusión

Figura 7.4: Evolución temporal de una fuente de calor inicial local a trozos.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 226

Page 227: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.4. Euler implícito y Crank-Nicolson 227

Ejemplo sin solución analítica

En la siguiente Figura 7.4 se observa como una fuente de calor irregular sedifumina de forma suave de acuerdo con la ecuación.

7.4. Euler implícito y Crank-NicolsonVamos a mejorar en dos aspectos, primero usaremos Euler implícito en tiempo y

diferencias centradas en espacio para ver como podemos obtener un método con unerror O(∆t) + O(∆x2) sin necesidad de ligar ∆t con ∆x y sin ninguna restricciónsobre los parámetros.

Después vamos a ver el método de Crank-Nicolson que nos va a permitir tenerun error O(∆t2) + O(∆x2) también sin tener que relacionar ∆t con ∆x. Ahora sitenemos el mismo orden para ∆t y ∆x y el resultado es óptimo.

Observación 102 Uso de norma discreta en la variable espacial: Nos vamosa encontrar matrices simétricas tridiagonales definidas positivas y con autovaloresreales y tendremos que controlar sus potencias. Observemos que si

P = V DV t, D = diag(d1, ..., dd)

donde V V t = IM , entoncesP n = V DnV t

y por lo tanto,∥P n∥2 = ∥V DnV t∥2 = ∥Dn∥2 = max

j=1,..,d|dj|n.

Por lo tanto, es más conveniente usar la norma vectorial ∥v∥2 =√v21 + ...+ v2d por

las propiedades que la norma matricial inducida verifica.Vamos a usar un factor de reescalamiento ∆x1/2 para tener en cuenta que

cuando ∆x → 0 entonces d → +∞ y la dimensión finita del espacio vectorial crece.Usaremos

∥v∥∆x =(∆x

d∑j=1

|vj|2)1/2

.

lo que no afecta para nada a la norma matricial inducida. Es claro que

∥g∥∆x = ∆x1/2∥g∥2.

La razón de este factor reside en que si vj = g(xj) para una función continua g(x)entonces

lım∆x→0

∥g∥∆x = lım∆x→0

(∆x

d∑j=1

|g(xj)|2)1/2 =(∫ b

a

|g(x)|2dx)1/2

227 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 228: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

228 Capítulo 7 La ecuación de difusión

usando la suma de Riemann. Por lo tanto, reescalar la norma vectorial por el factor∆x1/2 nos permite pasar de los valores nodales, en los puntos xj, a un valor integralpara la función, es decir, una norma de la función.

También, por ejemplo, si 1 ∈ Rd representa el vector con todas sus componentes1 tenemos que

∥1∥∆x =(∆x

d+1∑j=0

12)1/2

=(∆x d

)1/2

=( d

d+ 1

)1/2

→ 1.

Ejercicio 129 Se puede repetir el análisis del método anterior con esta norma yobservar que se obtiene el mismo resultado.

7.4.1. Euler implícito en tiempo diferencias centradas enespacio

Siguiendo la idea de Euler implícito podemos buscar la información desde elpunto (tn+1, xj) tomando datos del nivel temporal n + 1 y entonces acoplamos lasincógnitas.

Igual que antes,

u(tn+1, xj)− u(tn, xj)

∆t= ut(t

n+1, xj) +∆t

2utt + ...

u(tn+1, xj+1)− 2u(tn+1, xj) + u(tn+1, xj−1)

∆x2= uxx(t

n+1, xj) +∆x2

2uxxxx + ...

de donde

0 = ut(tn+1, xj)− ν uxx(t

n+1, xj) =u(tn+1, xj)− u(tn, xj)

∆t

− νu(tn+1, xj+1)− 2u(tn+1, xj) + u(tn+1, xj−1)

∆x2

+ O(∆t) +O(∆x2)

poniendo unj = u(tn, xj),

un+1j − un

j

∆t− ν

un+1j+1 − 2un+1

j + un+1j−1

∆x2= O(∆t) +O(∆x2).

Eliminando los términos O(∆t)+O(∆x2) tenemos la posibilidad de construir valoresvnj que cumplan

vn+1j − vnj∆t

− νvn+1j+1 − 2vn+1

j + vn+1j−1

∆x2= 0, n ≥ 0, j = 1, ...,M

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 228

Page 229: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.4. Euler implícito y Crank-Nicolson 229

con la esperanza de que vnj ∼ unj = u(tn, xj) e imponiendo los datos conocidos por

el dato inicial v0j = u0j y por los datos de contorno vn0 = un

0 junto a vnd+1 = und+1.

Aquí se puede ver que lo único que se conoce es el valor vnj siendo el resto datosdesconocidos. Por lo tanto, es un cálculo implícito puesto que cada incógnita vn+1

j

involucra las incógnitas vecinas vn+1j+1 y vn+1

j−1 . Cada ecuación se describe entoncescomo

−µ vn+1j+1 + (1 + 2µ) vn+1

j − µ vn+1j−1 = vnj n ≥ 0, j = 1, ..., d

en donde aparece otra vez el número de Courant

µ = ν∆t

∆x2.

Observación 103 Este número se puede interpretar como la relación de las tallasde las particiones en las variables temporales y espaciales pero teniendo en cuentael orden de las derivadas que se aproximan, por eso sale ∆t y ∆x2, junto con elcoeficiente de difusión que es el que hace que la solución continua se disipe más omenos despacio por el dominio computacional.Tenemos un sistema de ecuaciones lineales que, teniendo en cuenta que los valoresen los extremos son nulos para simplificar, se escribe como

−µ vn+12 + (1 + 2µ) vn+1

1 = vn1 ,

−µ vn+13 + (1 + 2µ) vn+1

2 − µ vn+11 = vn2 ,

−µ vn+14 + (1 + 2µ) vn+1

3 − µ vn+12 = vn3 ,

. . . = . . . , (j = 4, ..., d− 1)

(1 + 2µ) vn+1d − µ vn+1

d−1 = vnd ,

Luego en cada paso hay que resolver un sistema lineal donde la matriz es tridiagonalP V n+1 = V n, n ≥ 0

siendo P = tridiag(−µ, 1 + 2µ,−µ).Observación 104 En el caso no homogéneo se resuelve un sistema lineal en laforma

P V n+1 = V n + bn+1

donde bn+1 es el vector bn+1 = µ (vn+10 , 0, ..., 0, vn+1

d+1 )′.

Por lo tanto, nuestro esquema de cálculo queda como:

Dados v0j = u0j para j = 1, .., d y con vn0 = 0, vnd+1 = 0 se resuelve el sistema

linealP V n+1 = V n, n ≥ 0.

y es un método basado en Euler implícito en tiempo y diferencias centradas enespacio.

229 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 230: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

230 Capítulo 7 La ecuación de difusión

7.5. Semidiscretización: Método de líneasEs interesante discretizar en espacio y mantener la derivada temporal. Es como

lanzar una ecuación diferencial ordinaria desde cada punto xj de la partición. Esteenfoque nos permite también unificar métodos:

Discretizando en espacio, la ecuación se describe en cada punto interior (parapoder usar los vecinos) como

d

dtu(t, xj) = ν

u(t, xj+1)− 2u(t, xj) + u(t, xj−1)

∆x2+O(∆x2), j = 1, 2, 3, ..., d.

Si eliminamos el término O(∆x2) tenemos entonces el sistema de ecuaciones dife-renciales ordinarias

d

dtvj(t) = ν

vj+1(t)− 2vj(t) + vj−1(t)

∆x2, j = 1, 2, 3, ..., d.

donde vj(t) aproxima al verdadero valor u(t, xj). Entonces, poniendo V (t) ∈ Rd

dado por V (t) = (v1(t), v2(t), ..., vd(t)) podemos escribir la semidiscretización comoun sistema de ecuaciones diferenciales lineales en la forma

d

dtV (t) = − ν

∆x2AV (t) +

ν

∆x2b(t)

donde A = tridiag(−1, 2,−1) ∈ Rd×d y b(t) ∈ Rd proviene de los datos de contorno.

Observación 105 En el caso de tener un termino de fuerza,

ut − νuxx = f

tendremos la expresión general

d

dtV (t) = − ν

∆x2AV (t) +

ν

∆x2b(t) + f(t)

para f(t) = (f1(t), f2(t), ..., fd(t))′.

Ejercicio 130 La matriz A = tridiag(−1, 2,−1) ∈ Rd×d es simétrica definidapositiva y con autovalores positivos dados por

αj = 4 sin( jπ

2(d+ 1)

)2

, j = 1, 2, ..., d.

Como para j = 1, 2, ..., d los valores j

d+ 1

π

2forman una partición de (0, π/2) es

claro que αj ∈ (0, 4). Cuanto más grande es d más cerca de cero se encuentra

α1 =1

d+ 1

π

2por lo que la matriz se acerca a ser singular.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 230

Page 231: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.5. Semidiscretización: Método de líneas 231

Ejercicio 131 Los autovalores de la matriz A∆x =1

∆x2tridiag(−1, 2,−1) ∈ Rd×d

cumplenλj = j2π2 +O(∆x4), j = 1, 2, ..., d.

Para ello sólo hay que tener en cuenta que, usando Taylor,

αj = 4 sin( jπ

2(d+ 1)

)2

∼ 4( j

d+ 1

π

2

)2

= 4(∆x j

π

2

)2

, j = 1, 2, 3, ..., d

ya que ∆x = (d + 1)−1. Por lo tanto, usando los autovalores máximo y mínimotenemos

∥A∆x∥∆x = ∥A∆x∥2 ∼ dπ2, ∥A−1∆x∥∆x = ∥A−1

∆x∥2 ∼1

π2.

También es bueno observar que el condicionamiento de la matriz empeora al dismi-nuir ∆x puesto que

k2(A∆x) =λmax

λmin

∼ d2 ∼ 1

∆x2.

Una vez introducida una discretización en espacio, los método vistos hasta ahora sepueden describir con facilidad usando una discretización en tiempo. Ponemos ahoravnj ∼ v(tn, xj) y tenemos:

La aplicación del método de Euler explícito a la variable temporal genera:

V n+1 − V n

∆t= − ν

∆x2AV n +

ν

∆x2bn

o lo que es lo mismo

V n+1 = (Id − µAd)Vn + µ bn

donde Id − µAd = tridiag(µ, 1− 2µ, µ).

La aplicación del método de Euler implícito a la variable temporal genera:

V n+1 − V n

∆t= − ν

∆x2AV n+1 +

ν

∆x2bn+1

o lo que es lo mismo

(Id + µAd)Vn+1 = V n + µ bn+1

donde Id +µAd = tridiag(−µ, 1+ 2µ,−µ) y se resuelve el sistema lineal, estoes

V n+1 = (Id + µAd)−1(V n + µ bn+1)

(la inversa no se calcula nunca por ser un proceso numéricamente inestable).

231 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 232: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

232 Capítulo 7 La ecuación de difusión

Dando un paso más importante podemos aplicar Crank-Nicolson a la variabletemporal obteniendo:

V n+1 − V n

∆t=

1

2− ν

∆x2AV n+1 +

ν

∆x2bn+1+ 1

2− ν

∆x2AV n +

ν

∆x2bn

o lo que es lo mismo

(Id +1

2µAd)V

n+1 = (Id −1

2µAd)V

n +1

2µ bn+1 + bn

y se resuelve el sistema lineal

V n+1 = (Id +1

2µAd)

−1(Id −1

2µAd)V

n +1

2µ bn+1 + bn

Si simplificamos y tomamos datos de contorno cero, b(t) = 0 entonces nos quedauna iteración limpia en cada caso en la forma

V n+1 = P V n, n ≥ 0

o bienV n = P n V 0, n ≥ 0

donde la matriz P es:

para Euler explícito:P = PEx = Id − µAd

es decir Id − µAd = tridiag(µ, 1− 2µ, µ).

para Euler implícito:P = PIm = (Id + µAd)

−1

donde Id + µAd = tridiag(−µ, 1 + 2µ,−µ).

para Crank-Nicolson:

P = PCN = (Id +1

2µA)−1(Id −

1

2µAd)

donde, obviamente,

Id +1

2µAd = tridiag(−1

2µ, 1+ µ,−1

2µ), Id −

1

2µAd = tridiag(

1

2µ, 1− µ,

1

2µ).

Vamos a fijarnos en el caso donde los datos de contorno son cero, es decir, en elcaso homogéneo.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 232

Page 233: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.6. Estudio unificado de la estabilidad 233

7.6. Estudio unificado de la estabilidadVamos a usar la norma ∥ · ∥∆x y estudiar la estabilidad, consistencia y conver-

gencia en esta norma. En general, tomemos P cualquiera de las matrices PEx, PIm

o PCN . Podemos unificar la estabilidad de todos los tres métodos antes expuestos.Dados V 0 ∈ Rd y W 0 = V 0 + ϵ ∈ Rd (se sobreentiende ϵ = (ϵ1, ϵ2, ..., ϵd) ∈ Rd)

tenemos que comparar los cálculos

V n+1 = PV n = P n+1V 0

conW n+1 = PW n = P n+1W 0

de donde por linealidad

V n+1 −W n+1 = P n+1ϵ, n ≥ 0.

Entonces∥V n −W n∥∆x ≤ ∥P n∥∆xϵ

donde ahora ϵ := ∥ϵ∥∆x abusando de la notación.De forma totalmente equivalente a lo escrito anteriormente, para garantizar

estabilidad debemos tener

∥V n∥∆x ≤ ∥P n∥∆x ∥V 0∥∆x ≤ C ∥V 0∥∆x, n ≥ 0,

es decir, que todas las potencias de P deben estar acotadas en la norma matricialinducida por ∥·∥∆x que sabemos coincide con ∥·∥2, luego el estudio de los autovaloreses fundamental. Los autovalores de cada matriz son:

Para Euler explícito la matriz de iteración es

PEx = Id − µAd.

donde Id − µAd = tridiag(µ, 1 − 2µ, µ). Los autovalores de PEx = Id − µAd

sonσ(Id − µAd) = 1− µαjj=1,...,d

donde αjj=1,...,d son los autovalores de Ad. Sabemos que los autovalores deAd cumplen 0 < αj < 4, por lo tanto, si µ ≤ 1/2 se cumple

−1 ≤ 1− µαj ≤ 1

y por lo tanto, imponiendo µ ≤ 1/2, tenemos

∥P nEx∥∆x = ∥P n

Ex∥2 = maxj

|1− µαj|n ≤ 1, ∀n ≥ 0

con lo que vemos una estabilidad con condiciones sobre µ.

233 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 234: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

234 Capítulo 7 La ecuación de difusión

En el caso de Euler implícito tenemos

PIm = (Id + µAd)−1

donde Id + µAd = tridiag(−µ, 1 + 2µ,−µ). Pero los autovalores de Id + µAd

son ahoraσ(Id + µAd) = 1 + µαjj=1,...,d

que son todos positivos y mayores que 1, luego

σ((Id + µAd)−1) = 1

1 + µαj

j=1,...,d

y por lo tanto, sin ningun tipo de restricción sobre µ,

∥P nIm∥∆x = ∥P n

Im∥2 = maxj

1

(1 + µαj)n< 1, ∀n ≥ 0

con lo que vemos una estabilidad sin condiciones sobre µ.

En el caso de Crank-Nicolson:

PCN = (Id +1

2µAd)

−1(Id −1

2µAd)

donde

Id +1

2µAd = tridiag(−1

2µ, 1+ µ,−1

2µ), Id −

1

2µAd = tridiag(

1

2µ, 1− µ,

1

2µ).

Entonces los autovalores son

λ ∈ σ(PCN) ⇔ λ =1− 0.5µαj

1 + 0.5µαj

y evidentemente se cumple para cualquier valor de µ

−1 <1− 0.5µαj

1 + 0.5µαj

< 1.

luego también aquí tenemos estabilidad al ser

∥P nCN∥∆x = ∥P n

CN∥2 = maxj

∣∣∣1− 0.5µαj

1 + 0.5µαj

∣∣∣n < 1, ∀n ≥ 0

y es una estabilidad sin condiciones sobre µ.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 234

Page 235: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.7. Estudio de la consistencia 235

7.7. Estudio de la consistencia7.7.1. Consistencia para Euler implícitoDefinición 132 Si u(t, x) es la solución de la ecuación diferencial entonces sedefine el error de truncatura local para Euler implícito en tiempo y centrado enespacio como

T∆t,∆x(t, x) =u(t+∆t, x)− u(t, x)

∆t

− νu(t+∆t, x+∆x)− 2u(t+∆t, x) + u(t+∆t, x−∆x)

∆x2

Usando la edp ut − νuxx = 0 y al igual que con Euler explicito tenemos

T∆t,∆x = max(t,x)

|T∆t,∆x(t, x)| = O(∆t) +O(∆x2)

Por lo tanto, el método es de orden 1 con respecto a ∆t y de orden 2 con respectoa ∆x.

7.7.2. Consistencia para Crank-NicolsonVeamos como obtenemos ganancia de un orden en tiempo. En este caso tenemos

Definición 133 Si u(t, x) es la solución de la ecuación diferencial entonces sedefine el error de truncatura local para Crank-Nicolson como

T∆t,∆x(t, x) =u(t+∆t, x)− u(t, x)

∆t

− 1

2νu(t+∆t, x+∆x)− 2u(t+∆t, x) + u(t+∆t, x−∆x)

∆x2

− 1

2νu(t, x+∆x)− 2u(t, x) + u(t, x−∆x)

∆x2.

Teorema 134 El error de truncatura del método de Crank-Nicolson es de orden 2en espacio y 2 en tiempo

T∆t,∆x(t, x) = O(∆t2) +O(∆x2)

Dem: Usando desarrollos de Taylor en un punto (t, x) cualquiera tenemos

u(t+∆t, x)− u(t, x)

∆t= ut(t, x) +

∆t

2utt(t, x) +

∆t2

6uttt(t, x) + ...

235 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 236: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

236 Capítulo 7 La ecuación de difusión

por otro lado

u(t+∆t, x+∆x)− 2u(t+∆t, x) + u(t+∆t, x−∆x)

∆x2

= uxx(t+∆t, x) +∆x2

12uxxxx(t+∆t, x) + ...

pero además, desarrollando con respecto a (t, x) los valores en (t+∆t, x), tenemosque

uxx(t+∆t, x) = uxx(t, x) + uxxt(t, x)∆t+∆t2

2uxxtt(t, x) + ....

luego

u(t+∆t, x+∆x)− 2u(t+∆t, x) + u(t+∆t, x−∆x)

∆x2=

= uxx(t, x) + uxxt(t, x)∆t+∆t2

2uxxtt(t, x) + ....+

∆x2

12uxxxx(t+∆t, x) + ...

y también

u(t, x+∆x)− 2u(t, x) + u(t, x−∆x)

∆x2

= uxx(t, x) +∆x2

12uxxxx(t, x) + ...

de donde sumando ambos desarrollos

u(t+∆t, x+∆x)− 2u(t+∆t, x) + u(t+∆t, x−∆x)

∆x2

+u(t, x+∆x)− 2u(t, x) + u(t, x−∆x)

∆x2

= uxx(t, x) + uxxt(t, x)∆t+∆t2

2uxxtt(t, x) + ....

+∆x2

12uxxxx(t+∆t, x) + ...+ uxx(t, x) +

∆x2

12uxxxx(t, x) + ...

= 2uxx(t, x) + uxxt(t, x)∆t+∆t2

2uxxtt(t, x) + ....

+∆x2

12uxxxx(t+∆t, x) +

∆x2

12uxxxx(t, x) + ...

= 2uxx(t, x) + uxxt(t, x)∆t+O(∆t2) +O(∆x2).

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 236

Page 237: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.8. Estudio unificado de la convergencia 237

De donde

T∆t,∆x(x, t) = ut(t, x) +∆t

2utt(t, x) +O(∆t2)

− νuxx(t, x)−∆t

2νuxxt(t, x) +O(∆t2) +O(∆x2).

Usando que ut = ν uxx y entonces también utt = ν uxxt y nos queda

T∆t,∆x(x, t) = O(∆t2) +O(∆x2).

Aprovechando también la idea dada por el método de lineas podemos escribir elerror de truncatura como vector T∆t,∆x(t

n) = (T∆t,∆x(tn, x1), ..., T∆t,∆x(t

n, xd))′ y

entonces usando ahora Un los valores exactos

Para Euler explícito:

Un+1 = (Id − µAd)Un +∆t T∆t,∆x(t

n)

Para Euler implícito:

Un+1 = (Id + µAd)−1Un +∆t (Id + µAd)

−1T∆t,∆x(tn)

o bienUn+1 = (Id + µAd)

−1Un +∆t T∆t,∆x(tn)

donde T∆t,∆x(tn) posee el mismo orden que T∆t,∆x(t

n) con respecto a ∆t y a∆x al estar ∥(Id + µAd)

−1∥∆x acotada.

Para Crank-Nicolson:

Un+1 = (Id + 0.5µAd)−1(Id − 0.5µAd)U

n +∆t T∆t,∆x

donde T∆t,∆x posee el mismo orden que T∆t,∆x(tn) con respecto a ∆t y a ∆x

al estar ∥(Id + 0.5µAd)−1∥∆x acotada.

7.8. Estudio unificado de la convergenciaLos esquemas numéricos se pueden escribir en el caso homogéneo como

V n+1 = PV n, n ≥ 0

mientras que usando el error de truncatura podemos escribir para la solución exactaUn = (u(tn, x1), ..., u(t

n, xd))′

Un+1 = PUn +∆tT∆t,∆x, n ≥ 0

237 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 238: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

238 Capítulo 7 La ecuación de difusión

donde para Euler explícito

T∆t,∆x = T∆t,∆x = O(∆t) +O(∆x2),

para Euler implícito

T∆t,∆x = (Id+ µA)−1 T∆t,∆x = O(∆t) +O(∆x2)

y para Crank-Nicolson

T∆t,∆x = (Id+ 0.5µA)−1 T∆t,∆x = O(∆t2) +O(∆x2).

Por la linealidad del esquema, si En = V n − Un entonces

En+1 = PEn +∆tT∆t,∆x, n ≥ 0.

Iterando, tenemos que (Id es la matriz identidad de talla d)

E1 = PE0 +∆tT∆t,∆x,

E2 = PE1 +∆tT∆t,∆x = P 2E0 + P + Id∆tT∆t,∆x

E3 = PE2 +∆tT∆t,∆x = P 3E0 + P 2 + P + Id∆tT∆t,∆x

de donde se observa fácilmente la recurrencia

En = P nE0 + P n−1 + ...+ P 2 + P + Id∆tT∆t,∆x.

Como ya hemos visto, si µ ≤ 1/2 para Euler explicito o sin ninguna restricciónsobre µ para Euler implícito o Crank-Nicolson, se cumple ∥P n∥∆x ≤ 1 para todon ≥ 0 y las matrices que multiplican a los vectores de truncatura T∆t,∆x tambiénestán acotadas en norma ∥ · ∥2 ≤ 1. Por lo tanto, podemos reemplazar T∆t,∆x porT∆t,∆x y obtenemos

∥En∥∆x ≤ ∥E0∥∆x + n∆tT∆t,∆x.

de donde

∥En∥∆x ≤ ∥E0∥∆x + T∆t,∆x, ∀n ≥ 0.

Recopilamos los tres resultados vistos sobre la discretización del problema de difu-sión para µ = ν

∆t

∆x2mantenido constante

Teorema 135 Para µ ≤ 1/2 el método de Euler explícito en tiempo y diferenciascentradas en espacio es convergente con orden 1 con respecto al parámetro temporal∆t y orden 2 con respecto al parámetro espacial ∆x (la restricción µ ≤ 1/2 obliga atener ∆t ≤ 1

2ν∆x2) (el recíproco también es cierto, aunque no lo vemos, es decir,

si hay convergencia µ ≤ 1/2).

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 238

Page 239: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.9. Problema de contorno estacionario 239

Teorema 136 Sin restricción sobre µ, el método de Euler implícito en tiempo ydiferencias centradas en espacio es convergente con orden 1 con respecto al parámetrotemporal ∆t y orden 2 con respecto al parámetro espacial ∆x.

Tener ordenes distintos no es la situación más conveniente y Crank-Nicolson aportala solución.

Teorema 137 Sin restricción sobre µ, el método de Crank-Nicolson en tiempo ydiferencias centradas en espacio es convergente con orden 2 con respecto al parámetrotemporal ∆t y orden 2 con respecto al parámetro espacial ∆x.

7.9. Problema de contorno estacionarioEn general, para problemas del tipo

−ν uxx(x) + b ux(x) + λu(x) = f(x), ∀x ∈ (a, b), (7.16)u(a) = ua, (7.17)u(b) = ub. (7.18)

que contienen los efectos típicos de difusión, transporte y reacción se usa la dis-cretización que permita matener orden 2 en ∆x para ux (Taylor hasta la terceraderivada) y se invierte el sistema lineal resultante. De acuerdo al juego de paráme-tros ν, b, λ y a las condiciones de contorno impuestas podemos tener o no soluciónal sistema lineal. Necesitamos por lo tanto algunos resultados sobre matrices que seven en la última sección.

Vamos a estudiar el problema básico

−uxx(x) = f(x), ∀x ∈ (0, 1), (7.19)u(0) = u0, (7.20)u(1) = u1. (7.21)

Aplicamos una discretización centrada en espacio para resolver el sistema lineal quesurge. La discretización básica que expresa uxx(x), cuando x es un punto interiordel intervalo (0, 1), en terminos de valores puntuales vecinos nos lleva a

u(x+∆x)− 2u(x) + u(x−∆x)

∆x2= uxx(x) +

∆x2

12uxxxx(δ) = uxx(x) +O(∆x2)

donde δ ∈ (x, x+∆x) que también se puede expresar como δ = x+θ∆x para algúnθ ∈ (0, 1).

Esto se traduce en un sistema de ecuaciones en cada punto de la partición yausual: Para j = 1 tenemos la ecuación

− u(x2) + 2u(x1)− u(x0)

∆x2= f(x1)−

∆x2

12u(4(x1 + θ1∆x)

239 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 240: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

240 Capítulo 7 La ecuación de difusión

para j > 1 y j < M las ecuaciones− u(xj+1) + 2u(xj)− u(xj−1)

∆x2= f(xj)−

∆x2

12u(4(xj + θj∆x)

y para j = d

− u(xd+1) + 2u(xd)− u(xd−1)

∆x2= f(xd)−

∆x2

12u(4(xd + θd∆x)

donde θj ∈ (0, 1) y los valores u(x0) y u(xd) son datos. En forma matricial se escribecomo

A∆xU = f + T∆x

donde T∆x es el vector de errores de truncatura, es decir,

T∆x =∆x2

12(u(4(x1 + θ1∆x), ..., u(4(xd + θd∆x))′

el vector f corresponde a

f = (f(x1), ..., f(xd))′ +

1

∆x2(u(x0), 0, ..., 0, u(xd))

yA∆x =

1

∆x2tridiag(−1, 2,−1) ∈ Rd×d.

Entonces esto genera el esquema de cálculoA∆xV = f

donde V = (vj) es tal que vj ∼ u(xj). Se plantean dos preguntas:1. La primera es si los problemas discretos A∆xV = f se pueden resolver

2. La segunda es si la diferencia V − U tiende a cero cuando ∆x lo hace enalguna norma vectorial conveniente y a que velocidad lo hace.

7.9.1. Existencia de solución de los problemas discretosSabemos que la matriz

A∆x =1

∆x2tridiag(−1, 2,−1) ∈ Rd×d

cumple las condiciones del apartado 2 del Teorema 140, ver Sección 7.11. Peroademás podemos ver que es simétrica positiva definida. Una simple cuenta nos dice

x′A∆xx = x21 + x2

d +d∑

i=1

(x2i − x2

i−1)2 ≥ 0

luego es una prueba más de que es invertible. Por lo tanto los problemas discretosse pueden resolver.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 240

Page 241: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.9. Problema de contorno estacionario 241

7.9.2. ConvergenciaVeamos, si la solución del problema continuo cumple u(4(x) = 0 para todo x, es

decir, si es un polinomio de grado 3, entonces el proceso es exacto, es decir, el errorcometido al sustituir la edp por el sistema lineal es cero.

Ejemplo 138 Por ejemplo, u(x) = x(1− x)/2 es la solución exacta de

−uxx(x) = 1, ∀x ∈ (0, 1), (7.22)u(0) = 0, (7.23)u(1) = 0. (7.24)

Cada partición genera el esquema de cálculo

A∆xV = f

donde V = (vj) es tal que vj = u(xj), es decir, vj ya no es aproximado sino igual au(xj).

Veamos el caso general: sabemos que

A∆xV = f

y queA∆xU = f + T∆x

por lo queU − V = A−1

∆xT∆x

y usando una norma vectorial cualquiera vemos que

∥U − V ∥ ≤ ∥A−1∆x∥∥T∆x∥

Necesitamos entonces dos ingredientes. Primero la consistencia

∥T∆x∥ → 0 ∆x → 0

y luego la estabilidad∥A−1

∆x∥ ≤ cte, ∆x → 0

(observar que ∥A−1∆x∥ es la norma matricial inducida).

241 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 242: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

242 Capítulo 7 La ecuación de difusión

Uso de normas vectoriales

Aunque ya hemos hablado de ésto, podemos volver a reiterarlo:

Si usamos la norma ∥V ∥∞ = maxj=1,...,d |vj| no se observa el efecto de que ladimension crece con ∆x y podemos escribir

∥T∆x∥∞ ≤ max |u(4(x)|12

∆x2 = cte ∆x2 = O(∆x2)

observar que la constante delante de ∆x2 depende de las derivadas de or-den 4 de la solución exacta; no es necesario conocer esta constante pues sólobuscamos la velocidad de convergencia.

Pero si usamos ∥V ∥2 = (∑d

j=1 v2j )

1/2 obtenemos, acotando cada componente,que

∥T∆x∥2 =max |u(4(x)|

12∆x2d1/2

y nos aparece el término d1/2 ∼ ∆x−1/2 ya que ∆x = (d + 1)−1 que crececuando ∆x → 0. Es por ello que es más conveniente usar la norma reescalada

∥V ∥∆x = (∆xd∑

j=1

v2j )1/2 = ∆x1/2∥V ∥2

porque entonces

∥T∆x∥∆x ≤ max |u(4(x)|12

∆x2d1/2∆x−1/2 ≤ O(∆x2).

Además, la norma matricial asociada sigue siendo la misma, ∥A∥∆x = ∥A∥2.

7.9.3. Convergencia usando la norma ∥ · ∥∆x

Para ver la convergencia en la norma ∥ · ∥∆x tenemos que

∥U − V ∥∆x = ∥A−1∆x∥∆x∥T∆x∥∆x = ∥A−1

∆x∥2O(∆x2)

y si usamos los autovalores de A−1∆x,de acuerdo al ejercicio 131,

∥A−1∆x∥∆x ≤ cte

luego∥U − V ∥∆x = ∥A−1

∆x∥∆x∥T∆x∥∆x ≤ O(∆x2)

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 242

Page 243: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.9. Problema de contorno estacionario 243

7.9.4. Convergencia usando la norma ∥ · ∥∞Esta parte es más delicada y se puede dejar para una segunda lectura.

Vamos a ver que A∆x es monótona, con lo que tendremos información sobre suinversa. Para ello usamos el Lema 4 y vemos que si A∆xV ≥ 0 entonces V ≥ 0.

Tomemos el indice p tal que vp ≤ vj para todo j = 1, ..., d. Entonces A∆xV ≥ 0quiere decir

2v1 − v2 ≥ 0

−vj+1 + 2vj − vj−1 ≥ 0, j = 2, ..., d− 1

2vM − vd−1 ≥ 0

Entonces si p = 1 tenemos que v1 ≤ v2 luego −v2 ≤ −v1 y entonces de la primeradesigualdad

0 ≤ 2v1 − v2 ≤ 2v1 − v1 = v1

por lo que V ≥ 0. Si ahora p = d tenemos vd ≤ vd−1 entonces de la última desigual-dad

0 ≤ 2vd − vd−1 = vd + (vd − vd−1)

pero como vd − vd−1 ≤ 0 entonces debe ser vd ≥ 0 y entonces V ≥ 0. Finalmente, si2 < p < d tenemos

−vp+1 + 2vp − vp−1 ≥ 0

pero como vp − vp+1 ≤ 0 y vp − vp−1 ≤ 0 llegamos a que vp = vp+1 = vp−1 yprocediendo de forma iterativa llegamos a los casos p = 1 o p = d. Por lo tanto,A∆x es monótona.

Usando el problema

−uxx(x) = 1, ∀x ∈ (0, 1), (7.25)u(0) = 0, (7.26)u(1) = 0 (7.27)

que tiene por solución u(x) = x(1− x)/2 y el esquema numérico genera la soluciónexacta, se tiene

A∆xU = e

donde e = (1, 1, ..., 1)′ luegoA−1

∆xe = U

y como U tiene como componentes los valores de u(x) = x(1− x)/2 en cada nodoresulta que

∥A−1∆xe∥∞ ≤ max

x∈(0,1)x(1− x)/2 ≤ 1

8.

243 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 244: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

244 Capítulo 7 La ecuación de difusión

Usando que para una matriz cualquiera M = (mij) se tiene

∥M∥∞ = maxi

∑j

|mij|

y como A∆x es monótona, entonces A−1∆x ≥ 0 de donde siendo e = (1, 1, ..., 1) se

verifica queA−1

∆x ≥ 0 ⇒ ∥A−1∆x∥∞ = ∥A−1

∆xe∥∞ ≤ 1

8.

Veamos finalmente la convergencia,

U − V = A−1∆xT∆x

y tomando la norma infinito tenemos

∥U − V ∥∞ = ∥A−1∆x∥∞∥T∆x∥∞

de donde∥U − V ∥∞ = max |u(xj)− vj| = O(∆x2)

7.10. Problema de transporte y difusiónUno de los problemas más interesantes involucra el transporte y la difusión de

una sustancia y se puede describir como:

−ε u′′(x) + λu′(x) = f(x) x ∈ (0, 1), (7.28)u(0) = 0, (7.29)u(1) = 0. (7.30)

La función f y los números reales ε > 0 y λ son tales que existe solución única alproblema.

Esta ecuación modela el transporte y difusión de un producto en un medio convelocidad λ (hacia la derecha si λ > 0 y hacia la izquierda si λ < 0). El parámetroε > 0 mide la difusión del producto en el medio. La producción y destrucción de lasustancia se modela por el término f , que en general depende de la propia u.

Si suponemos f constante y ε y λ constantes entonces la solución exacta sepuede calcular como

u(x) =f

λ

(x− ePex − 1

ePe − 1

)(7.31)

donde Pe = λ/ε. La razón Pe = λ/ε se llama el número de Péclet y midela importancia del transporte comparado con la difusión. Cuando |Pe| >> 1 el

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 244

Page 245: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.10. Problema de transporte y difusión 245

Figura 7.5: Resultados con d + 1 = 21 con producidas con ε = 1, λ = 40 o λ = 50y f = 1. Distintos valores de Pe∆x.

esquema numérico planteado de forma más natural experimenta dificultades y lamatriz generada se aproxima a ser singular.

Al realizar una aproximación por diferencias finitas a la solución de este proble-ma la matriz tridiagonal resultante es

A = tridiag(−1− Pe∆x

2, 2,−1 + Pe

∆x

2).

El valor Pe∆x = Pe∆x

2que se llama el número de Peclet de la partición y

relaciona el número de Peclet Pe con la talla de la partición. La condición para quese pueda resolver el sistema de forma estable, ver Figura 7.5 es

Pe∆x ≤ 1

lo que equivale a∆x ≤ 2/Pe = 2

ε

λ.

245 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 246: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

246 Capítulo 7 La ecuación de difusión

7.11. Matrices tridiagonales y monótonas7.11.1. Matrices simétricas definidas positivas

Si A esta en esta situación, entonces es diagonalizable con todos sus autovalorespositivos y además

∥A∥2 = λmax, ∥A−1∥2 =1

λmin

.

7.11.2. Matrices tridiagonalesAl discretizar para el punto xj apoyandonos en los puntos xj−1 y xj+1, en este

tipo de problemas surgen con frecuencia matrices tridiagonales de la forma A =tridiag(bi, ai, ci) ∈ Rd×d, es decir,

A =

a1 c1 0 . . . . . . 0b2 a2 c2 0 . . . 0

0. . . . . . . . . . . . . . .

... . . . . . . . . . . . . . . .0 0 . . . bd−1 ad−1 cd−1

0 0 0 . . . bd ad

.

La diagonal principal es a = (a1, ..., ad), la diagonal inferior es b = (b2, ..., bd) y ladiagonal superior es c = (c1, ..., cd−1).

Introducimos la suma de las filas sin la diagonal:

r1 = |c1|, rd = |bd|, rj = |bj|+ |cj|, j = 2, 3, ..., d− 1.

Definición 139 Se dice que A es diagonal dominante si

|ai| ≥ ri, ∀i = 1, 2, ..., d

Se dice que A es estrictamente diagonal dominante si

|ai| > ri, ∀i = 1, 2, ..., d

Teorema 140 La matriz A es invertible en alguno de los dos casos siguientes:

Si A es estrictamente diagonal dominante.

A es diagonal dominante, ci = 0, ∀i y |bd| < |ad|.

Ejemplo 141 La matriz A = tridiag(−1, 2,−1) ∈ Rd×d es diagonal dominantepero no estrictamente dominante. Pero cumple ci = −1 = 0, ∀i y | − 1| < |2|, porlo que es invertible.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 246

Page 247: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

7.11. Matrices tridiagonales y monótonas 247

Observación 106 Las sistemas lineales resueltos hasta ahora han sido los plan-teados por Euler implícito y Crank-Nicolson. Las matrices respectivas son

Id + µAd, Id + 0.5µA

o bientridiag(−µ, 1 + 2µ,−µ), tridiag(−0.5µ, 1 + µ,−0.5µ)

luego en ambos casos son matrices tridiagonales y estrictamente diagonal dominan-tes. Además se puede observar que es el término proveniente de la derivada temporalel que contribuye de forma importante a este comportamiento, a través de la matrizId que aporta un 1 en la diagonal. Este término ya no está en los problemas esta-cionarios y es más delicado saber si la matriz resultante es invertible o no; es poreso que usamos el resultado arriba expuesto.

Una cuestión fundamental es la determinación del módulo de los autovalores deuna matriz. Esto no es fácil pero en algunos casos puede hacerse. Recordemos elsiguiente resultado

Teorema 142 Teorema de los círculos de Gershgorin: los autovalores de unamatriz A = (aij) pertenecen a la unión de los círculos en el plano complejo dadospor los discos Bi de centro aii y radio ri en donde ri =

∑j =i |aij|.

En el caso de las matrices anteriores la aplicación es muy sencilla al ser los discostodos el mismo

Ejemplo 143 Si A = tridiag(−1, 2,−1) entonces D = B(2, 2) y si αj ∈ σ(A)entonces

αj ∈ B(2, 2) ⇔ |λ− 2| < 2

de donde|αj| ≤ |αj − 2 + 2| < 2 + 2 = 4.

En paticular, aquí sabemos que

αj = 4 sin( jπ

2(d+ 1)

)2

, j = 1, 2, ..., d

y es claro que αj ∈ (0, 4) como se confirma por el Teorema.

7.11.3. Matrices monótonasDefinición 144 Un vector v = (vj) ∈ Rd se dice positivo si todas sus entradas sonno negativas, es decir, vj ≥ 0. Se escribe v ≥ 0.

Definición 145 Una matriz A = (aij) ∈ Rd×d se dice positiva si todas sus entradasson no negativas, es decir, aij ≥ 0. Se escribe A ≥ 0.

247 Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia

Page 248: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

248 Capítulo 7 La ecuación de difusión

Definición 146 Una matriz A = (aij) ∈ Rd×d se dice monótona si existe A−1 yA−1 es positiva, es decir, A−1 ≥ 0.

Lema 4 Una matriz A = (aij) ∈ Rd×d es monótona sí y sólo sí

v ∈ Rd; Av ≥ 0 ⊂ v ∈ Rd; v ≥ 0

Dem: Supomgamos que A es monótona y que v es tal que Av ≥ 0. Entonces comoexiste A−1 y A−1 ≥ 0 entonces usando que Av ≥ 0 se tiene

v = A−1(Av) ≥ 0.

Luego si A monotona entonces se cumple la inclusión.Veamos ahora que si se cumple la inclusión de los conjuntos entonces A es

monótona. Primero, como A es cuadrada se tiene que existe A−1 si se cumple queAv = 0 implica v = 0. Veamos, si Av = 0 entonces A(+v) ≥ 0 pero tambiénA(−v) ≥ 0 por lo tanto v ∈ v ∈ Rd; v ≥ 0 y también −v ∈ v ∈ Rd; v ≥ 0 porlo que debe ser v = 0 y tenemos que existe A−1.

Por otro lado, la columna bj de la matriz A−1 es bj = A−1ej donde ej es el vectorcanónico de la base estandard. Pero como Abj = ej ≥ 0 entonces bj ≥ 0 y por lotanto, la columna j-ésima de A−1 es nonegativa luego toda A−1 es no negativa. Porlo que A es monótona.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 248

Page 249: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

Bibliografía

[1] V.I. Arnold, Ordinary Differential Equations; Springer-Verlag, Berlin, 1992.

[2] K.E. Atkinson, W. Han, D.E. Stewart, Numerical solutions of ordinary differen-tial equations; Wiley, 2009.

[3] Richard L. Burden, J. Douglas Faires, Numerical analysis, Brooks/Cole CengageLearning, 2010.

[4] J. C. Butcher, Numerical Methods for Ordinary Differential Equations, JohnWiley and Sons, Ltd, 2008

[5] W. Cheney, D. Kincaid, Numerical Mathematics and Computing.; Brooks/ColePublishing Company, 1999.

[6] P.G. Ciarlet, Introduction a l’ analyse numérique matricielle et a l’ optimisation,Ed. Masson 1982

[7] G. Dahlquist G and A. Björck, Numerical Methods; Prentice-Hall, EnglewoodCliffs, N.J., 1974.

[8] J.F. Epperson, An introduction to numerical methods and analysis Wiley, 2007.

[9] D. F. Griffiths, D. J. Higham, Numerical methods for ordinary differential equa-tions; Springer-Verlag, 2010.

[10] G.H. Golub, J.M. Ortega, Scientific Computing and Differential Equations.Academic Press, 1992.

[11] G.H. Golub, C.F. Van Loan, Matrix Computations, 3rd edition. The JohnsHopkins University Press, 1996.

[12] E. Hairer, S.P. Norsett, G. Wanner, Solving Ordinary Differential Equations I,Nonstiff problems Springer-Verlag, 2008.

[13] E. Hairer, G. Wanner, Solving Ordinary Differential Equations II, Stiff andDifferential-Algebraic Problems. Springer-Verlag, 2010.

249

Page 250: Métodos Numéricos para las Ecuaciones Diferenciales ...€¦ · Introducción a las Ecuaciones Diferenciales Resumen del tema En este capítulo revisaremos algunos conceptos básicos

250 Bibliografía

[14] M. W. Hirsch, S. Smale, Ecuaciones diferenciales, sistemas dinámicos y álgebralineal Alianza Universidad, 1974.

[15] E. Isaacson, H.B. Keller, Analysis of Numerical Methods; John Wiley and Sons,New York 1966.

[16] A. Iserles, A First Course in the Numerical Analysis of Differential Equations,2nd edition, Cambridge Texts in Applied Mathematics, 2009.

[17] J.D. Lambert, Numerical methods for ordinary differential equations; Wiley,1991.

[18] R.J. Leveque, Finite Difference Methods for Ordinary and Partial DifferentialEquations Steady State and Time Dependent Problems, Society for Industrialand Applied Mathematics (SIAM), Philadelphia, July, 2007

[19] J. H. Mathews, K. D. Finn, Métodos Numéricos con MATLAB, Prentice Hall,2000.

[20] A. Quarteroni, R. Sacco y F. Saleri, Numerical Mathematics. Springer-Verlag,2000.

[21] L. F. Shampine, R.C. Allen, S. Pruess, Fundamental of Numerical ComputingJohn Wiley and Sons, 1997.

Eliseo Chacón Vera, Dpto. Matemáticas, Universidad de Murcia 250