notas de clase introducciÓn a la teorÍa de modelos darío ... · das de 1950 y 1960, gracias a...

68
Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío García Universidad de los Andes Universidad de Antioquia Julio 15-26, 2019 1

Upload: others

Post on 16-May-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Notas de Clase

INTRODUCCIÓN A LA TEORÍA DE MODELOS

Darío GarcíaUniversidad de los Andes

Universidad de AntioquiaJulio 15-26, 2019

1

Page 2: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Índice

Información del curso 3Introducción y descripción del curso 3Prerrequisitos 3Contenido 3Referencias 41. Lenguajes, estructuras y teorías 5

1.1. Lenguajes y estructuras de primer orden 51.2. Fórmulas y teorías 61.3. Equivalencia elemental, isomorfismos y teorías. 81.4. Conjuntos definibles e interpretabilidad 10

2. Teoremas de completitud y de compacidad 132.1. Construcciones de Henkin y transferencia 142.2. Aplicaciones de compacidad 172.3. Teorías completas y categoricidad 18

3. Subestructuras elementales y Löwenheim-Skolem 213.1. Skolemizaciones y Löwenheim-Skolem descendente 233.2. Cadenas elementales 24

4. Back & Forth 264.1. Ejemplo: Órdenes lineales densos 264.2. Ejemplo: el grafo aleatorio 27

5. Tipos 316. Ultraproductos y aplicaciones 35

6.1. La construcción de ultraproducto 356.2. Propiedades expresables en primer orden 366.3. Hiperreales y análisis no-estándar 376.4. Un ultraproducto de campos 386.5. Cardinalidad de los ultraproductos 39

7. Teoremas de preservación y eliminación de cuantificadores 457.1. Lemas de separación 457.2. Preservación de fórmulas universales 467.3. Preservación de fórmulas inductivas. 477.4. Eliminación de cuantificadores 487.5. Campos algebraicamente cerrados 547.6. Campos real cerrados 567.7. Aritmética de Presburger 61

8. Teorema de omisión de tipos y espacios de Stone 638.1. Teorema de omisión de tipos 638.2. El espacio de Stone 638.3. Teorías ω-categóricas 658.4. Modelos primos 66

Referencias 68

2

Page 3: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Información del curso

Profesor: Darío García - Universidad de los Andes

Fechas: 15-26 de Julio, 2019.

Horario: Lunes a Viernes - 9:00-11:00Lunes, Miércoles y Viernes - 14:00-16:00

Introducción y descripción del curso

Teoría de modelos es una rama de la lógica matemática que estudia la relación entre estructuras matemáticas(grupos, campos, grafos, etc.) y los lenguajes lógicos que se usan para describirlos. El principal concepto esel de conjunto definible, que es el conjunto de soluciones de una fórmula de primer orden en una estructura,y puede verse como una abstracción del concepto de variedad algebraica.

La teoría de modelos tiene sus orígenes en el teorema de completitud de Gödel, y en el teorema de compa-cidad (Gödel/Malcev). Algunos de los primeros resultados tienen que ver con encontrar modelos de ciertasteorías en cardinalidades arbitrarias (Löwenheim-Skolem) y la construcción de ultraproductos. En las déca-das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría demodelos en álgebra, particularmente en campos real-cerrados, campos diferencialmente cerrados, y principiosde transferencia en anillos henselianos.

En este curso describiremos los resultados mencionados anteriormente, poniendo mucho énfasis en ejemplosy aplicaciones en otras áreas de las matemáticas. Por ejemplo, daremos una descripción modelo-teórica delcuerpo ordenado de los números reales y mostraremos cómo pueden ser usados para obtener una caracteri-zación de funciones racionales positivas semi-definidas, lo que da una solución al Problema 17 de Hilbert.

Uno de los principales resultados será el principio de transferencia de categoricidad, ó Teorema de Morley: SiT es una teoría completa en un lenguaje contable con un único modelo (módulo isomorfismo) en algún cardi-nal no-contable, entonces T tiene exactamente un modelo de cardinalidad κ para todo cardinal no contable κ.

La maquinaria necesaria para probar el anterior teorema incluye los conceptos de rango de Morley y teoríasde ω-estables, que ilustran ideas que aún hoy son centrales en la investigación en teoría de modelos: nocionesabstractas de independencia, rango y dimensión, identificación de propiedades dóciles que nos permitenentender los conjuntos definibles en ciertas estructuras (como el campo de los complejos), entre otras.

Prerrequisitos

Es deseable tener conocimientos en álgebra abstracta (grupos y campos), lógica y topología. Sin embargo,los prerrequisitos necesarios serán introducidos en el curso.

Contenido

Herramientas básicas: Lenguajes y Estructuras. Teorías. Conjuntos definibles e interpretabilidad.Equivalencia elemental y sub-estructuras elementales. Test de Tarski-Vaught. Teorema de completitudy teorema de compacidad. Teorías completas. Teoremas de Löwenheim-Skolem. Test de categoricidadde Vaught. Back & Forth. Teorema de Steinitz.Ultraproductos: La construcción de ultraproductos. Teorema de Łoś . Principios de transferencia.Teorema de Ax-Grothendieck. Anillos locales y henselianos. Principio de Ax-Kochen.Eliminación de cuantificadores: Teoremas de preservación. Eliminación de cuantificadores. Ejem-plos en Álgebra: eliminación de cuantificadores en campos algebraicamente cerrados y campos realcerrados.Tipos y modelos contables: Tipos. Espacio de tipos (espacio de Stone). Teorema de omisión detipos y modelos primos. Teorías ω-categóricas. Teorema de Ryll-Nardzewski.Teorías ω-estables: Indiscernibles. Teorías ω-estables. Rango de Morley. Teorema de Lachlan. Pa-res de Vaught. Teorema de Categoricidad de Morley. Fórmulas algebraicas. Conjuntos fuertementeminimales. Campos diferencialmente cerrados.

3

Page 4: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Pregeometrías: Dimensión. Modularidad. Geometrías asociadas a una pregeometría. Curvas planasy linearidad.

Referencias

[1] D. Marker. Model Theory: an introduction. Springer-Verlag. 2002[2] B. Poizat. A course in Model Theory: an introduction to contemporary Mathematical Logic. Springer Universitext. 2000[3] K. Tent, M. Ziegler. A course in model theory. Cambridge University Press. 2012.

4

Page 5: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

1. Lenguajes, estructuras y teorías

1.1. Lenguajes y estructuras de primer orden. En lógica matemática, uno de nuestros primerosintereses consiste en usar lenguajes de primer orden para describir estructuras matemáticas. Por ejemplo,cuando pensamos en la estructura (R,+, ·, exp, 0, 1, <), estamos pensando en el conjunto R, equipado condos funciones binarias + y ·, la función x 7→ ex, la relación binaria <, y dos elementos distinguidos 0 y 1,pero nada más. La manera como formalizamos esta relación entre lenguajes y estructuras serán las primerasdefiniciones de este curso.

Definición 1.1. Un lenguaje de primer orden es una colección de símbolos L que se dividen en tres clases:

Un conjunto de símbolos de función F , y para cada f ∈ F un entero positivo nf .Un conjunto de símbolos de relación R, y para cada R ∈ R un entero positivo nR.Un conjunto de símbolos de constante C.

Los números nf y nR nos dicen que f es una función de nf variables, y que R es una relación nR-aria.Además, cualquiera de los tres conjuntos puede ser vacío.

Ejemplo 1.2. Los siguientes son algunos ejemplos de lenguajes:

(i) Lenguaje de grupos: Lgr = ∗, e, donde ∗ es un símbolo de función binaria y e es un símbolo deconstante.

(ii) Lenguaje de anillos: Lr = +, ·,−, 0, 1, donde +, · son símbolos de funciones binarias, − es un símbolode función unaria, y 0, 1 son símbolos de constante.

(iii) Lenguaje de anillos ordenados: Lor = Lr ∪ <, donde < es un símbolo de relación binaria.(iv) El lenguaje de conjuntos puros: L = ∅.(v) El lenguaje de grafos: Lg = R, donde R es una relación binaria.(vi) El lenguaje de K-espacios vectoriales: Dado un campoK, es el lenguaje LK−ev = +, 0∪fα : α ∈ K

donde para cada α ∈ K, fα es un función unaria.

Definición 1.3. Una L-estructura M corresponde a la siguiente información:

Un conjunto no vacío M , que se conoce como el universo de M o el dominio de M.Para cada símbolo de función f , una función distinguida fM :Mnf →M .Para cada símbolo de relación R, un subconjunto distinguido RM ⊆MnR .Para cada símbolo de constante c, un elemento distinguido cM ∈M .

Los objetos distinguidos fM, RM, cM se conocen como las interpretaciones de los símbolos del lenguaje enla estructura M.

Ejemplo 1.4. El grupo (Z,+, 0) es una estructura en el lenguaje de grupos Lgr, donde interpretamos laconstante e como el elemento distinguido 0 ∈ Z, y el símbolo de función binaria ∗ es interpretado como lafunción binaria + : Z2 → Z definida como la suma usual.

Es importante notar que una Lgr-estructura no tiene por qué ser un grupo, ya que esto dependerá de laspropiedades que la estructura cumpla. Por ejemplo, (N, 0,+) también es una Lgr-estructura.

Ejemplo 1.5. Como estructuras en el lenguaje Lor de anillos ordenados, tenemos el campo ordenado delos números reales (R, 0, 1,+, ·, <), el anillo ordenado de los racionales (Q, 0, 1,+, ·, <), o el anillo de seriesformales sobre los reales, (R((t)),+, ·, 0, 1,≺), haciendo a ≺ t para todo real a.

Ejemplo 1.6. Si tenemos un grafo G = (V (G), E(G)), puede ser visto como una estructura en el lenguajede grafos Lg = R pensando en el conjunto de vértices como el universo, y definiendo la relación RG como(x, y) ∈ RG si y sólo si x, y ∈ E(G).

Ejemplo 1.7. Una estructura V en el lenguaje de K-espacios vectoriales estará dada por V = (V,+V , 0V , fVα )de la manera usual: +V y 0V corresponderán a la suma de vectores y al vector nulo, y para cada α ∈ K lafunción fVα se interpreta como el producto por escalar: fVα (v) = α · v para todo v ∈ V .

Definición 1.8. Supongamos que M y N son L-estructuras con universos M y N respectivamente. UnaL-inmersión es una función inyectiva η :M → N que preserva la interpretación de todos los símbolos en L.Esto es,

Para cada símbolo de constante c, η(cM) = cN .5

Page 6: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Para cada símbolo de función f y cada tupla a1, . . . , anfde elementos en M ,

η(fM(a1, . . . , anf)) = fN (η(a1), . . . , η(anf

)).

Para cada símbolo de relación R y cualquier tupla (a1, . . . , anR) ∈MnR ,

(a1, . . . , anR) ∈ RM si y sólo si (η(a1), . . . , η(anR

)) ∈ RN .

De cierta manera, podemos entender las L-inmersiones como una especia de “homomorfismos inyectivos”. UnaL-inmersión biyectiva se denomina L-isomorfismo. Si M ⊆ N y el mapa de inclusión es una L-inmersión,decimos que M es una subestructura de N , o que N es una extensión de M.

Ejemplo 1.9 (Estructuras e inmersiones).

(i) (Z,+, 0) es una subestructura de (R,+, 0).(ii) Si η : Z → R es la función η(x) = exp(x), entonces η es una Lgr-inmersión entre (Z,+, 0) y (R, ·, 1).

1.2. Fórmulas y teorías. Una L-fórmula de primer orden es una cadena finita de símbolos construídausando los símbolos del lenguaje L, símbolos de variable v1, v2, . . . , el símbolo de igualdad =, los conectivosbooleanos ∧,∨ y ¬ (que se leen como “y”, “o” y “no”) y los cuantificadores ∀ y ∃ (que se leen como “paratodo” y “existe”, respectivamente), y los paréntesis ( , ).

Intuitivamente, una fórmula es una expresión finita y “con sentido” usando los símbolos ya descritos. Ade-más, se requiere que los cuantificadores varíen únicamente sobre variables asociadas a elementos de unaL-estructura. Una L-sentencia es una L-fórmula que no tiene ninguna variable libre, es decir, todas las va-riables que aparecen tienen un cuantificador que actúa sobre ellas.

A continuación daremos una definición (un poco más) formal de fórmulas de primer orden.

Definición 1.10. El conjunto de L-términos es el conjunto más pequeño TerL tal que:

(i) Para cada símbolo de constante c, c ∈ TerL.(ii) Cada símbolo de variable vi está en TerL, para i = 1, 2, . . ..(iii) Si f es un símbolo de función y t1, . . . , tnf

∈ TerL, entonces f(t1, . . . , tnf) ∈ TerL.

Por ejemplo, ·(v1,+(v3, 1)), +(·(v1, v2),+(v3, 1)) y +(1,+(1,+(1, 1))) son Lr-términos. Sin embargo, porsimplicidad escribimos estos elementos como v1 · (v3 + 1), v1 · v2 + (v3 + 1), y 1 + (1 + (1 + 1)) si no haylugar a confusiones. De cierta forma, los términos definen funciones en las diferentes L-estructuras de maneranatural. Por ejemplo, el término ·(+(v1,+(1, 1)), v2) define de forma natural la función s : R2 → R dada pors(x, y) = (x+ 2) · y.Definición 1.11. Se define el conjunto de L-fórmulas atómicas como el conjunto de secuencias de símbolos φque son de la forma t1 = t2 ó R(t1, . . . , tnR

), donde los ti son L-términos y R es un símbolo de relación nR-aria.

Se define el conjunto de L-fórmulas como el conjunto más pequeño ForL que contiene a las fórmulas atómicasy que cumple lo siguiente:

(i) Si φ ∈ ForL, ¬φ está en ForL.(ii) Si φ,ψ están en ForL, entonces (φ ∧ ψ) y (φ ∨ ψ) están en ForL.(iii) Si φ está en ForL, entonces ∀vi φ y ∃vi φ está en ForL.

Comentario 1.12. El lector puede notar que no hemos usado otros conectivos famosos, pero podemos verloscomo abreviaciones útiles. Por ejemplo, φ→ ψ es una abreviación para ¬φ∨ ψ, y φ↔ ψ es una abreviaciónpara (φ → ψ) ∧ (ψ → φ). Incluso podríamos considerar φ ∨ ψ y ∀v φ como abreviaciones de ¬(¬φ ∧ ¬ψ)y ¬(∃v ¬φ). 1 Estas abreviaciones serán útiles cuando intentemos probar algún resutado por inducción enfórmulas, ya que elimina el caso de ∨ y ∀

También usaremos las abreviacionesn∧

i=1

ψi para ψ1 ∧ · · · ∧ ψn yn∨

i=1

ψi para ψ1 ∨ · · · ∨ ψn.

Comentario 1.13. Cuando no se generen confusiones, a veces será útil permitir como posibles variables lasletras x, y, z, etc., y es posible omitir en ocasiones algunos de los paréntesis usados.

1Esto por supuesto está basado en un resultado importante de lógica proposicional: ¬,∧ es un conjunto completo deconectivos.

6

Page 7: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Para darnos una idea de qué tipo de afirmaciones se pueden expresar como fórmulas de primer orden, damosalgunos ejemplos:

Ejemplo 1.14. Las siguientes son fórmulas en el lenguaje Lor:(v1 = 0 ∨ v1 > 0)∃v2 (v2 · v2 = v1)∀v1(v1 = 0 ∨ ∃v2(v2 · v1 = 1))

Ejemplo 1.15. En el lenguaje Lgr, podemos expresar “ser un grupo abeliano” por medio de la siguientesentencia:

∀x∀y∀z[(x ∗ y) ∗ z = x ∗ (y ∗ z)]︸ ︷︷ ︸Asociatividad

∧∀x(x ∗ e = x ∧ x = e ∗ x)︸ ︷︷ ︸neutro

∧∀x∃y(x ∗ y = e)︸ ︷︷ ︸inversos

∧∀x∀y(x ∗ y = y ∗ x)︸ ︷︷ ︸conmutatividad

.

Ejemplo 1.16. El campo ordenado de los números reales está completamente axiomatizado por las siguientespropiedades:

Axiomas de campo: Axiomas de orden:

1. ∀x∀y∀z[(x+ y) + z = x+ (y + z)] 10. ∀x∀y(x < y ∨ x = y ∨ y < x)

2. ∀x(x+ 0 = x ∧ x = 0 + x) 11. ∀x∀y∀z((x < y ∧ y < z) → x < z)

3. ∀x∃y(x+ y = 0) 12. ∀x∀y∀z(x < y → x+ z < y + z)

4. ∀y(x+ y = y + x) 13. ∀x∀y∀z((x < y ∧ z > 0) → x · z < y · z)5. ∀x∀y∀z[(x · y) · z = x · (y · z)] 14. ∀x∀y∀z((x < y ∧ z < 0) → y · z < x · z)6. ∀x(x · 1 = x ∧ x = 1 · x)7. ∀x(x 6= 0 → ∃y(x · y = 1)) Completitud:

8. ∀y(x · y = y · x) ∀S ⊆ R[(∃x(x ∈ S) ∧ ∃y∀x(x ∈ S → x < y)

9. ∀x∀y∀z(x · (y + z) = x · y + y · z) → ∃z∀x(∃t(t ∈ S ∧ x < t) ∨ x = z ∨ x < z)]

De estas propiedades, solamente la última (axioma de completitud) no parece ser expresable en primer ordenporque cuantifica sobre subconjuntos de los reales, y utiliza el símbolo ∈ que no estaba en el lenguaje originalLor. 2

Definición 1.17. Una L-sentencia es una fórmula en la cual todas las variables aparecen cuantificadas por∀ ó ∃.

Comentario 1.18. Sea M una L-estructura. Veremos en un momento que cada L-sentencia es cierta ófalsa en M. En contraste, si φ es una fórmula con variables libres v1, . . . , vn, podemos pensar que φ estáexpresando una propiedad de ciertos elementos en Mn.

Definición 1.19. Sea φ una fórmula con variables libres v = (v1, . . . , vm), y sea a = (a1, . . . , am) ∈ Mm.Definimos inductivamente la expresión M |= φ(a) de la siguiente manera:

(i) Si φ es t1 = t2, entonces M |= φ(a) si y sólo si tM1 (a) = tM2 (a).(ii) Si φ es R(t1, . . . , tnR

), entonces M |= φ(a) si y sólo si (tM1 (a), . . . , tMnR(a)) ∈ RM.

(iii) Si φ = ¬ψ, entonces M |= φ(a) si y sólo si M 6|= ψ(a).(iv) Si φ es (ψ ∧ θ), entonces M |= φ(a) si M |= ψ(a) y M |= θ(a).(v) Si φ es (ψ ∨ θ), entonces M |= φ(a) si y sólo si M |= ψ(a) ó M |= θ(a).(vi) Si φ es ∃vjψ(v, vj), entonces M |= φ(a) si y sólo si existe b ∈M tal que M |= ψ(a, b).(vii) Si φ = ∀vj ψ(v, vj), entonces M |= φ(v) si y sólo si M |= ψ(a, b) para todo b ∈ M.

Si M |= φ(a), decimos que M |= φ(a) satisface φ(a), o que φ(a es cierta en M. 3.

Definición 1.20. Sea M una L-estructura. Decimos que M satisface una sentencia σ (y lo denotamos comoM |= σ) si la sentencia σ es cierta en M .

Proposición 1.21. Supongamos que M es una subestructura de N y sean a ∈M y φ(v) una fórmula librede cuantificadores. Entonces M |= φ(a) si y sólo si N |= φ(a).

2Cabe señalar sin embargo que este axioma es expresable en el lenguaje de la teoría de conjuntos L = ∈, por medio deuna sentencia muchísimo más complicada, y asumiendo los axiomas de Zermelo-Frankel.

3Esta definición se conoce como la definición de verdad de Tarski

7

Page 8: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Demostración. EJERCICIO. (Puede probar primero por inducción en términos que si t(v) ∈ TerL y b ∈Mentonces tM(b) = tN (b). Luego, demostrar el resultado por inducción en fórmulas, teniendo en cuenta queno es necesario tener en cuenta el paso inductivo.)

Ejemplo 1.22. Considere la fórmula ϕ(x, y) := x < y en el lenguaje de anillos ordenados. Tenemos entoncesque R |= ϕ(0, 1) ∧ ϕ(

√2, 2), pero R 6|= ϕ(π, e).

1.3. Equivalencia elemental, isomorfismos y teorías.

Definición 1.23. Sean M,N dos L-estructuras. Decimos que M y N son elementalmente equivalentes (yescribimos M ≡ N ) si para toda L-sentencia σ, M |= σ si y sólo si N |= σ.

Ejemplo 1.24. Considere la sentencia en el lenguaje de anillos ordenados dada por σ = ∃x(x2 = 1 + 1).Dicha sentencia es cierta en (R, 0, 1,+, ·, <), pero no en (Q, 0, 1,+, ·, <). De esta manera, el campo de losnúmeros reales no es elementalmente equivalente al campo de los números racionales.

Definición 1.25. Si M es una L-estructura, definimos la teoría de M como el conjunto de L-sentencias σtal que M |= σ. A este conjunto o denotamos como Th(M).

De esta manera, podríamos decir que M y N son elementalmente equivalentes si y sólo si Th(M) = Th(N ).El siguiente resultado muestra que Th(M) es un invariante de la estructura M.

Teorema 1.26. Supongamos que j : M → N es un L-isomorfismo. Entonces M ≡ N .

Demostración. Probaremos por inducción en fórmulas algo un poco más fuerte: para toda L-fórmula φ(x1, . . . , xn)y a1, . . . , an ∈M , M |= φ(a1, . . . , an) si y sólo si N |= φ(j(a1), . . . , j(an)).

Afirmación: Si t(v) es un término, con v = v1, . . . , vn entonces j(tM(a) = tN (j(a)).

Demostración de la afirmación. Probamos esto por inducción en términos.

(i) Si t = c es una constante, j(tM(a)) = j(cM) = cN = tN (a).(ii) Si t = vi, entonces j(tM(a)) = j(ai) = tN (j(a)).(iii) Si t = f(t1, . . . , tm) y ya se cumple el resultado para los términos t1, . . . , tm, entonces

j(tM(a)) = j(fM(tM1 (a), . . . , tMm (a))

= fN (j(tM1 (a)), . . . , j(tMm (a))) (por la definición de isomorfismo)

= fN(tN1 (j(a)), . . . , tNm(j(a))

)(por hipótesis de inducción)

= tN (j(a))

Ahora procedemos a probar el resultado por inducción en fórmulas.

(i) Si φ(v) es t1 = t2, entonces

M |= φ(a) ⇔ tM1 (a) = tM2 (a) (por definición de |=)

⇔ j(tM1 (a)) = j(tM2 (a)) (porque j es una función inyectiva)

⇔ tN1 (j(a)) = tN2 (j(a)) (por la afirmación anterior)

⇔ N |= φ(j(a)).

(ii) Si φ(v) es R(t1, . . . , tn), entonces

M |= φ(a) ⇔ (tM1 (a), . . . , tMn (a)) ∈ RM

⇔ (j(tM1 (a)), . . . , j(tMn (a))) ∈ RN

⇔ (tN1 (j(a)) = tN2 (j(a))) ∈ RN

⇔ M |= φ(j(a)).

(iii) Si φ(v) es ¬ψ(v), entonces por inducción tenemos

M |= φ(a) ⇔ M 6|= ψ(a) ⇔ N 6|= ψ(j(a)) ⇔ N |= φ(j(a)).

(iv) Si φ(v) es ψ(v) ∧ θ(v), entonces

M |= φ(v) ⇔ M |= ψ(v) y M |= θ(v) ⇔ N |= ψ(v) y N |= θ(v) ⇔ N |= φ(v).8

Page 9: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

(v) Si φ(v) es ∃w ψ(v,w), entonces

M |= φ(a) ⇔ M |= ψ(a, b) para algún b ∈M

⇔ N |= ψ(j(a), j(b))

⇔ N |= ψ(j(a), c) para algún c ∈ N (c = j(b))

⇔ N |= φ(j(a)).

Definición 1.27. Dado un lenguaje L, una L-teoría T es simplemente un conjunto de L-sentencias. Decimosque M |= T si M |= φ para todas las sentencias φ ∈ T .

Por ejemplo, el conjunto T = ∀x(x = 0),∃x(x 6= 0) es una teoría, pero como las dos sentencias soncontradictorias no tiene modelos.A continuación veremos nuestros primeros ejemplos de teorías.

Ejemplo 1.28 (Conjuntos infinitos). En el lenguaje L = ∅, consideramos la teoría T que tiene, para cadan ≥ 1, la sentencia

σn := ∃x1∃x2 . . . ∃xn

1≤i<j≤nxi 6= xj

que afirma que existen al menos n elementos diferentes. Una L-estructura M con universo M satisface T siy sólo si M es infinito.

Ejemplo 1.29 (Órdenes lineales). Sea L = <, donde < es un símbolo de relación binaria. La clase deórdenes lineales es axiomatizada por las L-sentencias

∀x(¬(x < x))

∀x∀y∀z((x < y ∧ y < z) → x < z)

∀x∀y(x < y ∨ x = y ∨ y < x).

Hay varias extensiones interesantes de la teoría de órdenes lineales. Por ejemplo, podríamos añadir la sentencia

∀x∀y(x < y → ∃z(x < z ∧ z < y))

para obtener la teoría de órdenes lineales densos, o podríamos en cambio añadir la sentencia

∀x∃y(x < y ∧ ∀z(x < z → (z = y ∨ y < z)))

para obtener la teoría de órdenes lineales en donde cada elemento tiene un único sucesor. Podríamos tambiéntener sentencias que afirman o evitan la existencia de elementos extremos.

Ejemplo 1.30 (Relaciones de equivalencia). Sea L = E, donde E es un símbolo de relación binaria. Lateoría de relaciones de equivalencia está dada por

∀x(E(x, x))

∀x∀y(E(x, y) → E(y, x))

∀x∀y∀z((E(x, y) ∧E(y, z)) → E(x, z)).

Como antes, existen varias extensiones interesantes de esta teoría. Por ejemplo, podríamos decir que cadaclase tiene dos elementos:

∀x∃y(x 6= y ∧E(x, y) ∧ ∀z(E(x, z) → (z = x ∨ z = y))).

También podríamos usar la sentencia

∃x∃y(¬E(x, y) ∧ ∀z(E(x, z) ∨ E(y, z)))

y el conjunto infinito de sentencias∀x∃x1∃x2 . . . ∃xn

1≤i<j≤nxi 6= xj ∧

n∧

i=1

E(x, xi)

: n ≥ 1

para axiomatizar la clase de relaciones de equivalencia con exactamente dos clases, ambas infinitas.

Ejemplo 1.31 (Grafos). Durante este curso, un grafo estará dado por un conjunto de vértices y una relaciónbinaria que es simétrica e irreflexiva. Esto puede axiomatizarse mediante la siguiente teoría:

∀x∀y(R(x, y) → R(y, x),∀x(¬R(x, x)).9

Page 10: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Ejemplo 1.32 (Grupos). Ya antes vimos un conjunto de cuatro sentencias en el lenguaje Lgr = ∗, e queaxiomatizan la propiedad “ser un grupo abeliano”. Podríamos además añadir el conjunto infinito de sentencias

∀x(x 6= e→ x ∗ x ∗ · · · ∗ x︸ ︷︷ ︸n-veces

6= e) : n ≥ 1

que juntas aseguran que x no hay ningún elemento con torsión n para ningún n. En otras palabras, estateoría axiomatizaría la teoría de grupos abelianos libres de torsión.

Ejemplo 1.33 (Grupos abelianos ordenados). Consideremos el lenguaje L = +, <, 0, donde + es unsímbolo de función binaria, < es un símbolo de relación binaria y 0 es un símbolo de constante. Los axiomasde grupos ordenados están dados por:

Los axiomas de grupos abelianos, en lenguaje aditivo.Los axiomas de órdenes lineales,∀x ∀y ∀z(x < y → x+ z < y + z).

Ejemplo 1.34. La teoría de campos algebraicamente cerrados (ACF) es la teoría en el lenguaje de anillosLr = 0, 1,+, · que incluye los 9 axiomas de campo descritos anteriormente, junto con las sentencias de laforma

θn = ∀a0, a1, . . . , an(an 6= 0 → ∃x(a0 + a1x+ · · ·+ anxn = 0))

para todo n ≥ 1. Esta teoría contiene un conjunto enumerable de sentencias, y se tiene que K |= ACF si ysólo si K es algebraicamente cerrado.

Ejemplo 1.35 (Aritmética de Peano). Consideremos el lenguaje L = +, ·, s, 0 donde + y · son símbolosde relación binaria, s es una función unaria y 0 es un símbolo de constante. Podemos pensar en la funcións como la función sucesor x 7→ x + 1. Los axiomas de Peano (de primer orden) para la aritmética son lassentencias4:

∀x(s(x) 6= 0) ∀x(x 6= 0 → ∃y(s(y) = x)) ∀x(x+ 0 = x)

∀x∀y(x+ s(y) = s(x+ y)) ∀x(x · 0 = 0) ∀x∀y(x · s(y) = (x · y) + x),

junto con los axiomas IND(φ) para cada fórmula φ(v,w), donde IND(φ) es la sentencia

∀w[(φ(0, w) ∧ ∀v(φ(v,w) → φ(s(v), w))) → ∀x(φ(x,w)).]1.4. Conjuntos definibles e interpretabilidad.

Definición 1.36. Sea M = (M, . . .) una L-estructura. Decimos que X ⊆ Mn es definible si existe unaL-fórmula φ(x1, . . . , xn; y1, . . . , ym) y b ∈ Mm tal que X = a ∈ Mn : M |= φ(a, b). Decimos entoncesque φ(x, b) define a X. Además, decimos que X es A-definible o definible sobre A si existe una fórmulaψ(x, y1, . . . , yℓ) y b ∈ Aℓ tales que ψ(x, b) define X.

Podemos entender los conjuntos definibles como conjuntos de soluciones en Mn de una fórmula de primerorden. Si φ(x1, . . . , xn; a1, . . . , am) define un conjunto X ⊆Mn, también escribimos X = φ(Mn; a1, . . . , am),y decimos que X es definible con parámetros a1, . . . , am.

Ejemplo 1.37. En el lenguaje de anillos, podemos considerar la fórmula φ(x) = ∃y(y · y = x), que tieneuna variable libre. En el campo de los complejos, esta fórmula define al conjunto φ(C) = C, mientras que enel campo de los reales define a φ(R) = R≥0.

Ejemplo 1.38. En el lenguaje de grupos abelianos, la fórmula D3(x) := ∃y(y+y+y = x) tiene una variablelibre, y en el grupo (Z,+, 0) define al conjunto 3Z, mientras que en el grupo (Q,+, 0) define a Q.

Ejemplo 1.39. Si G es un grupo y a ∈ G, podemos definir el centro de a mediante la fórmula ϕ(x, a) :=x · a = a · x, y el centro del grupo será definido por Z(x) := ∀y(y · x = x · y).Comentario 1.40. Dado que las fórmulas de primer orden son cerradas bajo ∧,∨,¬,∃, los conjuntos defini-bles son cerrados bajo intersecciones y uniones finitas, pero también bajo complementos y proyecciones. Porejemplo, si K es un campo, entonces W = (x, y) ∈ K2 : xy = 1 es un conjunto definible, y su proyecciónπ1(W ) = x ∈ K : ∃y(xy = 1) también es definible, y de hecho corresponde con el conjunto definido por lafórmula x 6= 0.

4En los trabajos de Peano, el axioma de inducción tiene la forma ∀A ⊆ N[(0 ∈ A ∧ ∀x(x ∈ A → s(x) ∈ A) → A = N), queno es una sentencia en lógica de primer orden, pero sí en lógica de segundo orden. Este axioma junto con los ya mencionadoscaracteriza completamente la estructura de los números naturales. Los axiomas mencionados aquí corresponden con el fragmentode primer orden de los axiomas originales de Peano.

10

Page 11: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Ejemplo 1.41. Ahora daremos algunos ejemplos en el lenguaje de anillos Lr = +,−, ·, 0, 1.

Si M = (R,+,−, ·, 0, 1) es un anillo y p(X) =m∑

i=0

aiXi ∈ R[X], entonces Y = x ∈ R : p(x) = 0 es

un conjunto definible, pues podemos considerar la fórmula φ(x, y0, y1, . . . , yn) dada por

yn · x · · · x︸ ︷︷ ︸n-veces

+ · · ·+ y1 · x+ y0 = 0,

por lo que tendremos Y = φ(M,a0, a1, . . . , an). Este conjunto es A-definible, para cualquier A ⊇a0, . . . , an.Considere la fórmula ψ(x) = ∃y(y2 = x). En M = (R,+,−, ·, 0, 1) esta fórmula define el intervalo[0,+∞), mientras que en N = (C,+,−, ·, 0, 1) define el conjunto C.Consideremos la fórmula φ(x, y) := ∃z(z 6= 0 ∧ z2 + x = y). En M = (R,+,−, ·, 0, 1), tenemos quea < b si y sólo si M |= φ(a, b). Esto muestra que el orden es ∅-definible en el campo de números reales.Sea M = (Z,+,−, ·, 0, 1) el anillo de los enteros. Sea X = (m,n) ∈ Z2 : m < n. Este conjuntotambién es ∅-definible, ya que por el Teorema de Lagrange todo entero positivo se puede escribir comola suma de cuatro cuadrados. Así, si consideramos la fórmula φ(x, y) dada por

∃z1, z2, z3, z4(z1 6= 0 ∧ y = x+ z21 + z22 + z23 + z24),

entonces X = (m,n) ∈ Z2 : M |= φ(m,n) := φ(Z2).El conjunto de los números primos P es definible en el anillo (Z,+, ·, 0, 1). Como ya vimos, el orden esdefinible, por lo que el conjunto de primos es precisamente el conjunto de soluciones de la fórmula

P (x) := x > 1 ∧ ∀y(1 < y < x→ ¬∃z(y · z = x)).

Sea F un campo y M = (F [X],+,−, ·, 0, 1). El conjunto F es definible en M, ya que correspondeal conjunto de unidades de F [X] junto con el polinomio nulo. Podemos entonces usar la fórmulaθ(x) := “x = 0 ∨ ∃y(xy = 1).

Para saber si un conjunto X es definible, usualmente tratamos de encontrar una fórmula cuyo conjunto desoluciones sea precisamente X. Pero, ¿cómo probar que un conjunto no es definible? El siguiente resultadonos proporciona un criterio útil.

Lema 1.42. Sea M una L-estructura. Si X ⊆Mn es A-definible entonces cualquier L-automorfismo de Mque fije puntualmente A fija a X como conjunto. Esto es, si σ es un automorfismo de M tal que σ(a) = apara todo a ∈ A, entonces σ(X) = X.

Demostración. Sea ψ(x, a) una L-fórmula que define el conjunto X, con a ∈ A. Sea σ un automorfismo deM tal que σ(a) = a, y sea b ∈Mn. Tenemos entonces que

b ∈ X ⇔ M |= ψ(b, a) ⇔ M |= ψ(σ(b), σ(a)) ⇔ M |= ψ(σ(b), a) ⇔ σ(b) = X,

lo que muestra que σ(X) = X.

Ejemplo 1.43. El único elemento ∅-definible en la estructura M = (Z,+) es 0. En efecto, 0 es definiblemediante la fórmula φ(x) = ∀y(x + y = y + x = y), pero además el automorfismo σ : Z → Z dado porσ(x) = −x solamente deja fijo a x = 0 y mueve los demás elementos.

Corolario 1.44. El conjunto de los números reales no es definible en el campo de los números complejos.

Demostración. Si R fuese definible, sería definible sobre un conjunto finito de parámetros A ⊆ C. Seanr, s ∈ C elementos algebraicamente independientes sobre A con r ∈ R y s 6∈ R (por ejemplo, r, s pueden sertrascendentes sobre Q(A)). Existe un automorfismo σ de C tal que σ A es la identidad y σ(r) = s. De estamanera, σ(R) 6= R, y R no es definible sobre A.

Esto funciona muy bien porque C tiene muchos automorfismos, pero la situación puede ser muy diferente.Por ejemplo, la Lr-estructura R,+, ·, 0, 1), no tiene automorfismos no triviales: cualquier automorfismo debefijar los números naturales, y por lo tanto los racionales. Además, como el orden es definible, termina fijandotodos los números reales. Sin embargo, R tiene un total de 22

ℵ0 posibles subconjuntos, pero solamente 2ℵ0

posibles definiciones. Por lo tanto, existen muchos subconjuntos de R que no son definibles, pero no podemosusar el Lema 1.42 para probar que algún conjunto en particular no es definible.

Más adelante veremos que el converso del Lema 1.42 se cumple en modelos que sean suficientemente ricos.11

Page 12: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

EJERCICIOS DE PRÁCTICA

Ejercicio 1.(a) Demuestre que toda fórmula sin cuantificadores puede ponerse en forma normal disyuntiva: una dis-

yunción (∨) de conjunciones (∧) de fórmulas básicas (fórmulas atómicas o negaciones de atómicas).(b) Demuestre que toda fórmula φ(x) se puede escribir en forma normal prenexa: Q1y1 · · ·Qnyn ψ(x, y)

donde ψ es una fórmula sin cuantificadores en forma normal disyuntiva.

Ejercicio 2. Demuestre que todo grupo abeliano libre de torsión es ordenable, usando compacidad (y sinecesita, el diagrama de la teoría).

Ejercicio 3. Considere la estructura (Q,+).

(a) Defina lo que significa “X es un subconjunto de Q definible sin parámetros”.(b) Encuentre cuatro subconjuntos diferentes definibles sin parámetros.(c) Demuestre que cualquier conjunto definible sin parámetros es uno de los cuatro que listó arriba.

Ejercicio 4. Determine si los siguientes pares de estructuras son isomorfas, elementalmente equivalentes oninguna de las dos, en el lenguaje dado. Justifique sus respuestas.

1. (R, ·0) y (C,×, 0) con L = ×, 1.2. (Q, <) y (Q ∩ [0, 4], <) con L = <.3. (Q, <) y (Q ∩ (−1, 1), <) con L = <.4. (Z,+, 0) y (Z⊕ Z,+, (0, 0)) con L = ×, 1.

Ejercicio 5. Considere la estructura (C,+,×, 0, 1).(a) Use inducción en la longitud de los términos para demostrar que todos los términos t(x) con una

variable libre y parámetros en C son polinomios con coeficientes en C.(b) Demuestre que si A ⊆ C es un conjunto definible con fórmulas sin cuantificadores (las que no usan ∀

ó ∃) y parámetros en C, entonces A es finito o su complemento es finito. (probablemente quiera hacerinducción en fórmulas)

Ejercicio 6. Demuestre que para cada par de números reales distintos r, s existe una fórmula ϕ(x) tal que(R,≤,+, ·, 0, 1) |= ϕ[r] y (R,≤,+, ·, 0, 1) 6|= ϕ[s].

12

Page 13: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

2. Teoremas de completitud y de compacidad

Definición 2.1. Sea T una teoría y σ una sentencia. Decimos que σ es una consecuencia lógica de T (y sedenota T |= σ) si para todo modelo M de T se cumple que M |= σ. Equivalentemente, si T ∪ ¬σ no tienemodelos.

Dada una L-teoría T y una L-sentencia σ, mostrar que T |= σ parece ser una tarea difícil, ya que seríanecesario revisar que todos los modelos de T efectivamente satisfacen σ. En la práctica, para mostrar queT |= σ se da una prueba informal de que σ es verdadera en cada modelo de T , usualmente a partir de ciertosaxiomas que están en T .

Una prueba de σ a partir de T es una sucesión finita de L-fórmulas 〈ψ1, . . . , ψm〉tal que ψm = σ y para cadai = 1, . . . ,m se tiene que ψi ∈ T ó ψi se puede obtener de ψ1, . . . , ψi−1 por medio de reglas de inferencialógica. Escribimos T ⊢ σ (T deduce σ) si existe una prueba de σ a partir de T .

No daremos un tratamiento de todos estos temas en este curso, pero sí daremos algunas propiedades:

Las pruebas son finitas.(Validez) Si T ⊢ σ entonces T |= σ.Si T es un conjunto finito de sentencias, existe un algoritmo que dado un conjunto de L-formulasψ1, . . . , ψm y una L-sentencia σ, puede decidir si 〈ψ1, . . . , ψm〉 es una prueba de σ a partir de T o no.

Uno de los teoremas más importantes de lógica matemática establece precisamente que la noción sintácticafinitaria de “prueba” logra capturar la noción semántica de “consecuencia lógica”.

Teorema 2.2 (Teorema de completitud de Gödel, 1929). Si T es una L-teoría y σ es una L-sentencia,entonces T ⊢ σ si y sólo si T |= σ.

Demostración. Para ver una demostración de este resultado, recomendamos [7, Sección 3.2].

Recordemos que una teoría T se dice inconsistente si T genera contradicciones, es decir, si existe una sentenciaσ tal que T ⊢ (σ ∧ ¬σ). Si una teoría T no es inconsistente, diremos que es consistente.

Corolario 2.3. Una teoría T es consistente si y sólo si T tiene modelos.

Demostración. (⇐) Supongamos que M es un modelo de T . Si T fuese inconsistente, existiría una sentenciaσ tal que T ⊢ (σ ∧ ¬σ), por lo cual T |= (σ ∧ ¬σ). Así, M |= σ ∧ ¬σ, y por la definición de satisfacción, esoocurre si y sólo si M |= σ y M 6|= σ, que es absurdo.

(⇒) Si T no tiene modelos, entonces podemos decir que cada modelo de T es un modelo de σ ∧ ¬σ. Deesta manera, T |= (σ ∧ ¬σ), y por el Teorema de Completitud, T ⊢ (σ ∧ ¬σ). Esto muestra que T esinconsistente.

Definición 2.4. Decimos que una teoría T es satisfactible si T tiene modelos.

El Teorema de Completitud también tiene la siguiente consecuencia, en apariencia simple, pero que posible-mente es la herramienta más importante en teoría de modelos.

Teorema 2.5 (Teorema de Compacidad). Una teoría T es satisfactible si y sólo T es finitamente satisfac-tible, es decir, si cada subconjunto finito de T es satisfactible. 5

Demostración. Claramente si T es satisfactible, entonces T es finitamente satisfactible pues podemos usar elmismo modelo M |= T . En la otra dirección, si T no tuviera modelos, entonces T es inconsistente y existeuna sentencia σ tal que T ⊢ (σ ∧¬σ). Dado que las pruebas son finitas, existe un subconjunto finito T0 ⊆ Ttal que T0 ⊢ σ ∧ ¬σ. Esto muestra que T0 es inconsistente, por lo que T0 no tiene modelos, y concluiríamosque T no es finitamente satisfactible.

Dado que no será importante para nosotros entender la naturaleza precisa de nuestro sistema de deducciónformal, no presentaremos una demostración del Teorema de Completitud. 6 Para efectos de este curso,podríamos usar la siguiente definición basada en este importante resultado.

Definición 2.6. Una teoría T se dice consistente (o satisfactible) si existe un modelo M tal que M |= T .

5Este teorema se le atribuye a Maltsev (1936), aunque diferentes versiones ya aparecían en los trabajos de Gödel.6Sin embargo, más adelante daremos una prueba del teorema de compacidad que no utiliza el teorema de completitud

13

Page 14: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

2.1. Construcciones de Henkin y transferencia. Una de las demostraciones más usadas actualmentepara el teorema de completitud se basa en los trabajos de Henkin (1946) en donde usa el método de cons-tantes. A partir de una teoría finitamente satisfactible T es necesario construír un modelo para T y la ideaprincipal se basa en agregar suficientes constantes al lenguaje de tal forma que cada elemento de nuestromodelo estará nombrado por una constante del nuevo lenguaje.

Una de las consecuencias más importantes de esta construcción es el siguiente principio de transferencia:

Teorema 2.7 (Löwenheim-Skolem, versión 1). Si T es una teoría contable que tiene modelos infinitos,entonces para cada cardinal κ ≥ ℵ0, T tiene modelos de cardinalidad κ.

Una de las particularidades del poder de expresión de la lógica de primer orden radica en la incapacidadde distinguir entre diferentes cardinalidades infinitas. Esto es a la vez una debilidad y una fortaleza, ya quenos permite encontrar modelos de una misma teoría contable T en todas las cardinalidades infinitas, comolo describe el anterior teorema.

Definición 2.8. Decimos que una L-teoría T es una teoría de Henkin si para toda fórmula φ(x) con unavariable libre x existe una constante c ∈ L tal que T |= (∃xφ(x)) → φ(c).

Una teoría T se dice maximal si para toda sentencia σ se tiene que σ ∈ T ó ¬σ ∈ T .

Lema 2.9. Supongamos que T es una L-teoría maximal finitamente satisfactible. Si ∆ ⊆ T es finito y∆ |= ψ, entonces ψ ∈ T .

Demostración. Si ψ 6∈ T , entonces por maximalidad tendríamos que ¬ψ ∈ T . Esto mostraría que ∆ ∪ ¬ψes un subconjunto finito de T que no tiene modelos, una contradicción.

Lema 2.10. Si T es una L-teoría de Henkin, finitamente satisfactible y maximal entonces T tiene modelos.Más aún, si κ es un cardinal y L tiene a lo más κ símbolos de consante, existe un modelo M |= T con|M| ≤ κ.

Demostración. Sea C el conjunto de símbolos de constante de L. Dados dos elementos c, d ∈ C, definimos larelación c ∼ d si y sólo si T |= c = d.

Es fácil ver que ∼ es una relación de equivalencia. La transitividad es una consecuencia del Lema 2.9.

El universo de nuestro modelo será M = C/ ∼, el conjunto de clases de equivalencia de C módulo ∼. Ahoravemos como interpretar los diferentes símbolos del lenguaje en M .

Si c es una constante en L, entonces hacemos cM = c/ ∼, la clase de equivalencia de c módulo ∼.Si R es un símbolo de relación n-aria en L, entonces RM = (c1/ ∼, . . . , cn/ ∼) : T |= R(c1, . . . , cn).Si f es un símbolo de función n-aria y c1, . . . , cn son constantes en L, entonces T |= ∃x(f(c1, . . . , cn) =x). Como T es una teoría de Henkin, existe una constante cn+1 tal que “f(c1, . . . , cn) = d”∈ T . Defi-nimos entonces fM(c1/ ∼, . . . , cn/ ∼) = d/ ∼.

Afirmación 1: Estas interpretaciones están bien definidas.

Demostración de la afirmación: Supongamos que c1, . . . , cn y c′1, . . . , c′n son constantes en L tales que ci ∼ c′i

para todo i = 1, . . . , n. Si T |= R(c1, . . . , cn), podemos considerar ∆ = R(c1, . . . , cn), c1 = c′1, . . . , cn =c′n ⊂fin T y ψ = R(c′1, . . . , c

′n). Por el Lema 2.9, como ∆ |= ψ, tenemos que ψ ∈ T . Esto muestra que el

conjunto RM está bien definido.Similarmente, supongamos que f(c1, . . . , cn) = d y f(c′1, . . . , c

′n) = d′ están en T . Podemos tomar entonces

∆ = f(c1, . . . , cn) = d, f(c′1, . . . , c′n) = d′, c1 = c′1, . . . , cn = c′n y ψ = d = d′. Claramente, ∆ |= ψ y

tendremos que T |= d = d′, es decir, d ∼ d′.

Con esto ya hemos completado la descripción de la estructura M. Ahora probaremos que M |= T . Comen-zamos con las fórmulas que sólo usan términos:

Afirmación 2: Supongamos que t es un término con variables libres x1, . . . , xn. Si c1, . . . , cn, d ∈ C, entoncesT |= t(c1, . . . , cn) = d si y sólo si tM(c1/ ∼, . . . , cn/ ∼) = d/ ∼.

14

Page 15: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Demostración de Afirmación 2: (⇒) Veremos por inducción en términos que si “t(c1, . . . , cn) = d”∈ T en-tonces tM(c1/ ∼, . . . , cn/ ∼) = d/ ∼.

Si t es un símbolo de constante c, y T |= c = d, entonces cM := c/ ∼= d/ ∼.Si t es la variable vi y T |= t(c1, . . . , cn) = d, tenemos que T |= ci = d, por lo cual

tM(c1/ ∼, . . . , cn/ ∼) = ci/ ∼= d/ ∼ .

Sea f un símbolo de función n-aria, t1, . . . , tm son términos con variables libres x1, . . . , xn y seat = f(t1, . . . , tm) un nuevo término tal que T |= tM(c1, . . . , cn) = d. Supongamos como hipótesis deinducción que el resultado se cumple para los términos t1, . . . , tm.

Como T es una teoría de Henkin, existen constantes d1, . . . , dm ∈ C tales que

T |= t1(c) = d1 ∧ · · · ∧ tm(c) = dm.

Además, por el Lema 2.9, tenemos que T |= f(d1, . . . , dm) = d. Esto implica por la definición de lainterpretación en M que fM(d1/ ∼, . . . , dm/ ∼) = d/ ∼. Por la hipótesis de inducción, tenemos que

tM(c1/ ∼, . . . , cn/ ∼) = fM(tM1 (c/ ∼), . . . , tMm (c/ ∼))

= fM(d1/ ∼, . . . , dm/ ∼)

= d/ ∼,como queríamos.

Probaremos ahora por inducción en fórmulas que para cualquier L-fórmula φ(x1, . . . , xn) y c1, . . . , cn ∈ C,

M |= φ(c1/ ∼, . . . , cn/ ∼) si y sólo si “φ(c1, . . . , cn)”∈ T .

Si φ es t1 = t2, entonces por el Lema 2.9 y la propiedad de Henkin existen constantes d1, d2 tales quet1(c) = d1 y t2(c) = d2. Por lo tanto,

M |= φ(c/ ∼) ⇔ d1/ ∼= d2/ ∼⇔ d1 ∼ d2

⇔ T |= d1 = d2 ⇔ T |= t1(c) = t2(c)

⇔ “t1(c) = t2(c)”∈ T .

Si φ es R(t1, . . . , tm), existen d1, . . . , dm ∈ C tales que t1(c) = d1, . . . , tm(c) = dm ∈ T . Por laAfirmación 2, tMi (c/ ∼) = di/ ∼ para cada i = 1, 2, . . . ,m, y tenemos que

M |= φ(c/ ∼) ⇔ d/ ∼∈ RM

⇔ T |= R(d)

⇔ T |= φ(c).

Supongamos ahora que el resultado es cierto para φ. Si M |= ¬φ(c/ ∼), entonces por definiciónM 6|= φ(c/ ∼), lo que por hipótesis de inducción implica que φ(c) 6∈ T . Como T es maximal, ¬φ(c) ∈ T .

Recíprocamente, si ¬φ(c) ∈ T , entonces φ(c) 6∈ T pues T es finitamente satisfactible. Así, porhipótesis de inducción, M 6|= φ(c/ ∼), por lo cual M |= ¬φ(c/ ∼).Supongamos el resultado para φ y para ψ. Tenemos entonces

M |= φ(c/ ∼) ∧ ψ(c/ ∼) ⇔ M |= φ(c/ ∼) y M |= ψ(c/ ∼)

⇔ φ(c), ψ(c) ∈ T (por hipótesis de inducción)

⇔ φ(c) ∧ ψ(c) ∈ T (por Lema 2.9)

Supongamos el resultado para φ es ∃y ψ(x, y) y que el resultado es cierto para ψ(x, y). Si M |=∃y ψ(d/ ∼, y), entonces existe una constante c ∈ L tal que M |= ψ(d/ ∼, c/ ∼). Por hipótesis deinducción, esto implica que ψ(d, c) ∈ T , y finalmente por el Lema 2.9, ∃y(ψ(d, y)) ∈ T .

Recíprocamente, supongamos que ∃y(ψ(d, y)) ∈ T . Como T es una teoría de Henkin, existe unaconstante c ∈ L tal que T |= (∃y(ψ(d, y))) → ψ(d, c). Por el Lema 2.9, esto implica que ψ(d, c) ∈ T ,y podemos concluír por hipótesis de inducción que M |= ψ(d/ ∼, c/ ∼). En particular se cumple queM |= ∃y(ψ(d/ ∼, y)).

En particular, tenemos que M |= T , como se quería probar. Además, |M| ≤ |C| ≤ κ. 15

Page 16: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Para mostrar el Teorema 2.7, debemos ver ahora que el lenguaje L puede ser extendido a un lenguaje L∗

añadiendo constantes, y la teoría T puede extenderse a una L∗-teoría T ∗ que es de Henkin.

Lema 2.11. Sea T una teoría finitamente satisfactible en un lenguaje L. Existe un lenguaje L∗ ⊇ L yuna L∗-teoría finitamente satisfactible T ∗ que es de Henkin. Más aún, L∗ puede escogerse de tal forma que|L∗| = |L|+ ℵ0.

Demostración. En primer lugar, para cada fórmula φ(x) sea cφ un nuevo símbolo de constante, y considereL1 = L ∪ cφ : φ(x) L-fórmula. Para cada L-fórmula φ(x), podemos tomar la sentencia Θφ := (∃xφ(x)) →φ(cφ). Sea T1 = T ∪ Θφ : φ(x) L-fórmula.Veamos que T1 es finitamente satisfactible. Si ∆ es un subconjunto finito de T1, entonces ∆ = ∆0 ∪Θφ1 , . . . ,Θφn donde ∆0 es un subconjunto finito de T . Como T es finitamente satisfactible, existe unaL-estructura M tal que M |= ∆0. Vamos a convertir a M en una L1-estructura M′, simplemente diciendocómo interpretar los símbolos de constante cφ. Si M |= ∃x(φi(x)), entonces existe un elemento ai ∈ M talque M |= φ(ai). Ponemos entonces cMφi := ai para i = 1, 2, . . . , n. Para los demás símbolos de constante,

simplemente hacemos cMφ = a donde a es un elemento arbitrario de M .

Como en M′ la interpretación de los símbolos en L, no ha cambiado, tenemos que M′ |= ∆0. Además, porla intepretación de las constantes cφ1 , . . . , cφn , también tenemos que M′ |= Θφ1 , . . . ,Θφn. Esto es, M′ |= ∆.

Note que podemos iterar esta construcción, encontrando lenguajes L1 ⊆ L2 ⊆ · · · y una sucesión de Li-teorías T1 ⊆ T2 ⊆ · · · tal que si φ(x) es una Li-fórmula, existe un símbolo de constante cφ ∈ Li+1 tal queTi+1 |= (∃xφ(x)) → φ(cφ).

Tomemos L∗ =⋃i<ω Li y T ∗ =

⋃i<ω Ti. Por construcción, T ∗ es una L∗-teoría de Henkin. Además, si ∆ es

un subconjunto finito de T ∗, ∆ ⊆ Ti para algún i < ω, y dado que Ti es finitamente satisfactible existiráM |= ∆. Así, T ∗ es finitamente satisfactible.

Finalmente, note que si |Li| es la cardinalidad de los símbolos en Li, entones existen a lo más |Li|+ℵ0 fórmulasen Li. De esta manera, |Li+1| ≤ |Li|+ ℵ0, y podríamos probar por inducción que |L∗| ≤ |L|+ ℵ0.

Lema 2.12. Si T es una L-teoría finitamente satisfactible, entonces existe una L-teoría maximal finitamentesatisfactible T ′ ⊇ T .

Demostración. Sea I el conjunto de todas las L-teorías finitamente satisfactibles que extienden T , ordenadoparcialmente por inclusión. Si C ⊆ I es una cadena, sea TC =

⋃Σ : Σ ∈ C. Note que si ∆ es un sub-conjunto finito de TC , entonces ∆ ⊆ Σ tal que Σ ∈ C, por lo que existe M |= ∆. Esto muestra que TC esfinitamente satisfactible.

De esta manera, (I,⊆) es un orden parcial tal que toda cadena tiene una cota superior en I. Por el lemade Zorn, existe un elemento maximal T ′ ∈ I, esto es, una L-teoría T ′ ⊇ T que es finitamente satisfactible ymaximal con respecto a la inclusión.

Veamos ahora que T ′ es maximal en el sentido que para toda L-sentencia σ, σ ∈ T ′ ó ¬σ ∈ T ′. ComoT es finitamente satisfactible, por el teorema de compacidad existe M |= T ′. Si σ 6∈ T ′, entonces por la⊆-maximalidad de T ′ tendríamos que T ′ ∪ φ no es finitamente satisfactible. En particular, M 6|= φ, ypor la definición de satisfacción, M |= ¬φ. Esto muestra que T ′ ∪ ¬φ es finitamente satisfactible, y por⊃-maximalidad de T ′, ¬φ ∈ T ′.

Demostración del Teorema 2.7. Sea T una L-teoría finitamente satisfactible con modelos infinitos, y κ uncardinal con κ ≥ |L|.

Considere en primer lugar una extensión del lenguaje L1 añadiendo nuevos símbolos de constante di : i < κy la teoría T1 = T ∪ di 6= dj : i < j < κ que extiende T y afirma que las constantes di : i < κ son todasdistintas. Note que L′ contiene κ+ |L| = κ constantes.

Por el Lema 2.11, existe un lenguaje L∗ ⊇ L1 y una L∗-teoría T ∗ ⊇ T1 que es de Henkin. Por el Lema 2.12,existe una L∗-teoría T ′ ⊇ T ∗ que es maximal. Note que T ∗ también es una teoría de Henkin ya que para

16

Page 17: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

cualquier L∗-fórmula φ(x), [(∃x φ(x)) → φ(cφ)] ∈ T ∗ ⊆ T ′. De esta manera, por el Lema 2.10, existe unmodelo M de T ′ tal que

|M| ≤ |constantes en L∗| ≤ κ+ ℵ0 = κ.

Por otra parte, como dMi : i < κ es una colección de κ elementos diferentes en M, tendremos que |M| ≥ κ.Así, considerando la L-estructura M L que se obtiene al interpretar en M únicamente los símbolos dellenguaje L, tendremos que M L|= T y |M L | = |M | = κ.

2.2. Aplicaciones de compacidad.

Proposición 2.13. Sea L un lenguaje que contiene el lenguaje de grupos Lgr = ∗, e. Sea T una teoríaque extiende la teoría de grupos, y φ(v) una L-fórmula. Suponga que para todo n ≥ 1 existe Gn |= T ygn ∈ Gn que tiene orden finito mayor o igual a n tal que Gn |= φ(gn). Entonces existe G |= T y g ∈ G talque G |= φ(g) y g tiene orden infinito. En particular, no existe ninguna fórmula que defina los puntos detorsión en todos los modelos de T .

Demostración. Considere el lenguaje L′ = L ∪ c donde c es un nuevo símbolo de constante. Considere laL′-teoría T ′ dada por

T ′ := T ∪ φ(c) ∪ c · c · · · c︸ ︷︷ ︸n-veces

6= e : n = 1, 2, . . ..

Si G fuese un modelo de T ′, y g = cG es la interpretación de c en G, entonces G |= φ(g) y g tendría ordeninfinito. Así, basta con mostrar que T ′ es satisfactible.

Sea ∆ ⊆ T ′ un subconjunto finito. Tenemos entonces que

∆ ⊆ T ∪ φ(c) ∪ c · c · · · c︸ ︷︷ ︸n-veces

6= e : n = 1, 2, . . . ,m

para algún m ∈ N. Podemos ver a Gm+1 como una L′-estructura, interpretando el elemento c como gm+1.Como Gm+1 |= T ∪ φ(gm+1) y gm+1 tiene orden mayor o igual que m+ 1, tendremos que Gm+1 |= ∆. Deesta forma, T ′ es finitamente satisfactible, y por el Teorema de Compacidad, T ′ es satisfactible.

Proposición 2.14. No existe ninguna teoría Γ con modelos infinitos en un lenguaje L ⊇ < tal queM = (M,<, . . .) |= Γ si y sólo si M es un buen orden.

Demostración. Supongamos que sí, y considere una extensión L′ de L que se obtiene al añadir símbolos deconstante nuevos cn : n < ω. Sea Γ′ la L′-teoría dada por

Γ′ = Γ ∪ cn+1 < cn : n < ω.Esta teoría afirma que las constantes cn : n < ω forman una cadena descendente infinita. Sea Γ0 unsubconjunto finito de Γ . Como Γ tiene modelos infinitos, existe un buen orden infinito M = (M,<, . . .). Enparticular, deben existir elementos an : n < ω que forman una cadena creciente infinita en M. Como Γ0

es finito, existe un número máximo k ∈ N tal que ck aparece mencionado en alguna fórmula de Γ0. Podemosinterpretar los nuevos símbolos de constante de la siguiente manera:

cMi := ak−i si i ≤ k

cMi := a0

Con estas interpretaciones, M es una L′-estructura que satisface Γ y ck < ck−1 < · · · < c1 < c0. En particu-lar, M |= Γ0.

Hemos probado que la teoría Γ′ es finitamente satisfactible, y por compacidad Γ′ es satisfactible. Esto es,existe un modelo M′ |= Γ′, lo que es absurdo pues este modelo tiene que ser un buen orden con una cadenadescendente infinita dada por cM

0 > cM′

1 > · · · .

Proposición 2.15. Sea L = +, ·, <, 0, 1 y sea Th(N) la L-teoría completa de los números naturales. Existeun modelo M |= Th(N) y un elemento a ∈M tal que a es más grande que cualquier número natural.

Demostración. Sea L′ = L ∪ c, donde c es un nuevo símbolo de constante, y considere la teoría

T = Th(N) ∪ τn := 1 + · · ·+ 1︸ ︷︷ ︸n-veces

< c : n < ω.

17

Page 18: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Si ∆ es un subconjunto finito de T , podemos hacer que N sea un modelo de ∆ interpretando c como unnúmero natural suficientemente grande (mayor que maxn : τn ∈ ∆). Así, T es finitamente satisfactible,y por compacidad existe M |= T . Si a ∈ M es la interpretación de c en este modelo, tendremos quea > 1 + · · ·+ 1︸ ︷︷ ︸

n-veces

para todo n ≥ 1.

2.3. Teorías completas y categoricidad.

Definición 2.16. Una L-teoría T se dice completa si para toda L-sentencia σ ∈ L, se tiene que T |= σ óT |= ¬σ, pero no ambas.

Ejemplo 2.17. Por ejemplo, la teoría de grupos no es completa, ya que para la sentencia σ = ∀x, y(x·y = y·x)se tiene que hay grupos G1, G2 tales que G1 |= σ y G2 |= ¬σ.

Ejemplo 2.18. Si M es una L-estructura, entonces Th(M) es una teoría completa.

De hecho, esta puede verse como una caracterización de teorías completas.

Proposición 2.19. Si T una L-teoría completa, entonces existe una L-estructura M para la cual

Th(M) = σ ∈ Sent(L) : T |= σ.Demostración. Toda teoría completa es consistente por definición, por lo que existe una L-estructura M talque M |= T . En particular, Th(M) ⊇ T , y tendremos que Th(M) ⊇ σ : T |= σ.

Supongamos ahora que σ ∈ Th(M), esto es M |= σ, y por definición tenemos que M 6|= σ. Ahora, siT 6|= σ, entonces por la completitud de T tenemos que T |= ¬σ, y como M |= T , tendremos que M |= ¬σ.Contradicción.

Usualmente, determinar exactamente cuáles sentencias pertenecen a Th(M) puede ser una tarea difícil. Enmuchos casos, la clave para entender Th(M) consiste en encontrar una L-teoría T más simple tal que M |= Ty T es completa. En este caso, M |= σ si y sólo si T |= σ.

El Teorema 2.7 nos proporciona un test útil para determinar si una teoría es completa o no.

Definición 2.20. Sea κ un cardinal infinito, y sea T una teoría con modelos infinitos. Decimos que T esκ-categórica si cualesquiera dos modelos de T de cardinalidad κ son isomorfos.

Teorema 2.21 (Test de Vaught para completitud). Sea T una teoría satisfactible que no tiene modelosfinitos, y tal que T es κ-categórica para algún cardinal κ ≥ |L|. Entonces T es completa

Demostración. Sea T una teoría satisfactible y κ-categórica para algún cardinal κ ≥ |L|. Si T no es completa,existe una L-sentencia σ tal que T 6|= σ y T 6|= ¬σ, esto es, existen modelos M1,M2 tales que M1 |= T ∪ σy M2 |= T ∪¬σ. Sean T1 = Th(M1) y T2 = Th(M2). Estas son teorías satisfactibles, y por el Teorema 2.7,existen modelos M ′

1 |= T1 y M ′2 |= T2 de cardinalidad κ.

Como T es κ-categórica, tenemos que M ′1∼= M ′

2. En partcular, como M ′1 |= σ tenemos que M2 |= σ. Esto

contradice que M2 |= ¬σ.

Ejemplo 2.22. Por ejemplo, consideremos la teoría TFp−vs de Fp espacios vectoriales infinitos. Esta teoría esκ-categórica para todo cardinal infinito κ, ya que si M,N |= TFp−vs, entonces M y N tiene bases de tamañoκ sobre Fp y cualquier biyección entre las bases inducirá un isomorfismo entre M y N .

De manera similar, la teoría de Q-espacios vectoriales es ℵ1-categórica, y por el test de Vaught, completa.

Ejemplo 2.23. La teoría de campos algebraicamente cerrados de característica 0 no es ℵ0-categórica, perosí es κ-categórica para todo cardinal κ ≥ ℵ1.

Note por ejemplo que Qalg

y Q(π)alg

son modelos no isomorfos de esta teoría. Sin embargo, si K1,K2 |= ACF0

y tienen cardinalidad κ > ℵ0, K1 y K2 tienen grado de trascendencia κ y cualquier biyección entre bases detrascendencia inducirá un isomorfismo entre K1 y K2.

Ejemplo 2.24. Considere la teoría de grupos abelianos divisibles libres de torsión, DAG. Esta teoría esaxiomatizada por el siguiente conjunto de sentencias en el lenguaje L = +, 0

18

Page 19: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Axiomas de grupos abelianos:

∀x, y, z ((x+ y) + z = x+ (y + z)),

∀x (x+ 0 = 0 + x = x),

∀x∃y (x+ y = 0),

∀x, y(x+ y = y + x)

Divisible:∀x∃y (y + · · ·+ y︸ ︷︷ ︸

n-veces

= x) : n ≥ 1.

Libres de torsión:∀x (x 6= 0 → x+ · · · + x︸ ︷︷ ︸

n-times

6= 0 : n ≥ 1.

Es fácil ver que cualquier grupo abeliano libre de torsión puede verse como un Q-espacio vectorial. En estesentido, si G1 y G2 satisfacen esta teoría y tienen cardinalidad ℵ1, cualquier biyección entre dos bases B1 yB2 de G1 y G2 puede extenderse a un isomorfismo entre G1 y G2. Por lo tanto, DAG es ℵ1-categórica, y porlo tanto completa.

19

Page 20: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

EJERCICIOS DE PRÁCTICA

Ejercicio 1. Sea Σ = φii∈N una sucesión de fórmulas tales que φi+1 |= φi para todo i. Suponga que existeuna sentencia θ tal que para todo modelo M tenemos M |= Σ si y sólo si M |= θ. Demuestre que que paraalgún n ∈ N se tiene que |= φn ↔ φn+1.

Ejercicio 2. Demuestre que “ser grupo abeliano cíclico” no es axiomatizable en primer orden. (Por ejemplo,encuentre grupos elementalmente equivalentes G1 y G2 tal que uno es cíclico y el otro no).

Ejercicio 3. Sea L un lenguaje de primer orden. Si Σ1 y Σ2 son conjuntos de sentencias de L tales queΣ1∪Σ2 no tiene modelos, entonces existe una sentencia τ tal que Mod(Σ1) ⊆ Mod(τ) y Mod(Σ2) ⊆ Mod(¬τ).

20

Page 21: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

3. Subestructuras elementales y Löwenheim-Skolem

Definición 3.1. Si M y N son L-estructuras, una L-inmersión j : M → N se dice una inmersión elementalsi para cualquier fórmula φ(x1, . . . , xn) y a1, . . . , an ∈M ,

M |= φ(a1, . . . , an) si y sólo si N |= φ(j(a1), . . . , j(an)).

Definición 3.2 (Extensión elemental). Si M es una subestructura de N , decimos que M es una subestructuraelemental de N (y escribimos M ≺ N si el mapa inclusión es una inmersión elemental. En este caso, tambiéndecimos que N es una extensión elemental de M.

De manera intuitiva, la diferencia entre subestructura y subestructura elemental es que para ser subes-tructura sólo es necesario respetar las interpretaciones de los símbolos del lenguaje, mientras que para sersubestructura elemental es necesario respetar las verdades sobre elementos en la estructura más pequeña.

Hasta el momento tenemos cuatro posibles relaciones entre modelos: subestructura (⊆), equivalencia elemen-tal (≡), isomorfismo (∼=) y subestructura elemental (≺). También sabemos que M ∼= N implica M ≡ N .Además, si M ≺ N , o incluso si j : M → N es una inmersión elemental, entonces para cualquier sentenciaσ (fórmulas sin variables) también tendremos M |= σ si y sólo si N |= σ. Por lo tanto, M ≡ N .

Ejemplo 3.3. Sean M = (Q,+, ·, 0, 1) y N = (R,+, ·, 0, 1). Claramente M ⊆ N , pero M 6≡ N . En efecto,consideremos la sentencia σ = ∃x(x · x = 1 + 1) que afirma que existe un elemento cuyo cuadrado es 2.Tenemos que M 6|= σ, pero N |= σ.

Ejemplo 3.4. Sean M = (2N, <) y N = (N, <). Claramente M ⊆ N . Más aún, la función j :M → N dadapor j(x) = x/2 es un isomorfismo, ya que es biyectiva y para todo a, b ∈ M , a < b si y sólo si a/2 < b/2.De esta manera, M ∼= N , por lo que también tendríamos M ≡ N . Sin embargo, M ⊀ N , pues podemosconsiderar la fórmula φ(x1, x2) = ∃y (x1 < y < x2) y tomamos a1 = 0 y a2 = 2 en M , tendremos queM 6|= φ(0, 2) pero N |= φ(0, 2).

Definición 3.5 (Diagrama elemental). Sea M una L-estructura. Sea LM el lenguaje donde añadimos Lnuevos símbolos de constante m para los elementos de M .

El diagrama atómico de M es la LM -teoría Diagat(M) dada por

φ(m1, . . . ,mn) : φ es una fórmula atómica, o negación de una fórmula atómica, y M |= φ(m1, . . . ,mn).El diagrama elemental de M es la LM -teoría Diag(M) dada por

φ(m1, . . . ,mn) :M |= φ(m1, . . . ,mn).En otras palabras, el lenguaje LM es lo que se obtiene al nombrar cada elemento de M como una nuevaconstante, el diagrama elemental de M es la LM -teoría que corresponde a la descripción de todas las propie-dades de los elementos de M , y el diagrama atómico de M es la LM -teoría que describe las propiedades deelementos de M que se pueden expresar con fórmulas atómicas.

Lema 3.6. Sean M una L-estructura y N una LM -estructura.

1. Si N |= Diag(M) entonces existe una L-inmersión de M en N .2. Si N |= Diag(M) entonces existe una L-inmersión elemental de M en N .

Demostración. Supongamos en primer lugar que N |= Diag(M), y consideremos el mapa j : M → N dadopor j(m) = mN , donde mN es la interpretación de la constante m en la LM -estructura N . Si m1,m2 sondos elementos distintos de M , entonces m1 6= m2 es la negación de una LM -fórmula atómica que se cumpleen M , por lo cual N |= mN

1 6= mN2 . Esto muestra que j es inyectiva. Veamos que j es una L-inmersión.

Si c es un símbolo de constante en L, entonces existe un elemento m ∈M tal que cM = m. Tenemosentonces que M |= cM = m y como φ(c,m) := “c = m” es una LM -fórmula atómica, N |= cN = mN .Esto es, j(cM) = j(m) = mN = cN .Si f es un símbolo de función k-aria en L y m1, . . . ,mk ∈ M . Sea m = fM(m1, . . . ,mk). Siconsideramos la LM -fórmula atómica φ(m1, . . . ,mk,m) := “f(m1, . . . ,mk) = m” tendremos queN |= fN (mN

1 , . . . ,mNk ) = mN . De esta manera,

j(fM(m1, . . . ,mk)) = j(m) = mN = fN (mN1 , . . . ,m

Nk ) = fN (j(m1), . . . , j(mk)).

21

Page 22: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Si R es un símbolo de relación k-aria en L, entonces para cualquier tupla m1, . . . ,mk en M , tenemosque

(m1, . . . ,mk) ∈ RM ⇔ M |= RM(m1, . . . ,mk)

⇔ N |= RN (mN1 , . . . ,m

Nk ) (porque R(m1, . . . ,mk) es una LM -fórmula atómica)

⇔ N |= RN (j(m1), . . . , j(mk))

⇔ (j(m1), . . . , j(mk)) ∈ RN

De esta manera, como j es inyectiva y preserva todos los símbolos en el lenguaje L, j : M → N es unaL-inmersión.

Supongamos ahora que N |= Diag(M). En particular, N |= Diag(M), por lo que el mapa definido por j(m) =mN es una L-inmersión. Si φ(x1, . . . , xn) es una L-fórmula y m1, . . . ,mk ∈ M , note que φ(m1, . . . ,mk) esuna LM -fórmula atómica. Tenemos entonces que

Si M |= φ(m1, . . . ,mk), entonces φ(m1, . . . ,mk) ∈ Diag(M), por lo cual N |= φ(mN1 , . . . ,m

Nk ), esto

es, N |= φ(j(m1), . . . , j(mk)).Si M 6|= φ(m1, . . . ,mk) entonces ¬φ(m1, . . . ,mk) ∈ Diag(M), por lo cual N |= ¬φ(mN

1 , . . . ,mNk ), es

decir, N 6|= φ(j(m1), . . . , j(mk))

Esto muestra que si N |= Diag(M), j : M → N es una inmersión elemental.

Lema 3.7 (Cortar y pegar). Sean M,N dos L-estructuras. Si j : M → N es una L-inmersión elemental,existe una estructura extension elemental M ≺ N ′ y un L-isomorfismo f : N ′ → N que extiende j.

Demostración. EJERCICIO

El siguiente resultado utiliza las observaciones anteriores y compacidad para crear extensiones elementales.

Teorema 3.8 (Löwenheim-Skolem ascendente). Sea M una L-estructura infinita y κ un cardinal tal queκ ≥ |M|+ |L|. Entones existe una L-estructura N de cardinalidad κ tal que M ≺ N .

Demostración. Dado que M |= Diag(M), la LM -teoría Diag(M) es satisfactible. Por el Teorema 2.7, existeuna LM -estructura N ′ de cardinalidad κ tal que N ′ |= Diag(M), y por el Lema 3.6, existe una inmersiónelemental j : M → N ′. Así, por el Lema de “cortar y pegar”, existe N isomorfo a N ′ tal que M ≺ N , ytendremos también que |N | = |N ′| = κ.

Teorema 3.9 (Test de Tarski-Vaught). Supongamos que M es una subestructura de N . Entonces M esuna subestructura elemental de N si y sólo si para toda fórmula φ(x, y) y a ∈ M , si existe b ∈ N tal queN |= φ(b, a) entonces existe c ∈M tal que N |= φ(c, a).

Demostración. (⇒) Supongamos que N es una extensión elemental de M y sea φ(x; y) una fórmula y a ∈M .Si existe b ∈ N tal que N |= φ(b, a), tenemos N |= ∃x(φ(x, a)). Dado que M ≺ N , M |= ∃x(φ(x, a)), por loque existe c ∈M tal que M |= φ(c, a). De nuevo, como M ≺ N , N |= φ(c, a). X

(⇐) Supongamos que M ⊆ N satisfacen el test de Tarski-Vaught. Veremos que M ≺ N , y para esto debe-mos ver que para cualquier fórmula φ(y) y a ∈M , M |= φ(a) si y sólo si N |= φ(a).

Veremos esto por inducción en fórmulas, pero dado que M ⊆ N , la condición requerida ya se cumple paratoda fórmula φ(x) sin cuantificadores. Dado que toda fórmula se puede escribir en forma normal prenexa7,sólo resta probar el caso inductivo de un cuantificador. Supongamos que el resultado ya se tiene para lafórmula ψ(x, y), y consideremos φ(y) = ∃x(ψ(x, y)) y una tupla a ∈M .

7Esto es φ(y) se puede escribir de la forma φ(y) := Q1x1 . . . Qmxm(ψ(x1, . . . , xm, y) donde cada uno de los símbolos Qi esun cuantificador ∀ ó ∃.

22

Page 23: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

N |= φ(a) ⇔ N |= ∃x(ψ(x, a))⇔ existe b ∈ N tal que N |= ψ(b, a)

⇔ existe c ∈M tal que N |= ψ(c, a) (por el test de Tarski-Vaught)

⇔ existe c ∈M tal que M |= ψ(c, a) (por hipótesis de inducción)

⇔ M |= ∃x(φ(x, a))⇔ M |= φ(a).X

De esta manera, M es una subestructura elemental de N .

3.1. Skolemizaciones y Löwenheim-Skolem descendente.

Definición 3.10. Sea T una L-teoría. Decimos que T admite funciones de Skolem si para toda L-fórmulaφ(x, y) existe un símbolo de función |y| − aria fφ ∈ L tal que T |= ∀y[(∃xφ(x, y)) → φ(fφ(y), y)]. En otraspalabras, existen suficientes símbolos de función en el lenguaje para atestiguar cualquier fórmula existencial.

Esta definición es análoga a la definición de teoría de Henkin, en la que había suficientes constantes paraatestiguar las fórmulas existenciales sin parámetros. En este caso, existen suficientes funciones en el lenguajepara atestiguar de manera uniforme las fórmulas existenciales con parámetros: si existe una solución b de lafórmula φ(b, a), esta solución puede encontrarse simplemente calculando fφ(a).

En el contexto de esta analogía, el siguiente resultado parece apenas natural:

Teorema 3.11. Sea T una L-teoría. Existe un lenguaje L∗ ⊇ L y una L∗-teoría T ∗ ⊇ T tales que T ∗ admitefunciones de Skolem y siempre que M |= T , se puede expandir M a una L∗-estructura M∗ |= T ∗. Más aún,podemos escoger L∗ de tal forma que |L∗| = |L|+ ℵ0.

La teoría T ∗ = T sk se conoce como la skolemización de T .

Demostración. Definiremos inductivamente una sucesión de lenguajes L = L0 ⊆ L1 ⊆ · · · y una sucesión deLi-teorías Ti con T = T0 ⊆ T1 ⊆ · · · .

Dado Li, sea Li+1 = L ∪ fφ : φ(x, y1, . . . , yn) ∈ Li, donde fφ es símbolo de función n-aria. Para cadaLi-fórmula φ(x, y), podemos considerar la sentencia

Ψφ := ∀y [(∃x φ(x, y)) → φ(fφ(y), y)],

y construír la Li+1-teoría Ti+1 = Ti ∪ Ψφ : φ ∈ Li.

Note que si M |= Ti, es posible interpretar los símbolos de función en Li+1 \ Li en M de tal forma queM |= Ti+1. En efecto, dada una Li-fórmula φ(x, y), crearemos una función g : M |y| → M . Dado a ∈ M |y|,podemos considerar el conjunto Xa = b ∈M :M |= φ(b, a). Si Xa 6= ∅, tomamos g(a) ∈ Xa. Si Xa = ∅, laelección para g(a) es irrelevante. Una vez hecho esto, podemos tomar la interpretación fMφ = g. Por cons-trucción, para todo a ∈M se tiene que Xa 6= ∅ implica que g(a) ∈ Xa, por lo cual M |= Ti ∪ Ψφ : φ ∈ Li.Es decir, M |= Ti+1.

Sea L∗ =⋃i<ω Li, y T ∗ =

⋃i<ω Ti. Si φ(x, y) es una L∗-fórmula, φ(x, y) ∈ Li para algún i < ω, por lo cual

∀y[(∃x φ(x, y)) → φ(fφ(y), y)] ∈ Ti+1 ⊆ T ∗. Esto muestra que T ∗ es una L∗-teoría que admite funciones deSkolem. Además, cada símbolo de función en L∗ \ L puede interpretarse en M, obteniendo una expansiónM∗ que es modelo de T ∗.

Finalmente, como añadimos sólo un nuevo símbolo de función a Li+1 por cada Li-fórmula, |Li+1| ≤ |Li|+ℵ0,y tendremos que |L∗| ≤ |L|+ ℵ0.

Teorema 3.12 (Löwenheim-Skolem descendente). Si N es una L-estructura y A ⊆ N , existe una subes-tructura elemental M de N tal que A ⊆M y |M| ≤ |A|+ |L|+ ℵ0.

Demostración. Sea T = Th(N ). Por el lema anterior, existe una teoría T ∗ ⊇ T en un lenguaje L∗ ⊆ L queadmite funciones de Skolem. Más aún, podemos ver a N como una L∗-estructura tal que N |= T ∗.

23

Page 24: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Definamos X0 = X, y dado Xi, definamos,

Xi+1 = Xi ∪ fN (a) : f ∈ L∗ es un símbolo de función n-aria y a ∈ Xni

Sea M =⋃i<ωXi. Tenemos entonces que |M | ≤

∣∣⋃i<ω(L∗ ×X<ω

i )∣∣ ≤ |L|+ |X|+ ℵ0.

En primer lugar, veamos que podemos intepretar los símbolos de L en el conjunto M para formar unasubestructura M de N .

Si f es un símbolo de función n-aria en L y a ∈ Mn, entonces a ∈ Xni para algún i < ω y fN (a) ∈

Xi+1 ⊆M . De esta manera, fN M :Mn →M , por lo que podemos interpretar fM como fN N .Si R es un símbolo de relación n-aria en L, definimos RM = RN ∩Mn.Si c es un símbolo de constante en L, podemos considerar la L-fórmula φ(x, y) := ∃x x = c. Así,existe una función de Skolem fc ∈ L∗ tal que fc(a) = cN para todo a ∈ N , y en particular, cN ∈ M .Podemos entonces poner cM = cN .

Ahora veamos que M es una subestructura elemental de N . Sea φ(x, y) es una L-fórmula y supongamosque existen b ∈ N y a ∈ M tales que N |= φ(b, a). Usando la función de Skolem fφ ∈ L∗, tenemos porconstrucción que c = fφ(a) ∈M . Así, dado que N |= T ∗, N |= ∀y[(∃x φ(x, y)) → φ(fφ(y))], y en particular,N |= φ(c, a). Esto muestra que M y N satisfacen el test de Tarski-Vaught, por lo cual M ≺ N

Comentario 3.13. Durante la anterior demostración vimos que si A es un subconjunto del universo de unaL-estructura N , podemos generar una subestructura de N que contenga a A simplemente agregando lasconstantes y cerrando bajo funciones. Los símbolos de relación se transfieren fácilmente para subconjuntosarbitrarios no vacíos.

3.2. Cadenas elementales.

Definición 3.14. Sea (I,<) un orden lineal. Supongamos que para cada i ∈ I, Mi es una L-estructura.Decimos que 〈Mi : i ∈ I〉 es una cadena de L-estructuras si Mi ⊆ Mj para i < j. Si además Mi ≺ Mj

para todo i < j, decimos que 〈Mi : i ∈ I〉 es una cadena elemental.

Si 〈Mi : i ∈ I〉 es una cadena no vacía de L-estructuras, podemos definir la L-estructura M =⋃i∈I Mi de

la siguiente manera:

El universo de M será M =⋃i∈IMi.

Si c es un símbolo de constante en L, entonces cMi = cMj para todo i, j ∈ I. Definimos entoncescM = cMi para cualquier (todo) i ∈ I.Si f es un símbolo de función n-aria en L y a1, . . . , an ∈ M , existe i ∈ I tal que a1, . . . , an ∈ Mi,y definimos fM(a1, . . . , an) := fM〉(a1, . . . , an). Esta función está bien definida pues si a1, . . . , an ∈Mi,Mj para i < j, entonces fMi(a1, . . . , an) = fMj(a1, . . . , an) pues Mi ⊆ Mj .Si R es un símbolo de relación n-aria en L, RM =

⋃i∈I R

Mi ⊆Mn.

Se puede ver fácilmente que Mi ⊆ M para todo i ∈ I. Más aún, tenemos el siguiente resultado:

Teorema 3.15. Sea (I,<) un orden lineal y sea 〈Mi : i ∈ I〉 una cadena elemental de L-estructuras.Entonces M =

⋃i∈I Mi es una extensión elemental de cada Mi.

Demostración. Probaremos por inducción en fórmulas que para cada i ∈ I se cumple lo siguiente: para todafórmula φ(y) y a ∈ Mi,

M |= φ(a) ⇔ Mi |= φ(a).

Como ya tenemos que Mi ⊆ M, el resultado ya se cumple para cualquier fórmula atómica φ(a).

Conectivos: Supongamos que el resultado ya se tiene para φ(y) y para ψ(y). Tenemos entonces que

Mi |= φ(a) ∧ ¬ψ(a) ⇔ Mi |= φ(a) y Mi 6|= ψ(a)

⇔ M |= φ(a) y M 6|= ψ(a) (por hipótesis de inducción)

⇔ M |= φ(a) ∧ ¬ψ(a).Cuantificadores: Supongamos que el resultado ya se tiene para ψ(x, y). Si Mi |= ∃x ψ(x, a), entoncesexiste b ∈ Mi tal que Mi |= ψ(b, a), y por hipótesis de inducción, M |= ψ(b, a), por lo que M |=∃x ψ(x, a). Recíprocamente, si M |= ∃x ψ(x, a), entonces existe b ∈M tal que M |= ψ(b, a). Tenemosentonces que b ∈ Mj para algún índice j > i, y por hipótesis de inducción Mj |= ψ(b, a), es decir,Mj |= ∃x ψ(x, a). De esta forma, como Mi ≺ Mj , tenemos que Mi |= ∃x ψ(x, a).

24

Page 25: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

EJERCICIOS DE PRÁCTICA

Ejercicio 1. Sea L un lenguaje enumerable y sea M un modelo enumerable. Demuestre que existe un modeloenumerable N tal que M ≺ N y M 6= N .

25

Page 26: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

4. Back & Forth

4.1. Ejemplo: Órdenes lineales densos.

Veremos ahora el método de back & forth (o va y viene), que es un método de demostración que sirvepara encontrar un isomorfismo entre dos estructuras contables a partir de isomorfismos parciales entre susestructuras finitas. Este método aparece en los trabajos de Cantor, donde él lo utilizó para mostrar quecualesquiera dos órdenes lineales densos sin extremos contables son isomorfos.

Teorema 4.1 (Cantor). La teoría DLO de órdenes lineales densos sin extremos es ℵ0-categórica.

Demostración. Supongamos que (M,<) y (N,<) son dos órdenes lineales densos sin extremos tales que|M | = ℵ0 = |N |. Sean M = an : n < ω y N = bn : n < ω enumeraciones para los elementos de M y N ,respectivamente. Para encontrar un isomorfismo f : (M,<) → (N,<), lo que haremos es definir funcionesparciales fn entre M y N que satisfacen las siguientes propiedades:

(i) Para todo n < ω, fn ⊆ fn+1 (como conjuntos de parejas ordenadas en M ×N).(ii) dom(fn), im(fn) son finitos para todo n < ω.(iii) dom(fn) ⊇ a0, . . . , an y im(fn) ⊇ b0, . . . , bn.(iv) Para todo ai, aj ∈ dom(fn), (M,<) |= ai < aj si y sólo si (N,<) |= fn(ai) < fn(aj).

Una vez hecho esto, f =⋃n<ω fn será un isomorfismo entre (M,<) y (N,<). Para comenzar, basta con

tomar f0 = (a0, b0). Supongamos ahora que fn ya ha sido construído con las propiedades requeridas, yveamos como construír fn+1.

Forth: En este paso construímos una función f ′n que extiende a fn y tiene a an+1 en su dominio. Sian+1 ∈ dom(fn), hacemos f ′n = fn. Ahora, si an+1 6∈ dom(fn), podemos organizar linealmente loselementos en dom(fn), como c1 < . . . < ck. Tenemos tres posibilidades para el nuevo elemento an+1:• an+1 < c1. Como N no tiene extremo inferior, existe un elemento b′n+1 ∈ N tal que b′n+1 < fn(c1).

En este caso hacemos f ′n = fn ∪ (an+1, b′n+1).

• ck < an+1. Como N no tiene extremo superior, existe un elemento b′n+1 ∈ N tal que fn(ck) < b′n+1.En este caso hacemos f ′n = fn ∪ (an+1, b

′n+1).

• Existe un único i ≤ k tal que ci < an+1 < ci+1. Como (N,<) es un orden denso, existe un elementob′n+1 ∈ N tal que fn(ci) < b′n+1 < fn(ci+1), y podemos poner f ′n = fn ∪ (an+1, b

′n+1).

Back: En este paso construímos la función fn+1 ⊇ f ′n que tiene bn+1 en su imagen. Si bn+1 ∈ im(f ′n),hacemos fn+1 = f ′n, pero si bn+1 6∈ im(f ′n), podemos ordenar linealmente los elementos en im(f ′n)como d1 < · · · < dℓ. De nuevo tenemos tres casos:• Si bn+1 < d1, como (M,<) es un orden sin extremos, existe un elemento a′n+1 ∈ M tal quea′n+1 < (f ′n)

−1(d1), y hacemos fn+1 = f ′n ∪ (a′n+1, bn+1).• Si dℓ < bn+1, como (M,<) es un orden sin extremos, existe un elemento a′n+1 ∈ M tal que(f ′n)

−1(dℓ) < a′n+1, y hacemos fn+1 = f ′n ∪ (a′n+1, bn+1).• Si existe j ≤ ℓ tal que dj < bn+1 < dj+1, entonces como (M,<) es un orden denso existe

un elemento a′n+1 ∈ M tal que (f ′n)−1(dj) < a′n+1 < (f ′n)

−1(dj+1). Hacemos entonces fn+1 =f ′n ∪ (a′n+1, bn+1)

Como |dom(fn+1)| ≤ |dom(fn)| + 2 y | im(fn+1) ≤ | im(fn)| + 2, se cumple la condición (ii). Además,fn ⊆ fn+1, an+1 ∈ dom(fn+1) y bn+1 ∈ im(fn+1), por lo que se cumplen las condiciones (i) y (iii). Finalmen-te, por construcción, fn+1 satisface la condición (iv).

De esta forma, f =⋃n<ω fn ⊆M ×N es una función con

dom(f) =⋃

n<ω

dom(fn) ⊇⋃

n<ω

a0, . . . , an =M y im(f) =⋃

n<ω

im(fn) ⊇⋃

n<ω

b0, . . . , bn = N.

Así, f : M → N , y siempre que a < a′ en M , a, a′ ∈ dom(fn) para algún n < ω, y tendremos quef(a) = fn(a) < fn(a

′) = f(a′). Esto muestra que f es un isomorfismo entre (M,<) y (N,<). 26

Page 27: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

b b b b bbb

b b b b bbb

a0

b0

a1

b′1

a2

b′2

a3

b′3

a′1

b1

a′2

b2

a′3

b3

Corolario 4.2. La teoría de órdenes lineales densos es completa. En particular, (Q, <) ≡ (R, <).

Demostración. Por el test de categoricidad de Vaught, DLO es completa. Además, como (Q, <), (R, <) |=DLO, tenemos por la Proposición 2.19

(Q, <) |= σ ⇔ σ ∈ Th(Q, <) ⇔ DLO |= σ ⇔ σ ∈ Th(R, <) ⇔ (R, <) |= σ.

4.2. Ejemplo: el grafo aleatorio.

Uno de los resultados más importantes (y más influyentes) en teoría de grafos es el Teorema de Ramsey :para todo k ≥ 1 existe un número natural n tal que cualquier grafo con al menos n vértices contiene unclique o un anticlique de tamaño k. Recordemos que un anticlique es un subconjunto cuyos vértices no estánrelacionados, mientras que un clique es simplemente un subconjunto cuyos vértices son adyacentes dos a dos.Otra forma de enunciar este resultado es por medio de coloreos: si coloreamos las posibles aristas de un grafocon n vértices, con dos colores, necesariamente encontraremos un conjunto monocromático de tamaño k.

Definición 4.3. Sea k ≥ 1. El número de Ramsey de k es el mínimo número natural n = R(k) tal quecualquier grafo con R(k) vértices

Erős estudió los números de Ramsey por muchos años. A él se le atribuye la siguiente frase: “ suponiendo quelos alienígenas invadieran la tierra y amenazaran con destruirla si en el curso de un año los seres humanos nohallaran el número de Ramsey R(5), podríamos poner a trabajar a las mejores mentes y las computadorasmás rápidas y obtener el número a tiempo, pero que si nos exigieran el número R(6), nuestro mejor chancesería atacarlos de manera preventiva.”Uno de sus primeros resultados es la siguiente cota inferior para el número de Ramsey:

Teorema 4.4 (Erdős, 1947). Para cada 2 ≤ k ∈ N, el número de Ramsey de k es al menos R(k) ≥ 2k/2.

Esto es, para cada k existe un grafo Gk con |Gk| ≥ 2k/2 que contiene cliques ni anticliques de tamaño k. Erdősprobó este resultado usando el método probabilístico con modelo G(n, p = 1/2), y analizando sus propiedadesasintóticas. En particular, el mostró que para n = 2k/2, la probabilidad

P(G(n, p) contenga un conjunto homogéneo de tamaño k) < 1.

En el límite, el modelo probabilístico del grafo aleatorio también satisface los axiomas Ar del restaurante deAlice: “you can get anything you want”:

Ar := ∀x1, . . . , xr, y1, . . . , yr

1≤i,j≤rxi 6= yj → ∃z

1≤i≤rz 6= xi ∧ z 6= yj ∧ zRxi ∧ ¬zRyi

.

b

b b b b b bb b b b b b

x1 x2 · · · xr y1 y2 · · · yr

z

U V

Erdős y Rényi probaron mucho tiempo después que estos axiomas se cumplían para casi todos los grafosfinitos. Específicamente, obtuvieron el siguiente resultado:

27

Page 28: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Teorema 4.5 (Erdős, Rényi - 1963). Dado un número fijo r ≥ 1,

limn→∞P (G(n, p) |= Ar) = 1.

En particular, para cada grafo finito H,

limn→∞P (H es un subgrafo de G(n, p)) = 1.

Teorema 4.6 (Rado -1964). Existe un único grafo contable G que satisface todos los axiomas de la teoríaRG= Ar : r ∈ N.Demostración. Primero, construiremos un modelo contable para RG. Este modelo se construirá como la uniónde una cadena creciente de grafos 〈Gn : n < ω〉. Primero, tomamos G0 = a0, un grafo que consta de unsólo vértice.

Supongamos ahora que Gn ya ha sido construído. Ahora, dados subconjuntos U, V ⊆ Gn tales que U ∩ V ∅,añadimos un vértice bU,V que es adyacente a cada vértice en U y no es adyacente a ningún vértice en V .Tomamos entonces Gn+1 = Gn ∪ bU,V : U, V ⊆ Gn, U ∩ V = ∅. Finalmente, tomemos G =

⋃n<ωGn.

Veamos que G |= RG. Sea r ≥ 1, y sean a1, . . . , ar, b1, . . . , br elementos en G tales que ai 6= bj para todo1 ≤ i, j ≤ r. Existe entonces n < ω tal que a1, . . . , ar, b1, . . . , br ∈ Gn, y por construcción, existe un elemen-to c ∈ Gn+1 ⊆ G tal que c es adyacente a todos los ai’s, y no es adyacente con ninguno de los bj ’s. Estomuestra que G |= Ar, y como esto se cumple para todo r ≥ 1, tenemos que G |= RG, esto es, RG es satisfactible.

Para la unicidad, veremos que si G1,G2 son dos grafos contables que satisfacen todos los axiomas Ar, entoncesG1

∼= G2. Para esto, usaremos de nuevo el método de back & forth.

Supongamos que G1 = x : n : n ∈ N y G2 = yn : n ∈ N son enumeraciones de los grafos G1,G2. Lo queharemos será construír una colección de isomorfismos parciales fn : n ∈ N (conjuntos de parejas ordenadasen G1 × G2) que cumplirán las siguientes condiciones:

Dom fn ⊇ x0, . . . , xn,Im(fn) ⊇ y0, . . . , yn,Para cada n ∈ N, fn ⊆ fn+1

Si x, x′ ∈ dom(fn), entonces xRx′ si y sólo si fn(x)Rfn(x′).

Esto lo hacemos inductivamente. Para f0, simplemente tomamos el par f0 = (x0, y0). Supongamos ahoraque fn ya ha sido construído, y veremos como obtener fn+1.

Forth: Considere el elemento xn+1. Si xn+1 ∈ dom(fn), entonces definimos f ′n = fn. Si xn+1 6∈ dom(fn),definamos los conjuntos U = x ∈ dom(fn) : xRxn+1 y W = x ∈ dom(fn) : ¬xRxn+1. Por los axiomasAr sabemos que existe un elemento y ∈ G2 que es adyacente a todos los vértices en fn(U) y no es adyacentea ninguno de los vértices en fn(W ). Así, tomamos simplemente f ′n = fn ∪ (xn+1, y).

Back: Similarmente, dado el elemento yn+1 ∈ G2, podemos definir los conjuntos U = x ∈ dom(fn) :f(x)Ryn+1 y W = x ∈ dom(fn) : ¬f(x)Ryn+1, y existe un elemento x ∈ G1 que está relacionado con loselementos en U y no está relacionado con ningún elemento en W . Tomamos entonces fn+1 = f ′n∪(x, yn+1.Es claro que las funciones fn satisfacen las condiciones requeridas, y si tomamos f :=

⋃n∈N fn, tendremos

que f es un isomorfismo entre G1 y G2.

Definición 4.7. A este único grafo contable G se le conoce como el grafo aleatorio o grafo de Rado. A lateoría en el lenguaje de grafos dada por RG = Ar : r ≥ 1 se le conoce como la teoría del grafo aleatorio.

Corolario 4.8. La teoría RG del grafo aleatorio es completa.

Demostración. Es claro que la teoría RG sólo puede tener modelos infinitos. Además, RG es ℵ0-categórica, ypor el test de categoricidad de Vaught, RG es completa.

La teoría RG es muy interesante porque nos permite deducir propiedades de grafos aleatorios finitos. Fijen ∈ N y tomemos V = 1, 2, . . . , n. Para cada posible arista e ∈ [V ]2, considere el espacio de probabilidadΩe = 0e, 1e con Probe(0e) = 1− p, Probe(1e) = p para algún p ∈ (0, 1) fijo. Sea G(n, p) el espacio de

28

Page 29: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

probabilidad Ω :=∏

e∈[V ]2

Ωe con la medida producto.

Note que cada elemento Ω está en correspondencia con un único grafo G con conjunto de vértices V . Porconsiguiente, los eventos en G(n, p) son propiedades de grafos sobre V . Por ejemplo, para e ∈ [V ]2, elconjunto Ae = x ∈ Ω : xe = 1e = G : e ∈ E(G) es el evento “e es una arista del grafo”y su probabilidades Prob(Ae) = Probe(1e ×

∏e′ 6=e 1 = p.

Afirmación 1: Los eventos Ae son independientes y ocurren con probabilidad p. Por definición, si S =e1, . . . , ek ⊆ [V ]2, entonces

Prob(Ae1 ∩Aek) = Prob

e′ 6∈SΩe′ ×

k∏

i=1

1ei

= 1 · pk = Prob(A1) · · ·Prob(Aek).

Considere ahora para r ≥ 1, el evento definido por Pr = G ∈ G(n, p) : G |= Ar, que es la colección degrafos G en V tales que para cualesquiera conjuntos disyuntos U,W ⊆ V con |U | ≤ r, |W | ≤ r existe unvértices v 6∈ U ∪W tal que uRv y ¬(uRw) para todo u ∈ U,w ∈W .

Teorema 4.9. Para todo r ≥ 1 y todo p ∈ (0, 1), casi todos los grafos G ∈ G(n, p) satisfacen la propiedadPr. Esto es,

lımn→∞

Prob(Pr(G(n, p)) = 1.

Demostración. Si fijamos n ∈ N, subconjuntos de vértices U,W y v ∈ [n] \ (U ∪W ), tenemos que Prob(∀u ∈U,∀w ∈W (uRv ∧ ¬(uRw)) = p|U | (1− p)︸ ︷︷ ︸

q

|W | ≥ prqr. Por lo tanto,

Prob(No existe vértice apropiado v para el par (U,W ))

= (1− p|U |q|W |)|[n]\(U∪W )| = (1− p|U |q|W |)n−|U |−|W |

≤ (1− prqr)n−2r.

Note que no existen más de n2r pares (U,W ) con U ∩W = ∅ y |U | ≤ r, |W | ≤ r, pues cada par de estospuede ser codificado por una función f : a1, . . . , ar∪b1, . . . , br → 1, . . . , n (si |U | < r o |W | < r, el par(U,W ) estaría codificado por una función no inyectiva). De esta forma, la probabilidad de que para algúnpar U,W no existe un elemento apropiado v es a lo más (1− prqr)n−2r · n2r. Así, como 2r es una constantey prqr = pr(1− p)r ≤ p(1− p) = p− p2 < 1, concluímos que

lımn→∞

Prob((Pr(G(n, p)))c) ≤ lımn→∞

n2r · (1− prqr)n−2r = lımn→∞

n2r · (1 − prqr)n−2r = 0

porque el decrecimiento exponencial domina al crecimiento polinomial.

Teorema 4.10 (Ley 0-1 para grafos). Para cualquier sentencia φ en el lenguaje de grafos y todo p ∈ (0, 1),se tiene que

lımn→∞

Prob((G(n, p) |= φ) = 1 ó lımn→∞

Prob((G(n, p) |= φ) = 0.

Demostración. Como la teoría RG es completa, tenemos que RG |= φ ó RG |= ¬φ. Sean Ar ∈ RG con rsuficientemente grande tal que Ar |= φ, ó Ar |= ¬φ.Como lım

n→∞Prob((G(n, p) |= Ar) = 1,, tenemos dos casos:

Si Ar |= φ, entonces todo modelo de Ar es un modelo de φ. Por lo tanto,

1 ≤ lımn→∞

Prob((G(n, p) |= Ar) ≤ lımn→∞

Prob((G(n, p) |= φ) ≤= 1.

Si Ar |= ¬φ, entonces por el razonamiento anterior tendríamos que

lımn→∞

Prob((G(n, p) |= φ) = lımn→∞

[1− Prob((G(n, p) 6|= φ)] = 1−[lımn→∞

Prob((G(n, p) |= ¬φ)]= 1− 1 = 0.

29

Page 30: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

EJERCICIOS DE PRÁCTICA

30

Page 31: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

5. Tipos

Definición 5.1. Sea M una L-estructura, A ⊆My Σ(x) un conjunto de L-fórmulas con parámetros en A yvariable x. Decimos que un elemento b ∈ M realiza Σ(x) si M |= φ(b, a) para cada fórmula φ(x, a) ∈ Σ(x).En este caso, escribimos M |= Σ(b).

También decimos que Σ(x) es un conjunto finitamente satisfactible en M si cada subconjunto finito de Σ serealiza en M.

Lema 5.2. Un conjunto Σ(x) es finitamente satisfactible en una L-estructura M si y sólo si existe unaextensión elemental de M en la que se realiza Σ(x).

Demostración. Si Σ(x) se realiza en algún modelo, entonces Σ(x) es finitamente satisfactible. Para el recí-proco, sea L′ una extensión del lenguaje L donde añadimos una constante por cada elemento de M y unaconstante adicional c. Consideremos la L′-teoría

Γ = Σ(c) ∪Diag(M).

Sea Γ0 un subconjunto finito de Γ. Tenemos entonces que Γ0 ⊆ φ1(c), . . . , φk(c) ∪ Diag(M). Como Σ(x)es finitamente satisfactible en M, existe un elemento a ∈ M tal que M |= φ1(a) ∧ · · · ∧ φk(a). Podemosconsiderar M como una L′-estructura, tomando cM := a y mM := m para cada m ∈ M, y con estasinterpretaciones, M |= Γ0.Esto muestra que Γ es finitamente satisfactible, y por compacidad, existe M′ |= Γ. Dado que M′ |=Diage l(M), podemos asumir que M ≺ M′. Además, Σ(x) es realizado en M′ por el elemento cM

′.

Ejemplo 5.3. Considere la estructura M = (R,+, ·, 0, 1, <), y el conjunto de fórmulas

Σ(x) =

0 < x <

1

n: n ∈ N

.

Es fácil ver que este es un conjunto consistente de fórmulas, ya que el subconjunto finito 0 < x < 1, . . . , 0 <x < 1/k de Σ(x) es realizado en R, por ejemplo por 1/(k + 1).

Así, por el Lema anterior, debe existir una extensión elemental R de R y un elemento ε ∈ R que realizaΣ(x). Esto es, 0 < ε y para todo n ∈ N, n · ε < 1. Este tipo de elemento se conoce como un infinitesimal.

Note en particular que R |= Th(R,+, ·, 0, 1, <), por lo que cualquier propiedad de primer orden que sea ciertaen R también será cierta en R. Sin embargo, note que R no es arquimediano, por lo que “ser arquimediano”no es expresable en primer orden en el lenguaje Lor = +, ·, 0, 1, <.Definición 5.4. Sea M una L-estructura y A un subconjunto de M . Un conjunto p(x) de L(A)-fórmulas sedice un tipo sobre B si p(x) es un conjunto maximal finitamente satisfactible en M. En este caso, decimosque A es el dominio de p, o que B es el conjunto de parámetros de A.

El conjunto de todos los tipos sobre A se denota como SM(A), ó S(A) si es claro cuál es la estructura M.

Comentario 5.5. Por el Lema de Zorn, cada conjunto finitamente satisfactible Σ(x) de L(A)-fórmulas puedeextenderse a un tipo p(x) sobre A. Por esta razón, a los conjuntos finitamente satisfactibles de fórmulastambién se les llama tipos parciales.

Ejemplo 5.6. Cada elemento b de M determina un tipo dado por

tp(b/A) = tpM(b/A) := φ(x, a) : M |= φ(b, a), φ(x, a) es una L(A)-fórmula.Este se conoce como el tipo de b sobre A (en M).

Comentario 5.7. Note que un elemento b realiza el tipo p(x) ∈ S(A) precisamente cuando p = tp(b/A).Más aún, si M′ es una extensión elemental de M, entonces para todo A ⊆ M , SM′

(A) = SM(A) y paratodo b ∈M tpM′(b/A) = tpM(b/A). (EJERCICIO)

Usaremos la notación tp(a) para tp(a/∅).

De forma similar, conjuntos maximales finitamente satisfactibles de fórmulas x1, . . . , xn se conocen comon-tipos, y Sn(A) = SM

n (A) denota el conjunto de n-tipos sobre A.31

Page 32: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Teorema 5.8. Toda estructura M tiene una extensión elemental N en la cual todos los tipos sobre M serealizan.

Demostración. Para cada p ∈ S(M), sea cp un nuevo símbolo de constante. Basta con encontrar un modelopara la teoría

Γ = Diag(M) ∪⋃

p∈S(M)

p(cp).

Sin embargo, como cada p ∈ S(M) es finitamente satisfactible en M, es fácil ver que esta teoría es finita-mente satisfactible. Por el Teorema de Compacidad, existe un modelo M′ para Γ, que será una extensiónelemental de M pues M′ |= Diag(M), y cada tipo p ∈ S(M) es realizado en M′ por la interpretación cM

p .

Podemos también demostrar este resultado usando una construcción de cadenas. Sea 〈pα : α < λ〉 unaenumeración de todos los tipos en S(M). Vamos a construír inductivamente (en ordinales) una cadenaelemental de estructuras

M = M0 ≺ M1 ≺ · · · ≺ Mβ ≺ · · · (β < λ)

Para comenzar, tomamos M = M0. Si β = α + 1, tenemos que pα es finitamente satisfactible en Mα.Por el Lema 5.2, existe una extensión elemental Mα+1 que realiza pα. Si β es un ordinal límite, tomamosMβ =

⋃α<βMα. Por el Teorema 3.15, Mβ es una extensión elemental de cada Mα, α < β.

Finalmente, sea N =⋃α<λMα. Por Teorema 3.15, N es una extensión elemental de M0 = M. Por

construcción, para cada tipo pα ∈ S(M) existe un elemento en Mα+1 ⊆ N que realiza pα. Por lo tanto, Nrealiza todos los tipos en S(M), como queríamos probar.

Proposición 5.9. Sea M una L-estructura, A ⊆M y σ : M → M un automorfismo tal que σ(a) = a paracada a ∈ A. 8 Si σ(b) = b′, entonces tp(b/A) = tp(b′/A).

Demostración. Por definición, para cada L(A)-fórmula φ(x, a) tenemos que

φ(x, a) ∈ tp(b/A) ⇔ M |= φ(b, a) (por definición de tipo de b sobre A)

⇔ M |= φ(σ(b), σ(a)) (por definición de automorfismo de M sobre A)

⇔ M |= φ(b′, a) (por las hipótesis acerca de σ)

⇔ φ(x, a) ∈ tp(b′/A).

Ejemplo 5.10. Sea A = Q, subconjunto del campo C. Si b ∈ C, tenemos dos posibilidades para tp(b/A):b es algebraico sobre Q: En este caso, existe un polinomio irreducible f(x) con coeficientes en Q talque f(b) = 0. En este caso, el tipo tp(b/Q) está completamente determinado por la fórmula f(b) = 0,ya que si b′ es otra posible raíz de f , entonces existe un automorfismo σ ∈ Aut(C/A) tal que σ(b) = b′,y por la Proposición 5.9, tp(b/Q) = tp(b′/Q)b es trascendente sobre Q: En este caso, y por un argumento de automorfismos similar, el tipo tp(b/Q)está completamente determinado por las fórmulas

f(x) 6= 0 : f ∈ Q[X].Ejemplo 5.11. Consideremos la estructura M = (Q, <). Tenemos los siguientes tipos sobre Q:

Tipos realizados: caracterizados por la fórmula x = q para algún q ∈ Q.Tipos al infinito: p∞ = x > q : q ∈ Q, p−∞ = x < q : q ∈ QCortes irracionales: Si r es un número irracional, podemos considerar el tipo

pr = q1 < x < q2 : (R, <) |= q1 < r < q2.Cortes racionales: Dado a ∈ Q, tenemos los tipos

a+ := q1 < x < q2 : q1 ≤ a < q2 y a− := q1 < x < q2 : q1 < a ≤ q2.

bb Qaq

√2

a+a− p+∞p−∞ p√2“x = q”

8Esto se denota como σ ∈ Aut(M/A))

32

Page 33: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Ejemplo 5.12. Sea M una estructura con una relación de equivalencia E que tiene infinitas clases coninfinitos elementos cada una. Tenemos los siguientes tipos sobre M :

Los tipos realizados.Tipos no realizados en una clase existente: Para un elemento a ∈M , están dados por conjuntos de laforma

pa := xEa ∪ x 6= b : M |= bEa.Hay un tipo de estos por cada clase de equivalencia en MTipos no realizados en nuevas clases: Este tipo está determinado por el conjunto de fórmulas

q := ¬xEa : a ∈M.

b

b

b

b

b b b

a

“x = a”

pa

q

Definición 5.13. Sea M una L-estructura y κ un cardinal infinito. Decimos que M es κ-saturada si todotipo p(x) ∈ SM

1 (A) sobre un conjunto A ⊆M con |A| < κ tiene una realización en κ.

Ejemplo 5.14. Note que si |M| = κ, entonces M no puede ser κ+-saturada, ya que no puede realizar eltipo Σ(x) := x 6= m : m ∈M con parámetros en A =M que tiene tamaño κ.

Ejemplo 5.15. El campo (C,+, ·, 0, 1) es ℵ1-saturado. En efecto, si A ⊆ C es un conjunto contable y p(x) esun tipo sobre A, se puede ver que p(x) corresponde al tipo de un elemento algebraico sobre Q(A) o al tipo deun elemento trascendente sobre Q(A). En cualquier caso, si b′ es una realización de p(x) (posiblemente en unaextensión elemental de C), existe b ∈ C y un automorfismo σ tal que σ(b′) = b, por lo cual p(x) = tp(b/A).

Ejemplo 5.16. La estructura (R.+, ·, 0, 1, <) no es ℵ0-saturada. En efecto, Σ(x) = 0 < n · x < 1 : n ∈ Nes un tipo parcial sobre ∅ que no tiene una realización en R.

Ejemplo 5.17. Si M es un modelo contable de RG, entonces existen 2ℵ0 tipos distintos sobre M .

33

Page 34: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

EJERCICIOS DE PRÁCTICA

34

Page 35: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

6. Ultraproductos y aplicaciones

6.1. La construcción de ultraproducto. La construcción de ultraproducto es un método uniforme paraconstruír límites modelos de teorías de primer orden a partir de una clase de estructuras en un mismo lengua-je. Históricamente se había utilizado en análisis funcional, por Skolem en su estudio de modelos no estándarde la aritmética, y por Hewitt en el estudio de ciertas clases de campos que resultaron ser ultraproductos decampos.

Sin embargo, no fue hasta 1955 con Jerzy Łoś que se dió una definición formal de ultraproductos, y graciasa los estudios posteriores de Frayne, Tarski y Ax se generalizó el uso de ultraproductos en álgebra y teoríade modelos.

Definición 6.1. Sea I un conjunto infinito de índices. Un filtro sobre I es una colección F de subconjuntosde I que satisface:

(i) I ∈ F , ∅ 6∈ F .(ii) Si A,B ∈ F entonces A ∩B ∈ F .(ii) Si A ∈ F y A ⊆ B ⊆ I entonces B ∈ F .

Definición 6.2. Un ultrafiltro sobre I es un filtro maximal U . Equivalentemente, es un filtro U sobre I queademás satisface la siguiente condición:

(iv) Para todo A ⊆ I, A ∈ U ó Ac = I −A ∈ U .

Ejercicio 2 (Ejemplos de filtros y ultrafiltros). Supongamos que I = N.

Dado A ⊆ N no vacío, existe el filtro generado por A: FA = 〈A〉 = X ⊆ N : A ⊆ X.

Este tipo de filtros son ultrafiltros únicamente si A = n para algún n ∈ N. Por esta razón sedenominan ultrafiltros principales.

El filtro de Fréchet: F = X ⊆ N : N−X es finito..El filtro de Fréchet no es un ultrafiltro, ya que ni A = 2N ni Ac = (2N)c están en F .

Sin embargo, usando el Lema de Zorn, todo filtro puede extenderse a un ultrafiltro. Es claro que un ultrafiltroes no principal si y sólo si extiende al filtro de Fréchet.

Proposición 6.3 (Propiedades de ultrafiltros). Sea U un ultrafiltro sobre un conjunto de índices I.

1. Si I = X1 ∪ · · · ∪Xn es una partición finita de I, entonces existe un único k ≤ n tal que Xj ∈ U .2. Si X ∈ U y Y1 ∪ Y2 = X, entonces Y1 ∈ U o Y2 ∈ U .

Demostración. - Note que si Xk1 ,Xk2 ∈ U para dos conjuntos distintos, entonces Xk1 ∩Xk2 = ∅ ∈ U , lo quees absurdo. Esto muestra que a lo más uno de los conjuntos Xk está en U . Definamos ahora los conjuntosAk = I \Xk. Si ningún Xk pertenece a U , entonces A1, . . . , An ∈ U , y tendríamos que A1 ∩ · · · ∩An = ∅ ∈ U ,una contradicción.- Si no, tendríamos que Y c

1 , Yc2 ∈ U , por lo cual Y c

1 ∩ Y c2 = (Y1 ∪ Y2)

c = Xc ∈ U , contradiciendo queX ∈ U .

Definición 6.4 (Ultraproducto). Sean 〈Mi : i ∈ I〉 una colección de estructuras en un mismo lenguaje L yU un ultrafiltro sobre I. Definimos su ultraproducto como

M =∏

UMi :=

i∈IMi

/∼U

donde la relación ∼U está dada por:

(ai : i ∈ I) ∼U (bi : i ∈ I) si y sólo si i ∈ I : ai = bi ∈ U .Esto es, dos tuplas (ai : i ∈ I) y (bi : i ∈ I) son ∼U -equivalentes si ai = bi para U -casi todo i ∈ I. Podemosdotar a M de una L-estructura, de la siguiente manera:

Si c ∈ L es un símbolo de constante, entonces

cM := [cMi ]U35

Page 36: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Si f ∈ L es un símbolo de función n-aria, entonces definimos

fM ([a1i ]U , . . . , [ani ]U ) := [fMi(a1i , . . . , a

ni )]U .

Si R ∈ L es un símbolo de relación n-aria, entonces

RM := ([a1i ]U , . . . , [ani ]U ) : (a1i , . . . , ani ) ∈ RMi para U -casi todo iEl siguiente es el Teorema Fundamental de Ultraproductos.

Teorema 6.5 (Jerzy Łoś , 1955). Sea 〈Mi : i ∈ I〉 una colección de L-estructuras y U un ultrafiltro sobre I.Para toda L-fórmula ϕ(x1, . . . , xn), tenemos que

UMi |= ϕ(a1, . . . , an) si y sólo si i ∈ I :Mi |= ϕ(ai1, . . . , a

in) ∈ U .

Este teorema usualmente se parafrasea de la siguiente manera:

Una afirmación es cierta en el ultraproducto M =∏

U Mi si y sólo si es cierta para U-casi todas las estructurasMi”

Demostración. La demostración de este resultado usa inducción en fórmulas. Para no extendernos tanto, nola haremos por completo pero haremos un esquema.

Para fórmulas fórmulas atómicas, el resultado se sigue por la forma como se define la interpretación deconstantes, funciones y relaciones en el ultraproducto. Para los conectivos ¬ y ∧, se sigue del hecho que unultrafiltro es cerrado bajo intersecciones finitas, y de que para todo A ⊆ I, o bien A ∈ U ó Ac ∈ U .

Finalmente, supongamos que la fórmula tiene la forma ϕ(x1, . . . , xn) = ∃y(ψ(x1, . . . , xn, y)), y que el resul-tado ya se tiene para ψ(x1, . . . , xn, y).

(⇐) Supongamos queM |= ϕ(a1, . . . , an). Existe entonces un elemento b = [bi]U tal queM |= ψ(a1, . . . , an, b).Por hipótesis de inducción, A = i ∈ I :Mi |= ψ(ai1, . . . , a

in, b

i) ∈ U , y tomando como testigos de la fórmulaexistencial los elementos bi, tendremos que A = i ∈ I :Mi |= ∃y(ψ(ai1, . . . , ain)) ∈ I, como queríamos.

(⇒) Supongamos ahora a1, . . . , an ∈ M , y que el conjunto A = i ∈ I : Mi |= ∃y(ψ(ai1, . . . , ain)) ∈ U .Para cada i ∈ A, existe un elemento bi ∈ Mi para el cual Mi |= ψ(ai1, . . . , a

in, b

i). Consideremos entoncesel elemento b = [bi]U ∈ M , donde para cada i 6∈ A, bi es un elemento arbitrario de Mi. Así, dado queA = i ∈ I : Mi |= ψ(ai1, . . . , a

in, b

i) ∈ U , y por hipótesis de inducción, M |= ψ(a1, . . . , an, b). Esto muestraen particular que M |= ∃y(ψ(a1, . . . , an)), como queríamos.

6.2. Propiedades expresables en primer orden.

Una de las primeras aplicaciones de los ultraproductos fue la de detectar propiedades que no se podían expre-sar en primer orden en un lenguaje determinado. Anteriormente ya habíamos mencionado que la propiedadde completitud del campo de los números reales no parecía expresable en primer orden, pero no dimos unaprueba concreta de por qué esto efectivamente era así.

Antes de esto, daremos un par de ejemplos mucho más sencillos. Comencemos con la propiedad de “ser ungrafo conexo”.

Definición 6.6. Un grafo (G,R) se dice conexo si cualesquiera dos elementos x, y ∈ G están a distanciafinita. Esto es, si para todo x, y ∈ G existen z1, . . . , zn ∈ G tales que

G |= R(x, z1) ∧R(zn, y) ∧∧

0≤i<nR(zi, zi+1).

En primera instancia esto puede parecer una propiedad de primer orden, pero debemos poner atención alcuantificador implícito para n: para todo x, y existe n ∈ N y z1, . . . , zn, etc.También podríamos entender esta obstrucción como una disyunción infinita, de la siguiente manera: 9

9

36

Page 37: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

G |= ∀x, y∨

n∈N

∃z1, . . . , zn

R(x, z1) ∧R(zn, y) ∧

0≤i<nR(zi, zi+1)

Teorema 6.7 (Hajek, 1977). La propiedad “ser conexo” no es expresable en primer orden en el lenguage degrafos.

Turán, 1984. Supongamos que sí, y que ser conexo se expresa por una sentencia σ en Lgrafos. Considere losgrafos cíclicos Cn con vértices 1, 2, . . . , n, donde xRy si y sólo si |x−y| = 1 (modn). Tomemos G =

∏U Cn

con respecto a un ultrafiltro no-principal U . Dado que cada Cn es conexo, Cn |= σ para todo n ∈ N, y porTeorema de Łoś se cumple que G |= σ. Esto es, G es un grafo conexo.

Sean α = [1, 1, 1, . . .]U y β = [1, 2, . . . , ⌊n2 ⌋, . . .]U . De nuevo por Teorema de Łoś , tendremos que para cadak ≥ 1,

G |= ¬∃x0, . . . , xk(x0 = α ∧ xk = β ∧

k−1∧

i=0

xiRxi+1

),

es decir, dist(α, β) ≥ k para todo k ∈ N. Esto muestra que G no es conexo, obteniendo una contradicción.

Comentario 6.8. Usando un resultado sobre cardinalidades de ultraproductos que veremos después, es fácilmostrar que G =

∏U Gn es de hecho isomorfo a una unión de 2ℵ0 cadenas contables.

6.3. Hiperreales y análisis no-estándar.

Sea I = N, Mn = (R; 0, 1,+, ·, <) para cada n ∈ N y U un ultrafiltro no principal sobre N. DefinimosR∗ :=

∏U Mn, que es el conjunto de reales no-estándar.

Veamos algunas de las propiedades de R∗. En primer lugar, note que el mapa J : R → R∗, J(r) := [r, r, . . .]Ues una inmersión de anillos ordenados. Por abuso de notación, el elemento [r, r, . . .]U ∈ R∗ se denota como r,y tendríamos que R ⊆ R∗.

El orden en R∗ es denso: Sea ϕ = ∀x, y(x < y → ∃z(x < z ∧ z < y)). Esta es una LAO-sentencia, y comon ∈ N : Mn |= ϕ = N ∈ U , tenemos por el Teorema de Łoś que R∗ |= ϕ. Por lo tanto, (R∗, <) es denso.Más aún, un argumento similar muestra que cualquier propiedad que sea expresable en el lenguaje de anillosordenados y sea cierta en R también será cierta en R∗. En particular, R∗ es un anillo ordenado y satisfacetodos los axiomas (1)-(14) mencionados anteriormente.

Definición 6.9. Sea R un anillo ordenado. Un elemento ǫ ∈ R se dice infinitesimal si para todo n ∈ N setiene que − 1

n < −ǫ, ǫ < 1n . De manera análoga, un elemento α ∈ R se dice infinito si |α| > n · 1 para todo

n ∈ N.

La propiedad arquimediana de los números reales nos dice que el anillo ordenado R no contiene elementosinfinitos ni infinitesimales.

En R∗ existen elementos infinitesimales: Sabemos que 0 = [0, 0, 0, . . .]U y sea an = 1n := [ 1n ,

1n ,

1n , . . .]U .

Sea ǫ = [1, 12 ,13 , . . . ,

1n , . . .]U . Por Teorema de Łoś , 0 < ǫ < 1

n para todo n ∈ N. En particular, R∗ es noarquimediano.También existen elementos infinitos, como por ejemplo

α = [1, 2, 3, . . .]U =1

ǫ.

Existen también números hipernaturales, que son números de la forma α = [k1, k2, k3, . . .]U tal que kn ∈ N

para U -casi todo n. Es fácil ver que si α ∈ N∗ \ N, entonces α es infinito.

Teorema 6.10 (Sierpinski). Sean a1, . . . , an, b números reales positivos. Entonces, el conjunto de soluciones

en N de la ecuacióna1x1

+a2x2

+ · · ·+ anxn

= b es finito.

37

Page 38: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Demostración. Si hubiera infinitas soluciones enteras, en particular se tiene que al menos una de las coor-denadas de todas las posibles soluciones valores arbitrariamente grandes. Así, en R∗ habría al menos unasolución (x1, . . . , xk) con al menos una coordenada xi hipernatural no estándar. Sin pérdida de generalidad,supongamos que x1, . . . , xk son naturales estándar y xk+1, . . . , xn son naturales no estándar. Tendríamosentonces

ak+1

xk+1+ · · ·+ an

xn= b0 −

(a1x1

+ · · · akxk

),

que es absurdo pues el lado derecho es un real estándar, mientras el izquierdo es un infinitesimal positivo.

Otra de las aplicaciones de análisis no-estándar es una noción generalizada de convergencia, que depende delultrafiltro no-principal U usado para construír R∗.

Definición 6.11. Sea rn : n ∈ N una sucesión de números reales y s ∈ R. Decimos que la sucesiónrn : n ∈ N U-converge a s si y sólo si para todo ǫ > 0, n ∈ N : |rn − s| < ǫ ∈ U . Esto lo denotamostambién como lımn→U rn = s, y decimos que s es el ultralímite de la sucesión rn.

Proposición 6.12. Si U un ultrafiltro no-principal sobre N, entonces toda sucesión acotada en R U-convergeen R.

Demostración. Sea rn : n ∈ N una sucesión de números reales, y supongamos que N > 0 satisface que−N < rn < N para todo n. En primer lugar, note que si n ∈ N : rn = s ∈ U para algún s ∈ R, entoncestendríamos que lım

n→Urn = s.

Supongamos ahora que este no es el caso. Vamos a definir inductivamente una colección de intervalos cerradosIk : k ≥ 1 tales que Ik ⊇ Ik+1 y n ∈ N : rn ∈ Ik ∈ U para cada k ≥ 1. Comenzamos poniendoI1 = [−N,N ], para el cual tenemos que n ∈ N : rn ∈ [−N,N ] = N ∈ U .

Si Ik = [ak, bk] ya ha sido definido, consideremos los intervalos J1 =[ak,

ak+bk2

]y J2 =

[ak+bk

2 , bk

]y los

conjuntos dados por Xk = n ∈ N : rn ∈ Ik, Y1 = n ∈ N : rn ∈ J1 y Y2 = n ∈ N : rn ∈ J2. Dado queXk = Y1 ∪ Y2 y Xk ∈ U , tenemos que exactamente uno de los conjuntos Yt pertenece a U , y tomaremos Ik+1

como el correspondiente intervalo Jt.Note que Ik : k ≥ 1 es una colección de intervalos cerrados con Ik ⊇ Ik+1, la intersección

⋂k≥1 Ik es no

vacía. Además, dado que la longitud de cada intervalo Ik+1 es la mitad del intervalo Ik, tendremos que

longitud

k≥1

Ik

= lım

k→∞2N

2k−1= 0,

por lo cual⋂k≥1 Ik = s para algún s ∈ R. Es fácil ver que dicho elemento s es el ultralímite de la sucesión

rn : n ∈ N.

6.4. Un ultraproducto de campos.

Sea I = P el conjunto de los números primos, y para cada primo p, sea Fp = Fpalg

en el lenguaje de anillos.Si U es un ultrafiltro no principal sobre P, y considere F =

∏U Fp.

F es algebraicamente cerrado: Considere para cada n ∈ N, la fórmula

θn := ∀a0∀a1 · · · ∀an (an 6= 0 → ∃z(an · zn + · · ·+ a1 · z + a0 = 0)) .

F tiene característica 0: Considere la fórmula

ϕn := 1 + 1 + · · ·+ 1︸ ︷︷ ︸n−veces

6= 0

Un argumento diferente muestra que la cardinalidad de F es 2ℵ0 , y así, por el Teorema de Steinitz C ∼=∏

UFp

alg.

Teorema 6.13 (Ax-Grothendieck, 1968). Toda función racional f : Ck → Ck que sea inyectiva es sobreyec-tiva.

Demostración. Como ya vimos, C ∼=∏

U Fpalg

. La propiedad “Toda función racional de grados fijos n,m quesea inyectiva es sobreyectiva” puede expresarse en primer orden con una sentencia σn,m en el lenguaje de

38

Page 39: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

campos. En efecto, si denotamos f(x) =p(x)

q(x)con p(x) = a0+a1x+ . . .+anx

n y q(x) = b0+b1x+ · · ·+bmxm,

entonces podemos expresar

∀a0, a1, . . . , an, b0, . . . , bm (∀x, y(p(x) · q(y) = p(y) · q(x) → x = y) → ∀y∃x(p(x) = q(x) · y))

De esta manera, si σn,m es cierta en Fpalg

para casi todo primo p, entonces por Teorema de Łoś sería ten-

dríamos que vale para∏

U Fpalg ∼= C.

Recordemos que Fpalg

=⋃ℓ∈N Fpℓ . Por lo tanto, dada una función racional inyectiva f : Fp

alg → Fpalg

y un

elemento b ∈ Fpalg

se tiene que el elemento b y todos los coeficientes de f están contenidos en Fpℓ para algúnℓ. Esto es, f

∏h arpoonrightFpℓ

: Fpℓ → Fpℓ es una función racional inyectiva entre campos finitos, por lo

tanto sobreyectiva, y existe α ∈ Fpℓ ⊆ Fpalg

tal que f(α) = b.

6.5. Cardinalidad de los ultraproductos. A continuación veremos algunas propiedades relacionadascon cardinalidades y ultraproductos de estructuras finitas, entre las que se encuentra una propiedad impor-tante de realizabilidad denominada ℵ1-saturación.

Definición 6.14. Sea I un conjunto de índices y U un ultrafiltro sobre I. También, sea Mi : i ∈ I unacolección de estructuras en un mismo lenguaje y

∏U Mi su correspondiente ultraproducto con respecto al

ultrafiltro U .

1. Un subconjunto X de I se dice U-grande simplemente si X ∈ U .2. Decimos que una propiedad P se cumple para U-casi todo Mi si el conjunto i ∈ I : Mi |= P es

U -grande.3. Decimos que el tamaño de Mn tiende a infinito con respecto al ultrafiltro U (|Mn| →U ∞) si para todoN ∈ N, se tiene que n ∈ N : |Mn| ≥ N ∈ U .

Comentario 6.15. Un caso trivial ocurre cuando U es un ultrafiltro principal de la forma U = X ⊆ I :k ∈ X para algún k ∈ I fijo. En este caso,

∏U Mi

∼=Mk, y una propiedad es cierta en el ultraproducto si ysólo si se cumple para Mk.

Una propiedad muy importante de los ultraproductos de estructuras de primer orden es el hecho que son ℵ1-saturados: para cada subconjunto contable A ⊆M y cada subconjunto p(x) de fórmulas p(x) con parámetrosen A que sea finitamente satisfactible en M , existe una tupla c de M que realiza todas las fórmulas en p(x).

Proposición 6.16. Si M =∏UMi es un ultraproducto con respecto a un ultrafiltro no principal U sobre

I = ω. Entonces M is ℵ1-saturado.

Demostración. Supongamos que p(x) = ϕm(x) : m ∈ N es una enumeración de las fórmulas en p(x). Comop(x) es finitamente satisfactible en M , tenemos que para cada k ∈ N el conjunto ϕ1(M) ∩ · · · ∩ ϕk(M) esno-vacío.Por el Teorema de Łoś , esto implica que el conjunto

S′k := i ∈ ω :Mi |= ∃x(ϕ1(x) ∧ · · · ∧ ϕk(x))

pertenece a U . Sea Sk = S′k ∩ [k,+∞). Note que estos conjuntos son U -grandes, Sk ⊇ Sk+1 para cada k, y⋂

k∈N Sk = ∅.Dado i ∈ S1, denotemos como ki al número natural k más grande tal que i ∈ Sk, y sea ai ∈ ϕ1(Mi) ∩ · · · ∩ϕki(Mi). Por construcción, tenemos que para cada m ∈ N,

i ∈ ω : ai ∈ ϕm(Mi) ⊇ i ∈ ω : m ≤ ki ⊇ S1 ∩ Sm = Sm ∈ U .De esta forma, por el Teorema de Łoś , si a = [ai]U entonces M |= ϕm(a) para todo m, por lo que a ∈ Mrealiza p(x).

Algunas veces es útil conocer la cardinalidad de ciertos ultraproductos, para poder usar resultados de catego-ricidad como el Teorema de Steinitz. Cuando el conjunto de índices es arbitrario, conocer el tamaño exactode los ultraproductos puede ser un problema difícil, incluso para ultraproductos de estructuras contables.Las principales referencias en este aspecto son [22] y [26]. En este último se muestra que si un ultraproductode conjuntos finitos tiene cardinalidad κ, entonces κℵ0 = κ.

39

Page 40: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Sin embargo, cuando consideramos ultraproductos de estructuras contables sobre un conjunto contable deíndices, podemos obtener un resultado simple pero igualmente poderoso.

Proposición 6.17. Si M =∏UMi es un ultraproducto de estructuras finitas con I = N and |Mi| →U ∞,

entonces |M | = 2ℵ0 .

Demostración. En primer lugar, note que

∣∣∣∣∣∏

U

Mi

∣∣∣∣∣ ≤∣∣∣∣∣∏

i∈ωMi

∣∣∣∣∣ ≤∣∣∣NN

∣∣∣ = |R|, por lo cual |M | ≤ 2ℵ0 . Para la

otra desigualdad, dado un subconjunto A ⊆ N, podemos considerar la función fA : N → N definida como

fA(n) =∑

k<n

χA(k) · 2k

donde χA es la función característica de A. Considere la familia de funciones F = fA : A ⊆ N.

Afirmación: Para cada n ∈ N, fA(n) < 2n y para cualesquiera subconjuntos distintos A,B de N, n ∈ N :fA(n) = fB(n) es finito.

Demostración de la afirmación: Es claro que fA(n) < 2n para cada fA ∈ F . Además, dados dos subconjuntosdistintos A,B de N, mostraremos que n ∈ N : fA(n) = fB(n) = n ∈ N : n ≤ mın(AB).

Sea t = mın(AB), y supongamos sin pérdida de generalidad que t ∈ A \ B. Note que fA(t + 1) =∑k≤t χA(k) · 2k = 2t +

∑k<t χA(k) · 2k = fB(t + 1) + 2t, por lo cual fA(t + 1) > fB(t + 1). Ahora, si

fA(n) = fB(n) para algún n > t+ 1 tendríamos que:

fA(n) =∑

k<t

χA(k) · 2k + 2t +∑

t<k<n

χA(k) · 2k =∑

k<t

χA(k)︸ ︷︷ ︸=χB(k)

·2k +∑

t<k<n

χB(k) · 2k = fB(n).

Sustrayendo el primer sumando en ambos lados obtenemos

2t +∑

t<k<n

χA(k) · 2k =∑

t<k<n

χB(k) · 2k

2t

(1 +

t<k<n

χA(k) · 2k−t)

= 2t ·∑

t<k<n

χB(k) · 2k−t

1 +∑

t<k<n

χA(k) · 2k−t =∑

t<k<n

χB(k) · 2k−t,

que es una contradicción pues el lado izquierdo es un número impar mientras que el derecho es un númeropar. Claim.Consideremos ahora el conjunto In = i ∈ I : 2n ≤ |Mi| ≤ 2n+1. Ninguno de los conjuntos In están U ,pero ellos forman una partición de I. Para cada i ∈ In, sea ai,j : j < 2n una enumeración de 2n elementosdiferentes de Mi. Para cada subconjunto A ⊆ N, consideremos el elemento

aA = [ai,fA(n)]U

donde n es el único número natural n tal que i ∈ In.Note que si A,B son subconjuntos diferentes de N, entonces

i ∈ I : aiA = aiB = i ∈ I : ai,fA(n) = ai,fB(n)= i ∈ I : i ∈ In and fA(n) = fB(n) ⊆

⋃In : f(n) = g(n)

que es una unión finita de conjuntos que no están en U . Así, i ∈ I : aiA = aiB 6∈ U , y concluímos que

aA 6= aB por el Teorema de Łoś . De esta manera,

∣∣∣∣∣∏

U

Mi

∣∣∣∣∣ ≥ 2ℵ0 .

Comentario 6.18. Note que esta cota sobre la cardinalidad del ultraproducto también aplica si se toma elultraproducto de estructuras contables sobre un conjunto contable de índices. Por ejemplo, tenemos que∣∣∣∣∣∣

p∈PFp

alg/U

∣∣∣∣∣∣= 2ℵ0 .

40

Page 41: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Ejercicio 3.1. Si U es un ultrafiltro sobre un conjunto de índices I y para cada i ∈ I, Fi es un ultrafiltro sobre un

conjunto de índices Ji, considere el conjunto de índices K = (i, j) : i ∈ I, j ∈ Ji. Defina la colecciónW de subconjuntos de K dada por

X ∈ W si y sólo si i ∈ I : j ∈ Ji : (i, j) ∈ X ∈ Fi ∈ U .Demuestre que W es un ultrafiltro sobre K.

2. Muestre que cada ultraproducto de ultraproductos de estructuras finitas es isomorfo a un ultraproductode estructuras finitas.

Lema 6.19 (Clasificación de ultraproductos de órdenes lineales finitos). Cada ultraproducto infinito deórdenes lineales finitos tiene tipo de orden de la forma ω + I × Z + ω∗, donde I es un orden lineal ℵ1-saturado, denso y sin extremos.

Demostración. Sea M =∏

U Li un ultraproducto infinito de órdenes lineales finitos. Primero, considerelas fórmulas ϕmın(x) := ∀y(y = x ∨ x < y) y ϕmax(x) := ∀y(y = x ∨ y < x). Note que las sentenciasσmın = ∃x(ϕmın(x)) y σmax := ∃x(ϕmax(x)) (que aseguran la existencia de elementos mínimo y máximo) sonciertas en cada Li. Así, por Teorema de Łoś ’, L tiene elemento mínimo y máximo, que llamaremos c0, c1respectivamente.También, note que para cada i ∈ N,

Li |=∀x[¬ϕmax(x)) → ∃y(x < y ∧ ∀w(x < w → (y ≤ w)))

]

Esto es, cada elemento en Li diferente del máximo tiene un sucesor inmediato, y similarmente, cada elementoen Li diferente del mínimo tiene un predecesor inmediato. Esta propiedad se transfiere a L por el Teoremade Łoś ’ y podemos considerar la relación de equivalencia dada por

a ∼ b⇔ existe n ∈ Z tal que Sn(a) = b.

Esta relación de equivalencia no es definible, pero aún podemos dar una descripción de las clases de equiva-lencia: a := a/ ∼ para a ∈ L:

a := a/ ∼=

c0, S(c0), S2(c0), . . . if a ∼ c0

c1, S−1(c1), S−2(c1), . . . , if a ∼ c1

Sn(a) : n ∈ Z if a 6∼ c0, c1

(donde S es la función sucesor (o predecesor si el exponente es negativo.) Note que el orden original en Linduce un orden lineal en L/ ∼, dado por a < b siy sólo si a < b (para a 6∼ b). Este orden tiene elementomínimo c0 = c0/ ∼ y máximo c1 = c1/ ∼. Sea I = L/ ∼ \c0, c1. Por construcción, sabemos que L esisomorfo a c0 ∪ I ×Z∪ c1 ∼= ω ∪ I × Z∪ ω∗, así que sólo queda mostrar que I es un orden lineal ℵ1-saturadodenso y sin extremos, que además tendrá cardinalidad 2ℵ0 pues gracias a la Proposición 6.17 tenemos que

2ℵ0 = |L| = |ω + I × ω + ω| = |I|.Supongamos que a, b son dos elementos I con a < b, y considere el tipo

pa,b(x) = Sn(a) < x < S−n(b) : n ∈ N= ∃x1, . . . , xn, y1, . . . , yn(a < x1 < · · · < xn < x < yn < · · · < y1 < b) : n ∈ N

Como L es ℵ1-saturated, existe un elemento c ∈ L que realiza pa,b(x), y tendremos que a < c < b. Así, I esdenso. Un argumento similar se puede usar para mostrar que I no tiene puntos extremos, completando laprueba.

Proposición 6.20 (Gurevich, 1988). La propiedad “ser un orden lineal de cardinalidad par” no se puedeexpresar en primer orden. Esto es, no existe una sentencia σ en el lenguaje de órdenes tal que para cadaestructura finita M , M |= σ si y sólo si M tiene cardinalidad par.

Comentario 6.21. Notemos que algunas propiedades sobre cardinalidades sí pueden expresarse para cla-ses de estructuras finitas. Por ejemplo, la propiedad “ser de cardinalidad potencia de algún primo” puedeexpresarse en el lenguaje Lrings = +, ·, 0, 1 mediante los axiomas de dominio de integridad. Similarmente,“tener cardinalidad potencia de 2” se puede expresar en el mismo lenguaje mediante los axiomas de campo yla sentencia “1 + 1 = 0”.

41

Page 42: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Demostración. Sea L = < y sea K la clase de L-estructuras formada por los órdenes lineales finitos.Supongamos que existe una setnencia σ tal que para todo M ∈ K, M |= σ si y sólo si |M | es par.Sea An el orden lineal (1, 2, . . . , n, <), y considere las estructuras M =

∏U A2n y M ′ =

∏U A2n+1 donde

U es un ultarfiltro no principal en N.Por el Lema 6.19, y usando un argumento de “back and forth”, tendremos que A ∼= ω + I × Z + ω∗ ≡ω + I ′ × Z + ω∗ ∼= B. Así, como cada A2n es par, M |= σ lo que implica que M ′ |= σ, y tendríamos queA2n+1 |= σ para U -casi todo n. Contradicción.

Proposición 6.22 (Ley 0-1 para órdenes lineales finitos). Para cada sentencia σ en el lenguaje L = <,existe n ∈ N tal que, o bien L |= σ para todo orden lineal finito de tamaño |L| ≥ n, o L |= ¬σ para todoorden lineal de tamaño |L| ≥ n.

Demostración. Supongamos que no. Entonces existe una sentencia σ y órdenes lineales finitos de cardinalidadarbitrariamente grande 〈Ln, L′

n : n ∈ N〉 tales que |Ln|, |L′n| ≥ n y Ln |= σ,L′

n |= ¬σ. Sin embargo, estocontradice el hecho que

∏U Ln ≡∏U L

′n.

Koponen y Luosto mostraron en [23] usando ultraproductos de estructuras finitas que las propiedades “serun grupo simple” y “ser un grupo nilpotente” no se pueden expresar en primer orden para la clase de gruposfinitos. Por ejemplo, si U es un ultrafiltro no-principal sobre el conjunto de primos P, podemos mostrar que“ser simple” no es definible en grupos finitos mostrando que G =

∏U Z/pZ and G′ =

∏U (Z/pZ⊕ Z/pZ).

Note que G y G′ son grupos abelianos divisibles libres de torsión. Así, son espacios vectoriales sobre Q detamaño 2ℵ0 , por lo cual G ∼= G′ simplemente encontrando una biyección entre las bases de G y G′ sobre Q.

42

Page 43: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

EJERCICIOS DE PRÁCTICA

El siguiente es un resultado curioso también relacionado con el grafo aleatorio.

Definición 6.23 (Grafos de Paley). Sea q = pn una potencia de primo tal que q ≡ 1 (mod 4). Definimos elgrafo de Paley Pq como el grafo cuyo conjunto de vértices es V = Fq y su relación está dada por xRy si ysólo si x 6= y y (x− y) es un cuadrado.

P5

b

b

b

b

b

0

1

2

3

4

P9

b

b

bb

b

b

bb

b

P13

b

b

bbb

b

b

b

b

b bb

b

La hipótesis q ≡ 1 (mod 4) garantiza que (−1) es un cuadrado en Fq, por lo cual la relación R es simétrica.Un teorema bastante técnico de Bollobás and Thomason (ver Theorem 10 en Ch. XIII.2 de [3]) establece losiguiente:

Teorema 6.24 (Bollobás - Thomason, 1981). Sean U,W conjuntos disyuntos de vértices en Pq con |U∪W | =m, y definamos

v(U,W ) = v ∈ Pq \ (U ∪W ) : vRu ∧ ¬vRw para todo u ∈ U,w ∈W.Entonces,

|v(U,W ) − 2−mq| ≤ 1

2(m− 2 + 2m+1)q1/2 +

m

2.

Usando este resultado, podemos concluír lo siguiente:

Corolario 6.25. Sea U un ultrafiltro sobre el conjunto I = q : q is a prime power and q ≡ 1 (mod 4).Entonces P =

∏U Pq es un modelo de la teoría del grafo aleatorio.

Demostración. Sean U = u1, . . . , uk, W = w1, . . . , wℓ subconjuntos disyuntos de P . Entonces los con-juntos U q = uq1, . . . , uqk, W q = wq1, . . . , wqk son subconjuntos disyuntos de Pq para U -casi todo q. Porel Teorema de Bollobás-Thomason, tenemos que |v(U q,W q)| ≥ 1

2k+ℓ q − Ck+ℓq1/2 para alguna constante fija

Ck+ℓ > 0. Así para q suficientemente grande (q ≥ 2k+ℓ+1 · Ck+ℓ), se tiene que

|v(U q,W q)| ≥ 1

2

(1

2k+ℓ

)q > 0,

por lo cual

q ∈ I : v(U q, wq) 6= ∅ =

q ∈ I : Pq |= ∃z

i,j

zRuqi ∧ ¬(zRwqj )

∈ U .

De esta forma, por el Teorema de Łoś , P |= ∃z(∧

i,j zRui ∧ ¬(zRwj)). Como esto se demostró para

conjuntos arbitrarios U,W de tamaños k, ℓ respectivamente, concluímos que P |= Ar para todo r ≥ 1, y asíP es un modelo de la teoría del grafo aleatorio.

Ejercicio 4. Sea U un ultrafiltro no principal sobre N y sea

R∗ :=∏

U(R,+,−, ·, 0, 1, <).

(a) Considere el elemento a = (1, 2, 3, . . . , n, . . .)/ ∼U . Pruebe que para todo k ∈ N, k < a. Concluya quela propiedad arquimediana no se puede expresar como una sentencia de primer orden.

(b) Pruebe que 0 < 1/a y que 1/a < 1/k para todo k ∈ N+, es decir que 1/a es un infinitesimal positivo.(c) Halle un infinitesimal positivo c tal que c < (1/a)k para todo k ∈ N+.

43

Page 44: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

(d) Sean d1, d2 ∈ R y ǫ1, ǫ2 infinitesimales. Pruebe que (d1 + ǫ1) · (d2 + ǫ2)− d1 · d2 es infinitesimal. ¿Quédice esto acerca de continuidad?

Ejercicio 5. Demuestre o refute: existe un campo infinito K tal que toda función algebraica es inyectiva siy sólo si es sobreyectiva.

Ejercicio 6. Demuestre que existe un campo de característica 0 que satisface las siguientes propiedades:−1 no es un cuadrado.Para todo x, alguno x ó −x es un cuadrado.−1 es la suma de dos cuadrados.

44

Page 45: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

7. Teoremas de preservación y eliminación de cuantificadores

7.1. Lemas de separación.

Lema 7.1 (Lema de separación). Sean T1, T2 dos teorías. Supongamos que H es un conjunto de sentenciasque es cerrado bajo ∧ y ∨ y contiene ⊤ y ⊥ ( verdad y falsedad). Entonces las siguientes son equivalentes:

1. Existe una sentencia σ ∈ H que separa T1 de T2. Esto es, T1 |= σ y T2 |= ¬σ.2. Cada modelos de T1 puede ser separado de cada modelo de T2 por sentencias en H. Es decir, dados

M1 |= T1 y M2 |= T2 existe una sentencia σ ∈ H tal que M1 |= σ y M2 |= ¬σ.Demostración. (1) ⇒ (2) Si existe una sentencia σ que separa T1 de T2, entonces para cualesquiera modelosM1 |= T1 y M2 |= T2 tendremos que M1 |= σ y M2 |= ¬σ.

(2) ⇒ (1) Para cualquier modelo M |= T1, sea HM el conjunto de sentencias en H que valen en M. Por(2), HM ∪ T2 no tiene modelos, pues un modelo de esta teoría sería un modelo N de T2 que no puede serseparado de M por ninguna sentencia en H.

Así, por el teorema de compacidad, HM ∪ T2 no es finitamente satisfactible, y existe una conjunción finitaσM de sentencias en HM que es inconsistente con T2. Como H es cerrado bajo conjunciones finitas, σM ∈ Hy T2 |= ¬σM. (*)Consideremos ahora el conjunto de sentencias T1 ∪ ¬σM : M |= T1. Claramente este conjunto es inconsis-tente, pues cualquier modelo M de T1 satisface σM. De nuevo por el teorema de compacidad, existen finitassentencias σM1

, . . . , σMktales que T1 ∪ ¬σM1

∧ · · · ∧ ¬σMk es inconsistente, por lo cual tendríamos que

T1 |= σM1∨ · · · ∨ σMk

.

Podemos tomar σ = σM1∨ · · · ∨ σMk

. Como H es cerrado bajo disyunciones, σ ∈ H. Además, por elargumento anterior, T1 |= σ, y por (*), T2 |= ¬σ. Es decir, σ ∈ H es una sentencia que separa T1 de T2.

Definición 7.2. Sea ∆ un conjunto de L-fórmulas y f : M → N una función entre L-estructuras. Usamosla notación f : M →∆ N para indicar que f es una función que preserva todas las fórmulas en ∆.

También usamos la notación M ⇒∆ N para indicar que toda sentencia en ∆ que sea cierta en M tambiénes cierta en N .

Lema 7.3. Sea T una teoría, M estructura y ∆ un conjunto de fórmulas cerrado bajo cuantificación exis-tencial, conjunción y sustitución de variables. Entonces las siguientes son equivalentes:

1. Todas las sentencias σ ∈ ∆ que son ciertas en M son consistentes con T .2. Existe un modelo N |= T y una función f : M →∆ N .

Demostración. (2) ⇒ (1) : Supongamos que existe f : M →∆ N con N |= T , y sea σ una sentencia en ∆tal que M |= σ. Tenemos entonces que N |= T ∪ σ, por lo cual T ∪ σ es consistente.

(1) ⇒ (2) : Considere el lenguaje extendido LM donde añadimos constantes para los elementos de M, yconsidere la teoría Th∆(M, (a ∈M)), el conjunto de LM -sentencias de la forma φ(a) con φ(x) ∈ ∆ tales queM |= φ(a).

Note que si N es un modelo de esta teoría, entonces para cada a ∈M existe un elemento distinto aN ∈ N , y lafunción f(a) = aN satisface que f : M →∆ N . De esta manera, basta con mostrar que Th∆(M, (a ∈M))∪Ttiene modelos.

Sea T0 un subconjunto finito de Th∆(M, (a ∈ M)). Tenemos entonces que T0 = φ1(a1), . . . , φk(ak) paraalgunas fórmulas φ1(x1), . . . , φk(xk) ∈ ∆ y a1, . . . , ak ∈M . Como ∆ es cerrado bajo cuantificación existencialy conjunciones, podemos considerar la sentencia en ∆ dada por σ := ∃x1 . . . ∃xk(φ1(x1)∧ · · · ∧φk(xk)). Estasentencia es cierta en M, y por hipótesis existe un modelo N0 |= T ∪ σ. Si interpretamos las constantesa1, . . . , ak como los testigos de la fórmula existencial en N0 y las demás constantes de manera arbitraria,tendremos que N0 |= T ∪ T0.

Así, por compacidad, T ∪Th∆(M, (a ∈M)) tiene modelos, como queríamos probar. 45

Page 46: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Corolario 7.4. Si M,N son dos L-estructuras y ∆ es una colección de fórmulas cerrado bajo cuantificaciónexistencial, conjunciones y sustitución de variables, entonces M ⇒∆ N si y sólo si existe una estructuraN ′ ≡ N y una función f : M →∆ N ′.

Demostración. Si aplicamos el Lema 7.3 a T = Th(N ), obtenemos que

Existe un modelo N ′ ≡ N y una función f : M →∆ N ′

⇔ existe un modelo N ′ |= Th(N ) y una función f : M →∆ N ′

⇔ toda sentencia σ ∈ ∆ que sea cierta en M es consistente con T = Th(N ) (por Lema 7.3)

⇔ toda sentencia σ ∈ ∆ que sea cierta en M también es cierta en N (porque Th(N ) es completa)

⇔ M ⇒∆ N .

7.2. Preservación de fórmulas universales.

Definición 7.5. Una fórmula universal es una fórmula φ(x1, . . . , xn) que tiene la forma

φ := ∀y1 . . . ∀ym(ψ(x1, . . . , xn; y1, . . . , ym)donde ψ(x1, . . . , xn; y1, . . . , ym) es una fórmula libre de cuantificadores.Similarmente, una fórmula existencial es una fórmula φ(x1, . . . , xn) que tiene la forma

φ := ∃y1 . . . ∃ym(ψ(x1, . . . , xn; y1, . . . , ym)).Definición 7.6. Decimos que T es una teoría universal si todas las sentencias en T son sentencias universales.

Comentario 7.7. Note que la negación de una sentencia universal es una sentencia existencial, y viceversa.

Lema 7.8. Las fórmulas universales se preservan bajo subestructuras. Esto es, si M es una subestructurade N y φ(x) := ∀y (ψ(x, y)) es una fórmula universal y a ∈M , entonces N |= φ(a) implica M |= φ(a).

Demostración. Supongamos que N |= ∀y ψ(a, y). Si M 6|= ∀y ψ(a, y), entonces existe una tupla b ∈M tal queM |= ¬ψ(a, b). Como ψ(x, y) es una fórmula libre de cuantificadores, por Proposición 1.21, N |= ¬ψ(a, b),contradiciendo que N |= ∀y ψ(a, y).

Teorema 7.9. Sean T1 y T2 dos teorías. Las siguientes son equivalentes:

1. Existe una sentencia universal que separa T1 de T2.2. No existe un modelo de T2 que sea una subestructura de un modelo de T1.

Demostración. (1) ⇒ (2). Sea H el conjunto de las sentencias universales. Por el Lema de Separación, lacondición (1) es equivalente a que cada modelo de T1 puede ser separado de un modelo de T2 por una senten-cia universal. Si existen modelos M1 |= T1 y M2 |= T2, tales que M2 |= M1, entonces por el lema anteriorcualquier sentencia universal que sea cierta en M1 será cierta en M2. Es decir, no existe sentencia universalque separe M1 de M2.

(2) ⇒ (1). Si la condición (1) no de cumple, entonces por el Lema de Separación existen dos modelosM1 |= T1 y M2 |= T2 que no pueden ser separados por una sentencia universal. Dado que la negación de unasentencia universal es una sentencia universal, esto quiere decir que si σ es una sentencia existencial, entoncesM2 |= σ implica M1. En otras palabras, si ∆∃ es el conjunto de fórmulas existenciales (que es cerrado bajocuantificación existencial, conjunción y sustitución de variables, e incluye a las fórmulas sin cuantificadores),entonces M2 ⇒∆∃

M1. Por el Corolario 7.4, existe M′1 ≡ M1 y una función f : M∈ →∆∃

M′1. En particular,

f es una L-inmersión, y por “corta y pega”, existe una estructura M′′1∼= M′

1 tal que M2 ⊆ M′′1 , lo que

contradice (2) pues M′′1∼= M′

1 ≡ M1 |= T1.

Definición 7.10. Sea T una L-teoría. Decimos que dos fórmulas φ(x) y ψ(x) son equivalentes módulo T (ocon respecto a T ) si T |= ∀x(φ(x) ↔ ψ(x)).

Teorema 7.11. Sea T una teoría.

1. Considere una fórmula φ(x1, . . . , xn). Las siguientes son equivalentes:(i) φ(x1, . . . , xn) es equivalente módulo T a una fórmula universal.(ii) Si M ⊆ N son modelos de T y a1, . . . , an ∈ M , entonces N |= φ(a1, . . . , an) implica que M |=

φ(a1, . . . , an).2. T es equivalente a una teoría universal si y sólo si todas las subestructura de un modelo de T es

también un modelo de T .46

Page 47: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Demostración. (1) (i)⇒(ii) Supongamos que φ(x1, . . . , xn) es equivalente a la fórmula ∀y ψ(x, y) dondex = (x1, . . . , xn). Por el Lema 7.8, como M |= N , N |= ∀y ψ(a, y) implica M |= ∀y ψ(a, y).

(ii)⇒(i). Consideremos el lenguaje L(c) que consiste en añadir nuevas constantes c1, . . . , cn a L, y las L(c)-teorías T1 = T ∪ φ(c) y T2 = T ∪ ¬φ(c). Por la condición (ii), no existe un modelo de T2 que seasubestructura de un modelo de T1, y por el Teorema 7.9, existe una L(c)-sentencia universal ψ(c) que se-para T1 de T2. Así, como T1 |= ψ(c) tenemos que T |= ∀x(φ(x → ψ(x)), y como T2 |= ¬ψ(c), se tiene queT |= ∀x(¬φ(x) → ¬ψ(x)).

(2) Dado que las fórmulas universales se preservan bajo subestructura, es claro que si T es una teoría universalentonces cualquier subestructura de un modelo de T es de nuevo un modelo de T . Supongamos ahora que Tes una teoría con esta propiedad, y sea σ una sentencia en T . Si tomamos T1 = T y T2 = ¬σ, por hipótesistenemos que no hay un modelo de T2 que sea subestructura de un modelo de T1, y por Teorema 7.9, existeuna sentencia universal ψ que separa T1 de T2, esto es, T |= ψ y ¬σ |= ¬ψ, esto es, T |= ψ y ψ |= σ. De estamanera, todos los axiomas σ de T se pueden derivar de la teoría

T∀ := ψ ∈ SentL : T |= ψ y ψ es universal.

Ejemplo 7.12. Considere la teoría de órdenes discretos disLO, axiomatizada por los axiomas de órdeneslineales junto a la sentencia

∀x [(∃y(y < x) → ∃u∀y(y < x→ y ≤ u)) ∧ (∃z(x < z) → ∃v∀z(x < z → v ≤ z))]

que afirma que todo elemento que no sea máximo tiene un sucesor inmediato, y todo elemento que no seamínimo tiene un predecesor inmediato.

Por el Teorema 7.9, no existe una sentencia universal que separe disLO de DLO, ó viceversa. En efecto,tenemos que (Z, <) ⊆ (Q, <) ⊆ (Q× Z, <lex), y (Z, <), (Q × Z, <lex) |= disLO y (Q, <) |= DLO.

7.3. Preservación de fórmulas inductivas.

Definición 7.13. Una ∀∃-fórmula (o fórmula inductiva) es una fórmula de la forma ∀y ∃z (ψ(x; y, z)) dondeψ(x, y, z) es una fórmula libre de cuantificadores.

Lema 7.14. Supongamos que σ es una ∀∃-sentencia, y sea (Mi : i ∈ I) una familia dirigida de modelos deσ con M =

⋃i∈I Mi. Entonces M también satisface σ.

Demostración. Escribamos σ = ∀x∃y ψ(x, y). Para cada a ∈ M |x|, existe algún Mi tal que a ∈ M|x|i , y

tenemos entonces que Mi |= ∃y(ψ(a, y), esto es, existe b ∈ Myi tal que Mi |= ψ(a, b). Como ψ es una

fórmula libre de cuantificadores y Mi ⊆ M, M |= ψ(a, b). De esta forma, M |= σ.

Teorema 7.15. Sean T1 y T2 dos teorías. Las siguientes son equivalentes:

1. Existe una ∀∃-sentencia que separa T1 de T2.2. No existe un modelo de T2 que sea unión de una cadena (o de una familia dirigida) de modelos de T1.

Demostración. (1) ⇒ (2) Supongamos que σ es una ∀∃-sentencia que separa T1 de T2, y sea M =⋃i∈I Mi

una unión de una familia dirigida de modelos de T1. Por el Lema 7.14, tenemos que M |= σ, por lo cual Mno puede ser modelo de T2.

(2) ⇒ (1). Si (1) no es cumple, entonces existen modelos M |= T1 y N 0 |= T2 tienen modelos que nopueden ser separados por una ∀∃-sentencia. Como ∃∀-fórmulas son equivalentes a negaciones de ∀∃-fórmulas,tenemos que N 0 ⇒∃∀ M, y por el Lema 7.4 existe un mapa f : N 0 →∀ M0 con M0 ≡ M. Podemos asumirsin pérdida de generalidad que N 0 ⊆ M0 y que f es el mapa inclusión. Entonces, tomando un conjuntode constantes A para los elementos de N 0, tenemos que M0

A ⇒∃ N 0A. Si aplicamos de nuevo el Lema 7.4

a Diag(N 0), podemos obtener una extensión N 1N de M0

N tal que N 1A ≡ N 0

A, es decir, N 0 ≺ N 1. Hemosconstruído entonces la siguiente configuración:

N 0 ⊆ M0 ⊆ N 1

≺47

Page 48: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Aplicando el mismo argumento a M y a N 1, obtenemos dos extensiones M1 ⊆ N 2 con M1 ≡ M y N 1 ≺ N 2.Podemos construír entonces una cadena infinita con la siguiente configuración:

N 0 ⊆ M0 ⊆ N 1 ⊆ M1 ⊆ N 2 ⊆ M2 ⊆ N 3 ⊆ M3 ⊆ · · ·≺ ≺ ≺ ≺

con Mi ≡ M y N i ≺ N i+1. Considere la estructura N ′ :=⋃i<ωMi =

⋃i<ωN i. Tenemos entonces que N ′

es la unión de una cadena ⊆-creciente de modelos de T1, pero también es un modelo de T2 pues es la uniónde la cadena elemental 〈N i : i < ω〉 de modelos de T1. Esto contradice (2).

Teorema 7.16. Sea T una teoría.

1. Para toda sentencia σ, las siguientes son equivalentes:(i) σ es equivalente módulo T a una ∀∃-sentencia.(ii) Si M0 ⊆ M1 ⊆ · · · es una cadena ⊆-creciente de modelos de T ∪ σ cuya unión M es también

modelo de T , entonces M satisface σ.2. T es cerrada bajo uniones de cadenas ⊆-creciente si y sólo si T puede ser axiomatizada por ∀∃.

Demostración. (1) Por el Lema 7.14 las ∀∃-fórmulas son preservadas bajo uniones de cadenas, por lo que setiene que (i) implica (ii). Para el recíproco, consideremos las teorías T1 = T ∪ σ y T2 = T ∪ ¬σ. Por(ii), la unión de una cadena ⊆-creciente de modelos de T1 no puede ser un modelo de T2, y por el Lema 7.14existe una ∀∃-sentencia τ que separa T1 de T2. Así, T |= σ → τ , mientras que T |= ¬τ → ¬σ.

(2) Por el Lema 7.14, si T es axiomatizada por ∀∃-sentencias entonces es cerrada bajo uniones de cadenas⊆-crecientes. Supongamos ahora que T es cerrado bajo uniones de cadenas, y sea σ una sentencia en T .Tenemos entonces que ninguna unión de modelos de T puede ser un modelo de ¬σ. Así, por el Teorema 7.16,existe una ∀∃-sentencia τ tal que T |= ψ y ¬σ |= ¬ψ. De esta forma, cada uno de los axiomas de T se puedenderivar de la teoría

T∀∃ := ψ ∈ SentL : T |= ψ, y ψ es una ∀∃-fórmula.

7.4. Eliminación de cuantificadores.

Definición 7.17. Una teoría T tiene eliminación de cuantificadores (en el lenguaje L) si toda L-fórmulaφ(x1, . . . , xn) es equivalente módulo T a una teoría ρ(x1, . . . , xn) libre de cuantificadores.

Ejemplo 7.18. En general la fórmula φ(x) := ∃y(x < y) en el lenguaje L = < no es equivalente a ningunafórmula libre de cuantificadores. Sin embargo, módulo la teoría DLO, esta fórmula es equivalente a x = x,pues cada elemento en un modelo de DLO tiene elementos que son mayores.

Ejemplo 7.19. Considere la fórmula φ(a, b, c) := ∃x(ax2 + bx+ c = 0).

Módulo la teoría ACF, φ(a, b, c) es equivalente a la fórmula a 6= 0.Módulo la teoría T = Th(R,+, ·, 0, 1, <), φ(a, b, c) es equivalente a la fórmula b2 − 4ac > 0.

Comentario 7.20. Para n = 0, eliminación de cuantificadores implicaría que cada sentencia es equivalentemódulo T a una sentencia libre de cuantificadores. Si L no tiene constantes, ⊤ y ⊥ son las únicas sentenciassin cuantificadores, y en este caso T sólo puede ser completa, o inconsistente.

Comentario 7.21. Es fácil convertir cualquier teoría T en una teoría con eliminación de cuantificadores,simplemente expandiendo el lenguaje. Si añadimos a L un símbolo de relación n-aria Rφ por cada L-fórmulaφ(x1, . . . , xn), y añadimos a T los axiomas

∀x1, . . . , xn(Rφ(x1, . . . , xn) ↔ φ(x1, . . . , xn)).

La teoría resultante se conoce como la Morleyzación Tm de T , y claramente tiene eliminación de cuantifica-dores. Más aún, muchas de las propiedades de T no se ven afectadas por la Morleyzación. Por ejemplo, T escompleta si y sólo si Tm es completa. Similarmente para κ-categoricidad, y otras propiedades que veremosmás adelante.

Definición 7.22. Un modelo primo de T es una estructura que puede sumergirse en cualquier modelo de T .

Ejemplo 7.23.48

Page 49: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Si T es una teoría ℵ0-categórica, el único modelo contable M de T es un modelo primo de T .

Para la teoría ACF0, M = (Qalg,+·, 0, 1) es un modelo primo. Similarmente, Fp

alges un modelo primo

de ACFp.El grupo (Q,+) es un modelo primo para la teoría DAG de grupos abelianos divisibles.

Lema 7.24. Si T es una teoría consistente con eliminación de cuantificadores que tiene un modelo primoentonces T es completa.

Demostración. EJERCICIO

Definición 7.25. Una fórmula existencial simple es una fórmula que tiene la forma φ(x) = ∃y(ρ(x, y)) dondeρ es una fórmula libre de cuantificadores. Si ρ es una conjunción de fórmulas básicas (es decir, una conjunciónde fórmulas atómicas o negaciones de atómicas), decimos que φ es una fórmula existencial primitiva.

Lema 7.26. Una teoría T tiene eliminación de cuantificadores si y sólo si toda fórmula existencial primitivaes equivalente módulo T a una fórmula libre de cuantificadores.

Demostración. La dirección de izquierda a derecha se sigue de las definiciones. Para mostrar la otra dirección,probaremos por inducción que toda fórmula es equivalente módulo T a una fórmula libre de cuantificadores.Para fórmulas sin cuantificadores, la condición se cumple trivialmente, por lo que basta considerar el caso deun cuantificador.

Antes de hacer este paso, note que ∃y (ρ1 ∨ ρ2) es equivalente a (∃y ρ1) ∨ (∃ρ2). Así, si ρ es una fórmula sincuantificadores, entonces usando la forma normal prenexa tenemos que

∃y ρ ≡ ∃y

i≤kρi

i≤k(∃y ρi) .

Supongamos el resultado para la fórmula ψ(x, y), y supongamos que φ(x) := ∃y(ψ(x, y)). Por hipótesis deinducción, existe una fórmula ρ′(x, y) libre de cuantificadores tal que T |= ∀x, y [ψ(x, y) ↔ ρ′(x, y)]. Así,∃y ψ(x, y) es equivalente módulo T a ∃y(ρ′(x, y) ≡ ∨i≤k(∃y ρ′i(x, y)). Por hipótesis, cada fórmula existencialprimitiva es equivalente a una fórmula libre de cuantificadores, existen fórmulas ρ1(x), . . . , ρk(x) tales quepara cada i ≤ k, ρi(x) es equivalente a ∃y ρ′i(x, y) módulo T , y φ(x) es equivalente módulo T a la fórmula∨i≤k ρi(x), que es libre de cuantificadores.

Proposición 7.27. La teoría INF de conjuntos infinitos, en el lenguaje de pura igualdad L = , tieneeliminación de cuantificadores

Demostración. Supongamos que φ(x1, . . . , xn) es una fórmula primitiva existencial. Esto es, φ = ∃y ψ(y, x)donde ψ es una conjunción de fórmulas atómicas y negaciones de atómicas. Dado que las únicas fórmulasatómicas son de la forma z1 = z2 (una variable igual a otra variable), podemos suponer que ψ(y, x) es unaconjunción de la forma:

ψ(y, x) :=∧

i∈I1y = xi ∧

j∈I2¬(y = xj) ∧

r∈J1xr1 = xr2 ∧

s∈J2¬(xs1 = xs2).

donde ∅ ⊆ I1, I2 ⊆ 1, . . . , n y ∅ ⊆ J1, J2 ⊆ 1, . . . , n2. Note que las dos primeras conjunciones nomencionan la variable y. De esta manera, si a1, . . . , an es una tupla de elementos en un modelo M |= INF,tenemos dos casos:

1. Si I1 6= ∅, entonces i0 ∈ I1 para algún 1 ≤ i0 ≤ n, y tendríamos que

∃y ψ(y, x) ≡∧

i∈I1xi0 = xi ∧

j∈I2¬(xi0 = xj) ∧

r∈J1xr1 = xr2 ∧

s∈J2¬(xs1 = xs2).

2. Si I1 = ∅, entonces dado que M tiene más de |I1| elementos, tendremos que

∃y ψ(y, x) ≡∧

r∈J1xr1 = xr2 ∧

s∈J2¬(xs1 = xs2)

pues dado que INF |= ∀x1, . . . , xn∃y (y 6= x1 ∧ · · · ∧ y 6= xn), para cualquier para cualquier tupla a quesatisfaga las últimas dos conjunciones es posible encontrar un elemento b que sea distinto de a1, . . . , an.

De esta manera, como cada fórmula primitiva existencial es equivalente (módulo INF) a una fórmula sincuantificadores, la teoría INF tiene eliminación de cuantificadores.

49

Page 50: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Proposición 7.28. La teoría de ordenes lineales densos sin extremos tiene eliminación de cuantificadores.

Demostración. De nuevo, sea φ(x) = ∃y ψ(y, x) donde ψ es una conjunción de fórmulas atómicas y negacionesde atómicas. En el lenguaje L = <, tenemos las siguientes fórmulas básicas:

z1 < z2, ¬(z1 < z2) ≡DLO (z2 ≤ z1) ≡ (z2 < z1 ∨ z1 = z2),z1 = z2, ¬(z1 = z2) ≡DLO (z1 < z2 ∨ z2 < z1).

De esta manera, y luego de distribuir el cuantificador existencial en las disyunciones, podemos suponer sinpérdida de generalidad que ψ(y, x) es una conjunción de la forma:

ψ(y, x) :=∧

i∈I1y = xi ∧

j∈I2xj < y ∧

k∈I3y < xk ∧ θ(x1, . . . , xn)

donde θ(x) es una conjunción de fórmulas básicas que no mencionan la variable y. Tenemos entonces dosposibilidades:

1. Si I1 6= ∅, entonces existe i0 ∈ I1 y tendríamos que

∃y ψ(y, x) ≡∧

i∈I1xi0 = xi ∧

j∈I2xj < xi0 ∧

k∈I3xi0 < xk ∧ θ(x1, . . . , xn).

2. Si I1 = ∅, entonces como DLO |= ∀x1, x2(x1 < x2 → ∃y(x1 < y < x2)) (es decir, como todos losmodelos de DLO son órdenes lineales densos) tenemos que

ψ(y, x) :=

j∈I2,k∈I3xj < xk

∧ θ(x1, . . . , xn).

Así, como toda <-fórmula primitiva existencial es equivalente módulo DLO a una fórmula sin cuantifica-dores, concluímos que DLO tiene eliminación de cuantificadores.

La pregunta natural que nos podríamos hacer en este punto es la siguiente: ¿de qué nos sirve saber quecierta teoría T tiene eliminación de cuantificadores en cierto lenguaje L? En teoría de modelos, el métodode eliminación de cuantificadores ha sido usado para obtener el siguiente tipo de resultados:

(a) Clasificación módulo equivalencias elementales: Supongamos que M y N son modelos de T , pero Ano es elementalmente equivalente a N . Entonces, debe existir una combinación booleana de senten-cias sin cuantificadores que es cierta en M y falsa en N . Usualmente estas sentencias corresponden apropiedades “algebraicas” de las estructuras, y habríamos reducido la noción de equivalencia elemen-tal a un conjunto de propiedades puramente algebraicas. Por ejemplo, Tarski probó que dos camposalgebraicamente cerrados son elementalmente equivalentes si y sólo si tienen la misma característica.

(b) Descripción de conjuntos definibles y tipos: Normalmente las fórmulas sin cuantificadores son másfáciles de entender, ya que se construyen por medio de operaciones booleanas de fórmulas atómicas.Así, eliminación de cuantificadores nos daría una forma efectiva de describir los conjuntos definiblesa través de las fórmulas atómicas, y los tipos estarían caracterizados por las fórmulas atómicas quecontengan. Por ejemplo, Tarski probó que en el campo de los números reales, todo conjunto definibleX ⊆ R se puede escribir como una unión finita de intervalos y puntos.

(c) Descripción de inmersiones elementales: Si sabemos que una teoría T tiene eliminación de cuantifica-dores, entonces las inmersiones elementales son precisamente aquellas que respetan las combinacionesbooleanas de relaciones atómicas.

Por ejemplo, del hecho de saber que DLO tiene eliminación de cuantificadores, podemos deducir que cualquierconjunto definible en una variable es una unión finita de intervalos y puntos: toda fórmula φ(x, a1, . . . , an)es de la forma

φ(x, a) :=∨

i

j

θij(x, a)

donde θij(x, a) es una de las fórmulas x = ai, x < ai, ai < x. Si hay alguna igualdad, en la conjunciónresultará el conjunto vacío ó un punto. Si en la conjunción sólo aparecen desigualdades, entonces al resultadoserá vacío o un intervalo.

50

Page 51: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Además, podemos deducir también que la lista de tipos completos dados en el Ejemplo 5.11 es completa, esdecir, cualquier tipo completo es equivalente a uno de los mencionados allí.

Proposición 7.29. La teoría EQUIV de una relación de equivalencia con infinitas clases de infinitos ele-mentos cada una en el lenguaje L = E tiene eliminación de cuantificadores.

Demostración. EJERCICIO

Teorema 7.30. La teoría RG del grafo aleatorio tiene eliminación de cuantificadores.

Demostración. EJERCICIO

Como ya vimos en los ejemplos anteriores, eliminación de cuantificadores es una propiedad acerca del nivelde deducción de un sistema de axiomas. Esto la hace una propiedad predominantemente sintáctica y nospodría impedir usar propiedades estructurales que ya conozcamos de los modelos de una teoría. En particular,este método no nos permite explotar ninguna información entre los mapas de modelos de T . Por ejemplo, laprueba de Tarski de que los campos algebraicamente cerrados tienen eliminación de cuantificadores se basabaen un estudio exhaustivo de ecuaciones polinomiales. (ver Tarski)Abraham Robinson pensó en un enfoque diferente. Para muchas teorías interesantes, tenemos informaciónestructural importante sobre los modelos de T : teoremas de descomposición, descripción de clausuras alge-braicas, o resultados sobre cuando un modelo se puede sumergir en otro. El mensaje de Robinson era entoncesel siguiente: para probar eliminación de cuantificadores, usemos un enfoque netamente semántico basado enpropiedades de los modelos de T (y no de las fórmulas en T ), y tratemos de usar todas las propiedadesalgebraicas de los modelos de T para este fin.

A continuación veremos algunos criterios para eliminación de cuantificadores basados en mapas elementalesy extensiones de L-estructuras. Recordemos que si M es una L-estructura y A ⊆M , denotamos por MA laL(A)-estructura obtenida al nombrar los elementos de A por nuevas constantes.

Teorema 7.31. Para una teoría T , las siguientes son equivalentes:

1. T tiene eliminación de cuantificadores.2. Si M1 y M2 de T con una subestructura común A entonces M1

A ≡ M2A.

3. Si M1,M2 son modelos de T con una subestructura común A y φ(x1, . . . , xn), entonces para todoa1, . . . , an ∈ A tenemos que M1 |= φ(a1, . . . , an) implica M2 |= φ(a1, . . . , an).

Si L no tiene constantes, A podría ser la “estructura vacía”.

Demostración. (1) ⇒ (2). Sea φ(a) una L(A)-sentencia que vale en M1, y escojamos una fórmula libre decuantificadores ρ(x) que es equivalente a φ(x) módulo T . Así, como M1,M2 |= T , tenemos que

M1 |= φ(a) ⇒ M1 |= ρ(a) (porque φ es equivalente a ρ módulo T )

⇒ A |= ρ(a) (porque ρ es libre de cuantificadores.)

⇒ M2 |= ρ(a)

⇒ M2 |= φ(a).

(2) ⇒ (3). Es claro, porque para una L-fórmula φ(x1, . . . , xn) y a1, . . . , an ∈ A, φ(a1, . . . , an) se convierte enuna L(A)-sentencia.

(3) ⇒ (1). Sea φ(x1, . . . , xn) una fórmula primitiva existencial. Para probar que φ(x) es equivalente móduloT a una fórmula libre de cuantificadores ρ(x), es suficiente extender L con una n-tupla c de nuevas constantesc1, . . . , cn y mostrar que las L(c)-teorías T ∪ φ(c) y T ∪ ¬φ(c) se pueden separar por una L(c)-sentenciaρ(c) libre de cuantificadores. Para esto, aplicaremos el Lema de Separación. Sean M1,M2 dos modelos deT con dos n-tuplas distinguidas a1, a2. Supongamos que (M1, a1) y (M2, a2) satisfacen las mismas L(c)-sentencias libres de cuantificadores. Mostraremos que M1 |= φ(a1) implica que M2 |= φ(a2).Considere las estructuras generadas por las tuplas a1 y a2, A1 = 〈a1〉M1〉 y A2 = 〈a2〉M2

. Si podemosmostrar que existe un isomorfismo f : A1 → A2 que envía a1 en a2, podríamos asumir que A1 = A2 = A ya1 = a2 = a, y el resultado se sigue de (3).

Cada elemento de A1 tiene la forma tM1

(a1) para un L-término t(x). Podemos definir entonces una funciónf : A1 → A2 como f(tM

1

(a1)) = tM2

(a2). Tenemos por definición que f(a1) = a2. Además, f está bien51

Page 52: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

definida: si s(a1) = t(a1) para dos L-términos s(x), t(x), entonces (M∞, a1) |= s(a1) = t(a1), y por lashipótesis, (M2, a2) |= s(a2) = t(a2), por lo que f(sM

1

(a1)) = f(tM1

(a1). Si intercambiamos los roles de M1

y M2, esto también muestra que f es inyectiva. Para ver sobreyectividad, basta con darnos cuenta que sia′ ∈ A2, a′ = tM

2

(a2) para algún L-término t(x), por lo cual a′ = f(tM1

(a1)).

Para terminar, supongamos que R es una relación m-aria, y tM1

1 (a1), . . . , tM1

m (a1) una tupla de m elementosen A1. Tenemos entonces que

(tM1

1 (a1), . . . , tM1

m (a1)) ∈ RA1

⇔ M1 |= R(tM1

1 (a1), . . . , tM1

m (a1))

⇔ (M1, a1) |= R(tM1

1 (c), . . . , tM1

m (c)) (como L(c)-estructuras)

⇔ (M2, a2) |= R(tM1

1 (c), . . . , tM1

m (c)) (Por que es una L(c)-fórmula sin cuantificadores)

⇔ M2 |= R(tM2

1 (a2), . . . , tM2

m (a2))

⇔ M2 |= R(tM2

1 (a2), . . . , tM2

m (a2))

⇔ M2 |= R(f(tM1

1 (a1)), . . . , f(tM1

m (a1)))

⇔ (f(tM1

1 (a1)), . . . , f(tM1

m (a1))) ∈ RA2

.

De esta forma, f : A1 → A2 es un isomorfismo, y esto concluye la prueba.

Teorema 7.32. Sea T una L-teoría consistente. Las siguientes son equivalentes:

1. T tiene eliminación de cuantificadores2. Si M1,M2 son modelos de T y f : A1 = 〈a1, . . . , an〉 → A2 = 〈a′1, . . . , a′n〉 es una L-inmersión entre

dos estructuras finitamente generadas de M1,M2 (respectivamente), entonces para todo b ∈ M1 existeuna extensión elemental M2 ≺ M′

2 y una L-inmersión g : 〈A1, b〉 → M′2 que extiende f .

M′2

M1 ⊇ 〈A1, b〉 M2

A1

f

g ≺

id

Demostración. Usaremos la parte (3) de las equivalencias en el Teorema 7.31.

(⇒) Por el Lema de “cortar y pegar”, podemos suponer sin pérdida de generalidad que M1,M2 con unasubestructura finitamente generada común A1 = 〈a1, . . . , an〉 ∼= 〈a′1, . . . , a′n〉 = A2. Dado b ∈ M1, considereel tipo p(x) = tpM1

(b/a1, . . . , an). Por eliminación de cuantificadores, para cada fórmula ψ(x, a) ∈ p(x),tenemos que M1 |= ∃x(φ(x, a)) implica M2 |= ∃xψ(x, a). Esto muestra que p(x) es un conjunto de fórmulasfinitamente satisfactible en M2, y por lo tanto existe una extensión elemental M′

2 de M2 que realiza p(x).Sea c ∈M ′

2 una realización de p(x). Tenemos entonces que

M1 |= φ(b, a1, . . . , an) ⇔ φ(x, a1, . . . , an) ∈ p(x) ⇔ M′2 |= φ(c, a1, . . . , an),

por lo que la L-inmersión f puede extenderse a una L-inmersión g : 〈A1, b〉 → M′2 tal que g(b) = c.

(⇐). Sean M1,M2 |= T con una subestructura común A. Veremos por inducción que si φ(x1, . . . , xn) esuna L-fórmula y a1, . . . , an ∈ A, entonces M1 |= φ(a1, . . . , an) implica M2 |= φ(a1, . . . , an). Dado que lasatisacción de fórmulas sin cuantificadores se transfiere en subestructuras, tenemos que si φ(x1, . . . , an) eslibre de cuantificadores entonces

M1 |= φ(a1, . . . , an) ⇒ A |= φ(a1, . . . , an) ⇒ M2 |= φ(a1, . . . , an).52

Page 53: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Supongamos ahora el resultado para ψ(x1, . . . , xn; y) y consideremos la fórmula φ(x) := ∃y ψ(x1, . . . , xn; y).Si M1 |= φ(a), entonces existe un elemento b ∈ M1 tal que M1 |= ψ(a, b). Por hipótesis, la L-inmersiónf = id : 〈a1, . . . , an〉M1

= 〈a1, . . . , an〉M2puede extenderse a una L-inmersión g : 〈a1, . . . , an, b〉 → M′

2,donde M2 ≺ M′

2. Así,

M1 |= ψ(a1, . . . , an, b) ⇒ M′2 |= ψ(g(a1), . . . , g(an), g(b)) ⇒ M′

2 |= ψ(a1, . . . , an, g(b))

⇒ M′2 |= ∃y ψ(a1, . . . , an, y)

⇒ M2 |= ∃y ψ(a1, . . . , an, y),por lo cual M2 |= φ(a1, . . . , an). Concluímos entonces que T tiene eliminación de cuantificadores.

EJERCICIO: Criterio con modelos saturados A manera de ejemplo, tenemos lo siguiente:

Proposición 7.33. Si K es un campo infinito, la teoría VECK de K-espacios vectoriales tiene eliminaciónde cuantificadores.

Demostración. Sean M1,M2 |= VECK y sea f : A = 〈a1, . . . , an〉 → M2 una LK−vs-inmersión de unasubestructura finitamente generada de M1 en M2. Note que la estructura A corresponde precisamente conel espacio vectorial generado por a1, . . . , an. Si b ∈ M1, y tenemos dos opciones:

Si b ∈ 〈a1, . . . , an〉, existe un LK−vs-término t(x1, . . . , xn) tal que b = tM1(a1, . . . , an). Se sabe queestos términos son de la forma λ1 · a1 + · · ·λnan para algunos coeficientes α1, . . . , αn ∈ K, por lo cualb ∈ A, y podríamos simplemente tomar g = f .Si b 6∈ 〈a1, . . . , an〉 tenemos dos casos: o bien 〈f(a1), . . . , f(an)〉 = M2 ó 〈f(a1), . . . , f(an)〉 ) M2.En el segundo caso, basta con tomar cualquier elemento c ∈ M2 \ 〈f(a1), . . . , f(an)〉, existirá unainmersión g : 〈A, b〉 → M2 tal que g(b) = c y extiende f . De hecho, este mapa estará definidoexplícitamente como

g(α1 · a1 + · · ·αn · an + β · b) := α1 · f(a1) + · · · + αn · f(an) + β · c.Si M2 = 〈f(a1), . . . , f(an)〉, podemos considerar el conjunto de fórmulas

Σ(x) := x 6= α1 · f(a1) + · · ·+ αn · f(an) : α1, . . . , αn ∈ K.Si Σ0 es un subconjunto finito de Σ, entonces existe un número finito de tuplas α ∈ Kn que aparecenmencionadas en fórmulas de Σ0. Así, como K es infinito, existe un elemento β que es diferente de losfinitos escalares mencionados en Σ0. De esta forma, si ai ∈ A \ 0, entonces β · f(ai) realiza Σ0 enM2. Esto muestra que Σ(x) es finitamente satisfactible en M2, y existe una extensión elemental M′

2

de M2 que realiza Σ. Si c ∈M ′2 es una realización de Σ(x), entonces por el argumento anterior existe

una LK−vs-inmersión g : 〈A, b〉 → M′2 que extiende a f .

Así, por el criterio dado por Teorema 7.32, VECK tiene eliminación de cuantificadores.

Teorema 7.34. La teoría DAG de grupos abelianos divisibles tiene eliminación de cuantificadores.

Demostración. La prueba se sigue del Teorema 7.32, y es similar a la prueba para VECK si tenemos en cuentaque todo grupo abeliano divisible puede verse como un Q-espacio vectorial.

Teorema 7.35. La teoría DOAG de grupos abelianos divisibles ordenados tiene eliminación de cuantificado-res.

Definición 7.36. Una teoría T se dice modelo completa si para cualquier par de modelos M1,M2 |= T conM1 ⊆ M2 se tiene que M1 ≺ M2.

Ejemplo 7.37. Por ejemplo, cualquier teoría que elimine cuantificadores es modelo completa.

Note que T es modelo completa si y sólo si para todo M |= T , la L(M)-teoría T ∪Diag(M) es completa.

Lema 7.38. (Test de Robinson) Sea T una teoría. Las siguientes son equivalentes:

1. T es modelo completa.2. Si M1 ⊆ M2 son ambos modelos de T y φ es una fórmula existencial en L(M1),

M2 |= φ implica M1 |= φ.

3. Cada fórmula es equivalente, módulo T , a una fórmula universal53

Page 54: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Demostración. (1) ⇒ (2). Supongamos que M2 |= ∃xψ(x, a) donde a ∈ M1 y ψ(x, y) es una fórmula li-bre de cuantificadores. Como T es modelo completa y M1 ⊆ M2, tenemos que M1 ≺ M2 y por lo tantoM1 |= ∃xψ(x, a).

(2) ⇒ (3). Por (2) y por Teorema 7.11, tenemos que toda fórmula existencial es equivalente módulo T auna fórmula universal. Veremos por inducción que toda fórmula φ(x1, . . . , xn) es equivalente a una fórmulauniversal. Dado que toda fórmula sin cuantificadores es universal, sólo basta hacer el paso inductivo concuantificadores. Supongamos el resultado para ψ(x, y), y sea φ(x) := ∃y ψ(x, y). Tenemos entonces unafórmula sin cuantificadores ρ(x, y, z) tal que ψ(x, y) es equivalente módulo T a ∀z ρ(x, y, z), esto es,

φ(x) ≡ ∃y ψ(x, y) ≡ ∃y∀z ρ(x, y, z).Tomando negaciones, y usando el hecho de que fórmulas existenciales son equivalentes a fórmulas universales,existe una fórmula sin cuantificadores θ(x,w, y) tal que

¬φ(x) ≡ ∀y ∃z (¬ρ(x, y, z)) ≡ ∀y ∀w (θ(x, y, w)).

De esta manera, φ(x) ≡ ∃y ∃w, (¬θ(x, y, w)), y tendremos que φ(x) es equivalente a una fórmula universal.

(3) ⇒ (1). Supongamos que M1 ⊆ M2 son modelos de T y sea φ(x) una fórmula. Por (3), existe una fórmulauniversal ∀y ψ(x, y), que es equivalente a φ(x). Así, para cada a ∈M1 se tiene que

M2 |= φ(a) ⇒ M2 |= ∀y ψ(a, y)⇒ M1 |= ∀y ψ(a, y) (por transferencia de fórmulas universales)

⇒ M1 |= φ(a).

De esta manera, M1 ≺ M2.

Definición 7.39. Si M1 ⊆ M2 satisface la propiedad (2), decimos que M1 es existencialmente cerrado enM2. Esto se denota como M1 ≺1 M2.

Definición 7.40. Sea T una teoría. Una teoría T ∗ es una modelo compañera de T si las siguientes condicionesse cumplen:

(a) Cada modelo de T puede ser extendido a un modelo de T ∗.(b) Cada modelo de T ∗ puede ser extendido a un modelo de T .(c) T ∗ es modelo completa.

Ejemplo 7.41. La modelo compañera de la teoría de órdenes lineales es DLO: Como DLO tiene eliminaciónde cuantificadores, también es modelo completa. Además, si (M,<) es un orden lineal, entonces (M,<) puedesumergirse en (M × Q, <lex) bajo el mapa x 7→ (x, 0). Ahora, si (M,<) |= DLO, esta estructura ya es unmodelo de la teoría de órdenes lineales.

Teorema 7.42. Una teoría T tiene máximo una modelo compañera T ∗, salvo equivalencia.

Demostración. Supongamos que T+ y T ∗ son dos modelo compañeras de T . Veremos primero que todomodelo de T+ es un modelo de T ∗. Sea M0 un modelo de T+. Por hipótesis, M0 puede extenderse a unmodelo de T , que a su vez se extiende a un modelo N0 de T ∗. Recíprocamente, existe un modelo M1 de T+

tal que N0 ⊆ M1. Siguiendo con este proceso encontramos cadenas 〈Mi : i < ω〉 y 〈Ni : i < ω〉 tales que

M0 ⊆ N0 ⊆ M1 ⊆ N1 ⊆ · · ·Tenemos entonces que M =

⋃i<ωMi =

⋃i<ωNi. Además, como T ∗, T+ son modelo completas y Mi ⊆

Mi+1, Ni ⊆ Ni+1, tenemos que para todo i se cumple que Mi ≺ Mi+1, Ni ≺ Ni+1, por lo cual las cadenasson elementales y tenemos que M0,N0 ≺ M. En particular, M0 |= T ∗.

Intercambiando los papeles de T+ y T ∗ obtendríamos que todo modelo de T ∗ es un modelo de T+. Así, comoT+ y T ∗ tienen los mismo modelos, concluímos que T ∗ y T+ son teorías equivalentes.

7.5. Campos algebraicamente cerrados.

Teorema 7.43 (Tarski). La teoría ACF de campos algebraicamente cerrados tiene eliminación de cuantifi-cadores.

54

Page 55: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Demostración. Sean K1 y K2 dos campos algebraicamente cerrados, y R = 〈a1, . . . , an〉 un subanillo comúnfinitamente generado. Sean F1, F2 los campos de fracciones de R en los campos K1,K2, respectivamente. Elmapa id : R → R se puede extender de forma canónica a un mapa f : F1 → F2. Sea b ∈ K1. Tenemos doscasos:

Si b es algebraico sobre F1, entonces existe un polinomio irreducible p(x) = a0 + a1x + · · · anxn concoeficientes en F1 tal que p(b) = 0. Como deg(p) = n, entonces el campo F1(bc) es generado comoespacio vectorial sobre F1 por la base 1, b, b2, . . . , bn−1. Como K2 es algebraicamente cerrado, existeun elemento c ∈ K2 tal que f(p)(c) = f(a0)+ f(a1)c+ · · ·+ f(an)c

n = 0. Dado que f es un mapa quepreserva fórmulas sin cuantificadores, en particular preserva sumas y productos, por lo que p(x) es irre-ducible si y sólo si f(p)(x) es irreducible. De esta manera, F2(c) se genera como F2-espacio vectorial porla base 1, c, c2, . . . , cn−1. Podemos entonces definir un isomorfismo g : F1(b) → F2(c) ⊆ K2 dado porg(a0+a1b+· · · an−1b

n−1) := f(a0)+f(a1)c+· · ·+f(an−1)cn−1, que claramente extiende a f : F1 → F2.

Si b es trascendente sobre F1, entonces b no es raíz de ningún polinomio con coeficientes en F2.Consideremos entonces el conjunto de Lr(F2)-fórmulas dado por

Σ(x) := f(a0) + f(a1)x+ · · ·+ f(an)xn 6= 0 : a0, . . . , an ∈ F1, n < ω.

Si Σ0 es un subconjunto finito de Σ, entonces menciona un conjunto finito de parámetros, y para unapotencia k suficientemente grande tendremos que f(ai)k no es raíz de ninguno de los polinomios queaparecen en Σ0. De esta forma, Σ(x) es finitamente satisfactible, y debe existir una extensión elementalK ′

2 de K2 que realiza Σ(x). Si c ∈ K2 es una realización, entonces c es un elemento trascendente sobreF2. De esta forma, existe un isomorfismo g : F1(b) → F2(c) ⊆ K2 que extiende a f y tal que g(b) = c.10

De esta forma, por el Teorema 7.32, la teoría ACF tiene eliminación de cuantificadores.

Corolario 7.44. La teoría ACF es modelo completa.

Demostración.

Note sin embargo que la teoría ACF no es completa, ya que por ejemplo no puede decidir la sentenciaσ := 1+1+1 = 0. Sin embargo, esta es la única obstrucción y se pueden caracterizar fácilmente las posiblescompletaciones de ACF.

Corolario 7.45. Las teorías ACF0 y ACFp (para un primo p) son las únicas posibles completaciones de ACF.

Demostración. La teoría ACF0 tiene eliminación de cuantificadores, y tiene como modelo primo Qalg

. Por

el Lema 7.24, ACF0 es completa. Similarmente, como ACFp tiene como modelo primo Fpalg

, esta teoría escompleta. Para ver que éstas son las únicas completaciones, basta tomar un modelo K |= ACF y darse cuentaque, o bien K tiene característica 0 y K |= ACF0, ó K tiene característica prima p y K |= ACFp.

Una consecuencia natural de este corolario es un hecho que ya habíamos mencionado antes: dos camposalgebraicamente cerrados son elementalmente equivalentes si y sólo si tienen la misma característica.

Corolario 7.46 (Teorema de los ceros de Hilbert). Si K un campo, entonces cualquier ideal propio I de

K[X1, . . . ,Xn] tiene un cero en la clausura algebraica Kalg

.

Demostración. Sea P un ideal maximal de K[X1, . . . ,Xn] que contiene a I, y considere el campo cocienteL = K[X1, . . . ,Xn]/P . Si I es generado por los polinomios f1, . . . , fk, entonces

L |= ∃x1, . . . , xn∧

1≤i≤kfi(x1, . . . , xn) = 0,

pues este existencial es atestiguado por la tupla x1 = X1/P, . . . , xn = Xn/P en L. Como esta fórmula es

existencial con parámetros enK ⊆ L, también se cumple en Lalg

. Podemos suponer además queKalg ⊆ L

alg, y

como ACF es modelo completa, esto implica que Kalg ≺ Lalg. En particular, existe una tupla c1, . . . , cn ∈ Kalg

tal queK |=

1≤i≤kfi(c1, . . . , cn),

esto es, (c1, . . . , cn) ∈(K

alg)n

es un cero del ideal I.

10Si b es trascendente sobre F , entonces F (b) es el campo de fracciones del anillo F [b], que como espacio vectorial sobre Fes generado por la base infinita 1, b, b2, . . .. Cada elemento de F [b] es de la forma p(b) donde p(X) ∈ F [X].

55

Page 56: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Definición 7.47. Sea K un campo algebraicamente cerrado y S un subconjunto de Kn. Decimos que S esconstruíble si es una combinación booleana de ceros de polinomios con coeficientes en K.

Corolario 7.48 (Chevalley). Sea K un campo algebraicamente cerrado. Si S es un conjunto construíble deKn y si h = (h1, . . . , hm) es un mapa polinomial sobre K de Kn en Km, entonces h(S) es un conjuntoconstruíble sobre Km.

Demostración. Como h es sobre K, los coeficientes de los polinomios h1, . . . , hm están en K. Sea S(x)lafórmula en L(K) que define al conjunto S. Entonces h(S) es definida con coeficientes en K por la L(K)-fórmula

θ(y1, . . . , ym) := ∃x1 . . . ∃xn (h1(x) = y1 ∧ · · · ∧ hm(x) = ym ∧ S(x))) .Por eliminación de cuantificadores, θ(y1, . . . , ym) es una combinación booleana de fórmulas atómicas, y comotodas las fórmulas atómicas en L(K) se pueden escribir de la forma p(x1, . . . , xk) = 0 para algún polinomioK[X1, . . . ,Xk], concluímos que h(S) es construíble.

7.6. Campos real cerrados. Veremos que la teoría RCF de campos real cerrados tiene eliminación decuantificadores, y como (R,+, ·, 0, 1, <) |= RCF, esto será particularmente útil para el estudio de conjuntosdefinibles en R. Sin embargo, para llevar a cabo la demostración es necesario estudiar algunos temas clásicosde campos formalmente reales.

Definición 7.49. Sea R un dominio de integridad. Un orden lineal < se dice compatible con la estructurade anillo de R si (R,+, ·, 0, 1, <) satisface las siguientes propiedades:

∀x, y, z (x < y → x+ z < y + z),

∀x, y, z (x < y ∧ 0 < z → xz < yz).

Lema 7.50. Si R es un dominio de integridad y < es un orden compatible, entonces < se puede extender deforma única a un orden compatible en el campo de fracciones F de R.

Demostración. Basta con ponera

b> 0 si y sólo si a · b > 0, y demostrar que en efecto este orden está bien

definido y es compatible con las operaciones en F . EJERCICIO

Ejercicio 7. En un campo ordenado (K,<), tenemos las siguientes propiedades:

1. 0 no es el máximo: Deben existir elementos x, y ∈ K tales que x < y, y tomando z = −x tendríamosque x+ (−x) = 0 < y + (−x).

2. Si x > 0 entonces −x < 0, y viceversa: Si 0 < x entonces tomando z = (−x) tendremos que0 + (−x) = −x < 0 = x+ (−x).

3. 1 > 0: Si 1 < 0, entonces −1 > 0 y tendríamos que 1 · (−1) < 0 · (−1), lo que sería −1 < 0. Absurdo.4. Los elementos cuadrados son positivos: En efecto, si x > 0 entonces 0 · x = 0 < x · x = x2, y si x < 0,

−x > 0 y tendremos que 0 = 0 · (−x) < (−x) · (−x) = x2.

Comentario 7.51. En un campo ordenado (K,<) las sumas de cuadrados son positivos. En particular,0 < 1 < 2 < 3 < · · · , por lo cual todo campo ordenado tiene característica 0.

Definición 7.52. Un campo K se dice formalmente real si −1 no puede escribirse como una suma (finita)de cuadrados.

Lema 7.53. Un campo admite un orden lineal compatible si y sólo si es formalmente real.

Demostración. Ya vimos que si (K,<) es un campo ordenado entonces −1 < 0 no puede ser una suma decuadrados. Para el recíproco, notemos primero que si Σ es el conjunto de suma de cuadrados en K, entoncesΣ es un semi-cono positivo, esto es, un conjunto P que satisface las siguientes condiciones:

Σ ⊆ P, P + P ⊆ P, P · P ⊆ P, −1 6∈ P.

La primera y tercera condición implican que si x ∈ P \0 entonces x ·(1x

)2= 1

x ∈ P . Además, P ∩ (−P ) = 0

pues si x ∈ P ∩ (−P ) \ 0, entonces tendríamos x = −y ∈ P para algún y ∈ P , y y · 1−y = −1 ∈ P .

Afirmación: Si P es un semi-cono positivo, entonces para todo b ∈ K, P + bP satisface las primeras trescondiciones para ser un semi-cono positivo. Más aún, la cuarta propiedad se cumple si y sólo si b = 0 ó−b 6∈ P .

56

Page 57: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Demostración de la afirmación: Claramente Σ ∈ P + bP pues 0 ∈ P . Además, se cumple que

(P + bP ) + (P + bP ) = (P + P ) + b(P + P ) ⊆ P + bP y

(P + bP ) · (P + bP ) ⊆ (P · P ) + b(P · P ) + b2(P · P ) ⊆ (P + P ) + b(P · P ) ⊆ P + bP.

Finalmente, veamos que −1 ∈ P +bP si y sólo si −b ∈ P . Note que b ∈ P +bP , así que si −b ∈ P , tendríamos−1b ∈ P , y por lo tanto −1 = b ·

(−1b

)∈ P . Recíprocamente, si −1 ∈ P + bP , existirían a0, a1 ∈ P tales

que −1 = a0 + ba1. De esta manera, −b = a0+1a1

∈ P pues a0 + 1 es la suma de un elemento de P con uncuadrado.

Por Lema de Zorn, existe un cono semi-positivo maximal P que contiene a Σ, y definamos x ≤ y si y sólosi y − x ∈ P . Veamos que esto da un orden lineal compatible con K.

Orden lineal: Si x 6≤ y, entonces −b = y − x 6∈ P , por lo cual P + bP es un semi-cono positivo. Pormaximalidad, b ∈ P + bP = P , por lo cual x− y ∈ P , es decir, y < x.Si x < y, entonces (y − x) ∈ P y para todo z ∈ K tendremos que (y + z) − (x+ z) = y − x ∈ P , porlo que x+ z < y + z.Si x < y y z > 0, tendremos (y − x), z ∈ P , por lo cual (y − x) · z = yz − xz ∈ P . Así, xz < yz.

De la prueba del lema anterior, se sigue el siguiente resultado:

Corolario 7.54. Sea K es un campo de característica 0 y b un elemento de K. Existe un orden compatiblede K que hace b negativo si y sólo si b no es suma de cuadrados.

Demostración. Si b 6∈ Σ, entonces Σ− bΣ es un cono semi-positivo.

Definición 7.55. Un campo ordenado (R,<) se dice real cerrado si todo elemento positivo es un cuadradoy todo polinomio de grado impar tiene una raíz en R.

Decimos que (R,<) es una clausura real de un subcampo ordenado (K,<) si R es real cerrado y cadaelemento de R es algebraico sobre K.

Ejemplo 7.56. Note que el campo de los reales es real cerrado, pero no es una clausura real del campoordenado (Q, <) porque R contiene elementos trascendentes. Sin embargo, el campo (Q

alg, <) también es real

cerrado y sí es una clausura real de (Q, <). Más aún, cualquier campo que sea relativamente algebraicamentecerrado en un campo real cerrado también es real cerrado.

Teorema 7.57. Todo campo ordenado (K,<) tiene una clausura real que está únicamente determinada porK, módulo isomorfismo.

Demostración. Existencia: Sea K≥0 el semi-cono positivo de (K,<) y sea L una extensión del campo K. Sepuede ver fácilmente (*) que el orden de K puede extenderse a L si y sólo si

P = x1y21 + · · ·+ xny2n : xi ∈ K≥0, yi ∈ L

es un cono semi-positivo de K, es decir, si −1 6∈ P . (*) Así, podemos aplicar el Lema de Zorn para obteneruna extensión algebraica maximal R de K con un orden compatible que extiende el orden en K. Veamos quedicho R es un campo real cerrado.

Sea r un elemento positivo de R y supongamos que r no es un cuadrado. Como el orden no puede extendersea L = R(

√r), existen ri ∈ R≥0 y si, ti ∈ R tales que

−1 =∑

ri(si√r + ti)

2.

Por lo tanto, −1 =∑ri(sir+ t

2i ), contradiciendo el hecho de que la parte derecha de la ecuación es positiva.

Esto muestra que cada elemento positivo de R es un cuadrado.

Ahora, supongamos que f ∈ R[X] es un polinomio de grado minimal impar n que no tiene raíces en R. Porla minimalidad de f , sabemos que f es irreducible. Sea α una raíz de f en una extensión algebraica de R, ysea L = R(α). Como L no existe un orden compatible en L, −1 es una suma de cuadrados en L. Así, existenpolinomios gi ∈ R[X] de grado menor que n tales que f divide a h = 1 +

∑g2i . Los coeficientes principales

de g2i son cuadrados en R, por lo que no pueden cancelarse entre sí. Esto muestra que el grado de h es pary menor que 2n, por lo que el polinomio h · f−1 tiene grado impar menor que n y no tiene raíces en R pues

57

Page 58: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

h no tiene raíces en R. Contradicción. re-escribir esta prueba

Unicidad: Supongamos que R y S son clausuras reales de (K,<). Dado que los elementos positivos de R yS son precisamente los cuadrados, basta probar que R y S son isomorfos como campos. Esto se basa en losdos siguientes hechos:R es isomorfo a S sobre K si para cualquier polinomio irreducible f ∈ K[X], f tiene una raíz en R si y sólosi tiene una raíz en S.

Lema 7.58 (Sylvester). Sea f un polinomio irreducible en K[X] y (R,<) una extensión real cerrada de(K,<). El número de raíces de f en R es igual a la signature or the trace form of the K-algebra

K[X]/f .

Así, por el Lema de Sylvester, como R y S son campos real cerrados, tienen el mismo número de raíces depolinomios irreducibles f ∈ K[X], y concluímios que R ∼= S. Completar

Comentario 7.59. Note que un campo formalmente real puede tener diferentes órdenes compatibles quepueden dar lugar a diferentes clausuras reales no isomorfas. Sin embargo, en un campo real cerrado el ordenestá completamente determinado por la estructura de campo: x ≤ y si y sólo si y− x es un cuadrado. Por lotanto, tiene sentido decir que un campo es real cerrado sin especificar el orden lilneal <.

Teorema 7.60 (Teorema Fundamental del Álgebra para campos real cerrados). Si R es un campo realcerrado, entonces C = R(

√−1) es algebraicamente cerrado.

Demostración. Cada elemento en C = R(√−1) tiene la forma a+ b

√−1, y tiene una raíz cuadrada α dadas

por √√a2 + b2 + a

√√a2 + b2 − a

2·√−1,

donde el signo ± depende del signo de b. Veremos que si F es una extensión finita de C, entonces F = C.Podemos asumir que F es una extensión de Galois de C. Sea G un subgrupo 2-Sylow de Aut(F/R) y L elcampo fijo de G. Entonces el grado [L : R] debe ser impar, y si L = R(α), entonces α tiene un polinomioirreducible de grado impar. Sin embargo, como todos los polinomios de grado impar tienen raíces en R, losúnicos polinomios irreducibles de grado impar son lineales, y tendremos que L = R. Así, tanto G = Aut(F/R)como H = Aut(F/C) son 2-grupos, y por lo tanto solubles. De esta forma, si H no es trivial, entonces tieneun subgrupo de índice 2, y así C tiene una extensión de grado 2, pero esto es imposible pues todo elementode C es un cuadrado. Concluímos entonces que H es trivial, es decir, F = C.

Corolario 7.61. Si R es un campo real cerrado, los únicos polinomios mónicos irreducibles son:

Polinomios lineales: X − a, donde a ∈ R.Polinomios cuadráticos: (X − b)2 + c, donde b, c ∈ R, c > 0.

Demostración. Como todo polinomio no constante f ∈ R[X] tiene una raíz en R(√−1), todos los polinomios

irreducibles deben ser lineales o cuadráticos. Todo polinomio mónico de grado 2 tiene la forma

X2 + a1X + a0 =

[X2 + a1X +

(a12

)2]+

[a0 −

(a12

)2]=[X − a1

2

]2+

[a0 −

(a12

)2]= (X − b)2 + c.

Además, el polinomio (X − b)2 + c es irreducible si y sólo si −c no tiene raíz cuadrada, si y sólo si c > 0.

Corolario 7.62. Si (K,<) es un campo real cerrado y (F,<) es un subcampo ordenado, la clausura real de

(F,<) en (K,<) es justamente (Falg ∩K,<).

Demostración. Sea (R,<) la clausura real de (F,<) en (K,<). Como todo elemento de G es algebraico

sobre F , tenemos que R ⊆ Falg ∩K. Ahora, si α ∈ F

alg ∩K \R, sea p(x) el polinomio mónico de α que esirreducible sobre R. Como (R,<) es real cerrado, tenemos dos opciones:

Si p(X) = X − a con a ∈ R, entonces α = a ∈ R.Si p(X) = (X − b)2 + c con b, c ∈ R y c > 0, entonces tendríamos (α − b)2 = −c, como R es realcerrado y c > 0, existe d ∈ R tal que d2 = c. De esta manera,

−1 =(α− b)2

c=

(α− b

d

)2

> 0,

obteniendo una contradicción.58

Page 59: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

La teoría de campos real cerrados es la teoría RCF en el lenguaje L = +, ·, 0, 1, < que contiene los siguientesaxiomas:

Axiomas de campo ordenado,Todo elemento positivo es un cuadrado: ∀x(x > 0 → ∃y(y2 = x)).Todo polinomio de grado impar tiene una raíz:

∀a0, . . . , a2n+1

[a2n+1 6= 0 → ∃x (a2n+1x

2n+1 + · · ·+ a1x+ a0 = 0)]: n < ω.

Teorema 7.63 (Tarski-Seiderberg). La teoría RCF tiene eliminación de cuantificadores

Demostración. Sean (K1, <) y (K2, <) dos campos real cerrados con un subanillo ordenado común (R,<).Por Lema 7.50, si F1 y F2 son los campos de fracciones de R en K1 y K2 respectivamente, entonces existeun isomorfismo de campos ordenados f : (F1, <) → (F2, <) que fija R. Sean G1, G2 las clausuras reales deF1 y F2 en K1 y K2, respectivamente. Por el Teorema 7.57, f se extiende de forma única a un isomorfismog : G1 → G2.

Así, para un elemento b ∈ K1, tenemos dos opciones. Si b es algebraico sobre F1, entonces b ∈ G1 y tenemosel mapa g : G1 → G2 ⊆ K2 que extiende a f . Supongamos ahora que b es trascendente sobre F1. Entoncesla extensión de campos G(b1) es isomorfa al campo de funciones racionales G1(X). Considere los conjuntos

G−1 := a ∈ G1 : a < b, G+

1 := a ∈ G2 : b < a.Tenemos entonces que todos los elementos de G−

2 := g(G−1 ) son menores que todos los elementos de G+

2 :=g(G+

1 ). Considere el conjunto de fórmulas Σ(x) sobre G2 dado por

Σ(x) := p(x) 6= 0 : p(X) ∈ G2[X] ∪ a < x < a′ : a ∈ G−2 , a

′ ∈ G+2 .

Si Σ0 es un subconjunto finito de Σ, entonces menciona finitos polinomios p1(X), . . . , pk(X) ∈ G2[X] y finitasfórmulas ai < x < a′i con i ≤ n. Así, como (G2, <) es un orden lineal denso, existe un elemento b′ ∈ G2 quees distinto de todas las raíces de polinomios p1(X), . . . , pk(X) y satisface ai < c′ < a′i para todo i ≤ n. Deesta manera, c |= Σ0(x).Esto muestra que Σ(x) es finitamente satisfactible en G2, y por lo tanto existe una extensión elemental G′

2

de G2 que realiza Σ(x). Sea c ∈ G′2 tal que G′

2 |= Σ(c). En particular, c es trascendente sobre G2, y existe unisomorfismo de campos h : G1(b) → G2(c) que extiende g y envía b en c. Mostraremos ahora que h tambiénpreserva el orden, y por el Lema 7.50, basta ver que h preserva el orden en G1[b1]. Sea p(b1) un elemento deG1[b1]. Por el Corolario 7.61, existe una descomposición

p(X) = ε∏

i<m

(X − ai)∏

j<n

((X − bj)2 + cj),

con ai, bj , cj ∈ G1 y cada cj es positivo. El signo de p(b) depende únicamente de los signos de los factoresǫ, b−a1, . . . , b−am. De la misma forma, el signo de h(p(b)) depende de los factores de ǫ, c−g(a1), . . . , c−g(am).Sin embargo, por la elección de c, tenemos que b < ai si y sólo si c− g(ai). Esto es, p(b) es positivo si y sólosi h(p(b)) es positivo, y concluímos que h : G1(b) → G2(b) ⊆ K ′

2 es un isomorfismo de campos ordenados.Por el Teorema 7.32, podemos concluír que RCF tiene eliminación de cuantificadores.

Corolario 7.64 (17o problema de Hilbert). Sea (K,<) un campo real cerrado. Un polinomio f ∈ K[X1, . . . ,Xn]es una suma de cuadrados f = g21 + · · · + g2k de funciones racionales gi ∈ K(X1, . . . ,Xn) si y sólo sif(a1, . . . , an) ≥ 0 para todo a1, . . . , an ∈ K.

Demostración. Claramente una suma de cuadrados no puede tomar valores negativos. Para el recíproco,supongamos que f no es una suma de cuadrados. Por Corolario 7.54 existe un orden compatible <1enK(X1, . . . ,Xn) para el cual f es negativo. Como los elementos positivos en K son cuadrados, el orden <1

extiende al orden <. Sea (L,<∗) la clausura real de (K(X1, . . . ,Xn), <1). Tenemos entonces que (K,<) ⊆(L,<∗), y además, L |= ∃x1, . . . xn(f(x1, . . . , xn) < 0). Sin embargo, (K,<), (L,<∗) |= RCF, y por eliminaciónde cuantificadores tendríamos que (K,<) ≺ (L,<∗), por lo cual (K,<) |= ∃x1, . . . xn(f(x1, . . . , xn) < 0).

El siguiente resultado da una descripción de los conjuntos definibles en una variable para campos real cerrados.Durante la prueba usaremos muchas propiedades que sabemos ciertas en R. Esta es una estrategia válida,pues dado que RCF es una teoría completa, para toda Lor-sentencia σ se tiene que

RCF |= σ ⇔ R |= σ.59

Page 60: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Corolario 7.65. Sea (R,<) un campo real cerrado. Si X ⊆ R1 un subconjunto definible, entonces X es unaunión finita de intervalos y puntos. Esto es, existen elementos a1 < b1 < · · · < ak < bk ∈ R ∪ ±∞ yc1, . . . , cℓ ∈ R tales que

X =k⋃

i=1

(ai, bi) ∪ℓ⋃

j=1

cj.

Demostración. Por eliminación de cuantificadores, todo definible en una variable es definido por una fórmulade la forma

r

s

θr,s(x), donde cada θr,s(x) es una fórmula básica. Como ya vimos antes en el caso de DLO,

las negaciones de fórmulas atómicas en este lenguaje son equivalentes a disyunciones de fórmulas atómicas.Así, podemos asumir sin pérdida de generalidad que cada θr,s(x) es una fórmula atómica.

Note además que si la afirmación se cumple para cada subconjunto definido por una fórmula atómica, en-tonces al realizar la combinación booleana también se preserva el resultado. 11 Por lo tanto, basta mostrarel resultado para fórmulas atómicas.

Las fórmulas atómicas (con parámetros) en el lenguaje de campos real cerrados pueden escribirse de la formap(x) = 0 ó p(x) > 0, donde p(X) ∈ K[X]. Dado que, p(X) tiene un número finito de raíces c1, . . . , cℓ en K,la fórmula p(x) = 0 define el conjunto c1, . . . , cℓ.

Considere ahora la fórmula atómica p(x) > 0. Si p(x) tiene grado par tenemos dos opciones:

Si p(X) no tiene raíces en R, entonces p(x) > 0 define el conjunto (−∞,+∞) = R, que es un intervalo.Si p(X) tiene raíces en R, podemos ordenar las diferentes raíces simples como b1 < a2 < b2 < · · · <bk−1 < ak. Note que existe un número par de raíces simples, porque de lo contrario en R existiríaun polinomio de grado par tal que lım

x→∞p(x) = −∞, ya que cada raíz simple representa un cambio de

signo. De esta forma, por el teorema del valor intermedio en R aplicado al polinomio p(X), la fórmulap(x) > 0 define precisamente el conjunto

(−∞, b1) ∪ (a2, b2) ∪ · · · ∪ (ak−1, bk−1) ∪ (ak,+∞).

El argumento cuando p(X) tiene grado impar es similar: el polinomio tiene un número impar de raícessimples, que se ordenaran como a1 < b1 < · · · < bk−1 < ak si el coeficiente principal de p(X) es positivo, ob1 < a2 < · · · < ak < bk si el coeficiente principal de p(X) es negativo.

Una pequeña moraleja que nos deja la anterior demostración es la siguiente: si una propiedad σ se puedeexpresar en primer orden en el lenguaje Lor y es cierta en R (sin importar cuál haya sido el método dedemostración utilizado para probarla) entonces σ es cierta en cualquier campo real cerrado, y existe unademostración que se desprende únicamente de los axiomas de RCF.

Definición 7.66. Sea (K,<) un campo ordenado. Decimos que X ⊆ Fn es un conjunto semialgebraico si esuna combinación Booleanda de fórmulas de la forma x ∈ Kn : p(x) > 0, donde p(X) ∈ K[X1, . . . ,Xn]

Por eliminación de cuantificadores, los conjuntos semialgebraicos son precisamente los conjuntos definibles.Por lo tanto, y usando la analogía con el Teorema de Chevalley, tenemos el siguiente resultado:

Corolario 7.67 (Tarski-Seidenberg). Los conjuntos semialgebraicos son cerrados bajo proyecciones.

Note que este resultado no se cumple para conjuntos algebraicos. Por ejemplo, la proyección en una variablede la ecuación xy = 1 (es decir, el conjunto definido por φ(x) = ∃y(xy = 1)) no es algebraico, sino (−∞, 0)∪(0,+∞).

Corolario 7.68. Si (R,<) es un campo real cerrado y A ⊆ Rn es un conjunto semialgebraico, entonces suclausura (en la topología euclideana) de A también es semialgebraico.

Demostración. Si ⊆ Rn es un conjunto semialgebraico, existe una fórmula φ(x1, . . . , xn) con parámetros enR tal que

A = (a1, . . . , an) ∈ Rn : R |= φ(a1, . . . , an).11Esto ocurre porque la intersección finita de intervalos es vacía o es de nuevo un intervalo. Esto incluye intervalos de la

forma a = [a, a]

60

Page 61: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Ahora, note que un punto b está en la clausura euclideana de A si y sólo si para todo ǫ > 0 existe a ∈ A talque

d(a, b) =

√√√√n∑

i=1

(ai − bi) < ǫ.

De esta manera, la clausura euclideana de A está definida mediante la fórmula

ψ(y) := ∀ǫ[ǫ > 0 → ∃x ((x1 − y1)

2 + · · ·+ (xn − yn)2 < ǫ2)

].

Esto es, cl(A) es definible con parámetros de R, y por lo tanto es un conjunto semialgebraico.

COMENTARIOS FINALES - TEORÍAS O-MINIMALES

7.7. Aritmética de Presburger. Como habíamos mencionado antes, para toda L-teoría T existe unaextensión L′ del lenguaje en la cual T tiene eliminación de cuantificadores. Sin embargo, esta extensión espuramente sintáctica, y no nos proporciona mejor información de la estructura que queremos estudiar. Elpunto de estudiar eliminación de cuantificadores para una estructura dada radica entonces en encontrar unaextensión adecuada L∗, lo más pequeña posible, en la que se tenga eliminación de cuantificadores pero aúnhaya una comprensión de los conjuntos definibles sin cuantificadores.

Finalizaremos esta sección con un ejemplo ligeramente más complicado. Sea L = +,−, 0, 1, < y considerela L-teoría del grupo ordenado (Z,+,−, 0, 1, <). Esta teoría no tiene eliminación de cuantificadores en L.Por ejemplo, podemos considerar la fórmula

ψn(x) := ∃y(y + · · · y︸ ︷︷ ︸n veces

= x)

que afirma que x es divisible por el n ≥ 2.

Ejercicio 8. Muestre que la fórmula ψn(x) no es equivalente módulo Th(Z) a ninguna fórmula sin cuanti-ficadores en el lenguaje L = +,−, 0, 1, <.Consideremos la expansión L∗ = L ∪ Dn : n ≥ 2 de L mediante predicados unarios, interpretado endiferentes L-estrucuras M como

M |= Dn(x) ⇔ M |= ∃y(y + · · · y︸ ︷︷ ︸n veces

= x).

Esta es una expansión definible en el lenguaje, por lo cual los conjuntos definibles de una L-estructura Msiguen siendo los mismos al ver M como una L∗-estructura.

Definición 7.69. Definimos la L∗-teoría Pres de la aritmética de Presburger, que está dada por los siguientesaxiomas:

(i) Axiomas de grupos abelianos (ii) 0 < 1 (iii) ∀x(x ≤ 0 ∨ x ≥ 1)

(iv)n Para cada n ≥ 2, ∀x

Dn(x) ↔ ∃y(y + · · · y︸ ︷︷ ︸

n veces

= x

(v)n Para cada n ≥ 2, ∀xn−1∨

i=0

Dn(x+ 1 + · · · + 1︸ ︷︷ ︸

i veces

) ∧∧

j 6=i¬Dn(x+ 1 + · · ·+ 1︸ ︷︷ ︸

j veces

)

COMPLETAR - ELIMINACIÓN DE CUANTIFICADORES PARA PRESBURGER

61

Page 62: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

EJERCICIOS DE PRÁCTICA

62

Page 63: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

8. Teorema de omisión de tipos y espacios de Stone

8.1. Teorema de omisión de tipos.

Definición 8.1. Sea T una L-teoría y Σ(x) un conjunto de L-fórmulas.

1. Un modelo M de T omite Σ (o que Σ(x) es omitido por M) si no existe ningún b ∈M que realice Σ(x).

2. Una fórmula φ(x) aisla a Σ(x) si φ(x) es consistente con T y para toda fórmula σ(x) ∈ Σ(x),

T |= ∀x (φ(x) → σ(x)).

3. Decimos que un tipo parcial Σ(x) es aislado en T si existe una fórmula φ(x) que es consistente con Ty aisla a Σ(x)

Teorema 8.2 (Teorema de omisión de tipos). Sea T es una teoría contable12 y consistente. Si Σ(x) no esun tipo aislado, entonces existe un modelo de T que omite a Σ(x).

Demostración. Sea C un conjunto contable de nuevas constantes. En primer lugar, vamos a extender T auna teoría T ∗ con las siguientes propiedades:

(a) T ∗ es una teoría de Henkin: para toda L(C)-fórmula ψ(x) existe una constante cψ ∈ C tal queT ∗ |= ∃xψ(x) → ψ(cψ).

(b) Para toda c ∈ C existe una fórmula σ(x) ∈ Σ(x) tal que ¬σ(c) ∈ T ∗

Para esto, vamos a construír una cadena de teorías T0 ⊆ T1 ⊆ · · · tal que T ∗ =⋃i<ω Ti. Sea C = ci : i < ω

una enumeración de las constantes y ψi(x) : i < ω una enumeración de todas las L(C)-fórmulas.Supongamos que T2i ya ha sido construída. Sea c una constante en C que no ha sido mencionada enT2i ∪ ψi(x), y ponemos T2i+1 := T2i ∪ ∃xψi(x) → ψi(c). Tenemos que T2i+1 es consistente, pues siM era un modelo de T2i, entonces o bien M0 |= ∃xψ(x) y podemos interpretar la nueva constante c comouna realización de ψ(x), ó M |= ¬∃xψ(x) en cuyo caso podemos interpretar la constante c como queramos.

Note que T2i+1 tiene la forma T ∪ δ(ci, c) donde ci, c son constantes en C y ci no está incluída en la tuplac. Dado que la L-fórmula ∃y δ(x, y) no aisla a Σ(x), existe alguna fórmula σ ∈ Σ tal que ∃y δ(x, y) ∧ ¬σ(x)es consistente con T . Hacemos entonces T2i+2 = T2i+1 ∪ ¬σ(ci).Tomemos ahora T ∗ =

⋃i<ω Ti. La condición (a) se verifica por los pasos impares en la construcción, mientras

que la condición (b) se verifica por los pasos pares. Además, como cada Ti era consistente, T ∗ es finitamenteconsistente y existe un modelo (M′, cM

i ) |= T ∗. Tomemos ahora la subestructura M = cM′

i : i < ω. Porel test de Tarski-Vaught, como cada L(C)-fórmula existencial ∃xψ(x) es atestiguada por una constante enM, tenemos que M ≺ M′, y en particular M |= T . Además, M omite σ pues por la condición (b), paracada elemento c ∈M existe una fórmula σ ∈ Σ tal que M |= ¬σ(c).

Corolario 8.3. Sea T una teoría contable y consistente, y sea

Σ0(x1, . . . , xn0),Σ1(x1, . . . , xn1

), . . .

una sucesión de tipos parciales. Si ninguno de los Σi es aislado, entonces existe un modelo de T que omitetodos los Σi.

Demostración. EJERCICIO.

8.2. El espacio de Stone. Fijemos una teoría T . Como ya vimos antes, un n-tipo es un conjunto maximalde fórmulas p(x1, . . . , xn) consistente con T . Denotamos como Sn(T ) al conjunto de todos los n-tipos de T . 13

Si B es un subconjunto de una L-estructura M, denotamos como SMn (B) al conjunto Sn(Th(MB), esto es,

el conjunto de todos los n-tipos con parámetros en B consistentes con M.

Ejercicio 9. Si T es una teoría completa y M es cualquier modelo de T , entones SMn (∅) = Sn(T ).

Para cada L-fórmula φ(x1, . . . , xn), denotamos por [φ] al conjunto de todos los n-tipos que contienen lafórmula φ.

Lema 8.4. Se cumplen las siguientes afirmaciones:

12Es decir, el lenguaje L es contable13Podemos también considerar S0(T ), que será el conjunto de todas las extensions completas de T , módulo equivalencia.

63

Page 64: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

1. [φ] = [ψ] si y sólo si φ y ψ son equivalentes módulo T .2. Los conjuntos [φ] son cerrados bajo operaciones booleanas. Más aún,

[φ] ∩ [ψ] = [φ ∧ ψ] [φ] ∪ [ψ] = [φ ∨ ψ]Sn(T ) \ [φ] = [¬φ] Sn(T ) = [⊤] y ∅ = [⊥].

Demostración. (1) (⇒) Si φ(x) y ψ(x) no son equivalente módulo T , entonces existe un modelo M |= T talque M |= ∃x (φ(x) ∧ ¬ψ(x) ó M |= ∃x (¬φ(x) ∧ ψ(x). En el primer caso, tenemos entonces que existe untipo q(x) ⊆ φ(x) ∧ ¬ψ(x), por lo cual q ∈ [φ] \ [ψ]. En el segundo caso, existiría un tipo q′ ∈ [ψ] \ [φ].

(⇐) Si φ(x) y ψ(x) son equivalentes en T , entonces T |= ∀x(φ(x) ↔ ψ(x)). De esta manera, si p(x) =tpM(a) ∈ Sn(T ) para algún modelo M |= T y a ∈M , tendremos que

p ∈ [φ] ⇔ φ(x) ∈ p = tpM(a) ⇔ M |= φ(a) ⇔ M |= ψ(a) ⇔ ψ(x) ∈ tpM(a) = p↔ p ∈ [ψ].

La parte (2) se deja como ejercicio.

Se sigue entonces que la colección de subconjuntos [φ] de Sn(T ) es cerrada bajo intersecciones finitas, eincluye a Sn(T ). Por lo tanto, B = [φ] : φ(x1, . . . , xn) es una L-fórmula forma una base de abiertos parauna topología en Sn(T ). Dotado con esta topología, llamamos a Sn(T ) el n-espacio de Stone de T .

Lema 8.5. El espacio Sn(T ) es 0-dimensional, Hausdorff y compacto.

Demostración. Recordemos que ser 0-dimensional es justamente tener una base de clopens. Para esto, bastacon ver que la base del espacio de Stone satisface

B = [φ] : φ(x1, . . . , xn) L-fórmula = Sn(T ) \ [¬φ] : φ(x1, . . . , xn) L-fórmula.Para ver que es Hausdorff, supongamos que p, q son dos tipos diferentes en Sn(T ). Como p y q son consisten-tes maximales, existe una fórmula φ(x1, . . . , xn) tal que φ ∈ p y ¬φ ∈ q. Así, los abiertos [φ] y [¬φ] separanp y q y son disyuntos.

Ahora veamos que Sn(T ) es compacto. Supongamos que [φi] : i ∈ I es un cubrimiento de Sn(T ). Si estecubrimiento no se pudiera reducir a un cubrimiento finito, entonces para cada subconjunto finito i1, . . . , ik ⊆I existiría un tipo q 6∈ [φi1 ] ∪ · · · ∪ [φik ]. En otras palabras, q ∈ [¬φi1 ∧ · · · ∧ ¬φik ]. Esto muestra entoncesque el conjunto de fórmulas ¬φi : i ∈ I es finitamente consistente, y por el Teorema de compacidad, existeun tipo q ∈ Sn(T ) tal que q ⊇ ¬φi : i ∈ I (como conjuntos de fórmulas. De esta manera, en el espacio deStone tendríamos que

q ∈⋂

i∈I[¬φi] =

i∈I(Sn(T ) \ [φi]) = Sn(T ) \

i∈I[φi] = Sn(T ) \ Sn(T ) = ∅,

que es una contradicción.

Lema 8.6. Todos los clopens de Sn(T ) son de la forma [φ].

Demostración. Sea X un clopen de Sn(T ). Si X = ∅, entonces X = [⊥]. Si X 6= ∅, entonces por ser abiertopara cada punto q ∈ X existe un abierto básico [φq] tal que q ∈ [φq] ⊆ X. De esta manera, se tiene elcubrimiento X =

⋃q∈X [φq].

Por otra parte, como X es un subconjunto cerrado en un compacto, X es compacto, y existe un recubrimientofinito [φq1 , . . . , [φqk ] tal que

X = [φq1 ] ∪ · · · ∪ [φqk ] = [φq1 ∨ · · · ∨ φqk ].

Lema 8.7. Sean M,N dos L-estrcturas y A0, B0 subonjuntos de M y N respectivamente. Cualquier mapa

elemental 14 f : A0 → B0 induce un mapa sobreyectivo continuo f : Sn(B0) → Sn(A0).

14Recordemos que un mapa elemental f : A0 → B0 es una función tal que para toda tupla a ∈ A0, y toda fórmula φ(x),M |= φ(a) si y sólo si N |= φ(f(a)).

64

Page 65: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Demostración. Si q(x) ∈ Sn(B0), definimos

f(q) := φ(x1, . . . , xn, a) : a ∈ A0, φ(x1, . . . , xn, f(a) ∈ q.Note que f(q) es un tipo completo: si φ(x1, . . . , xn; a) 6∈ f(q), entonces φ(x1, . . . , xn, f(a) 6∈ q, por lo que¬φ(x1, . . . , xn, f(a) ∈ q, y así ¬φ(x1, . . . , xn; a) ∈ f(q). Además, f es sobreyectiva, pues si q ∈ Sn(A0),q = f(p) donde p = φ(x, f(a)) : φ(x, a) ∈ q).

Sea ahora [φ(x, a)] un abierto básico de Sn(A0). Tenemos que

q ∈ f−1([φ(x, a)]) ⇔ f(q) ∈ [φ(x, a)] ⇔ φ(x, a) ∈ f(q) ⇔ φ(x, f(a)) ∈ q ⇔ q ∈ [φ(x, f(a))],

lo que muestra que f es continua.

Ejercicio 10. 1. Muestre que toda biyección elemental f : A0 → B0 induce un homeomorfismo Sn(A0) →Sn(B0). En este mapa, denotamos por f(p) la imagen de p dada por f(p) = φ(x, f(a) : φ(x, a) ∈ p.

2. Si M = N y A0 ⊆ B0, el mapa inclusión induce la restricción Sn(B0) → Sn(A0) dada por q A0=

φ(x, a) : φ(x, a ∈ q, a ∈ A0. En este caso decimos que q es una extensión de q A0.

Lema 8.8. Un tipo p es aislado en T si y sólo si p es un tipo aislado en Sn(T ). Más aún, φ aisla p si y sólosi [φ] = p.Demostración. Tenemos que [φ] = p si y sólo si para toda fórmula ψ(x) ∈ p, [φ] ⊆ [ψ], lo que ocurre siy sólo si T |= ∀x(φ(x) → ψ(x)) para toda fórmula ψ(x) ∈ p, es decir, si y sólo si φ(x) aisla el tipo p(x) enT .

8.3. Teorías ω-categóricas. Una teoría T es ℵ0-categórica (ó ω-categórica) si cualquier par de modelosde T de cardinalidad ℵ0 son isomorfos. Veremos que estas teorías pueden caracterizarse como teorías quetienen un número finito de n-tipos para cada n < ω.

Recordemos que una estructura M se dice ω-saturada si todos los 1-tipos sobre subconjuntos finitos M sonrealizados en M. Sin embargo, aunque esta definición sólo habla de 1-tipos, es fácil ver que una estructuraω-saturada realiza cualquier n-tipo sobre un subconjunto finito de M . Para esto, si p(x1, . . . , xn) es un tiposobre un subconjunto finito A0 de M , podemos escribir p(x1, . . . , xn) como

p(x1, . . . , xn) = p1(x1) ∪ p2(x1, x2) ∪ · · · pn(x1, . . . , xn)donde pk(x1, . . . , xk) es el conjunto de fórmulas en p(x1, . . . , xn) que sólo mencionan las variables x1, . . . , xk.Por ω-saturación, existe un elemento a1 ∈ M que realiza p1(x1), y existe un elemento a2 que realiza el tipop2(a1, x2). Siguiendo este proceso encontraremos una tupla (a1, . . . , an) ∈M que realiza p(x1, . . . , xn).El siguiente resultado es una generalización de la ℵ0-categoricidad de DLO, y la prueba usará back & forth.

Lema 8.9. Cualesquiera dos estructuras elementalmente equivalentes, contables y ω-saturadas son isomorfas.

Demostración. Sean M,N dos L-estructuras elementalmente equivalentes, contables y ω-saturadas, y seanM = a0, a1, . . . y N = b0, b1, . . . enumeraciones. Vamos a construír mapas elementales fn : An → Bnentre subconjuntos finitos de M y N tales que fn ⊆ fn+1, a0, . . . , an ⊆ dom(f2n+1) y b0, . . . , bn ⊆im(f2n+2).

Para comenzar, tomemos f0 = ∅, que es un mapa elemental pues M y N son elementalmente equivalentes.Supongamos ahora que f2n ya ha sido construído. Consideremos el tipo p(x) = tpM(an/A2n). Como fn esun mapa elemental,

fn(p) = φ(x, f(a)) : a ∈ A2n,M |= φ(an, a) ∈ S1(B2n),

y existe una realización b′n ∈ N de f2n(p). Definimos f2n+1 = f2n ∪ (an, b′n). Note que este es un mapaelemental pues para cualquier fórmula φ(x; y) y a ∈ A2n,

M |= φ(an; a′1, . . . , a

′k) ⇔ φ(x; a) ∈ tpM(an/A2n)

⇔ φ(x; f2n(a)) ∈ f(tpM(an/A2n)) = tpN (b′n/B2n)

⇔ N |= φ(b′n; f2n(a))

⇔ N |= φ(f2n+1(an), f2n+1(a)).

65

Page 66: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Similarmente, suponiendo que f2n+1 ya ha sido construído, podemos considerar el tipo q = tp(bn/B2n+1), yuna realización a′n del tipo f−1

2n+1(q), y f2n+2 = f2n+1 ∪ (a′n, bn) será un mapa elemental.Consideremos ahora f =

⋃n<ω fn : M → N , que es un isomorfismo pues es biyectiva y si φ(x) es una

L-fórmula y a ∈M , a ∈ An para algún n < ω y tendremos que

M |= φ(a) ⇔ N |= φ(fn(a)) ⇔ N |= φ(f(a)).

8.4. Modelos primos. Ryll-Nardzewski

66

Page 67: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

EJERCICIOS DE PRÁCTICA

Ejercicio 1. Sea L = ≤, c0, c1, . . . , cn, . . . (una constante por cada natural) y sea T la teoría que dice ≤es un orden denso y que ci < cj para todo i < j.

(a) Demuestre que hay por lo menos tres modelos de T . (Piense en el límite de ci cuando i tiende ainfinito).

(b) ¿Alguno de los modelos anteriores es saturado?(c) ¿Será que todo modelo enumerable es isomorfo a alguno de los anteriores?

67

Page 68: Notas de Clase INTRODUCCIÓN A LA TEORÍA DE MODELOS Darío ... · das de 1950 y 1960, gracias a los trabajos de Tarski, Robinson y Ax, se encontraron aplicaciones de teoría de modelos

Referencias

[1] V. Bergelson, A. Blass, M. Di Nasso, R. Jin, eds. Ultrafilters across mathematics. Contemporary Mathematics, 530. 2010[2] V. Bergelson. Ergodic theory and Diophantine problems. In Topics in symbolic dynamics and applications (Temuco, 1997),

volume 279 of London Math. Soc. Lecture Note Ser., pages 167–205. Cambridge Univ. Press, Cambridge, 2000.[3] B. Bollobás. Random graphs. Academic Press. New York, 1985.[4] G. Cherlin, L. Harrington, A.H. Lachlan. ℵ0-categorical, ℵ0-stable structures. Ann. Pure Appl. Logic, 28(2):103–135, 1985.[5] A. Chernikov, I. Kaplan. Forking and dividing in NTP2 theories. J. Symbolic Logic. Voume 77, Issue 1 (2012), 1-20.[6] A. Chernikov, S. Starchenko. A note on the Erdős-Hajnal property for stable graphs. Available at

http://arxiv.org/pdf/1504.08252v2.pdf . 2016[7] L. van den Dries. Mathematical logic: Lecture notes. Disponible en https://faculty.math.illinois.edu/~vddries/main.pdf

[8] H. Furstenberg. Ergodic behavior of diagonal measures and a theorem of Szemeredi on arithmetic progressions. Journald’Analyse Mathématique, 31:204–256, 1977. 10.1007/BF02813304.

[9] D. García, D. Macpherson, C. Steinhorn. Pseudofinite structures and simplicity. J. Math. Log. 15, 1550002 (2015)[10] D. García, F. Wagner. Unimodularity unified. Journal of Symbolic Logic, Vol 60, 2016.[11] I. Goldbring, H. Towsner. An approximate logic for measures. Israel Journal of Mathematics. March 2014, Volume 199,

Issue 2, pp 867–913.[12] Hajek. Generalized quantifiers and finite sets. 1977[13] D. Haskell, A. Pillay, C. Steinhorn. Model Theory, Algebra and Geometry. Mathematical Sciences Research Institute Pu-

blications, 39. 2000.[14] E. Hrushovski. Unimodular minimal sets. Journal of the London Math. Society, Volume 46 no. 3 (1992), 385–396.[15] E. Hrushovski, F. Wagner. Counting and dimensions. Model Theory with applications to Algebra and Analysis. 2008[16] E. Hrushovski. Stable group theory and approximate subgroups. Journal of the American Mathematical Society, vol. 25

(2012), pp. 189–243[17] E. Hrushovski. On pseudofinite dimensions. Notre Dame J. Formal Logic. Volume 54, Number 3-4 (2013). 463-495[18] J. Łoś , Quelques remarques, théorèmes problèmes sur les classes définissables d’algèbres, pp. 98-113 in Mathematical

Interpretations of Formal Systems, North-Holland 1955.[19] C. Kestner, A. Pillay. Remarks on unimodularity. J. Symbolic Logic. Volume 76 no. 4 (2011), 1453–1458.[20] B. Kim, A. Pillay. Simple theories. Annals of Pure and Applied Logic, 88, pp. 149-164. 1997.[21] A. Kruckman. Disjoint n-amalgamation and pseudofinite countably categorical theories. Available at

http://arxiv.org/pdf/1510.03539v1.pdf . 2015.[22] H.J. Keisler. Ultraproducts of finite sets. The Journal of Symbolic Logic Vol. 32, No. 1 (Mar., 1967), pp. 47-57.[23] A. Koponen, K. Luosto. Definability issues in finite group theory. Reports of the Department of Mathematics, University

of Helsinki, 227. 1999[24] M. Malliaris, S. Shelah. Regularity lemmas for stable graphs. Trans. Amer. Math. Soc. 366 (2014), 1551-1585.[25] A. Pillay. Strongly minimal pseudofinite structures. Available at http://arxiv.org/pdf/1411.5008v2.pdf . 2014[26] S. Shelah. On the cardinality of ultraproducts of finite sets. J. Symbolic Logic 35 (1970), no. 1, 83–84[27] T. Tao. Expanding polynomials over finite fields of large characteristic, and a regularity lemma for definable sets. Contri-

butions to Discrete Mathematics. Volume 10, Number 1, Pages 22–98, ISSN 1715-0868. 2014[28] T. Tao. A correspondence principle between (hyper) graph theory and probability theory, and the (hyper) graph removal

lemma. Journal d’Analyse Mathématique. December 2007, Volume 103, Issue 1, pp 1–45[29] G. Turán. On the definability of properties of finite graphs. Discrete Mathematics,Volume 49, Issue 3, May 1984, Pages

291-302.[30] F. Wagner. Simple theories. Kluwer academic publishers. 2000.

68