Álgebra básica · capítulo 1 lenguaje y matemáticas antes de comenzar decir que supondremos que...

148
Álgebra Básica Departamento de Álgebra

Upload: lamhanh

Post on 18-Oct-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

Álgebra Básica

Departamento de Álgebra

II

Índice general

1. Lenguaje y Matemáticas 11.1. Introducción a la lógica proposicional . . . . . . . . . . . . . . . 11.2. Cuantificadores universales y existenciales . . . . . . . . . . . . . 51.3. Demostraciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.4. Los números complejos . . . . . . . . . . . . . . . . . . . . . . . 9

2. Enteros 172.1. Divisibilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.2. Algoritmo de Euclides. Identidad de Bezout . . . . . . . . . . . . 202.3. Clases de congruencias módulo m. . . . . . . . . . . . . . . . . . 292.4. Los teoremas de Fermat y Euler . . . . . . . . . . . . . . . . . . 31

3. Polinomios 353.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353.2. Máximo común divisor . . . . . . . . . . . . . . . . . . . . . . . 403.3. Factorización. Factores múltiples . . . . . . . . . . . . . . . . . . 463.4. Congruencias. Teorema chino del resto . . . . . . . . . . . . . . . 493.5. Factorización en C[x] y en R[x] . . . . . . . . . . . . . . . . . . 523.6. Factorización en Q[x] . . . . . . . . . . . . . . . . . . . . . . . . 543.7. Factorización en Fp[x] . . . . . . . . . . . . . . . . . . . . . . . 603.8. Factorización efectiva en Q[x] y Fp[x]* . . . . . . . . . . . . . . 623.9. El teorema fundamental del álgebra* . . . . . . . . . . . . . . . . 68

4. Conjuntos 734.1. Conjuntos. Operaciones básicas . . . . . . . . . . . . . . . . . . 734.2. Producto cartesiano. Relaciones de equivalencia. . . . . . . . . . 844.3. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

5. Grupos 995.1. Grupos: Definiciones y ejemplos. . . . . . . . . . . . . . . . . . . 995.2. Subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

III

5.3. Orden de un elemento de un grupo . . . . . . . . . . . . . . . . . 1055.4. Grupos cíclicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 1085.5. Teorema de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . 1105.6. Subgrupos normales. Grupo cociente y grupo producto . . . . . . 1135.7. Homomorfismos de grupos . . . . . . . . . . . . . . . . . . . . . 1165.8. Teoremas de isomorfía . . . . . . . . . . . . . . . . . . . . . . . 1195.9. El grupo de las permutaciones . . . . . . . . . . . . . . . . . . . 122

6. Anillos y cuerpos 1316.1. Anillos (I): Unidades y divisores de cero . . . . . . . . . . . . . . 1316.2. Anillos (II): Ideales . . . . . . . . . . . . . . . . . . . . . . . . . 1346.3. Cuerpo de fracciones. Característica . . . . . . . . . . . . . . . . 1376.4. Epílogo: El problema de la factorización . . . . . . . . . . . . . . 140

∗Nota: las subsecciones con asterisco son opcionales.

IV

Capítulo 1

Lenguaje y Matemáticas

Antes de comenzar decir que supondremos que todos sabemos qué son losnúmeros (naturales, enteros, racionales y reales), y que conocemos las propieda-des elementales de la suma y el producto de números (asociativa, conmutativa,distributiva,..). La notación que usaremos a lo largo de estas notas será:

Los números naturales, N.

Los números enteros, Z.

Los números racionales, Q.

Los números reales, R.

El cero, 0, no se considera un número natural

1.1. Introducción a la lógica proposicional

En este tema trataremos de desarrollar el uso del lenguaje en el contexto delas matemáticas. A lo largo del mismo, por una proposición o sentencia lógicaentenderemos una declaración que puede ser verdadera o falsa. Por ejemplo:1) Hoy es lunes.2) 3 es mayor que 7.3) He nacido en Sevilla.

En los tres ejemplos es claro (aunque el 3 sea más complicado comprobarlo)que la declaración correspondiente es verdadera o falsa. Ésta es la característicafundamental de las proposiciones. La siguiente declaración (paradoja) “esta frasees falsa"no puede ser ni verdadera ni falsa, por tanto no la consideraremos comoproposición.

Otros ejemplos de declaraciones que no son proposiciones son:

1

1) El color azul es bonito.2) n es un número par.3) ¿Quién ha llegado?

Consideremos el conjunto P de todas la proposiciones posibles. Este conjuntoestá dividido en dos partes: las proposiciones que son verdaderas y las proposi-ciones que son falsas. Lo que pretendemos ver ahora es cómo podemos combinarproposiciones para obtener otras nuevas y, además, estudiar cómo se traduce laveracidad o falsedad de las proposiciones combinadas en la proposición resultan-te. Generalmente usaremos las letras p, q, r, ... para representar las proposiciones.Por ejemplo

p : hoy es lunes.

Negación

Dada una proposición p, definimos la proposición ¬p (no p) co-mo la proposición que es falsa cuando p es verdadera, y verdaderasi p es falsa.

Esta definición se puede ilustrar en su tabla de verdad

p ¬p

V FF V

Conjunción

Dadas dos proposiciones p y q, definimos p ∧ q (p y q) comola proposición que es verdadera sólo cuando ambas, p y q, sonverdaderas.

Su tabla de verdad es:p q p ∧ q

V V VV F FF V FF F F

2

Disyunción

Dadas dos proposiciones p y q, definimos la proposición p ∨q (p o q) como aquélla que es verdadera cuando una o ambasproposiciones son verdaderas.

Su tabla de verdad es:

p q p ∨ q

V V VV F VF V VF F F

Implicación

Dadas dos proposiciones p y q, definimos la proposición p →q (p implica q) como la proposición que es falsa cuando p esverdadera y q falsa, y verdadera en los demás casos. Llamaremosa p la hipótesis y a q la conclusión.

Su tabla de verdad es:

p q p → q

V V VV F FF V VF F V

Ya podemos construir todo tipo de proposiciones, y sus tablas de verdad. Porejemplo, la tabla de verdad de la proposición ¬p ∨ q es

p q ¬p ∨ q

V V VV F FF V VF F V

Otro ejemplo algo más complicado: la tabla de verdad de (p ∧ q) → r

3

p q r p ∧ q (p ∧ q) → r

V V V V VV V F V FV F V F VV F F F VF V V F VF V F F VF F V F VF F F F V

Se observa que las tablas de verdad de la implicación y del primer ejemplocoinciden.

Definición 1.1.1. Diremos que dos proposiciones son lógicamente equivalentes sitienen la misma tabla de verdad.

Ejemplo 1.1.2. Los siguientes pares de proposiciones son lógicamente equivalen-tes:a) p ∨ (q ∧ r), (p ∨ q) ∧ (p ∨ r) (propiedad distributiva)b) p ∨ (q ∨ r), (p ∨ q) ∨ r (propiedad asociativa)

Tautología

Diremos que una proposición es una tautología si los valores desu tabla de verdad son todos verdaderos.

Por ejemplo p ∨ ¬p. La negación de una tautología se denomina contradic-ción. Es decir, una contradicción es una proposición en cuya tabla de verdad sóloaparece el valor falso. Por ejemplo p ∧ ¬p.

Definición 1.1.3. Dadas dos proposiciones p y q definimos la proposición p ↔ q

(p sí y sólo si q) como la proposición que es verdadera cuando p y q son ambasverdaderas ó ambas falsas.

Su tabla de verdad es:

p q p ↔ q

V V VV F FF V FF F V

4

Con esta definición se puede comprobar que dos proposiciones p y q sonlógicamente equivalentes (⇔) si la proposición p ↔ q es una tautología.

Para terminar esta sección veamos cómo actúa la negación sobre ∨, ∧ y → .

Es un fácil ejercicio comprobar que:1) ¬(p ∨ q) ⇔ ¬p ∧ ¬q.

2) ¬(p ∧ q) ⇔ ¬p ∨ ¬q.

Estas propiedades se conocen con el nombre de las leyes de DeMorgan. Paraver cómo actúa la negación sobre → basta tener en cuenta que p → q ⇔ ¬p ∨q,y aplicando las leyes de DeMorgan, tenemos que:

¬(p → q) ⇔ ¬(¬p ∨ q) ⇔ (¬¬p) ∧ ¬q ⇔ p ∧ ¬q

1.2. Cuantificadores universales y existenciales

Comenzaremos escribiendo una proposición de distintas formas. Por ejemplo,sabemos (lo probaremos más adelante) que:

la desigualdad n2 < 2n es cierta para todos los números naturales mayores oiguales que 5.

Podemos expresar (escribir) esta proposición de distintas formas:

Para todo número natural n, si n ≥ 5, entonces n2 < 2n.

Para todo n, si n ∈ N y n ≥ 5, entonces n2 < 2n.

(∀n)[(n ∈ N ∧ n ≥ 5) → (n2 < 2n)].

Cada vez que hemos escrito la proposición, hemos aumentado el grado deformalidad. En la última aparece el símbolo ∀ (para todo), que denominaremos“cuantificador universal". Veamos otro ejemplo:

Todos los elementos del conjunto B son negativos.

Para todo x ∈ B, x < 0.

(∀x ∈ B)(x < 0).

Para todo x , si x ∈ B, entonces x < 0.

(∀x)(x ∈ B → x < 0).

5

La forma más general para una proposición conteniendo en cuantificador uni-versal sería como sigue. Si P(x) es una propiedad expresada en términos de x ,entonces una proposición general con el cuantificador universal sería:

(∀x)(P(x)),

que leeríamos: para todo x , P(x).

Volvamos al primer ejemplo. Sabemos que la desigualdad n2 < 2n es cierta sin ≥ 5, pero no lo es si 2 ≤ n ≤ 4. Es decir, sabemos que

Existe un número natural n tal que n2 ≥ 2n.

Existe n tal que n ∈ N y n2 ≥ 2n.

(∃n)(n ∈ N ∧ n2 ≥ 2n).

El símbolo ∃ se lee como “existe” y se denomina cuantificador existencial.Otro ejemplo:

Algún elemento del conjunto B es positivo.

Existe x ∈ B, x > 0.

(∃x ∈ B)(x > 0).

Existe x tal que x ∈ B y x > 0.

(∃x)(x ∈ B ∧ x > 0).

Si P(x) es una propiedad expresada en términos de x , entonces una proposi-ción general con el cuantificador existencial sería:

(∃x)(P(x)),

que leeríamos: existe un x tal que P(x).

Veamos un ejemplo con los dos cuantificadores:

Existe un elemento del conjunto A que es menor que todos los elementosdel conjunto B.

Existe x ∈ A tal que x < y para todo y ∈ B.

Existe x ∈ A tal que, para todo y ∈ B, x < y.

(∃x ∈ A)(∀y ∈ B)(x < y).

6

En matemáticas también usamos el símbolo ∃!, que significa “existe un único".La expresión (∃!x)(P(x)) se lee: “existe un único x tal que P(x)". Por ejemplo:∃!n ∈ N tal que n3 = 8.

Las proposiciones con cuantificadores se niegan siguiendo las dos reglas si-guientes:

¬[(∀x)(P(x))] ⇔ (∃x)(¬P(x))

¬[(∃x)(P(x))] ⇔ (∀x)(¬P(x)).

Un ejemplo con los dos cuantificadores: la negación de (∀ǫ > 0)(∃n ∈ N)(1/n <

ǫ) es (∃ǫ > 0)(∀n ∈ N)(1/n ≥ ǫ).

1.3. Demostraciones

En esta sección veremos los cuatro tipos de demostraciones que usaremos a lolargo de todo el curso.Prueba directa.

Esquema:

Teorema Si p entonces q.

Demostración: Supongamos p. Entonces [...], se tiene q.

Ejemplo.- Sea n un número natural. Probar que si n es impar entonces n2 es impar.Demostración: Si n es impar, es de la forma n = 2k + 1. Por tanto n2 = (2k +1)2 = 4k2 + 4k + 1 = 2(2k2 + 2k)+ 1, es decir, n2 es impar.Prueba de una proposición lógicamente equivalente.

Consiste en sustituir la proposición a demostrar por otra que sea lógicamenteequivalente y tratar de probar esta última. Por ejemplo, si queremos probar quep → (q ∨ r) podemos usar que es lógicamente equivalente a (p ∧ ¬q) → r.

Esquema:

Teorema p → (q ∨ r).

Demostración: Supongamos p ∧ ¬q. Entonces [...], se tiene r.

Prueba del contrarrecíproco.Es un caso particular de la anterior. Si se quiere probar p → q, usamos que es

lógicamente equivalente a ¬q → ¬p, y

Esquema:

7

Teorema p → q.

Demostración: Supongamos ¬q. Entonces [...], se tiene ¬p.

Ejemplo.- Sea n un número natural. Probar que si n2 es impar entonces n es impar.Demostración: Supongamos que n es par, es decir n = 2k. Entonces n2 = 4k2 espar.Prueba por reducción al absurdo.

Si queremos probar que p es un teorema (es verdadero), lo que queremos veres que p es una tautología. Por tanto ¬p es una contradicción.

Esquema:

Teorema p.

Demostración: Supongamos ¬p. Entonces [...] FALSO. Luego es una con-tradicción. Se tiene p.

Ejemplo.- Proposición (Pitágoras).-√

2 no es racional.Demostración.- Haremos la demostración por reducción al absurdo. Supongamosque

√2 es racional, es decir,

√2 = m

n, y suponemos que m y n no tienen ningún

factor común. Elevando al cuadrado tenemos 2 = m2/n2, luego m2 = 2n2. Comom2 es un número par, se deduce (probarlo) que m es par, m = 2r. Sustituyendotenemos 4r2 = 2n2, luego 2r2 = n2, de donde deducimos que n2, y por tanton, es un número par. Esto contradice el hecho de que m y n no tenían factorescomunes.Contraejemplos.-

Supongamos que tenemos una proposición y queremos saber si es verdaderao falsa. Por ejemplo, sea P(n) una propiedad que tratamos probar que se verificapara todos los números naturales n. Entonces:

Si P(n) es verdadera, tenemos que dar una prueba general.

Si P(n) es falsa, basta dar un valor de n en el que no se verifique la propie-dad.

Ejemplo.- Si nuestra propiedad P(n) es: “todo número impar es primo", bastacomprobar que para n = 9 no se verifica la propiedad, luego es falsa.Prueba por inducción.-

Supongamos que tratamos de probar una propiedad (un enunciado) sobre losnúmeros naturales n ≥ n0, para un n0 dado. Si denotamos por P(n) dicha propie-dad, la prueba por inducción funciona de la siguiente manera:

1) Probar que P(n0) es cierta

8

2) Suponer que P(n) es cierta (hipótesis de inducción)

3) Probar que P(n + 1) es cierta.

El segundo paso se puede sustituir por2’) Suponer que P(k) es cierta ∀k, n0 ≤ k ≤ n.

Ejemplo.- ∀n ∈ N se verifica que

1 + 2 + · · · + n = n(n + 1)

2.

Demostración:1) El resultado se verifica para n = 1, pues 1 = 1(1+1)

2 .

2) Suponemos el resultado cierto para n, es decir, 1 + 2 + · · · + n = n(n+1)2 .

3) Tenemos que probar que 1 + 2 + · · · + n + (n + 1) = (n+1)(n+2)2 . En efecto,

1+2+· · ·+n+(n+1) = [1+2+· · ·+n]+(n+1) = n(n + 1)

2+(n+1) = (n + 1)(n + 2)

2.

Ejemplo.- Todo número natural n > 1 tiene un divisor primo.Demostración:1) El resultado se verifica para n = 2, pues 2 es un divisor primo de 2.2’) Suponemos el resultado cierto ∀k, n0 ≤ k < n.

3) Tenemos que probar que n tiene un divisor primo. Si n es primo, n es el divisorbuscado. Si n no es primo entonces n = rs, con 1 < r, s < n. Luego r (y s) tieneun divisor primo.

1.4. Los números complejos

Números complejos

Un número complejo es un número de la forma a +b · i , donde a

y b son números reales e i es un símbolo que verifica la propiedadi2 = −1.

Dado un complejo en forma binómica z = a + b i , el número real a se deno-mina parte real de z, notado R(z), mientras que b se denomina parte imaginariade z, notado I(z). Dos números complejos son iguales si y sólo si tienen la mismaparte real y la misma parte imaginaria.

9

En C definimos las siguientes operaciones internas:

(a + b i)+ (c + d i) = (a + c)+ (b + d) i,

(a + b i)(c + d i) = (ac − bd)+ (ad + bc) i,

Proposición 1.4.1. (C,+, ·) es un cuerpo.

PRUEBA: Comprobar que C con estas dos operaciones es un cuerpo es algotedioso. Simplemente notaremos que el elemento neutro de la suma es 0 = 0+0 i

y el neutro del producto es 1 = 1+0 i . Así mismo, dado a +b i el inverso aditivoes −a + (−b) i y, si es distinto de 0, el inverso multiplicativo es precisamente

a/(a2 + b2)− (b/(a2 + b2)) i.

Nota 1.4.2. Si consideramos los números complejos de la forma a + 0 i vemosque podemos suponer R ⊂ C, identificando a ∈ R con a + 0 i ∈ C.

Definición 1.4.3. Dado un número complejo z = a + b i , llamaremos complejoconjugado de z, y lo notaremos z, al número complejo z = a − b i .

La operación de conjugación, a pesar de su inofensivo aspecto, tiene una im-portancia enorme, incluso en el estudio de objetos reales. Un par de propiedadesinmediatas, a partir de la definición, son las siguientes:

z1 + z2 = z1 + z2, z1 · z2 = z1 · z2,

de donde a su vez se deducen

−z = −z, 1/z = 1/z.

Sea z ∈ C. Es fácil ver que z ∈ R si y sólo si z = z.

Módulo

Sea z = a + bi ∈ C. Llamaremos módulo de z, denotado |z|, ala raíz cuadrada del número real positivo z · z = a2 + b2,

|z| =√

a2 + b2

10

1 2 3-3 -2 -1

1

2

3

-3

-2

-1

z=2+3i

z=2-3i-z=-2-3i

|z|

Figura 1.1: Representación gráfica

1 2 3-3 -2 -1

1

2

3

-3

-2

-1

z1=-1+2i

z2=3-i

z=z1+z2=2+i

Figura 1.2: Suma de complejos

11

Nota 1.4.4. La expresión del inverso multiplicativo de z resulta más sencilla usan-do el conjugado y el módulo:

1

z= z

z· 1

z= z

|z|2.

Gráficamente, podemos representar C como un plano:Forma polar o módulo-argumento Todo número complejo z se puede escribirde forma

z = |z|(a + b i),

donde a2 + b2 = 1 y, en consecuencia, existe un único ángulo α ∈ [0, 2π),llamado argumento de z, tal que

z = |z|(cos(α)+ sen(α) i).

Dos números complejos, representados en forma polar, son iguales si y sólo sisus módulos y sus argumentos son iguales.

Con esta notación es fácil ver que para multiplicar dos números complejos hayque multiplicar sus módulos y sumar sus argumentos. Para dividir, por tanto, sedividen sus módulos y se restan sus argumentos. En efecto: sean

z1 = r1(cos(α1)+ isen(α1)), z2 = r2(cos(α2)+ isen(α2)).

Entonces

z1z2 = r1r2 · [(cos(α1)+ isen(α1))(cos(α2)+ isen(α2)]

= r1r2 · [ (cos(α1)cos(α2)− sen(α1)sen(α2))+(cos(α1)sen(α2)+ cos(α2)sen(α1)) i ]

= r1r2 · [cos(α1 + α2)+ isen(α1 + α2)] .

De aquí se obtiene la fórmula de De Moivre:

Fórmula de De Moivre

Para todo número entero n, se tiene

(cos(α)+ isen(α))n = cos(nα)+ isen(nα).

PRUEBA: Si n ≥ 0 lo probaremos por inducción. Para n = 0 se verifica, pues

(cos(α)+ isen(α))0 = 1 = cos(0)+ isen(0).

12

1 2 3-3 -2 -1

1

2

3

-3

-2

-1

=2(cos 30 + i sen 30)√z= 3+ i

r=|z

|=2

θ=30

x=r cos(θ)

y=r sen(θ)

Figura 1.3: Forma polar

1 2 3-3 -2 -1

1

2

3

-3

-2

-1

z1=2(cos 30 + i sen 30)

z2=3/2(cos 75 + i sen 75)

z1z2=3(cos 105 + i sen 105)

Figura 1.4: Producto

13

Supongamos que se verifica para n, es decir,

(cos(α)+ isen(α))n = cos(nα)+ isen(nα).

Entonces,

(cos(α)+ isen(α))n+1 = (cos(α)+ isen(α))n(cos(α)+ isen(α)) =

= (cos(nα)+ isen(nα)(cos(α)+ isen(α)) = cos(n + 1)α + isen(n + 1)α.

Sea ahora n < 0. Pongamos n = −m. Entonces,

(cos(α)+ isen(α))n = (cos(α)+ isen(α))−m = 1

(cos(α)+ isen(α))m=

= 1

(cos(mα)+ isen(mα)= cos(mα)−isen(mα) = cos(−m)α+isen(−m)α = cos(nα)+isen(nα).

Forma exponencial Una variante de la forma polar se obtiene al tener en cuentala fórmula de Euler:

eiα = cos(α)+ isen(α).

Esto nos permite escribir un número complejo en la forma siguiente, denomi-nada forma exponencial:

z = |z|eiα .

Esta nueva forma es especialmente cómoda para expresar productos y cocien-tes ya que sólo hay que tener en cuenta las propiedades de la función exponencial(para multiplicar se suman exponentes y para dividir se restan). En particular, parapotencias con exponentes enteros se tiene

zn = |z|neinα.

Raíces n-ésimas de un número complejo Estudiemos ahora las potencias conexponente racional de un número complejo. Sean z = |z|eiα ∈ C y n un númeronatural. Consideremos ω = |ω|eiβ = n

√z = z1/n una raíz n-ésima de z. Se tiene

queωn = |ω|neinβ = |z|eiα = z.

Por tanto,

|ω| = n√

|z| y β = (α + 2kπ)/n, con k ∈ Z.

14

De todos estos valores sólo n consecutivos son distintos. Por tanto, un númerocomplejo z tiene siempre n raíces n-ésimas distintas

ωk = n√

|z|ei(α+2kπ)/n, con k = 0, 1, . . . , n − 1.

Observamos que las n raíces n-ésimas tienen todas el mismo módulo, y susargumentos se diferencian en 2π/n cada uno del siguiente, esto es, las raíces n-ésimas se encuentran en los vértices de un polígono regular de n lados inscrito enla circunferencia de centro 0 y radio n

√|z|. Como ejemplo, en la siguiente figura

podemos ver las raíces sextas de z = 8(cos30 + isen30)

1 2 3

-3 -2 -1

1

2

3

-3

-2

-1

z=8(cos 30 + i sen 30)

4 5 6 7

z1= 2 (cos 5 + i sen 5)√

z2= 2 (cos 65 + i sen 65)√ 2 (cos 125 + i sen 125)=z3√

z6= 2 (cos 305 + i sen 305)√

2 (cos 185 + i sen 185)=z4√

2 (cos 245 + i sen 245)=z5√

Figura 1.5: Raíces

15

16

Capítulo 2

Enteros

2.1. Divisibilidad

Antes de comenzar el tema enunciamos una propiedad de los números enterosque usaremos más adelante:

Principio de la buena ordenación: Todo subconjunto no vacío de Z acotadoinferiormente posee un mínimo.

Desarrollamos brevemente la teoría clásica de la divisibilidad sobre los núme-ros enteros.

Divisibilidad

Sean a, b dos enteros distintos de cero. Se dirá que a divide a b siexiste c ∈ Z tal que ac = b. En este caso se escribe a|b. Tambiénse dice que b es divisible por a.

Nota 2.1.1. Dos elementos especiales de Z son 1 y −1. Para empezar, obviamentedividen a todos los números enteros. Pero además son los únicos enteros con estapropiedad.

Supongamos que a ∈ Z es otro entero con esta propiedad. Entonces debedividir a 1, luego existe b tal que ab = 1. Entonces, o bien a, b son positivoso son negativos. Si son negativos, se pone (−a)(−b) = 1, con lo que se puedesuponer que ambos son positivos.

17

En este caso, si fuese a ó b mayor que 1 (por ejemplo a), sería a > 1 y b > 0(luego b ≥ 1) sería ab > 1 · b = b ≥ 1, luego ab > 1, lo que no puede ser. Así,a = b = 1, luego desde el principio a = ±1, b = ±1.

La relación de divisibilidad verifica las propiedades siguientes:

1. Propiedad reflexiva: a|a. En efecto, a = 1 · a.

2. Propiedad transitiva: Si a|b y b|c entonces a|c. En efecto, existen d, d ′ talesque b = ad y c = bd ′, luego c = add ′ lo que implica que a|c.

3. Si a|b y b|a entonces a = ±b. En efecto, existen c, c′ tales que b = ac ya = bc′. Así a = acc′, luego a − acc′ = a(1 − cc′) = 0. Como a 6= 0 pordefinición de divisibilidad, es 1 − cc′ = 0 luego cc′ = 1, de donde c′ = ±1y así a = ±b.

Por consiguiente, si nos restringimos a enteros positivos, la divisibilidad esuna relación de orden parcial porque la propiedad 3) anterior es la propiedad anti-simétrica: a|b y b|a H⇒ a = b.

Nota 2.1.2. La divisibilidad es compatible con las operaciones aritméticas. Enconcreto:

1. Si a|b y a|c entonces a|(b ± c). En efecto, existen d, d ′ ∈ Z tales queb = ad y c = ad ′. Así

b ± c = ad ± ad ′ = a(d ± d ′) ,

luego a|(b ± c).

2. Si a|b entonces a|bc, ∀c ∈ Z. En efecto, existe d ∈ Z tal que b = ad. Asíbc = adc, luego a|bc.

Veamos ahora uno de los resultados más importantes de este tema:

División euclídea

Sean a, b ∈ Z, b > 0. Existen unos enteros únicos q, r ∈ Z talesque:

1. a = qb + r

2. 0 ≤ r < b

Al entero q se le llama el cociente de la división y a r el resto.

18

PRUEBA: Vamos a probar primero la existencia. Si a < b, entonces se puedeponer q = 0 y r = a. Supongamos que a ≥ b y sea q ∈ Z tal que qb ≤ a <

(q + 1)b. Pongamos r = a − bq; hay que demostrar que 0 ≤ r < b. Desde luego,como a ≥ qb es a − qb = r ≥ 0. Por otro lado, como a < (q + 1)b, se tiene quer = a − qb < (q + 1)b − qb = b.

Probemos ahora la unicidad. Supongamos que existen q ′, r ′ ∈ Z tales que a =q ′b + r ′, 0 ≤ r < b. Si q ≥ q ′, restando obtenemos que (q − q ′)b = r ′ − r < b,igualdad que sólo se puede dar si q = q ′ y r = r ′. �

Nota 2.1.3. Este teorema se puede demostrar usando el principio de buena orde-nación. En efecto: sea S = {a −bx | x ∈ Z y a −bx ≥ 0}. S es no vacío y estáacotado inferiormente, luego posee un mínimo. Sea r = a − bq ≥ 0 dicho míni-mo. Falta ver que r < b. En caso contrario, r = b + r ′, 0 ≤ r ′ < r. Sustituyendose tiene que r ′ = a − b(q + 1) ∈ S, en contra de ser r el mínimo.

Nota 2.1.4. Podemos dar una nueva definición de divisibilidad: Sean a, b dosenteros distintos de cero. Se dirá que b divide a a si el resto de la división de a porb es cero.

Número primo

Un entero p 6= 0,±1 se llama primo si y sólo si es divisibleúnicamente por ±p y ±1.

Máximo común divisor

Dados dos enteros a, b, diremos que d > 0 es un máximo comúndivisor de a y b y denotaremos d = mcd(a, b), si se verifica:

1. d|a y d|b.

2. Si d ′ > 0 es tal que d ′|a y d ′|b entonces d ′|d.

Si d = 1 se dice que a y b son primos entre sí.

19

Mínimo común múltiplo

Diremos que m > 0 es un mínimo común múltiplo de a y b ydenotaremos m = mcm(a, b), si se verifica:

1. a|m y b|m.

2. Si m ′ > 0 es tal que a|m ′ y b|m ′ entonces m|m ′.

Nota 2.1.5. Por el momento no tenemos asegurada la existencia del mcd ni delmcm de dos enteros, pero es fácil comprobar que, de existir, son únicos.

Veamos el caso del mcd. Supongamos que d y f son dos mcd de a y b. Porser d un mcd y verificarse que f |a, f |b, por la propiedad 2) se tiene que f |d.Cambiando el papel de d y f , tenemos d| f , y por tanto la igualdad.

2.2. Algoritmo de Euclides. Identidad de Bezout

Veamos un procedimiento, el algoritmo de Euclides, para el cálculo del máxi-mo común divisor.

Proposición 2.2.1. Sean a, b ∈ Z+, a ≥ b, y efectuemos la división euclídea

a = qb + r . Entonces, si r = 0 es mcd(a, b) = b y si r 6= 0

mcd(a, b) = mcd(b, r).

PRUEBA: Si r = 0 es a = qb, luego mcd(a, b) = b. Si r 6= 0, sea

d = mcd(a, b), d ′ = mcd(b, r) ;

entonces d|r = a − qb, luego d|d ′. Por otra parte, d ′|a = qb + r , luego d ′|d y asíd = d ′. �

20

Algoritmo de Euclides

Este resultado nos permite describir el Algoritmo de Euclides:Sean a, b ∈ Z+, a ≥ b, y efectuemos la división euclídeaa = qb + r. Como r < b, podemos dividir b entre r , y así suce-sivamente, obteniendo:

a = qb + r 0 ≤ r < b

b = q0r + r1 0 ≤ r1 < r

r = q1r1 + r2 0 ≤ r2 < r1

r1 = q2r2 + r3 0 ≤ r3 < r2...

rn−1 = qnrn + rn+1 0 ≤ rn+1 < rn

rn = qn+1rn+1 + 0 rn+2 = 0

Proposición 2.2.2. Se tiene que mcd(a, b) = rn+1, es decir, el máximo común

divisor de a y b es el último resto no nulo al aplicar sucesivamente el algoritmo

de división.

PRUEBA: Por la proposición anterior se tiene que:

mcd(a, b) = mcd(b, r) = mcd(r, r1) = · · · = mcd(rn−1, rn) = mcd(rn, rn+1) = rn+1,

lo cual demuestra el resultado. �

Asociada al máximo común divisor está la identidad de Bézout, cuya existen-cia teórica viene afirmada por el siguiente teorema:

Identidad de Bézout

Sean a, b > 0 enteros y sea d = mcd(a, b). Existen enteros α, βtales que

αa + βb = d

A cualquier igualdad de este tipo se le llama identidad de Bé-zout.

21

PRUEBA: Demostramos la existencia de manera no constructiva. Sea

S = {n ∈ Z+ | n = xa + yb, x, y ∈ Z} ;

evidentemente S 6= ∅ porque a = 1 · a + 0 · b ∈ S. Como S está acotadoinferiormente por cero, tiene un mínimo al que llamamos n0 = αa+βb. Probemosque d = n0, viendo que d|n0 y n0|d. Como d|a y d|b entonces d|n0. Para ver quen0|d, demostraremos que n0|a y n0|b. Vamos a probar que n0|a, la otra relación seprueba de forma análoga. Por la división euclídea podemos escribir a = qn0 + r

con 0 ≤ r < n0. Entonces,

r = a − qn0 = a − q(αa + βb) = (1 − qα)a + (−qβ)b ∈ S .

Por la minimalidad de n0 tiene que ser r = 0, luego n0|a.�

Nota 2.2.3. Los enteros α y β que aparecen en la identidad de Bézout no sonúnicos. En efecto: para cualesquiera α, β tales que αa + βb = d, es

(α − kb)a + (β + ka)b = d, ∀k ∈ Z .

Corolario 2.2.4. Sean a, b > 0 enteros y sea d = mcd(a, b). Para cualesquiera

enteros γ, δ se verifica que γ a + δb es un múltiplo de d.

La identidad de Bézout nos permite probar el siguiente teorema:

Teorema de Euclides

Sean a, b, c > 0 tales que c|ab y mcd(c, a) = 1; entonces c|b.En particular, si p es primo, p|ab y p no divide a a, entonces p|b.

PRUEBA: Evidentemente, la segunda afirmación es consecuencia de la prime-ra; demostremos ésta. Por la identidad de Bézout, 1 = αa + βc. Multiplicandopor b esta expresión, se tiene que b = αab +βcb. Como c|ab y c|cb, se tiene quec|b. �

Proposición 2.2.5. Sean a, b ∈ Z,

d = mcd(a, b), a′ = a

d, b′ = b

d.

Entonces a′, b′ son primos entre sí.

22

PRUEBA: Si a′ y b′ no son primos entre sí, entonces existe d ′ ∈ Z, 1 6= d ′,tal que d ′|a′ y d ′|b′. Luego dd ′|a′d = a, dd ′|b′d = b y dd ′ > d, lo que no esposible. �

Ahora podemos definir el mínimo común múltiplo usando el máximo comúndivisor.

Proposición 2.2.6. Sean a, b ∈ Z, d = mcd(a, b). Se verifica que mcm(a, b) =ab/d.

PRUEBA: Sean

m = ab/d, a′ = a/d, b′ = b/d.

Se tiene que m = a′b = ab′, luego es múltiplo de a y b. Sea m ′ ∈ Z múltiplode a y b, m ′ = aa′′ = bb′′. Dividiendo esta última igualdad por d obtenemosa′a′′ = b′b′′ y, por el teorema de Euclides, a′|b′′, es decir, b′′ = a′c. Sustituyendom ′ = ba′c = mc, luego m es el mínimo común múltiplo de a y b. �

Teorema fundamental de la divisibilidad

Todo entero distinto de 0 y ±1 se descompone en producto finitode números primos. Esta descomposición es única salvo orden yproducto por ±1.

PRUEBA: Vamos primero a demostrar la existencia de la descomposición. Sean 6= 0,±1 un entero fijo, y vamos a demostrar que n se descompone en productode primos. Podemos suponer que n > 0 porque, si lo demostramos en este caso yn = p1 · · · pr , entonces −n = (−1) · p1 · · · pr , lo que demuestra el resultado paralos enteros negativos.

La existencia de la descomposición se prueba por inducción a partir de n = 2.El número n = 2 es primo. Supongamos que n > 2 y que todos los números me-nores que n se descomponen en producto finito de primos. Si n es primo hemosterminado: es producto de un primo (él mismo). Si no lo es, se descompone enproducto n = n1n2 de dos enteros positivos estrictamente menores que n. Al apli-car a n1 y n2 la hipótesis de inducción, vemos que n se descompone en productofinito de primos.

23

Para demostrar la unicidad (salvo orden y producto por unidades), basta con-siderar enteros positivos n por la misma razón que antes. Además, basta ver queno puede haber dos descomposiciones distintas de un mismo número positivo enproducto de primos positivos. Vamos a operar por reducción al absurdo. Supon-gamos que hay números que admiten dos descomposiciones distintas en productode primos positivos:

n = p1 · · · pr = q1 · · · qs .

Supongamos que r ≤ s. Tenemos p1|n = q1 · · · qs , luego p1|qi , para algúni , con 1 ≤ i ≤ s, de donde p1 = qi , al ser qi primo. Podemos suponer i = 1.Dividiendo por p1 se tiene que p2 · · · pr = q2 · · · qs . Repitiendo el razonamientopara p2, . . . , pr , llegamos a 1 = qr+1 · · · qs . Luego r = s y pi = qi , i =1, . . . , r . �

Teorema (Euclides)

El conjunto de los primos es infinito.

PRUEBA: Supongamos que no, es decir, que el conjunto de los primos fuesefinito, y sean p1, . . . , pr todos los primos. Sea n = p1 · · · pr + 1. Por la factori-zación única, n debe ser divisible por algún pi , lo que implicaría que pi |1 y esoes imposible. �

Nota 2.2.7. (Opcional) Veamos otra forma de definir el máximo común divisory el mínimo común múltiplo. La factorización única de un entero positivo n laescribiremos usualmente en la forma

n =∏

p primo

pνn(p)

donde todos los νn(p) son cero salvo un número finito. La factorización se puedeextender a enteros n < 0 poniendo

n = (−1)∏

p primo

pν−n(p) .

Sin embargo, la noción de número primo la reservaremos para los positivos, comohemos dicho antes.

Teorema (Existencia del máximo común divisor).– Dados dos enteros a, b > 0,existe un único d > 0 que verifica:

24

1. d|a y d|b.

2. Si d ′ > 0 es tal que d ′|a y d ′|b entonces d ′|d.

A este entero se le llama el máximo común divisor de a y b y se le denota d =mcd(a, b).

PRUEBA: Sean

a =∏

p primo

pνa(p), b =∏

p primo

pνb(p)

las descomposiciones de a y b en producto de primos. Según el enunciado quedaclaro que el único número que satisface las condiciones es

d =∏

p primo

pmKın(νa(p),νb(p)) .

Teorema (Existencia del mínimo común múltiplo).– Dados dos números a, b >

1, existe un único m > 0 que verifica:

1. a|m y b|m.

2. Si m ′ > 0 es tal que a|m ′ y b|m ′ entonces m|m ′.

A este entero se le llama el mínimo común múltiplo de a y b y se le denotam = mcm(a, b).

PRUEBA: Sean

a =∏

p primo

pνa(p), b =∏

p primo

pνb(p)

las descomposiciones de a y b en producto de primos. Según el enunciado quedaclaro que el único número que satisface las condiciones es

m =∏

p primo

pmKax(νa(p),νb(p)) = ab

mcd(a, b)

25

Congruencias

La división euclídea nos conduce inmediatamente a la noción de congruenciade módulo dado.

Congruencia

Dados enteros a, b,m 6= 0, se dirá que a es congruente conb módulo m 6= 0 si a − b es divisible por m. En este caso seescribirá a ≡ b (mod m).

Nota 2.2.8. De la división euclídea se deduce que siempre se puede suponer po-sitivo el módulo m de la congruencia. En efecto, si m < 0 y a ≡ b (mod m) esa − b = km, luego a − b = (−k)(−m) y por tanto a ≡ b (mod − m). Esto es loque haremos de ahora en adelante.

Una propiedad fundamental de las congruencias es la siguiente:

Proposición 2.2.9. a ≡ b (mod m) si y sólo si a y b dan el mismo resto en la

división euclídea por m.

PRUEBA: En efecto, si a ≡ b (mod m), entonces m|(b−a). Sean a = qm +r

b = q ′m + r ′,0 ≤ r, r ′ < m, entonces a − b = (q − q ′)m + (r − r ′), igualdadque sólo es posible cuando r ′ − r = 0 ya que |r ′ − r | < m. Recíprocamente, sia = qm + r , b = q ′m + r es a − b = (q − q ′)m, luego a ≡ b (mod m).

Se puede ver a las congruencias de módulo m > 0 fijo como una relación enZ. En este sentido es una relación de equivalencia porque verifica las siguientespropiedades (que son consecuencia inmediata de la definición):

1. Propiedad reflexiva: Para todo a ∈ Z es a ≡ a (mod m).

2. Propiedad simétrica: Si a ≡ b (mod m) entonces b ≡ a (mod m).

3. Propiedad transitiva: Si a ≡ b (mod m) y b ≡ c (mod m), entonces a ≡c (mod m).

Las congruencias son compatibles con la adición y la multiplicación.

26

Proposición 2.2.10. Se verifica que si a ≡ b (mod m) y c ≡ d (mod m) entonces

a ± c ≡ b ± d (mod m).

PRUEBA: Tenemos que a−b = hm y c−d = km. Sumando ambas igualdadesse tiene que (a + c)− (b + d) = (h + k)m, luego a + c ≡ b + d (mod m). �

Proposición 2.2.11. Se verifica que a ≡ b (mod m) y c ≡ d (mod m) H⇒ac ≡ bd (mod m).

PRUEBA:Tenemos que a −b = hm y c −d = km. Basta tener en cuenta que ac −bd =

ac−ad +ad −bd = a(c−d)+d(a−b) = (ak +dh)m, luego ac ≡ bd (mod m).�

Las congruencias tienen algunas propiedades interesantes que las diferenciande los enteros. ¿Qué ocurre con la cancelación multiplicativa de congruencias? Esdecir, se trata de ver si se verifica que

ax ≡ bx (mod m) H⇒ a ≡ b (mod m)

La respuesta es claramente negativa porque, por ejemplo,

2 · 2 ≡ 0 · 2 (mod 4) y 2 6≡ 0 (mod 4)

En general, la propiedad cancelativa no se verifica si x y m no son primosentre sí. En efecto, si 1 < d = mcd(x,m), x = x ′d, m = m ′d, entonces m ′x ≡0 · x (mod m) y m ′ 6≡ 0(mod m) porque 0 < m ′ < m.

Lo positivo de esta situación es que se verifica la propiedad cancelativa conmultiplicador x si y sólo si mcd(x,m) = 1. Acabamos de ver que, si este máximocomún divisor es mayor que 1 no se verifica la propiedad cancelativa. Veamosque sí se verifica cuando es 1. Sea ax ≡ bx (mod m) y mcd(x,m) = 1. Porla identidad de Bézout existen α, β ∈ Z tales que αx + βm = 1. Así, a =αax + βam, b = αbx + βbm, luego

a − b = α(ax − bx)+ β(a − b)m,

que es múltiplo de m. Por tanto, a ≡ b (mod m).

Veamos ahora que ocurre con la ecuación ax = b, a, b ∈ Z. Sabemos que laecuación anterior tiene solución entera si y sólo si a|b y su solución es x = b

a∈ Z.

En el caso de las congruencias tenemos

27

Proposición 2.2.12. La ecuación en congruencias

ax ≡ b (mod m)

tiene solución si y sólo si d = mcd(a,m) divide a b.

PRUEBA: Supongamos que d|b, b = dc. La identidad de Bézout nos dice qued = αa +βm, luego b = dc = αac +βmc. Como mc ≡ 0 (mod m), se tiene queαac ≡ b (mod m), es decir, αc es solución de la ecuación.

Para la implicación contraria supongamos que x0 es una solución de la ecua-ción en congruencias. Es decir ax0 − b = km, luego d|ax0 − km = b. �

Teorema chino del resto

Sean m1,m2, . . . ,mn enteros, mayores que 1, primos entre sí dosa dos, a1, a2, . . . , an ∈ Z. El sistema de congruencias:

x ≡ a1 (mod m1)

x ≡ a2 (mod m2)...

x ≡ an (mod mn)

tiene solución. Además, si x y x ′ son dos soluciones, entoncesx ≡ x ′ (mod M), donde M = m1m2 · · · mn. Recíprocamente, six es una solución y x ′ ≡ x (mod M), entonces x ′ es solución.

PRUEBA: Denotemos Mi = M/mi , ∀i = 1, . . . , n. Es claro que

mcd(mi , Mi ) = 1, ∀i = 1, . . . , n,

luego, por la identidad de Bézout, existen αi , βi ∈ Z verificando

1 = αi mi + βi Mi , i = 1, . . . , n.

Tomemos x = a1β1 M1 + a2β2 M2 + · · · + anβn Mn y comprobemos que x essolución. Para ello tendremos que comprobar que x ≡ ai (mod mi ), para todo i ,o, equivalentemente, que x − ai ≡ 0 (mod mi ), para todo i. Usando la identidadde Bézout correspondiente, tenemos ai = aiαi mi + aiβi Mi . Entonces,

x − ai = a1β1 M1 + · · · + anβn Mn − aiαi mi − aiβi Mi =

28

= a1β1M1 + · · · + ai−1βi−1 Mi−1 + ai+1βi+1 Mi+1 + · · · + anβn Mn − aiαi mi ,

y, al ser todos los sumandos múltiplos de mi , es x − ai ≡ 0 (mod mi ). �

Ejemplo 2.2.13. Resolvamos el siguiente sistema de congruencias:

x ≡ 1 (mod 2)x ≡ 2 (mod 3)x ≡ 3 (mod 5)

Siguiendo la notación de la demostración anterior, en nuestro caso tenemosm1 = 2,m2 = 3,m3 = 5, M = 30, M1 = 15, M2 = 10 y M3 = 6. Por laidentidad de Bezout tenemos

mcd(m1, M1) = 1, 1 = (−7) · 2 + 1 · 15, luego β1 = 1.mcd(m2, M2) = 1, 1 = (−3) · 3 + 1 · 10, luego β2 = 1.mcd(m3, M3) = 1, 1 = (−1) · 5 + 1 · 6, luego β3 = 1.

Por tanto una solución del sistema es

x = a1β1M1 + a2β2 M2 + a3β3 M3 = 53.

Las soluciones son los enteros congruentes con 53 módulo 30.

2.3. Clases de congruencias módulo m.

Fijemos un entero m ≥ 2, y sea Zm el conjunto de los enteros múltiplos de m.

Sabemos que la relación “ser congruente módulo m” es una relación de equi-valencia en el conjunto de los números enteros Z. Veamos que dicha relacióninduce una partición en Z en lo que llamaremos clases de congruencia módulo m.

Por definición, la clase de congruencia módulo m de un entero a es el conjunto{b ∈ Z | a ≡ b (mod m)}.

Veamos cómo es la clase de congruencia de un entero a ∈ Z. Sabemos queb ∈ Z está en la clase de a si y sólo si b es congruente con a módulo m, es decir,m|(b − a), luego b = a + qm. Por tanto, la clase de congruencia módulo m de a

es el conjunto de los enteros de la forma a + km, con k ∈ Z.

Así, dado a ∈ Z, la clase de congruencia módulo m la denotaremos por a +Zm, y al conjunto de todas las clases de congruencia módulo m lo denotaremospor Z/Zm.

29

Vamos a describir el conjunto Z/Zm y a ver que podemos sumar y multiplicarlos elementos de Z/Zm.

Proposición 2.3.1. Todo número natural es congruente módulo m a uno (y sólo

uno) de los enteros del conjunto {0, 1, 2, . . . ,m − 1}.

PRUEBA: Sea a ∈ N. El teorema de la división implica que a = qm + r ,0 ≤ r < m. La primera igualdad nos dice que a y r son congruentes módulo m.

Corolario 2.3.2. Todo número entero es congruente módulo m a uno (y sólo uno)

de los enteros del conjunto {0, 1, 2, . . . ,m − 1}.

Así, el conjunto de las clases de congruencias módulo m es

Z/Zm = {0 + Zm, 1 + Zm, . . . , (m − 1)+ Zm}.

Veamos cómo se definen la suma y el producto de clases de congruencias.

Definición.- Sean a + Zm, b + Zm ∈ Z/Zm dos clases de congruencias.

(a + Zm)+ (b + Zm) := (a + b)+ Zm

(a + Zm) · (b + Zm) := (ab)+ Zm.

Proposición 2.3.3. El conjunto Z/Zm, con las operaciones definidas anterior-

mente, es un anillo (abeliano).

Ejemplo 2.3.4. Supongamos que m = 10, a = 7, b = 9. Entonces

(7 + Z10)+ (9 + Z10) = 16 + Z10, (7 + Z10) · (9 + Z10) = 63 + Z10.

Teniendo en cuenta que 7 + Z10 = 17 + Z10, 9 + Z10 = 29 + Z10, ¿queocurre si cambiamos el 7 por 17 y el 9 por 29? No pasa nada, ya que el resultadoes el mismo: (17 +Z10)+ (29 +Z10) = 46 +Z10, pero 46 +Z10 = 16 +Z10.Lo mismo ocurre con el producto.

30

En la sección anterior probamos que las congruencias módulo m eran com-patibles con la suma y el producto, es decir, la suma y el producto que hemosdefinido no dependen del representante que uno elija.

Hemos visto que toda clase de congruencia a+Zm es igual a una clase r +Zm,con 0 ≤ r < m. A partir de este momento siempre que trabajemos con clases decongruencias módulo m la escribiremos usando un representante r, 0 ≤ r < m.

Así, pondremos (7 + Z10) · (9 + Z10) = 3 + Z10, ya que, por el teorema dedivisión, 63 = 6,10 + 3, luego 3 es congruente con 63 módulo 10, es decir,3 + Z10 = 63 + Z10. Análogamente −11 + Z10 = 9 + Z10.

Ejemplo 2.3.5. Como ejemplo escribimos las tablas de sumar y de multiplicar delas congruencias módulos 4 y 5.

+ 0 1 2 30 0 1 2 31 1 2 3 02 2 3 0 13 3 0 1 2

× 0 1 2 30 0 0 0 01 0 1 2 32 0 2 0 23 0 3 2 1

+ 0 1 2 3 40 0 1 2 3 41 1 2 3 4 02 2 3 4 0 13 3 4 0 1 24 4 0 1 2 3

× 0 1 2 3 40 0 0 0 0 01 0 1 2 3 42 0 2 4 1 33 0 3 1 4 24 0 4 3 2 1

2.4. Los teoremas de Fermat y Euler

Terminamos este tema probando dos teoremas muy importantes, debidos aFermat y Euler.

Sean m, n enteros positivos. Recordamos que el número combinatorio(

mn

)está

definido de la forma siguiente:(

m

n

)= m!

n!(m − n)!

31

Lema 2.4.1. Si p es primo, entonces p divide a(

pr

), para todo r, 0 < r < p.

PRUEBA: Sabemos que(

p

r

)= p!

r !(p − r)!

es un entero. Como 1 ≤ r ≤ p − 1, p no divide a r ! ni a (p − r)!, los enteros p yr !(p − r)! son primos entre sí. Por tanto r !(p − r)! divide a (p − 1)! y

(p

r

)= p

[(p − 1)!

r !(p − r)!

]

es un entero múltiplo de p. �

Corolario 2.4.2. Si p es primo, entonces, ∀a, b ∈ Z, (a+b)p ≡ a p+b p (mod p).

Teorema 2.4.3. Si p es primo, entonces, ∀a ∈ Z, a p ≡ a (mod p).

PRUEBA: Basta probarlo para enteros positivos. Lo haremos por inducción.Para a = 1 ya está. Supongamos el teorema cierto para a. Entonces

(a + 1)p ≡ a p + 1p ≡ a + 1(mod p)

por la hipótesis de inducción. �

(Pequeño) Teorema de Fermat

Si p es primo y no divide a a ∈ Z, entonces a p−1 ≡ 1 (mod p).

PRUEBA: Por el teorema anterior, a p ≡ a (mod p). Por ser p y a primosentre sí, se verifica la propiedad cancelativa, luego a p−1 ≡ 1 (mod p). �

Nota 2.4.4. El teorema de Euler está relacionado con las congruencias invertiblesmódulo m, esto es, los elementos a + Zm tales que existe b + Zm verificando

(a + Zm) · (b + Zm) = 1 + Zm.

Los elementos que verifican esta propiedad se denominan unidades módulom.

32

Proposición 2.4.5. a + Zm es una unidad en Z/Zm si y sólo si mcd(a,m) = 1.

PRUEBA: Supongamos que a + Zm es unidad. Entonces existe b + Zm talque (a +Zm)(b +Zm) = 1 +Zm, luego ab − 1 = qm, y ab − qm = 1, por tantoa y m son primos entre sí.

Recíprocamente, supongamos que mcd(a,m) = 1. Por la identidad de Bezoutexisten enteros r, s con ra + sm = 1. Luego 1 + Zm = (ra + sm) + Zm =(ra +Zm)+ (sm +Zm) = (a +Zm)(r +Zm). Por tanto a +Zm es una unidad.�

Corolario 2.4.6. El conjunto Z/Zp es un cuerpo si y sólo si p es primo.

La notación estándar para el cuerpo Z/Zp es Fp, aunque en estos apuntesseguiremos con la notación de congruencias.

Corolario 2.4.7. El número de unidades de Z/Zm es igual al número de enteros

a, 1 ≤ a < m, que son primos con m.

Definición.- Al número de enteros a, 1 ≤ a < m, que son primos con m se ledenota por φ(m), la función φ de Euler.

Teorema de Euler

Sea a + Zm una unidad en Z/Zm. Entonces

aφ(m) ≡ 1 (mod m).

PRUEBA: SeaP = {u1, u2, . . . , uφ(m)}

las unidades de Z/Zm. Sea

Q = {u1a, u2a, . . . , uφ(m)a}

el conjunto obtenido al multiplicar los elementos de P por a. Es claro (demostrar-lo) que los elementos de Q son todos distintos y son unidades en Z/Zm. Por tantolos elementos de P y Q son congruentes entre sí (en diferente orden), de donde

∏φ(m)i=1 ui ≡

∏φ(m)i=1 ui a (mod m)

33

Si ponemos u =∏φ(m)

i=1 ui se tiene u ≡ uaφ(m) (mod m). Como u y m sonprimos entre sí, se verifica la propiedad cancelativa y obtenemos

aφ(m) ≡ 1 (mod m).

Vamos a ver por último, cómo hallar φ(m) sin necesidad de comprobar ele-mento a elemento de {0, ...,m − 1} si son primos con m o no. Para ello no necesi-tamos más que la factorización de m (en realidad, sólo el conjunto de primos quedividen a m, que es algo menos preciso).

Proposición 2.4.8. La función φ verifica las siguientes propiedades:

1. Si p es primo, entonces φ(p) = p − 1.

2. Si p es primo, entonces φ(pn) = pn − pn−1 = pn(1 − 1/p).

3. Si m y n son primos entre sí, entonces φ(nm) = φ(n)φ(m).

4. Si n = pn11 p

n22 . . . p

nrr es la descomposición en factores primos de n, enton-

ces

φ(n) = n

(1 − 1

p1

)(1 − 1

p2

). . .

(1 − 1

pr

).

PRUEBA: Los apartados primero y segundo son elementales. El primero esdirecto y el segundo se sigue de observar que, los únicos números menores quepn y no primos con él son precisamente los múltiplos de p menores y hay, preci-samente pn−1 de éstos.

Para ver el tercer apartado, denotemos Ur las unidades mod r y definimos

f : Umn −→ Um × Un g : Um × Un −→ Umn

x 7−→ (x, x) (a, b) 7−→ x tal que x ≡ a (mod m)

x ≡ b (mod n)

Notemos que, dado que mcd(m, n) = 1, un entero es primo con mn si ysólo si lo es con m y n a la vez. Por tanto f está bien definida, y también lo está g

(utilizando el Teorema chino del resto). Es sencillo ver que f y g son aplicacionesinversas la una de la otra, por lo que

φ(mn) = ♯ (Umn) = ♯ (Um × Un) = φ(m)φ(n).

El cuarto apartado se sigue directamente del segundo y del tercero. �

34

Capítulo 3

Polinomios

3.1. Introducción

Sea k un cuerpo (por ejemplo, Q,R,C,Fp). Denotaremos por k[x] al conjuntode todas las expresiones de la forma

a(x) = am xm + am−1xm−1 + . . .+ a1x + a0,

con los ai ∈ k. De esta manera, k[x] es el conjunto de todos los polinomios concoeficientes en k. Dos polinomios son iguales si lo son coeficiente a coeficiente.

Grado

El grado de un polinomio no nulo a(x), notado grado(a(x)), esel mayor entero n tal que an 6= 0. El polinomio cuyos coeficientesson todos nulos se llama polinomio nulo y se denota por 0. Porconvención, su grado es grado(0) = −∞.

Sea a(x) =∑n

i=0 ai xi ∈ k[x] un polinomio no nulo con an 6= 0. Llamaremos

término líder de a(x) al término anxn , coeficiente líder a an y término constantea a0. Un polinomio es mónico si su coeficiente líder es 1. Los polinomios se dicenconstantes cuando su grado es cero, así como el polinomio nulo.

Los polinomios se pueden sumar y multiplicar, extendiendo las operacionesde k:Si a(x) =

∑ni=0 ai x

i , b(x) =∑m

i=0 bi xi , suponiendo sin pérdida de generalidad

que m ≥ n, podemos definir la suma como

a(x)+ b(x) =n∑

i=0

(ai + bi )xi + bn+1xn+1 + . . .+ bm xm.

35

Cuando m = n, basta quedarnos con el primer sumando de la expresión anterior.Tomando de nuevo a(x) y b(x), su producto está definido como:

d(x) = a(x)b(x) =m+n∑

l=0

dl xl , donde dl =

i+ j=l

ai b j .

Estando así definidas las operaciones, es claro que extienden las de k; bastatomar m = n = 0. Por otro lado, también es evidente que siempre y cuandoasumamos que −∞ < n y −∞ + n < −∞ para cualquier n ≥ 0 (algo, todo seadicho, nada extravagante), tenemos que

grado(a(x)+b(x)) ≤ mKax{grado(a(x)), grado(b(x))}, no dándose la igual-dad solamente cuando m = n y am + bn = 0.

grado(a(x)b(x)) = grado(a(x))+ grado(b(x))

Es fácil comprobar, y por ello le cedemos la tarea al lector interesado en fami-liarizarse con las nociones aquí descritas, que la suma y el producto de polinomiosverifican las propiedades conmutativa, asociativa y distributiva, además de poseerelemento neutro, elemento simétrico y elemento unidad. En otras palabras, k[x]es un anillo conmutativo, como el conjunto de los números enteros. Pero esta noes la única similitud con Z.

Teorema de división

Sean f (x), g(x) ∈ k[x] dos polinomios, con g(x) 6= 0. Entonces,existen dos únicos polinomios q(x), r(x) ∈ k[x] tales que

f (x) = q(x)g(x)+ r(x)

y grado(r(x)) < grado(g(x)).

PRUEBA: La demostración es constructiva, indicando cómo se calculan cocientey resto de la división euclídea.Si grado( f (x)) < grado(g(x)) tomamos q(x) = 0, r(x) = f (x), y ya hemosterminado nuestra construcción.

Supongamos ahora que grado( f (x)) ≥ grado(g(x)) y sean axm, bxn los tér-minos de mayor grado de f (x), g(x) respectivamente. Escribamos

f1(x) = f (x)− (a/b)xm−ng(x);

36

así pues f1(x) es un polinomio de grado estrictamente inferior al de f (x) y esco-giendo q1(x) = (a/b)xm−n , tenemos que f (x) = q1(x)g(x)+ f1(x).

Aplicando el mismo razonamiento a f1(x) y así sucesivamente, logramos crearun conjunto finito de igualdades del tipo

f (x) = q1(x)g(x)+ f1(x)

f1(x) = q2(x)g(x)+ f2(x)...

...

ft−1(x) = qt (x)g(x)+ ft (x),

donde

grado( f1(x)) > grado( f2(x)) > . . . > grado( ft (x))

y como vamos descendiendo al menos una unidad el grado en cada fi (x), o bienft (x) = 0 o bien es de grado inferior al de g(x), y de ahí la finitud del proceso.Poniendo

q(x) =t∑

i=1

qi (x) , r(x) = ft (x)

se tiene f (x) = q(x)g(x)+ r(x).

Hemos probado la existencia. Probemos ahora la unicidad. Consideremos puesdos expresiones para f (x) que verifiquen las propiedades que establece el teoremade división:

f (x) = q(x)g(x)+ r(x) = q ′(x)g(x)+ r ′(x);

entonces

r(x)− r ′(x) = (q ′(x)− q(x))g(x),

con lo que r(x)− r ′(x) debe ser nulo, ya que todo múltiplo no nulo de g(x) tieneque ser de grado mayor o igual que él. �

37

Algoritmo de división

Para calcular el cociente y el resto de la división entre f (x) yg(x), de grados respectivos m y n.Si m ≥ n tome

f1(x) = f (x)− (a/b)xm−ng(x) , q1(x) = (a/b)xm−n .

Repita con f1(x) y g(x) hasta que grado( ft (x)) < grado(g(x)).El cociente y el resto son

q(x) = q1(x)+ . . .+ qt−1(x) , r(x) = ft (x).

Si m < n, el cociente es 0 y el resto el propio f (x).

Veamos cómo funciona esto último con un ejemplo, que nos acompañará pornuestra lectura de las próximas secciones.

Ejemplo 3.1.1. Sean f (x) = x5− 12 x3+2x2−3x +3 y g(x) = 2x3− 2

3 x2+3x −1dos polinomios de Q[x]. Si queremos calcular el cociente y el resto de la divisiónde f (x) entre g(x), tomamos en primer lugar

f1(x) = f (x)− 1

2x2g(x) = 1

3x4 − 2x3 + 5

2x2 − 3x + 3.

Como grado( f1(x)) = 4, seguimos. Sea ahora

f2(x) = f1(x)−1

6xg(x) = −17x3

9+ 2x2 − 17x

6+ 3.

Tenemos que seguir, pues todavía no hemos bajado de grado 3, pero este será elúltimo paso. Así,

f3(x) = f2(x)+17

18g(x) = 37x2

27+ 37

18.

Ahora ya hemos terminado. El cociente y el resto de la división son

q(x) = 1

2x2 + 1

6x − 17

18, r(x) = 37x2

27+ 37

18.

Este teorema, aunque pueda parecer elemental a primera vista (y es que dehecho su prueba no es compleja), tiene numerosas aplicaciones inmediatas que lo

38

embellecen y nos permiten relatar interesantes propiedades de los polinomios enuna variable o de la estructura de k[x] como anillo. Algunas las detallaremos acontinuación, y otras las veremos más adelante en este u otros capítulos, cuandoprofundicemos en el estudio de los anillos de polinomios.

Corolario 3.1.2. (Teorema del resto) Sea un polinomio f (x) ∈ k[x], y sea un

elemento del cuerpo a ∈ k. Entonces f (a) es el resto de dividir f (x) por x − a.

PRUEBA: Por el teorema de división,

f (x) = (x − a)q(x)+ r(x), con grado(r(x)) < grado(x − a) = 1.

Por tanto, r(x) debe ser una constante, digamos r , luego f (a) = (a−a)q(a)+r =r . �

Corolario 3.1.3. (Teorema de la raíz) Sea un polinomio f (x) ∈ k[x] de grado

positivo. Entonces f (x) tiene una raíz a ∈ k (i.e., existe a en k tal que f (a) = 0)

si y sólo si es divisible por x − a.

PRUEBA: En efecto, podemos escribir f (x) = q(x)(x − a) + r con r ∈ k.Así f (a) = 0 si y sólo si r = 0, lo que equivale a que (x − a)| f (x). �

Corolario 3.1.4. (D’Alembert) Un polinomio no nulo f (x) ∈ k[x] de grado n

tiene a lo sumo n raíces distintas en k.

PRUEBA: Lo probaremos por inducción en n, el grado de f (x).

Si grado( f (x)) = 0, entonces f (x) en un polinomio constante no nulo, luegono tiene raíces en k. Nuestra hipótesis de inducción es que si h(x) es polinomiono nulo de grado n − 1 con r raíces distintas, r ≤ n − 1.

Supongamos ahora que f (x) es un polinomio de grado n > 0 y que tiene r

raíces distintas a1, . . . , ar en k. Veamos que r ≤ n.

Tenemos que f (ar ) = 0, luego por el teorema de la raíz f (x) = (x −ar )g(x),con grado(g(x)) = n − 1. Para cada i con 1 ≤ i ≤ r − 1, f (ai ) = 0 = (ai −ar )g(ai ). Como ai 6= ar , por fuerza g(ai ) = 0. En consecuencia a1, . . . , ar−1 sonraíces de g(x) y grado(g(x)) = n − 1. Por inducción, r − 1 ≤ n − 1, así quer ≤ n. �

Nota 3.1.5. Hay que notar, por si el lector andaba despistado en la lectura, que estecorolario no implica el aserto de que todo polinomio posee tantas raíces como sugrado. Este teorema es mucho más profundo e interesante y necesita conceptosque no veremos hasta más tarde.

39

3.2. Máximo común divisor

Continuan los parecidos razonables entre k[x] y Z, pues al igual que cuan-do manejamos los enteros, con el teorema de división para polinomios podemostrabajar la divisibilidad de polinomios, el algoritmo de Euclides y la identidad deBézout.

Máximo común divisor

Sean dos polinomios f (x), g(x) ∈ k[x]. Un polinomio p(x) ∈k[x] es un máximo común divisor de f (x) y g(x) si verifica:

1. p(x)| f (x) y p(x)|g(x)

2. Si q(x) es otro polinomio que divide a f (x) y a g(x) en-tonces q(x)|p(x).

Nota 3.2.1. A diferencia de lo que ocurre en los enteros, el máximo común divi-sor de dos polinomios no es único. Si p(x) = mcd( f (x), g(x)), entonces, paracualquier a ∈ k \ {0}, ap(x) = mcd( f (x), g(x)). Por eso cuando hablamos deun máximo común divisor, podremos acordar que estamos tomando un polinomiomónico y, en esas condiciones, sí que es único.

Como en los enteros, podemos calcular un máximo común divisor de dos po-linomios usando el teorema de división.

Consideremos dos polinomios f (x), g(x) ∈ k[x]; sabemos que existen q(x), r(x) ∈k[x] con grado(r(x)) < grado(g(x)) tales que

f (x) = q(x)g(x)+ r(x).

Proposición 3.2.2. Con las notaciones anteriores, se tiene que

mcd( f (x), g(x)) = mcd(g(x), r(x))

PRUEBA: Supongamos que

a(x) = mcd(g(x), r(x)), b(x) = mcd( f (x), g(x)).

Como f (x) = q(x)g(x) + r(x), a(x) no puede sino dividir a f (x) y así a(x)

es un divisor común de f (x) y g(x), luego por ser b(x) el máximo entre ellos,a(x)|b(x).

40

Análogamente, como

r(x) = f (x)− q(x)g(x),

se tiene que b(x)|r(x) y así b(x) es un divisor común de g(x) y r(x), luegob(x)|a(x). �

Algoritmo de Euclides

Sean f (x), g(x) ∈ k[x] dos polinomios no nulos, congrado( f (x)) > grado(g(x)). Entonces, si haciendo divisiones su-cesivas obtenemos

f (x) = q(x)g(x)+ r(x)

g(x) = q0(x)r(x)+ r1(x)

r(x) = q1(x)r1(x)+ r2(x)...

rn−2(x) = qn−1(x)rn−1(x)+ rn(x)

rn−1(x) = qn(x)rn(x),

este proceso es finito y, con las notaciones anteriores,mcd( f (x), g(x)) = rn(x).

PRUEBA: Consideremos la sucesión {grado(ri (x))}, que es una sucesión es-trictamente decreciente de enteros no negativos, pues el resto de la división polinó-mica es de menor grado que el divisor. Como el primer elemento es grado( f (x)),la sucesión puede tener a lo más grado( f (x))+ 1 elementos. Por tanto, existe unn ≥ 1 tal que rn+1(x) = 0. Esto prueba la finitud del proceso.

Ahora queda preguntarse si realmente obtenemos el máximo común divisor def (x) y g(x). Para la respuesta basta con aplicar el lema anterior para obtener que

mcd( f (x), g(x)) = mcd(g(x), r(x)) = . . . = mcd(rn−1(x), rn(x)) = rn(x).

Así pues, con este teorema hemos probado que el siguiente algoritmo es co-rrecto:

41

Algoritmo de Euclides

Para hallar el máximo común divisor de dos polinomios no nulosf (x), g(x) ∈ k[x].Efectúe la división f (x) = q(x)g(x) + r(x) y tome f0(x) =f (x), g0(x) = g(x) y r0(x) = r(x). Mientras ri (x) 6= 0, repitacon fi+1(x) = gi (x) y gi+1(x) = ri (x).Si rn+1(x) = 0, mcd( f (x), g(x)) = rn(x), notando r−1(x) =g(x).

Como en la sección anterior, ilustremos el método de arriba con los mismospolinomios:

Ejemplo 3.2.3. Queremos hallar el máximo común divisor de f (x) = x5 − 12 x3 +

2x2 − 3x + 3 y g(x) = 2x3 − 23 x2 + 3x − 1 en Q[x]. Siguiendo el algoritmo,

dividimos el primero entre el segundo, y tomamos

f0(x) = f (x) , g0(x) = g(x) , r0(x) = 37x2

27+ 37

18.

Como r0(x) 6= 0, dividimos g(x) entre r0(x), tomando

f1(x) = g(x) , g1(x) = r0(x) , r1(x) = 0.

La división anterior era exacta de cociente 1837(3x−1), con lo que mcd( f (x), g(x)) =

r0(x), o tomando el polinomio mónico asociado,

mcd( f (x), g(x)) = x2 + 3

2.

Hemos demostrado la validez del algoritmo de Euclides. Como pasaba en laprimera sección, a pesar de ser un resultado aparentemente trivial, esconde algu-nas aplicaciones, siendo la primera de ellas la identidad de Bézout, cuyas conse-cuencias en algunas de las abstrusas ecuaciones diofánticas polinómicas son deapreciar.

Identidad de Bézout

Sean f (x), g(x) ∈ k[x] dos polinomios no nulos. Si deno-tamos mcd( f (x), g(x)) = d(x) entonces existen elementosa(x), b(x) ∈ k[x] tales que

d(x) = a(x) f (x)+ b(x)g(x).

42

PRUEBA: La demostración es consecuencia de aplicar el algoritmo de Eucli-des al revés.En efecto, si con la notación del teorema, llamamos rn(x) = d(x), tendremos que

rn(x) = rn−2(x)− qn−1(x)rn−1 == rn−2(x)− qn−1(x)(rn−3(x)− qn−2(x)rn−2(x)) =

...

= a(x)r(x)+ b(x)g(x) == a(x) f (x)+ (b(x)− a(x)q(x))g(x).

Tomando a(x) = a(x) y b(x) = (b(x) − a(x)q(x)), tenemos lo que queríamos.�

Ejemplo 3.2.4. Sabemos que el máximo común divisor de nuestros polinomiospredilectos, f (x) = x5 − 1

2 x3 + 2x2 − 3x + 3 y g(x) = 2x3 − 23 x2 + 3x − 1 en

Q[x] es d(x) = x2 + 32 . ¿Cuáles son los polinomios a(x) y b(x) de la identidad

de Bézout para ellos? Siguiendo el algoritmo de Euclides realizado anteriormentepara ellos,

d(x) = 27

37f (x)− 27

37

(1

2x2 + 1

6x − 17

18

)g(x),

luego a(x) = 2737 y b(x) = −27

37q(x).

Como señalábamos antes, el algoritmo de Euclides tiene una importante apli-cación en la resolución de ecuaciones diofánticas polinómicas

α(x) f (x)+ β(x)g(x) = h(x),

donde f (x), g(x), h(x) ∈ k[x] son polinomios dados y α(x), β(x) ∈ k[x] sonlos polinomios a determinar, si es posible, claro está. El siguiente teorema da con-diciones suficientes para la existencia y unicidad de la solución de una ecuacióndiofántica polinomial y una prueba constructiva. Un caso especial del teorema escuando los polinomios f (x) y g(x) son relativamente primos, en cuyo caso laecuación diofántica polinómica dada se puede resolver para cualquier h(x) dado.

Proposición 3.2.5. Sean f (x), g(x) ∈ k[x] dos polinomios no nulos y sea d(x) =mcd( f (x), g(x)). Entonces, para cualquier polinomio h(x) ∈ k[x] divisible por

d(x), existen unos únicos polinomios α(x), β(x) ∈ k[x] tales que

α(x) f (x)+ β(x)g(x) = h(x), y

grado(α(x)) < grado(g(x))− grado(d(x)).

43

Más aún, si

grado(h(x)) < grado( f (x))+ grado(g(x))− grado(d(x)),

entonces β(x) verifica que

grado(β(x)) < grado( f (x))− grado(d(x)).

PRUEBA: Veamos primero la existencia.Por la identidad de Bézout sabemos que existen polinomios a(x), b(x) ∈ k[x] ta-les que a(x) f (x)+b(x)g(x) = d(x). Como h(x) es divisible por d(x), podremosescribir h(x) = h′(x)d(x), y así, a(x)h′(x) f (x)+ b(x)h′(x)g(x) = h(x).De este modo los polinomios α′(x) = a(x)h′(x), β ′(x) = b(x)h′(x) verificanla ecuación del enunciado. No obstante, los grados de estos polinomios en ge-neral no verifican las condiciones exigidas. Para evitar esto, si grado(α′(x)) ≥grado(g(x)) − grado(d(x)), dividimos α′(x) entre g(x)/d(x) y obtenemos queα′(x) = (g(x)/d(x))q(x)+α(x) con grado(α(x)) < grado(g(x))−grado(d(x)).Consideremos ahora β(x) = β ′(x)+ q(x)( f (x)/d(x)). Sustituyendo entonces,

α(x) f (x)+ β(x)g(x) = α′(x) f (x)+ β ′(x)g(x) = h(x).

Veamos ahora la unicidad. Supongamos pues que existen otros polinomiosα1(x), β1(x) ∈ k[x] verificando las condiciones del teorema. En ese caso,

α(x)( f (x)/d(x))+ β(x)(g(x)/d(x)) = h(x)/d(x)

α1(x)( f (x)/d(x))+ β1(x)(g(x)/d(x)) = h(x)/d(x),

luego

(α(x)− α1(x))( f (x)/d(x)) = −(β(x)− β1(x))(g(x)/d(x)).

Como los polinomios f (x)/d(x) y g(x)/d(x) son primos entre sí, necesariamente(g(x)/d(x))|(α(x) − α1(x)). Pero el grado de (α(x) − α1(x)) es menor que elgrado de (g(x)/d(x)), luego α(x)− α1(x) = 0.

Falta probar la última parte del teorema. Supongamos que

grado(h(x)) < grado( f (x))+ grado(g(x))− grado(d(x)).

Como β(x) = (h(x)− α(x) f (x))/g(x),

grado(β(x)) = grado(h(x)− α(x) f (x))− grado(g(x)).

Si tuviéramos que grado(h(x)) ≥ grado(α(x) f (x)) entonces ocurriría que

grado(β(x)) ≤ grado(h(x))− grado(g(x)) < grado( f (x))− grado(d(x)),

44

por la hipótesis adicional en el grado de h(x). En caso contrario, es decir, sigrado(h(x)) < grado(α(x) f (x)), entonces

grado(β(x)) ≤ grado(α(x))+grado( f (x))−grado(g(x)) < grado( f (x))−grado(d(x)),

por la propiedad que sabemos que verifica el grado de α(x). �

Hemos conseguido pues el siguiente método para resolver ecuaciones diofán-ticas lineales en polinomios:

Ecuaciones diofánticas lineales

Para resolver una ecuación de la forma

α(x) f (x)+ β(x)g(x) = h(x),

donde f (x), g(x), h(x) ∈ k[x] y grado(α(x)) < grado(g(x)) −grado(d(x)).Si h(x) no es divisible por mcd( f (x), g(x)) no existe solución.En caso de que sí sea divisible, aplique la identidad de Bézout af (x) y g(x) para obtener dos polinomios a(x), b(x) con

a(x) f (x)+ b(x)g(x) = d(x).

Si grado(a(x)) < grado(g(x)) − grado(h(x)), tome α(x) =a(x)h(x)/d(x), β(x) = b(x)h(x)/d(x) y hemos terminado. Encaso contrario, divida α(x) entre g(x)/d(x) para conseguir la ex-presión α(x) = (g(x)/d(x))q(x) + r(x). Asignando α(x) :=r(x) y β(x) := β(x)+ q(x)( f (x)/d(x)) hemos terminado.

Ejemplo 3.2.6. Para finalizar esta sección, reutilicemos nuestros polinomios delos ejemplos para mostrar cómo resolver una ecuación diofántica como las quehemos visto.Sean pues de nuevo f (x) = x5 − 1

2 x3 + 2x2 − 3x + 3 y g(x) = 2x3 − 23 x2 +

3x − 1 en Q[x]. Puesto que el ejemplo sería de dudosa utilidad si escogiéramosun polinomio h(x) no divisible por d(x) = x2 + 3

2 , tomemos un múltiplo suyo,por ejemplo, h(x) = (2x − 1)d(x) = 2x3 − x2 + 3x − 3

2 .Del ejemplo anterior obtuvimos la identidad de Bézout

27

37f (x)− 27

37

(1

2x2 + 1

6x − 17

18

)g(x) = d(x).

45

Ahora, grado(a(x)) = 0 = grado(g(x)) − grado(h(x)), así que debemos dividir2737(2x − 1) entre g(x)/d(x) = 2x − 2

3 , obteniendo como cociente y resto

q(x) = 27

37, r(x) = − 9

37.

Así, los polinomios solución de la ecuación son

α(x) = −1

3, β(x) = 1

74

(−74x3 − 27x2 + 139x − 97

)

3.3. Factorización. Factores múltiples

En nuestro recorrido en pos de obtener analogías con lo que ocurría con losenteros, vamos a ver qué elementos juegan el papel en el anillo de polinomios k[x]de los números primos, y una vez que los hayamos identificado, trabajaremos unpoco con ellos y con la noción de factorización.

Polinomio irreducible

Un polinomio p(x) ∈ k[x] es irreducible si no es una constante,y si el que podamos escribir p(x) = f (x)g(x) implica que unode los dos factores sea una unidad (una constante).

Proposición 3.3.1. Sea p(x) ∈ k[x] un polinomio irreducible. Si f (x) es un

polinomio que no es divisible por p(x), entonces el máximo común divisor de

p(x) y f (x) es 1 (una constante).

PRUEBA: Sea d(x) = mcd(p(x), f (x)). Como d(x)|p(x), existirá ciertopolinomio p′(x) de modo que podamos escribir p(x) = d(x)p′(x). Ahora bien,por la definición de irreducibilidad, o bien d(x) o bien p′(x) es constante. Si elpolinomio constante es d(x), tendríamos el resultado.Veamos pues qué pasa cuando el que fuera constante fuera p′(x). En ese casop(x)|d(x), por lo que p(x) dividiría a f (x), que no es posible. Por consiguiented(x) no puede ser nada más que una constante. �

Veremos a continuación dos resultados que dejaremos sin demostrar, pues suspruebas se pueden escribir de una manera completamente análoga a las de sussemejantes del ámbito de los enteros.

46

Proposición 3.3.2. Sea p(x) ∈ k[x] un polinomio irreducible. Dados dos polino-

mios f (x), g(x) ∈ k[x], si p(x)| f (x)g(x), entonces p(x) divide a alguno de los

dos.

Descomposición en factores irreducibles

Cualquier polinomio no constante de k[x] es irreducible o fac-toriza en producto de polinomios irreducibles. Este productoes único en tanto que si tenemos dos factorizaciones de f (x)

en producto de polinomios irreducibles en k[x] de la formaf (x) = p1(x) · · · ps(x) = q1(x) · · ·qt (x) necesariamente s =t y existe una correspondencia uno a uno entre los factoresp1(x), . . . , ps(x) y q1(x), . . . , qt(x) donde si pi (x) se correspon-de con q j (x), existe un α ∈ k \ {0} tal que pi (x) = αq j (x).

Hasta este punto, podemos aventurarnos y pronosticar que el lector puede estarinteresado por las múltiples analogías en la naturaleza como anillos entre k[x] yZ, o puede estar a punto de hastiarse al ver que las mismas propiedades que secomentaban para los enteros existen aquí, aumentando inútilmente (a su juicio,claro está) el número de páginas, o ambas cosas a la vez, una sin perjuicio dela otra. Para intentar evitar la segunda posibilidad entre otros objetivos, vamos apresentar una herramienta específica y útil de los polinomios: la derivada (formal),que coincide con el concepto usual de análisis.

Usaremos la notación habitual: f ′(x) es el polinomio que se obtiene al derivarf (x); D : k[x] → k[x] es la función que a cada polinomio le asocia su derivada,D( f (x)) = f ′(x).

Derivada de un polinomio

La derivada de un polinomio f (x) viene definida por las siguien-tes reglas:

1. Si f (x) = axn con a ∈ k, entonces D(axn) = naxn−1. (Sin = 0, D(a) = 0.)

2. Si f (x) = g(x) + h(x), entonces D( f (x)) = D(g(x)) +D(h(x)).

47

Proposición 3.3.3. Para cualesquiera polinomios f (x), g(x) ∈ k[x] y para todo

natural s > 1 se verifica que:

1. D( f (x)g(x)) = f (x)D(g(x))+ g(x)D( f (x)).

2. D( f (x)s) = s f (x)s−1 D( f (x)).

PRUEBA: La prueba es puramente efectiva, y no requiere mucha habilidad;basta con tener la suficiente concentración como para seguir los cálculos. Por ellose la dejamos al lector que quiera adquirir soltura con el manejo de las expresionesde los polinomios. �

Factores múltiples de un polinomio

Sea f (x) ∈ k[x] un polinomio.

1. Si f (x) tiene factores múltiples, entonces f (x) y f ′(x) noson primos entre sí.

2. En característica cero (k = Q,R,C), si f (x) y f ′(x) noson primos entre sí, entonces f (x) tiene factores múltiples.

PRUEBA: Supongamos que f (x) tiene algún factor múltiple, sea f (x) = p(x)sq(x),con s > 1. Entonces

f ′(x) = p(x)s−1[sp′(x)q(x)+ p(x)q ′(x)],

luego p(x) es un factor común de f (x) y f ′(x).

Sean d(x) = mcd( f (x), f ′(x)), que sabemos que es de grado mayor que ceropor el anterior apartado, y p(x) un factor irreducible de d(x). Veamos que p(x)

es un factor múltiple de f (x).En efecto, como p(x)| f (x), tenemos f (x) = p(x)g(x). Derivando esa expresión,

f ′(x) = p′(x)g(x)+ p(x)g′(x).

Como p(x)| f ′(x), p(x) también divide al producto p′(x)g(x), y, por ser p(x)

irreducible, divide a uno de los factores. Ahora bien, p(x) no puede dividir a p′(x)pues tiene grado estrictamente mayor ya que estamos trabajando sobre un cuerpode característica cero, luego p(x)|g(x), y g(x) = p(x)h(x), así que sustituímos yconseguimos la expresión f (x) = p(x)2h(x). �

48

3.4. Congruencias. Teorema chino del resto

Compadeciéndonos del lector algo hastiado de semejanzas entre Z y k[x], ycongratulándonos con el que permanece admirado por las coincidencias entre lasestructuras internas de ambos conjuntos (actitud muy recomendable para aprendera hacer y a apreciar las matemáticas), trabajaremos con las congruencias parapolinomios, definidas igualmente a las de los enteros y con propiedades similares(algo que suponemos que empieza a no resultar extraño teniendo en cuenta a lassecciones anteriores). De todos modos, para tranquilidad de unos y regocijo deotros, no nos extenderemos mucho en este punto; simplemente lo preciso.

Congruencia de polinomios

Sea p(x) ∈ k[x] un polinomio. Dados dos polinomiosf (x), g(x) ∈ k[x], diremos que f (x) y g(x) son congruentesmódulo p(x), y escribiremos

f (x) ≡ g(x) (mKod p(x)),

si p(x) divide a f (x)− g(x).

Nota 3.4.1. La relación de congruencia módulo un polinomio p(x) y tiene lasmismas propiedades que la de congruencia módulo m de enteros. Por ejemplo:

La congruencia módulo un polinomio es una relación de equivalencia.

Las congruencias son compatibles con la suma.

Las congruencias son compatibles con la multiplicación.

La congruencia es una relación de equivalencia en k[x].

De la misma forma que construimos los anillos Z/Zm de las clases de con-gruencias módulo m, podemos considerar el conjunto de las clases de congruen-cias de polinomios de k[x] módulo un polinomio m(x), y lo denotaremos pork[x]/(m(x)).

Proposición 3.4.2. Si un polinomio m(x) tiene grado d, cualquier clase de con-

gruencia módulo m(x) tiene un único representante r(x) de grado estrictamente

menor que d.

49

PRUEBA: Sea un polinomio f (x) ∈ k[x]. Por el algoritmo de división tene-mos que

f (x) = q(x)m(x)+ r(x) , con grado(r(x)) < grado(m(x))

y f (x) ≡ r(x)(mKodm(x)). Como el resto de la división es único, es él el repre-sentante de menor grado buscado. �

Dicho de otro modo, lo que esto prueba es que el conjunto de polinomios dek[x] de grado estrictamente menor que el de m(x) es un conjunto completo derepresentantes para k[x]/(m(x)).

Ejemplo 3.4.3. Sea m(x) = x2 + 1 ∈ Q[x]. Por la proposición, cada elemento deQ[x]/(m(x)) tiene un representante de grado menor o igual que 1. Como

x2 ≡ −1(mKodx2 + 1),

multiplicando por x tenemos que

x3 ≡ −x(mKodx2 + 1).

En general, es fácil ver por inducción en n que

x2n ≡ (−1)n(mKodx2 + 1) y que x2n+1 ≡ (−1)nx(mKodx2 + 1).

Como Q es un cuerpo infinito, existen infinitos polinomios de grado menor oigual que 1 en Q[x], y por tanto Q[x]/(x2 + 1) es un conjunto infinito.

Si utilizáramos ahora F3 en lugar de Q, por lo anterior tendríamos que

(F3)[x]/(x2 + 1) = {0, 1, 2, x, x + 1, x + 2, 2x, 2x + 1, 2x + 2}.

Al igual que hicimos cuando manejamos las congruencias en Z, podemos defi-nir sin problema la suma y la multiplicación de clases de congruencias de polino-mios como la clase definida por la suma y la multiplicación, respectivamente, desus representantes. Es fácil comprobar que estas operaciones están bien definidasy verifican las propiedades usuales de la suma y la multiplicación, convirtiendo ak[x]/(m(x)) en un anillo para cualquier polinomio m(x), y por ello lo dejaremoscomo ejercicio para quien pretenda familiarizarse más concienzudamente con lascongruencias en anillos de polinomios.

50

Teorema chino del resto

Sean m1(x), . . . ,mn(x) ∈ k[x] polinomios primos entre sí dos ados, y sean a1(x), . . . , an(x) ∈ k[x] otros polinomios arbitrarios.Entonces existe f (x) ∈ k[x] tal que:

f (x) ≡ a1(x) (mKodm1(x))

f (x) ≡ a2(x) (mKodm2(x))...

...

f (x) ≡ an(x) (mKodmn(x))

Además, para que el polinomio f (x) ∈ k[x] sea otra solución escondición necesaria y suficiente que se verifique que

f (x) ≡ f (x)(mKodm1(x)m2(x) · · ·mn(x)).

PRUEBA: La demostración es, como se imaginará, estimado lector, análoga a ladel teorema homónimo en el contexto entero.Puesto que mi (x) y m j (x) son primos entre sí, para todo i 6= j , mi (x) es primocon el producto

li (x) = m1(x) · · · mi−1(x)mi+1(x) · · · mn(x).

Así pues, por la identidad de Bézout, existirán αi (x), βi (x) ∈ k[x] tales que

1 = αi (x)mi (x)+ βi (x)li (x) , para cualquier i = 1, . . . , n.

Se tiene entonces que

βi (x)li (x) ≡ 1 (mKodmi (x))

βi (x)li (x) ≡ 0 (mKodm j (x)) , para todo i 6= j

Podemos tomar como solución entonces

f (x) = a1(x)β1(x)l1(x)+ a2(x)β2(x)l2(x)+ . . .+ an(x)βn(x)ln(x).

Vayamos a por el segundo aserto ahora. Si f (x) ≡ f (x)( mKod m1(x) · · ·mn(x)),existirá un polinomio q(x) tal que f (x)− f (x) = q(x)m1(x) · · ·mn(x). Toman-do en la anterior expresión clases de congruencia módulo mi (x), es claro quef (x) ≡ f (x)(mKodmi (x)) para todo i , y por tanto, es solución del problema.Recíprocamente, si f (x) 6≡ f (x)(mKodm1(x) · · · mn(x)), es porque existen dos

51

polinomios q(x), h(x), siendo h(x) no divisible por m1(x) · · ·mn(x), tales quef (x)− f (x) = q(x)m1(x) · · · mn(x)+ h(x). Como alguno de los mi (x) no pue-de dividir a h(x), alguna de las congruencias módulo mi (x) fallará, y por tantof (x) no será solución del problema. �

Sistemas lineales de congruencias

Para resolver el sistema

f (x) ≡ ai (x)(mKodmi (x)) , i = 1, . . . , n,

siendo los mi (x) polinomios primos entre sí y los ai (x) polino-mios cualesquiera.

Tome, para cada i , li (x) =(∏n

j=1 m j (x))/mi (x). Aplique la

identidad de Bézout a cada pareja li ,mi para obtener la igualdad

1 = αi (x)mi (x)+ βi (x)li (x).

Las soluciones son

f (x) = a1(x)β1(x)l1(x)+a2(x)β2(x)l2(x)+. . .+an(x)βn(x)ln(x),

y los polinomios congruentes con él módulo∏n

j=1 m j (x).

3.5. Factorización en C[x] y en R[x]

A continuación enunciaremos un resultado del que hablaremos con más detalleen la última sección. Para lo que estamos tratando aquí, su importancia es que nosdice cómo son los polinomios irreducibles sobre C. Ahora bien, su relevancia esmucho mayor, pero no adelantemos acontecimientos y centrémonos de momentoen la factorización de polinomios.

Teorema fundamental del Álgebra

Todo polinomio f (x) ∈ C[x] de grado positivo tiene una raízcompleja.

52

Corolario 3.5.1. Todo polinomio f (x) ∈ C[x] de grado positivo, digamos n,

tiene n raíces en C, esto es, se puede escribir como

f (x) = α

n∏

i=1

(x − αi ),

donde α, αi ∈ C.

PRUEBA: Por el teorema fundamental del álgebra, f (x) tiene una raíz α1 enC. Por tanto, por el teorema del resto podemos escribir f (x) = (x − α1) f1(x).Aplicando el mismo razonamiento a f1(x), y así sucesivamente, se llega, despuésde n − 1 pasos, a una expresión de la forma

f (x) = (x − α1) · · · (x − αn−1) fn−1(x),

donde fn−1(x) es un polinomio de primer grado. Como fn−1(x) se puede escribirfn−1(x) = αx − ααn, se tiene el resultado. �

En virtud del corolario, el problema de dilucidar si un polinomio de C[x] esirreducible o no es tremendamente sencillo; tanto como mirar su grado, pues losúnicos polinomios irreducibles en C[x] son los de grado 1. En R[x] no ocurre así,ya que, por ejemplo, los polinomios x2 +1 o x3 −15x −4 no se pueden factorizaren producto de polinomios de primer grado, aunque tampoco es que la cuestiónde la factorización devenga complicada. Veamos cómo son los irreducibles en esteotro anillo.

Proposición 3.5.2. Todo polinomio de R[x] de grado impar tiene una raíz en R.

Todo polinomio de grado par se descompone en producto de polinomios de grados

1 o 2 (los cuales son irreducibles si y sólo si sus raíces son complejas no reales).

PRUEBA: Sea f (x) ∈ R[x] un polinomio de grado positivo, digamos n. Af (x) lo podemos mirar con otros ojos, como elemento de C[x], así que aplicamosel teorema fundamental del Álgebra para saber que f (x) tiene n raíces en C. Sea

f (x) = anxn + an−1xn−1 + . . .+ a1x + a0 , ai ∈ R, i = 0, 1, . . . , n,

y sea α = a + bi una raíz de f (x). De

0 = f (α) = an(a + bi)n + an−1(a + bi)n−1 + . . .+ a1(a + bi)+ a0

se deduce, tomando conjugados, que

0 = f (α) = f (α) = an(a − bi)n + an−1(a − bi)n−1 + . . .+ a1(a − bi)+ a0.

53

En consecuencia, si α es una raíz de f (x), también debe serlo α, luego las raícesno reales de f (x) aparecen por pares de conjugadas. Si n es impar, tiene que haberuna raíz que coincida con su conjugada, es decir, que sea real. Con esto probamosel primer aserto.

En cuanto a la segunda afirmación, obramos como sigue. Si α = a +bi es unaraíz compleja no real de f (x), el polinomio

(x − α)(x − α) = x2 − 2ax + (a2 + b2)

divide a f (x) y tiene coeficientes reales, con lo que podemos descomponer a f (x)

en producto de factores de grado 2 a lo sumo. La cuestión de si estos se puedendescomponer a su vez en otros de grado 1 o son irreducibles es tan simple comoel hecho de que sus raíces sean reales o no. �

3.6. Factorización en Q[x]

Sea f (x) ∈ k[x] un polinomio de grado 2 o 3. En ese caso, f (x) es reduciblesi y sólo si tiene una raíz en k. En efecto, el hecho de que f (x) sea reduciblees equivalente a decir que tiene un divisor que es de grado 1. Si éste es ax − b,entonces b/a es una raíz de f (x).

Naturalmente, lo anterior no funciona para grados mayores. Un polinomiode grado 4 se puede descomponer, por ejemplo, en dos factores irreducibles degrado 2, como x4 + 3x2 + 2 en Q, luego no tiene por qué tener raíces en k. Conmayor razón ocurrirá esto en grados más altos. No obstante es bueno ver si unpolinomio dado tiene o no raíces en k. Si las tiene, y es de grado mayor que 1, esautomáticamente reducible.

Si echamos la vista atrás al capítulo anterior, la irreducibilidad de los enteros(esto es, saber si un entero es primo o no) constituía un problema enormementedifícil hasta 2002, mientras que en la sección anterior hemos visto que cuandok = C,R, en k[x] es bastante sencillo. Dependiendo de cuáles sean nuestros in-tereses, las analogías que veíamos hasta ahora entre k[x] y Z experimentan unvuelco. Consideremos entonces el caso de k = Q. El problema de saber cuándoun polinomio de Q[x] es irreducible es, en cambio, algo intrincado si se pretenderesolver de manera realmente efectiva. Sin embargo, el problema de la localiza-ción de raíces (que, como hemos notado en el párrafo anterior, es más simple), síse puede atacar, y es lo que haremos aquí.

Para empezar, notemos que si f (x) ∈ Q[x], es igual buscar sus raíces que lasde a f (x), donde a ∈ Z. En particular, podemos suponer que f (x) está en realidad

54

en Z[x] (esto es, todos sus coeficientes son enteros). En estas condiciones tenemosel siguiente resultado, también conocido como Regla de Ruffini:

Proposición 3.6.1. Sea el polinomio

f (x) = anxn + an−1xn−1 + . . .+ a1x + a0 , ai ∈ Z, i = 0, 1, . . . , n,

de grado n > 0. Supongamos que f (x) tiene una raíz racional α = a/b con a y

b primos entre sí. Entonces a|a0 y b|an .

PRUEBA: En efecto, como a/b es raíz de f (x),

0 = f (a/b) = an(a/b)n + an−1(a/b)

n−1 + . . .+ a1(a/b)+ a0,

luego, previa multiplicación por bn , tenemos que

0 = anan + an−1an−1b + . . .+ a1abn−1 + a0bn.

Como a divide a todos los términos salvo al último y es primo con b, debe dividira a0. E igualmente, como b divide a todos los términos salvo al primero y es primocon a, debe dividir a a0. �

Hemos visto que intentar localizar las raíces de los polinomios en Z[x] tienealgo más de futuro, o por lo menos es más abarcable, que en Q[x], así que segui-remos reduciéndonos al caso de los polinomios con coeficientes enteros, donde lafactorización única de los coeficientes nos puede ser de ayuda.

Contenido de un polinomio

Dado un polinomio f (x) ∈ Z[x] no nulo, se llama contenido def (x) al máximo común divisor de sus coeficientes. Se denota porc( f ). Se dirá que f (x) es primitivo si su contenido es 1.

El siguiente resultado es conocido como Lema de Gauss, como también sedenomina del mismo modo a otros resultados en otros campos matemáticos. Alfin y al cabo, Gauss fue un matemático muy prolijo y no es de extrañar que varioslemas suyos hayan pasado a la historia con el mismo nombre. De hecho, se con-funde incluso con un corolario suyo, pero el que presentamos es, en este contexto,el verdadero históricamente hablando, y aparece, con otras palabras, en el Artícu-lo 42 de su gran obra Disquisitiones Arithmeticae. (Los que entiendan el latín,que serán la mayoría, que no se preocupen, que en 1995 se editó una traducciónal español.)

55

Lema de Gauss

El producto de dos polinomios primitivos es primitivo.

PRUEBA: Sean

f (x) = am xm + am−1xm−1 + . . .+ a1x + a0 , ai ∈ Z, i = 0, 1, . . . ,m,

g(x) = bnxn + bn−1xn−1 + . . .+ b1x + b0 , b j ∈ Z, j = 0, 1, . . . , n

dos polinomios primitivos. Para probar que f (x)g(x) es primitivo basta ver que,fijado p ∈ Z irreducible, existe un coeficiente de f (x)g(x) que no es divisible porél.

Fijemos pues p irreducible. Sea s (resp t) el entero 0 ≤ s ≤ m (resp. 0 ≤ t ≤n) tal que p|ai para todo i > s (resp. p|b j para todo j > t), si se da el caso, y p

no divide a as (resp. a bt ). El coeficiente de x s+t en f (x)g(x) es

a0bs+t + . . .+ as−1bt+1 + asbt + as+1bt−1 + . . .+ as+t b0,

en el que se ve que p divide a todos los sumandos salvo a asbt . Así, p no divide ala suma, lo que prueba el resultado. �

Corolario 3.6.2. Si f (x), g(x) ∈ Z [x] son polinomios no nulos, entonces

c( f g) = c( f )c(g).

PRUEBA: Podemos escribir

f (x) = c( f ) f ′(x), g(x) = c(g)g′(x)

donde f ′(x) y g′(x) son primitivos. Así

f (x)g(x) = c( f )c(g) f ′(x)g′(x)

y, como f ′(x)g′(x) es primitivo por el lema de Gauss, debe ocurrir que c( f )c(g) =c( f g). �

El siguiente resultado es engañosamente sencillo, pero de una importanciaextrema cuando se trata de factorizar polinomios, como comprobaremos más ade-lante.

56

Corolario 3.6.3. Sea f (x) ∈ Z[x] un polinomio de grado positivo, digamos n,

que se descompone en Q[x] en producto de dos polinomios de grados estric-

tamente menores que n. Entonces, se descompone en Z[x] en producto de dos

polinomios de esos mismos grados.

PRUEBA: Sea f (x) = f1(x)g1(x), donde f1(x), g1(x) ∈ Q[x] con grado( f1(x)) <

n y grado(g1(x)) < n. Multiplicando la anterior igualdad por un cierto elementoa ∈ Z para quitarnos los denominadores de en medio del producto, se tendrá que

a f (x) = g(x)h(x) , g(x), h(x) ∈ Z[x].

De ahí se deduce que ac( f ) = c(gh) = c(g)c(h), luego a|c(g)c(h). Por tanto, sitomamos g(x) = c(g)g′(x), h(x) = c(h)h′(x), entonces

f (x) = c(g)c(h)

ag′(x)h′(x),

y ésa es la descomposición buscada. �

Corolario 3.6.4. Sea f (x) ∈ Z[x] un polinomio de grado positivo, digamos n, y

primitivo. Entonces f (x) es reducible en Z[x] si y sólo si lo es en Q[x].

PRUEBA: Muy, pero que muy simple; basta con releer el enunciado del coro-lario anterior. �

Terminaremos la teoría de esta sección con un criterio muy general de irredu-cibilidad de polinomios, aunque no concluyente al no poderse aplicar a todos.

Proposición 3.6.5. (Criterio de Eisenstein) Sea un polinomio de grado n > 0

f (x) = anxn + an−1xn−1 + . . .+ a1x + a0 , ai ∈ Z, i = 0, 1, . . . , n.

Supongamos que existe un elemento irreducible p ∈ Z que divide a todos los

coeficientes, salvo a an , y cuyo cuadrado p2 no divide a a0. Entonces f (x) es

irreducible en Q[x].

PRUEBA: Se hará por reducción al absurdo. Supongamos que f (x) fuesereducible en Q[x]. En consecuencia se descompondría en Q[x] en producto dedos polinomios de grado estrictamente inferior. Por el corolario anterior se puedeescribir

f (x) = (bs x s + bs−1x s−1 + . . .+ b1x + b0)(ct x t + ct−1x t−1 + . . .+ c1x + c0),

donde bi , c j ∈ Z para cualesquiera i, j y s, t < n.

57

Por la segunda hipótesis, p debe dividir a uno de entre b0 y c0, pero no aambos. Supongamos pues sin pérdida de generalidad que p|b0 y no divide a c0.Como p no divide a an , no puede dividir a todos los bi . Sea m el mínimo índice talque p no divide a bm , que sabemos que es menor que n. El coeficiente del términoen xm es

bmc0 + bm−1c1 + . . .+ b0cm = am,

que no es divisible por p pues todos los sumandos lo son salvo el primero. Ahorabien, que am con m < n no sea divisible por p es una contradicción, luego hemosterminado con la prueba. �

Para terminar esta sección veremos con ejemplos un procedimiento algo ele-mental, pero procedimiento al fin y al cabo (ya veremos métodos más sofisticados)para descomponer un polinomio con coeficientes en Q en producto de sus factoresirreducibles.

Notemos antes los siguientes hechos:

Todo polinomio f (x) ∈ Q[x] se puede escribir como d f (x) = h(x), cond ∈ Z, h(x) ∈ Z[x]. Por tanto, para obtener la descomposición en Q def (x) puedo calcular la de h(x). Es decir, podemos considerar sólo polino-mios con coeficientes enteros.

Sea f (x) ∈ Z[x]. Sabemos que f (x) = c( f )h(x), donde h(x) ∈ Z[x] yes primitivo. Para obtener la descomposición en Q de f (x) puedo calcularla de h(x). Es decir, podemos considerar sólo polinomios con coeficientesenteros y primitivos.

Ejemplo 3.6.6. Consideremos el polinomio f (x) = x5 + x3 − 2x2 − 2 ∈ Z[x],primitivo. Si f (x) es reducible se podrá poner como producto de dos polinomiosno constantes f (x) = g(x)h(x), con g(x), h(x) ∈ Z[x]. Como el polinomio departida es de grado 5, las posibilidades son:

1. grado(g(x)) = 1 y grado(h(x)) = 4

2. grado(g(x)) = 2 y grado(h(x)) = 3

Ahora se trata de probar “manualmente"si es posible alguna de las posibilida-des. Una respuesta negativa indicaría que el polinomio de partida es irreducible.

El primer caso es el teorema de Ruffini. Si g(x) = ax + b es de grado 1,entonces −b/a es una raíz de f (x). Por tanto, se dará la posibilidad (1) si y sólo sif (x) tiene raíces racionales (notemos que este argumento es válido independientedel grado del polinomio de partida).

58

En nuestro ejemplo sabemos por Ruffini que las posibles raíces de f (x) son±1,±2. Sustituyendo en f (x) comprobamos que ninguna es raíz, luego la posi-bilidad 1 no se da.

Veamos pues si es posible la segunda. Si lo fuera, existirían enteros a, b, c, d,e, f y r tales que:

x5 + x3 − 2x2 − 2 = (ax2 + bx + c)(dx3 + ex2 + f x + r) =

= adx5 + (ae +bd)x4 + (a f +be + cd)x3 + (ar +b f + ce)x2 + (br + c f )x + cr.

Este polinomio será igual a f (x) si tienen los mismos coeficientes. Por tanto, lasegunda posibilidad se da si y sólo si existen unos enteros a, b, c, d, e, f y r

verificando que

S :

1 = ad

0 = ae + bd

1 = a f + be + cd

−2 = ar + b f + ce

0 = br + c f

−2 = cr

Es decir, tenemos que tratar de resolver en Z el sistema de ecuaciones (no lineales)S. La mejor forma es estudiar casos. La primera ecuación nos dice que a = d = 1o a = d = −1. Supongamos que a = d = 1. Si con esta elección encontramosuna solución, ya tendríamos los polinomios g(x) y h(x) y no habría necesidadde seguir buscando. En caso contrario tendríamos que resolver el sistema cona = d = −1.

Si a = d = 1, el sistema anterior es:

S :

0 = e + b

1 = f + be + c

−2 = r + b f + ce

0 = br + c f

−2 = cr

De la última ecuación nos surgen los siguientes casos: (1) c = −1, r = 2, (2)c = 1, r = −2, (3) c = −2, r = 1 y (4) c = 2, r = −1.

Caso (1). El sistema a resolver es

S :

0 = e + b

1 = f + be − 1−2 = 2 + b f − e

0 = 2b − f

59

Sustituyendo e = −b, f = 2b en la segunda ecuación se obtiene b2 − 2b + 2 = 0que no tiene solución entera. Por tanto este caso es imposible.

Caso (2). El sistema a resolver es

S :

0 = e + b

1 = f + be + 1−2 = −2 + bf + e

0 = −2b + f

,

que tiene como solución b = e = f = 0.Concluyendo, llegamos a que f (x) es reducible y su descomposición es fac-

tores irreducibles es f (x) = (x2 + 1)(x3 − 2). Los polinomios x2 + 1 y x3 − 2son irreducibles pues no tienen raíces racionales.

Como el lector atento habrá podido observar al final no ha sido necesario lidiarcon el caso en que a = d = −1. Esto es porque si el polinomio de partida esmónico, podemos suponer que los factores en que se descompone son tambiénmónicos. De haber supuesto esto, habríamos obtenido los polinomios −x2 − 1 y−x3 + 2.

3.7. Factorización en Fp[x]

El mismo procedimiento “artesanal” que hemos usado en la sección anteriorpara factorizar en Q[x] se puede usar para obtener la descomposición en factoresirreducibles de polinomios con coeficientes en Fp, con p primo. No obstante, estasección también contendrá algún resultado que justifique más su existencia, y noun ejemplo solamente.

Ejemplo 3.7.1. Consideremos el polinomio f (x) = x4 + x3 + x + 2 ∈ F3[x]. Sif (x) es reducible se puede expresar como producto de dos polinomios no cons-tantes f (x) = g(x)h(x), con g(x), h(x) ∈ F3[x]. Como el polinomio de partidaes de grado 4, las posibilidades son:

1. grado(g(x)) = 1 y grado(h(x)) = 3

2. grado(g(x)) = 2 y grado(h(x)) = 2

El primer caso se resuelve, como en Q, comprobando si f (x) posee alguna raízen F3. Como F3 = {0, 1, 2} es finito, basta comprobar si algún elemento es raíz.En nuestro caso f (0) = 2, f (1) = 2 y f (2) = 1, luego la primera posibilidad nose da.

60

Para estudiar el segundo supuesto escribamos

f (x) = (x2 + ax + b)(x2 + cx + d)

(nótese que ya estamos asumiendo que los factores serán mónicos como f (x)).Operando e igualando coeficientes obtenemos el sistema

S :

1 = a + c

0 = b + ac + d

1 = ad + bc

2 = bd

De la cuarta ecuación, teniendo en cuenta los elementos de F3, obtenemos queo bien b = 1 y d = 2, o bien b = 2 y d = 1. Ahora bien, dado que ambospolinomios son de grado 2, podríamos reordenarlos si se diera lo segundo parasuponer sin pérdida de generalidad que b = 1 y d = 2. El sistema se queda delsiguiente modo:

S :

1 = a + c

0 = ac

1 = 2a + c

Su única solución es a = 0, c = 1. Por consiguiente, f (x) = (x2 +1)(x2 + x +2)es la descomposición en factores irreducibles buscada. (Los polinomios x2 + 1 yx2 + x + 2 son irreducibles al no tener raíces en F3.)

Para ilustrar la importancia del problema de factorizar sobre Fp[x] de la quehablábamos antes veamos cómo podemos relacionar la irreducibilidad en Q y enFp, con p primo. Sea

f (x) = anxn + . . .+ a1x + a0 ∈ Z[x]

primitivo, sea p un primo que no divida a an , y llamemos f (x) al polinomio

f (x) = anxn + . . .+ a1x + a0 ∈ Fp[x],

siendo ai = ai + Zp, 0 ≤ i ≤ n.

Proposición 3.7.2. Si f (x) es irreducible en Fp[x], entonces f (x) es irreducible

en Q[x].

PRUEBA: Aquél que seguramente por algún despiste todavía no se haya dadocuenta del argumento de la prueba, que tenga en cuenta que para cualesquierapolinomios f (x), g(x), f (x)g(x) = f (x)g(x) y que escriba el contrarrecíprocodel enunciado. �

Veamos, con un ejemplo, cómo podemos usar el resultado anterior.

61

Ejemplo 3.7.3. Sea f (x) = x4 − x3 + x2 − x + 1 ∈ Z[x]. Tomemos p = 2.Entonces f (x) = x4 + x3 + x2 + x + 1 ∈ F2. Ya que f (0) = 1 y f (1) = 1, f (x)

no tiene raíces en F2.

Como en caso de ser reducible, ningún factor de la descomposición de f (x)

sería de grado 1, pongamos por caso que

f (x) = (x2 + ax + b)(x2 + cx + d).

Como otras veces, operando e igualando coeficientes obtenemos el sistema

S :

1 = a + c

1 = b + ac + d

1 = ad + bc

1 = bd

La última ecuación nos dice que b = d = 1, y sustituyendo en el resto nosquedamos con

S :

{1 = a + c

1 = ac,

que no tiene solución. Por tanto, f (x) es irreducible en F2 y así, por la proposi-ción, f (x) es irreducible sobre Q.

Nota 3.7.4. Si bien en apariencia este procedimiento simplifica los cálculos a lahora de estudiar si un polinomio es o no irreducible sobre Q, tiene un grave in-conveniente. El recíproco de la proposición anterior es falso. Por ejemplo, el po-linomio x2 + 2 es irreducible sobre Q, pero f (x) = x2 ∈ F2[x] es reducible, o elpolinomio x2 − x + 1, irreducible en Q y con f (x) reducible en F3.

3.8. Factorización efectiva en Q[x] y Fp[x]*

En las últimas secciones hemos dado un largo paseo por la factorización de po-linomios, pero quizá pecaba de demasiado teórico, o poco efectivo. El objetivo deesta lección es dar dos opciones, computacionalmente efectivas y más sofisticadasque las vistas hasta ahora, para atacar el problema de la factorización de polino-mios sobre los racionales (método de los polinomios interpoladores de Lagrange)y sobre los cuerpos primos (método de Berlekamp).

El método de los polinomios interpoladores de Lagrange, como su propionombre indica, no es más que una adaptación a nuestro contexto del clásico méto-do de interpoladores lineales de Lagrange del Cálculo Numérico. En la literaturatambién se le conoce como método de Kronecker.

62

Comencemos con el caso de un polinomio f (x) ∈ Z[x] de grado n y sead = ⌊n/2⌋. Obviamente, salvo que f (x) sea irreducible, alguno de sus factoresirreducibles ha de tener grado menor o igual que d, por lo que basta buscar losposibles factores que verifican esta condición.

Para ello fijaremos d + 1 enteros distintos (normalmente lo más cerca posiblede 0, por motivos de comodidad) a0, a1, . . . , ad y hallaremos

ni = f (ai ), i = 0, . . . , d.

Ahora bien, si g(x) es un factor del tipo que busco de f (x), ha de verificar quesi = g(ai ) divide al ni correspondiente. Así pues, fijaremos una (d + 1)-upla dedivisores, de la forma

(s0, s1, . . . , sd) , donde si |ni , i = 0, . . . , d.

Recordemos que g(ai ) es precisamente g(x)(mKodx − ai ). En ese caso, por elteorema chino del resto, g(x) ha de ser entonces una solución al sistema

g(x) ≡ s0 (mKodx − a0)

g(x) ≡ s1 (mKodx − a1)...

...

g(x) ≡ sd (mKodx − ad)

Lo que hemos escrito en otras palabras y símbolos es la imposición de que g(ai ) =si = si (mKodx − ai ) para todo i . Sabemos que este sistema tiene solución única(pues los x −ai son primos entre sí) de grado menor o igual que d. Así pues, fijadoun vector de divisores, tenemos un posible divisor de f (x). Como los posiblesvectores de divisores son finitos, este procedimiento nos da una lista exhaustivade todos los posibles divisores de f (x) de grado menor o igual que d. Es más,podemos quedarnos con la mitad de vectores de divisores, pues la única soluciónasociada a (−s0,−s1, . . . ,−sd) será así el opuesto de la que verifique el sistemacon (s0, s1, . . . , sd).

Polinomios interpoladores de Lagrange

Para factorizar un polinomio f (x) ∈ Z[x].Sea d = ⌊n/2⌋, tome d +1 enteros distintos ai . Forme la (d +1)-upla ( f (ai )).Forme todas las posibles (d+1)-uplas (si ) formadas por divisoresde los f (ai ), y resuelva el sistema g(x) ≡ si (mKodx − ai ), paratodo i , y todas las (d +1)-uplas que no se diferencien en un signo.Si f (x) es reducible, de entre las soluciones no constantes, almenos dos serán un factor de f (x).

63

Ejemplo 3.8.1. Aprovechando que ya hemos factorizado algunos polinomios en,recuperemos uno de ellos para aplicarle el método que acabamos de detallar. Seapues el polinomio f (x) = x4 + x3 + x − 1 ∈ Z[x], primitivo. Como tiene grado4, elegimos 5 puntos cercanos al cero para evitarnos hacer cuentas más latosas.Calculamos los valores que toma f (x) en esos puntos:

f (−2) = 5 , f (−1) = −2 , f (0) = −1 , f (1) = 2 , f (2) = 25.

Podemos formar 768 quíntuplas distintas, de las que nos quedamos con 384, lamitad. Evidentemente no vamos a comprobar todas ellas en el reducido espaciocon el que contamos, sin mencionar la penosa tarea para el que escribe estas líneasque supondría dicho cálculo. No obstante, cualquier programa de cálculo efectua-ría esos cálculos sin rechistar, y al fin y al cabo es por esa razón por la que secomenta este método aquí.

Una vez aclarado lo anterior, sigamos con el ejemplo y probemos con la quín-tupla (1,−1,−1, 1, 5). Tenemos así el siguiente sistema de congruencias:

S :

g(x) ≡ 1 (mKodx + 2)g(x) ≡ −1 (mKodx + 1)g(x) ≡ −1 (mKodx)

g(x) ≡ 1 (mKodx − 1)g(x) ≡ 5 (mKodx − 2)

,

que tiene como solución al polinomio x2 + x − 1. Si dividimos f (x) entre aquél,obtenemos como cociente x2+1, que se conseguía al tomar la quíntupla (5,2,1,2,5).Por consiguiente, f (x) es reducible, y como los de grado 2 que hemos obtenidoson irreducibles sobre Q, hemos terminado de calcular su descomposición.Si hubiéramos seguido buscando factores, no habríamos obtenido más que losopuestos de los anteriores. Por ejemplo, la quíntupla (1,2,1,1,1) nos habría dadocomo resultado el polinomio − x4

6 + x3

6 + 2x2

3 − 2x3 + 1, que evidentemente no es

factor de f (x).

El algoritmo de Berlekamp para factorizar en Fp[x] data de 1967, fecha depublicación del artículo en donde se detallaba. Se basa en una idea sencilla, ygracias a eso y a su efectividad, ha sido desde entonces uno de los más utilizados,tanto para programar como para servir de ejemplo de algoritmo de factorizaciónen característica positiva. La idea de la que hablábamos se presenta en el siguienteteorema.

64

Teorema de Berlekamp

Sea f (x) ∈ Fp[x] de grado n, sin factores múltiples y mónico, ysupongamos que existe un polinomio g(x) tal que

f (x)|(g(x)p − g(x)

).

Entonces

f (x) =p−1∏

s=0

mcd( f (x), g(x)− s),

aunque varios de estos factores pueden ser polinomios constantes.

PRUEBA: Si hacemos memoria del no tan lejano capítulo anterior, recordaremosque en Fp teníamos que

x p − x =p−1∏

s=0

(x − s),

lo cual en particular implica que

g(x)p − g(x) =p−1∏

s=0

(g(x)− s).

Hay que decir que todos estos factores son primos entre sí al diferenciarse en unaconstante.

Probemos entonces la igualdad que hemos enunciado. Por un lado, no es nadadificultoso ver que

p−1∏

s=0

mcd( f (x), g(x)− s)| f (x),

pues todos los elementos de la izquierda dividen a f (x) y como los g(x)− s sonprimos entre sí también lo serán los divisores comunes.

En el otro sentido, si tomamos un factor irreducible de f (x), pongamos h(x),debe dividir a g(x)p − g(x), luego dividirá también a alguno de los g(x)− s y, deigual modo a mcd( f (x), g(x)− s).

En conclusión, los dos miembros de la igualdad se dividen mutuamente y alser mónicos, son iguales. �

65

A partir de aquí, la factorización de f (x) ∈ Fp[x] queda reducida por un ladoa encontrar g(x) de grado r < n tal que

f (x)|(g(x)p − g(x)),

y posteriormente a aplicar el algoritmo de Euclides p veces. Notemos entoncesque por estar en característica positiva y por el pequeño teorema de Fermat,

si g(x) =n−1∑

i=0

ai xi , entonces g p(x) =

n−1∑

i=0

ai xi p.

Vamos entonces a buscar un tal polinomio g(x) (concretamente, vamos a bus-car sus coeficientes a0, . . . , an−1). Dividamos así los monomios x i p entre f (x),que al tener grado n obtendremos

x0p = q0(x) f (x)+ r0(x) = q0(x) f (x)+ r00 + r10x1 + . . .+ rn−1,0xn−1

x1p = q1(x) f (x)+ r1(x) = q1(x) f (x)+ r01 + r11x1 + . . .+ rn−1,1xn−1

...

x (n−1)p = qn−1(x) f (x)+ rn−1(x) = qn−1(x) f (x)+ r0,n−1 + r1,n−1x1 + . . .+ rn−1,n−1xn−1

Por la unicidad de la división euclídea, el resultado de dividir g p(x) entre f (x) esel dado por la expresión

g p(x) =n−1∑

i=0

ai x i p =(

n−1∑

i=0

ai qi (x)

)f (x)+

n−1∑

i=0

airi (x),

y por el mismo motivo, el de dividir g p(x)− g(x) entre f (x) es

g p(x)−g(x) =n−1∑

i=0

ai xi p−

n−1∑

i=0

ai x i =(

n−1∑

i=0

ai qi (x)

)f (x)+

n−1∑

i=0

(airi (x)−ai x i ).

Por consiguiente, g(x) verifica lo que queremos si y sólo si

0 =n−1∑

i=0

(airi (x)− ai xi ),

o escrito en forma matricial, tomando la matriz de orden n ×n R = (ri j ), si y sólosi

(a0, . . . , an−1)t es solución del sistema (R − In) x = 0.

Así, gracias al algoritmo de Berlekamp, factorizar en Fp[x] se reduce a re-solver ciertos sistemas de ecuaciones lineales y aplicar el algoritmo de Euclides,operaciones ambas que se pueden realizar de manera muy eficiente.

66

Algoritmo de Berlekamp

Para factorizar un polinomio f (x) ∈ Fp[x] de grado n.Para cada i = 0, . . . , n − 1, efectúe las divisiones de x i p entref (x) para obtener los restos

r(x) = r0i + r1i x1 + . . .+ rn−1,i xn−1.

Construya la matriz R = (ri j ), y plantee el sistema lineal

(R − In) x = 0.

Si el sistema no tiene solución, f (x) es irreducible. Si tiene unasolución (a0, . . . , an−1)

t que represente a un polinomio no cons-tante, f (x) se descompone como

p−1∏

s=0

mcd(

f (x), (a0 − s)+ a1x + . . .+ an−1xn−1).

Ejemplo 3.8.2. Ilustremos también este método con el mismo polinomio que elanterior ejemplo, pero considerado en F3[x]. Sea así f (x) = x4 + x3 + x + 2 ∈F3[x]. Dividimos determinadas potencias de x entre f (x) y obtenemos:

1 = q0(x) f (x)+ r0(x) = 0 · f (x)+ 1

x3 = q1(x) f (x)+ r1(x) = 0 · f (x)+ x3

x6 = q1(x) f (x)+ r1(x) = q2(x) f (x)+ 1 + x + 2x2 + x3

x9 = q1(x) f (x)+ r1(x) = q3(x) f (x)+ x

Los cocientes no los hemos indicado todos porque sólo nos interesan los restospara formar la matriz. En nuestro caso,

R =

1 0 1 00 0 1 10 0 2 00 1 1 0

.

El sistema lineal en F3[x] que tenemos que resolver es

0 0 1 00 2 1 10 0 1 00 1 1 2

x = 0,

67

que tiene como solución cualquier vector de la forma x = (α, β, 0, β)t , dondeα, β ∈ F3. Si tomamos α = 1, β = 0, obtenemos la constante 1, que obviamentecumple que f (x)|13 − 1 = 0. Escogiendo pues α = 0, β = 1 conseguimos ladescomposición

f (x) = mcd( f (x), x3+x)mcd( f (x), x3+x+1)mcd( f (x), x3+x+2) = (x2+1)(x2+x+2)·1.

3.9. El teorema fundamental del álgebra*

El contenido de esta sección está tomado del artículo The Fundamental Theo-

rem of Algebra and Linear Algebra, de Harm Derksen, publicado en el AmericanMathematical Monthly 110 (2003), número 7, páginas 620-623. El objetivo queperseguimos es dar una prueba del teorema fundamental del álgebra con argumen-tos puramente algebraicos y a la vez asequible al lector que no tenga un conoci-miento profundo de esta materia, pues solamente usa algunas nociones de álgebralineal.

Teorema fundamental del álgebra

Todo polinomio no constante de C[x] tiene una raíz en C.

Si de algo no se puede quejar alguien que se acerque por primera vez al teo-rema que nos ocupa, es por falta de demostraciones. Existe una cantidad con-siderable de pruebas distintas, y usando técnicas variopintas. Desde la primera,elaborada por Gauss en su tesis doctoral de 1799 (aunque con algún fallo en elrigor matemático), hasta esta que aquí expondremos, existen pruebas topológicas,usando propiedades de la curva compleja que describe un polinomio, pruebas ana-líticas, que utilizan el teorema de Liouville de que toda función entera es acotada,pruebas algebraicas, basándose en la teoría de Galois entre otras herramientas, oincluso mixturas de los tres tipos anteriores.

Vayamos, sin más dilación, al desarrollo de la prueba. Para ello, definamos lapropiedad Pk,r (d), donde k es un cuerpo, R o C, y r = 1, 2. Su enunciado es elsiguiente:

Pk,r (d): Dados r endomorfismos Ai que conmuten entre todos de un k-espacio

vectorial V de dimensión n, no divisible por d, existe un autovector no nulo que

es común a todos ellos.

68

Para probar el teorema, bastaría con demostrar que se cumple la propiedadPC,1(2r ) para todo r ∈ N. Así, para cualquier polinomio (que podemos suponermónico sin problema) no constante f (x) ∈ C[x], se tiene que

f (x) = xn+an−1xn−1+. . .+a0 = det(x In−A) , con A =

0 0 · · · 0 −a0

1 0 · · · 0 −a1....... . .

......

0 0 · · · 1 −an−1

Como A representa a un endomorfismo de C y existe algún r tal que 2r no dividea n, A tendría un autovector no nulo. Su autovalor asociado sería raíz de f (x), yhabríamos acabado. �

Así pues, para probar PC,1(2r ) seguiremos el camino marcado a través de di-versos lemas, cada uno apoyándose en los anteriores. Como en la demostración dearriba, denotaremos por Ai tanto a un endomorfismo como a su matriz asociada.

Lema 3.9.1. Si se tiene Pk,1(d), también se cumple Pk,2(d).

PRUEBA: Sean A1 y A2 dos endomorfismos que conmutan de un k-espaciovectorial V de dimensión n no divisible por d. Vamos a probar por inducciónen n que tienen un autovector en común. Si n = 1, cada Ai no es más que lamultiplicación por una constante, y todos los vectores de V son propios, siendotrivial el aserto. Supongamos pues que también es cierto si dim V < n, y veámoslopara dim V = n.

Como Pk,1(d) se cumple, A1 tiene un autovalor λ ∈ k. Sean W y Z , res-pectivamente, el núcleo y la imagen del endomorfismo A2 − λI . Como A1 y A2

conmutan, W y Z permanecen fijos por A1.Supongamos que W 6= V . Entonces, como dim W + dim Z = dim V , d no divi-dirá a al menos alguna de las dos dimensiones, y además ambas son menores quen. Por tanto, por la hipótesis de inducción, A1 y A2 compartirán un autovector nonulo directamente en W o en Z .Si W = V , cualquier vector propio de A1 v cumple que A2v = λv, luego tambiéntenemos la propiedad. �

Lema 3.9.2. Si k = R, Pk,r(2) son ciertas para r = 1, 2.

PRUEBA: Por el lema anterior bastaría probar que PR,1(2) es cierta, esto es,que todo endomorfismo de un espacio vectorial sobre R de dimensión impar tieneun autovector no nulo, pero eso es equivalente a que su polinomio característicof (x) = det(x I − A) tenga alguna raíz en R. Ahora bien, f (x) es un polinomio de

69

grado impar con coeficientes reales, y ya hemos visto que siempre tiene al menosuna raíz real. �

Lema 3.9.3. Todo endomorfismo de un C-espacio vectorial de dimensión impar

tiene un autovector no nulo, esto es, PC,1(2) se cumple.

PRUEBA: Sea A : Cn → Cn un endomorfismo con n impar, y sea V =Hermn(C), el R-espacio vectorial de las matrices hermíticas (aquellas que A∗ =A

t = A) de orden n × n. Consideremos los siguientes endomorfismos R-linealesde V definidos como:

L1(B) = AB + B A∗

2, L2(B) = AB − B A∗

2i.

Ver que L1 y L2 están bien definidos y conmutan es un cálculo bien sencillo y nolo escribiremos en estas líneas.

Sabemos que dimR V = n2, que es impar. Entonces, por el lema anterior, L1

y L2 comparten un autovector no nulo al cumplirse PR,2(2). Sea B ese autovectoren V , cuyos valores propios asociados sean λ y µ respectivamente. En ese caso,

(L1 + i L2)(B) = AB = (λ+ µi)B,

luego cualquier columna no nula de B constituirá uno de los autovectores buscadospara A. �

Ya hemos acabado el ensamblaje de lemas previos al resultado que nos bastabapara probar el teorema fundamental del álgebra. Como el lector interesado (puesya por llegar hasta aquí ha demostrado un interés digno de mención) podrá ver,no hemos usado más que algunas propiedades básicas de espacios vectoriales ymatrices, asequibles a cualquier alumno con nociones básicas de álgebra lineal yque, evidentemente, presuponemos aquí, pues no es competencia de este texto elexplicar dichas nociones, sin que eso signifique ningún menoscabo a ellas. Perono nos alejemos del tema que nos ocupa y demostremos la proposición siguiente.

Proposición 3.9.4. Para todo r ∈ N se cumple PC,1(2r ).

PRUEBA: Se hará por inducción en r . Si r = 1 es el enunciado del lemaanterior, así que supongamos como hipótesis de inducción que tenemos PC,1(2l),con l < r .Tomemos pues un endomorfismo C-lineal A : Cn → Cn , con n divisible por 2r−1

pero no por 2r . Esto lo podemos asumir, puesto que si n no fuera divisible por2r−1 estaríamos en el caso de probar PC,1(2r−1). Sea V = Antn(C) el C-espacio

70

vectorial de las matrices antisimétricas con coeficientes complejos. Definamos dosendomorfismos de V , L1 y L2 como

L1(B) = AB − B At , L2(B) = AB At .

De nuevo, no probaremos que están bien definidos ni que conmutan entre ellos, yse lo dejaremos al lector con afán de comprobación.

Notemos que 2r−1 no divide a dim V , que es igual a n(n −1)/2. Por tanto, porla hipótesis de inducción, existe un vector propio B común a L1 y L2. Sean susautovalores asociados λ y µ, respectivamente. Así,

µB = ABAt = A(AB − λB),

es decir,(A2 − λA − µI )B = 0.

Sea v un vector columna de B, y sean α y β las dos raíces complejas del polinomiox2 − λx − µ, que sí que sabemos que tiene raíces en C, porque es de grado 2. Sillamamos w = (A − β I )v y es no nulo, tenemos que (A − α I )w = 0, y hemosterminado, siendo w el autovector que buscábamos. Si w = 0 eso querría decirque (A − β I )v = 0, siendo v el vector propio buscado. �

71

72

Capítulo 4

Conjuntos

4.1. Conjuntos. Operaciones básicas

Comenzaremos dando una noción intuitiva de uno de los conceptos matemá-ticos más importantes: el de conjunto. La Teoría de conjuntos, desde el puntode vista axiomático, fue introducida por Georg Cantor. Cantor nació en San Pe-tersburgo en 1845, donde vivió sus primeros once años. Desde 1869 ejerció comoprofesor en la universidad de Halle. Entre 1879 y 1884 Cantor publicó una seriede seis artículos en el Mathematische Annalen en los que desarrollaba una intro-ducción básica a la teoría de conjuntos. Falleció en 1917.

Conjunto

Llamaremos conjunto a una colección de objetos, distintos entresí, que comparten una propiedad. Para que un conjunto esté biendefinido debe ser posible discernir si un objeto arbitrario está ono en él.

Los conjuntos pueden definirse de manera explícita, citando todos sus elemen-tos entre llaves, por ejemplo

A = {1, 2, 3, 4, 5},

o de manera implícita, dando una o varias características que determinen si unobjeto dado está o no en el conjunto, por ejemplo

A = {x | x es un número natural par},

73

que se leerá: “A es el conjunto formado por los x tales que x es un número naturalpar”. Esta última opción (la definición implícita) es obviamente imprescindiblecuando el conjunto en cuestión tiene una cantidad infinita de elementos.

Los conjuntos se notarán con letras mayúsculas: A, B,... y los elementos conminúsculas, en general. Si el elemento a pertenece al conjunto A escribiremosa ∈ A. En caso contrario escribiremos a /∈ A.

En ocasiones hay que considerar varios conjuntos en pie de igualdad. En estoscasos es frecuente denotar los distintos conjuntos con la misma letra y un subíndi-ce que los diferencia. Los subíndices pueden ser finitos y concretos, por ejemplo,

X1, X2, X3, X4, X5;finitos pero en cantidad desconocida,

X1, X2, ..., Xn, donde n ∈ N,

o arbitrarios; un ejemplo de esto sería considerar

{Ai }i∈I ,

que se leería: la familia de conjuntos Ai donde i pertenece a I . Aquí I es elconjunto de subíndices que puede o no ser finito (en los ejemplos anteriores I ={1, 2, 3, 4, 5}, I = {1, 2, . . . , n} con n ∈ N y también I podría ser todo N).

Ejemplo 4.1.1. 1) Para cada i = 0, 1, . . . , 9, definimos los conjuntos Xi como

Xi = {Españoles cuyo año de nacimiento termina en i}.

2) Para cada n ∈ N, definimos el conjunto

An = {m ∈ Z | m es múltiplo de n}.De esta forma se tiene una familia infinita {An}n∈N de conjuntos. En particular, sin = 5 se tiene

A5 = {. . . ,−10,−5, 0, 5, 10, . . . }.Un conjunto que carece de elementos se denomina el conjunto vacío y se

denota por ∅. Un conjunto con un único elemento se denomina unitario.Notemos que, si X = {x} es un conjunto unitario, debemos distinguir entre el

conjunto X y el elemento x .

Subconjunto

Dados dos conjuntos A y B, si todo elemento de A es a su vezelemento de B diremos que A es un subconjunto de B y lo nota-remos A ⊂ B. En caso contrario se notará A 6⊂ B.

74

Definición 4.1.2. Dados dos conjuntos A y B, diremos que son iguales si tienenlos mismos elementos, es decir, si se verifica que A ⊂ B y B ⊂ A, y lo notaremospor A = B.

Esta definición nos lleva al procedimiento más habitual de demostración enteoría de conjuntos: la prueba por doble inclusión. Si queremos probar que dosconjuntos A y B son iguales, lo que haremos es probar que A ⊂ B y que B ⊂ A.A lo largo de esta sección veremos algunos ejemplos de esta técnica.

Cuando trabajamos con conjuntos concretos, siempre existe un contexto don-de esos conjuntos existen. Por ejemplo, si A = {−1, 1, 2, 3, 4, 5} y B = {x | x ∈N es par}, el contexto donde podemos considerar A y B es el conjunto de los nú-meros enteros, Z. En general, a este conjunto se le denomina conjunto universaly se denota por U. De una forma algo más precisa, sin olvidar que estamos dandonociones intuitivas, podemos dar la siguiente definición:

Conjunto universal

Conjunto universal o de referencia, que lo notaremos por U , es unconjunto del que son subconjuntos todos los posibles conjuntosque origina el problema que tratamos.

A lo largo de estas notas supondremos, salvo que se especifique lo contrario,que todos los conjuntos que usamos están contenidos en U. De esta forma, dadoun conjunto A, podemos representarlo con un diagrama de Venn.

A

U

Figura 4.1: Diagrama de Venn

Proposición 4.1.3. Sean A, B y C tres conjuntos cualesquiera. Se tienen las si-

guientes propiedades:

(a) A ⊂ A, ∅ ⊂ A.

(b) Si A ⊂ B y B ⊂ C, entonces A ⊂ C.

75

PRUEBA: La primera propiedad se sigue directamente de la definición.La demostración de (b) se sigue de la definición de subconjunto: todo elemento

de A está en B, por ser A ⊂ B y, dado que es elemento de B, está en C por serB ⊂ C . Así todo elemento de A está en C y hemos finalizado. �

Los subconjuntos de A distintos de ∅ y A se denominan subconjuntos propiosde A.

Complementario

Dado un conjunto A se define el complementario de A, notadopor A o Ac, como

A = {x | x ∈ U, x /∈ A}.

A

U

Figura 4.2: Complementario

Dado A ⊂ U , se dan las siguientes igualdades:

∅ = U, U = ∅, A = A.

Nos detendremos solamente en la tercera de las anteriores propiedades. Enefecto, por definición

A = {x | x ∈ U, x /∈ A},

pero para un x ∈ U , x /∈ A si y sólo si x ∈ A, por tanto los elementos de A sonprecisamente los de A.

Cardinal de un conjunto

Cuando A es un conjunto finito, el número de elementos de A sedenomina cardinal de A y se notará ♯(A).

76

Unión de conjuntos

Dados dos conjuntos A y B se define la unión de A y B, notadoA ∪ B, como el conjunto formado por aquellos elementos quepertenecen al menos a uno de los dos conjuntos, A ó B, es decir

A ∪ B = {x | x ∈ A ∨ x ∈ B}.

U

A B

Figura 4.3: Unión

Ejemplo 4.1.4. 1) Sean A = {a, b, c} y B = {2, 5, 7, c, a}, entonces

A ∪ B = {a, b, c, 2, 5, 7}.

2) Si A = {x ∈ Q | − 2 ≤ x ≤ 7} y B = {x ∈ Q | − 4 ≤ x ≤ 3}, entonces

A ∪ B = {x ∈ Q | − 4 ≤ x ≤ 7}.

3) Sean A = {Alumnos nacidos en enero} y B = {Alumnos nacidos en día par},entonces

A ∪ B = {Alumnos nacidos en día par o en los días impares de enero}.

Se definen de forma equivalente la unión de una cantidad finita de conjuntosA1, ..., An , que denotaremos

A1 ∪ ... ∪ An =n⋃

i=1

Ai ,

y la unión de una familia arbitrariamente grande de conjuntos {Ai }i∈I , que deno-taremos ⋃

i∈I

Ai .

77

Propiedades de la unión

La unión de conjuntos verifica las siguientes propiedades, paracualesquiera conjuntos A, B y C :

(a) Conmutativa: A ∪ B = B ∪ A.

(b) Asociativa: (A ∪ B) ∪ C = A ∪ (B ∪ C).

(c) A ⊂ A ∪ B, B ⊂ A ∪ B.

(d) ∅ ∪ A = A.

(e) A ⊂ B si y sólo si A ∪ B = B.

PRUEBA: (a) Los elementos de A ∪ B son los que pertenecen a A o a B

que, evidentemente, son los mismos elementos que pertenecen a B o a A, es decirA ∪ B = B ∪ A. La prueba de (b) se hace igual.(c) Sea a ∈ A. Es claro que a ∈ A ∪ B pues el elemento a verifica que está en A

o en B. Análogamente B ⊂ A ∪ B.

(d) Probaremos esta propiedad por doble inclusión. Por (c) tenemos que A ⊂∅ ∪ A. Recíprocamente,sea a ∈ ∅ ∪ A. Esto quiere decir que el elemento a tieneque estar, al menos, en uno de los conjuntos ∅ o A. Sabemos que a /∈ ∅, luegoa ∈ A.

(e) Supongamos que A ⊂ B. Para probar que A ∪ B = B basta probar queA ∪ B ⊂ B, pues la otra inclusión la tenemos por (c). Sea x ∈ A ∪ B, entoncesx ∈ A o x ∈ B. Pero si x ∈ A, como A ⊂ B se tiene que x ∈ B.

Recíprocamente, supongamos que A ∪ B = B. Entonces, por (c) tenemosA ⊂ A ∪ B = B.

Intersección de conjuntos

Dados dos conjuntos A y B se define la intersección de A y B,notado A ∩ B, como el conjunto formado por aquellos elementosque pertenecen al mismo tiempo a ambos conjuntos, A y B, esdecir

A ∩ B = {x | x ∈ A ∧ x ∈ B}.

78

U

A B

Figura 4.4: Intersección

Ejemplo 4.1.5. 1) Sean A = {a, b, c} y B = {2, 5, 7, c, a}, entonces

A ∩ B = {a, c}.2) Si A = {x ∈ Q | − 2 ≤ x ≤ 7} y B = {x ∈ Q | − 4 ≤ x ≤ 3}, entonces

A ∩ B = {x ∈ Q | − 2 ≤ x ≤ 3}.3) Sean A = {Alumnos nacidos en enero} y B = {Alumnos nacidos en día par},entonces

A ∩ B = {Alumnos nacidos en los días pares de enero}.Se definen de forma equivalente la intersección de una cantidad finita de con-

juntos A1, ..., An , y la intersección de una familia arbitrariamente grande de con-juntos {Ai }i∈I , que denotaremos, respectivamente,

A1 ∩ ... ∩ An =n⋂

i=1

Ai , y⋂

i∈I

Ai .

Si A y B son dos conjuntos tales que A ∩ B = ∅ se dice que A y B sondisjuntos.

Propiedades de la intersección

La intersección de conjuntos verifica las siguientes propiedades,para cualesquiera conjuntos A, B y C :

(a) Conmutativa: A ∩ B = B ∩ A.

(b) Asociativa: (A ∩ B) ∩ C = A ∩ (B ∩ C).

(c) A ∩ B ⊂ A, A ∩ B ⊂ B.

(d) ∅ ∩ A = ∅.

(e) A ⊂ B si y sólo si A ∩ B = A.

79

PRUEBA: (a) Los elementos de A ∩ B son los que pertenecen a A y a B

que, evidentemente, son los mismos elementos que pertenecen a B y a A, es decirA ∩ B = B ∩ A. La prueba de (b) se hace igual.(c) Sea a ∈ A ∩ B. Entonces a ∈ A pues el elemento a verifica que está en A yen B. Análogamente B ∩ A ⊂ B.

(d) Probaremos esta propiedad por doble inclusión. Por (c) tenemos que A∩∅ ⊂ ∅.La inclusión contraria se tiene pues sabemos que el ∅ es subconjunto de todos losconjuntos, en particular es ∅ ⊂ ∅ ∩ A.

(e) Supongamos que A ⊂ B. Para probar que A ∩ B = A basta probar queA ⊂ A ∩ B, pues la otra inclusión la tenemos por (c). Sea x ∈ A, entonces x ∈ B

pues A ⊂ B. Es decir x ∈ A ∩ B.

Recíprocamente, supongamos que A ∩ B = A. Entonces, por (c) tenemosA = A ∩ B ⊂ B.

Diferencia de conjuntos

Dados dos conjuntos A y B se define la diferencia de A y B,notada A \ B, como el conjunto formado por los elementos de A

que no están en B, es decir

A \ B = {x | x ∈ A ∧ x /∈ B}.

Se tiene que A \ B = A ∩ B. En efecto, sea x ∈ A \ B. Entonces x ∈ A yx /∈ B, luego x ∈ A y x ∈ B, es decir x ∈ A ∩ B. Para demostrar la inclusióncontraria basta leer la demostración anterior de derecha a izquierda.

U

A B

Figura 4.5: Diferencia

Ejemplo 4.1.6. 1) Sean A = {a, b, c} y B = {2, 5, 7, c, a}, entonces

A \ B = {b}.

80

2) Si A = {x ∈ Q | − 2 ≤ x ≤ 7} y B = {x ∈ Q | − 4 ≤ x ≤ 3}, entonces

A \ B = {x ∈ Q | 3 ≤ x ≤ 7}.

3) Sean A = {Alumnos nacidos en enero} y B = {Alumnos nacidos en día par},entonces

A \ B = {Alumnos nacidos en los días impares de enero}.

Notemos que, en general, A\B 6= B\A. En el apartado 1) del ejemplo anteriores A \ B = {a} y B \ A = {2, 5, 7}.

Diferencia simétrica de conjuntos

Dados dos conjuntos A y B se define la diferencia simétrica deA y B, notada A△B, como el conjunto formado por los elementosque pertenecen a uno sólo de los conjuntos A, B, es decir

A△B = {x | x ∈ A \ B ∨ x ∈ B \ A}.

Se tiene que A△B = (A ∩ B) ∪ (A ∩ B) = (A \ B) ∪ (B \ A).

U

A B

Figura 4.6: Diferencia simétrica

Ejemplo 4.1.7. 1) Sean A = {a, b, c} y B = {2, 5, 7, c, a}, entonces

A△B = {b, 2, 5, 7}.

2) Si A = {x ∈ Q | − 2 ≤ x ≤ 7} y B = {x ∈ Q | − 4 ≤ x ≤ 3}, entonces

A△B = {x ∈ Q | − 4 ≤ x < 2 y 3 < x ≤ 7}.

3) Sean A = {los alumnos nacidos en enero} y B = {los alumnos nacidos en día par},entonces

A△B = {los alumnos nacidos en los días impares de enero y en los pares del resto de meses}.

81

Veremos ahora algunas propiedades más de los conjuntos y demostraremosalgunos resultados fundamentales utilizando la técnica de la doble inclusión.

Proposición 4.1.8. Sean A ⊂ B dos conjuntos. Entonces A ∪ (B \ A) = B y

A ∩ (B \ A) = ∅.

PRUEBA: Ambas pruebas son sencillas. Veamos la primera afirmación. Seax ∈ A ∪ (B \ A). Si x ∈ A es x ∈ B, pues A ⊂ B. En caso contrario x ∈ B \ A,

es decir x ∈ B. Por tanto A ∪ (B \ A) ⊂ B.

Recíprocamente, sea x ∈ B. Si x ∈ A, entonces x ∈ A ∪ (B \ A). En casocontrario, x /∈ A, luego x ∈ B \ A y x ∈ A ∪ (B \ A). Por tanto B ⊂ A ∪ (B \ A).

Leyes distributivas - Leyes de De Morgan

Dados tres conjuntos A, B y C se verifican las siguientes igual-dades:

(a) Leyes distributivas:

A∩(B∪C) = (A∩B)∪(A∩C), A∪(B∩C) = (A∪B)∩(A∪C)

(b) Leyes de De Morgan (supongamos A, B ⊂ C):

C\(A∪B) = (C\A)∩(C\B), C\(A∩B) = (C\A)∪(C\B)

PRUEBA: Probaremos una de las leyes distributivas y una de las leyes de DeMorgan; las restantes quedan como ejercicio por ser simétricas a las probadas.Ambos resultados se probarán por doble inclusión.

Veamos que A∩(B ∪C) ⊂ (A∩ B)∪(A∩C). Para ello tomemos un elementoarbitrario x ∈ A ∩ (B ∪ C). Esto quiere decir que x está en A y además en B óen C . Esto implica que, bien está en A ∩ B, bien está en A ∩ C . En cualquier casox ∈ (A ∩ B) ∪ (A ∩ C).

Demostremos ahora que (A∩ B)∪(A∩C) ⊂ A∩(B ∪C). Si consideramos unelemento cualquiera y ∈ (A ∩ B)∪ (A ∩ C), y ha de pertencer a A ∩ B o a A ∩ C .Por tanto, bien está en A y en B o en A y en C . En cualquier circunstancia ha deestar en A y al menos en uno de los otros dos conjuntos B ó C . De aquíy ∈ A yademás y ∈ B ∪ C .

Pasemos a probar la segunda ley de De Morgan. Veamos primero C\(A∩B) ⊂(C \ A)∪(C \ B). Un elemento x de C \(A∩ B) ha de estar en C , pero no en A∩ B,

82

por lo que no puede estar en al menos uno de los dos conjuntos A ó B. Así, x hade pertenecer, bien a C \ A, bien a C \ B. En cualquier caso x ∈ (C \ A)∪ (C \ B).

Si tomamos ahora un elemento z ∈ (C \ A) ∪ (C \ B), observemos que z hade estar, bien en C \ A, bien en C \ B, por lo que debe estar en C y no estar en A

o en B. Así, z ∈ C , pero nunca puede estar en A ∩ B, por lo que z ∈ C \ (A ∩ B).�

Notemos que si en el apartado (b) del teorema anterior tomamos C = U, elconjunto universal, la leyes de De Morgan nos dicen que:

A ∪ B = A ∩ B, A ∩ B = A ∪ B.

A B

C

A B

C

Figura 4.7: Ley distributiva

A B

C

A B

C

Figura 4.8: Ley de De Morgan

Partes de un conjunto

Dado un conjunto X , se define el conjunto de las partes de X ,notado P(X), como el conjunto cuyos elementos son todos lossubconjuntos de X .

83

Ejemplo 4.1.9. Si tenemos el conjunto X = {0, 1, 2, 3}, entonces

P(X) = {∅, {0}, {1}, {2}, {3}, {0, 1}, {0, 2}, {0, 3}, {1, 2}, {1, 3}, {2, 3},{0, 1, 2}, {0, 1, 3}, {0, 2, 3}, {1, 2, 3}, X }

Teorema 4.1.10. El conjunto P(X) es finito si y sólo si lo es X. De hecho, en este

caso,

♯ (P(X)) = 2♯(X).

PRUEBA: En cuanto a la primera afirmación, si X es infinito, lo es obviamenteP(X). La otra implicación viene dada por la fórmula sobre los cardinales queprobaremos por inducción.

El caso ♯(X) = 0 es elemental, porque entonces X = ∅ y, por tanto P(X) ={∅}. Notemos que P(X) no es el conjunto vacío, es un conjunto unitario, cuyoúnico elemento es el conjunto vacío.

Supuesto cierto el resultado para todos los conjuntos que tienen, pongamos,n elementos, tomemos X un conjunto de n + 1 elementos, x ∈ X cualquiera, yescribamos

X = X ′ ∪ {x},donde X ′ = X \ {x} tiene n elementos. Entonces es claro que los subconjuntos deX son, bien subconjuntos de X ′, bien subconjuntos de X ′ a los que se ha añadidox, y que hay tantos subconjuntos de un tipo como del otro. Dado que, por hipótesisde inducción,

♯(P(X ′)) = 2n

se tiene, por tanto,

♯ (P(X)) = 2 · ♯(P(X ′)) = 2 · 2n = 2n+1.

4.2. Producto cartesiano. Relaciones de equivalen-cia.

Producto cartesiano

Dados dos conjuntos A y B, se define el producto cartesiano deA y B como el conjunto de pares ordenados formados (por esteorden) por un elemento de A y uno de B y se denota

A × B = {(a, b) | a ∈ A, b ∈ B}.

84

Dado (a, b) ∈ A × B, el elemento a ∈ A (respectivamente b ∈ B) se sueledenominar primera (segunda) componente del par.

Ejemplo 4.2.1. Sean A = {a, b, c} y B = {b, 1, 2, 3}. Entonces:

A×B = {(a, b), (a, 1), (a, 2), (a, 3), (b, b), (b, 1), (b, 2), (b, 3), (c, b), (c, 1), (c, 2), (c, 3)}

También se puede definir el producto cartesiano de una cantidad finita de con-juntos (para cantidades infinitas hay dos posibles generalizaciones y no las vere-mos por ahora ) de la forma natural

A1 × ...× An =n∏

i=1

Ai = {(a1, ..., an) | ai ∈ Ai , para i = 1, ..., n} .

Correspondencia

Una correspondencia G de A en B es un subconjunto del pro-ducto A × B. Equivalentemente se puede definir como una reglaque asocia algunos elementos de A con algunos elementos de B.Concretamente, G asocia a ∈ A con b ∈ B si (a, b) ∈ G.

Ejemplo 4.2.2. Sean A = {a, b, c} y B = {b, 1, 2, 3} los conjuntos del ejemploanterior. Entonces G = {(a, 1), (a, 3), (b, b), (b, 1), (b, 3)} es una corresponden-cia de A en B.

Las correspondencias se pueden representar como sigue:

ba

c

b1

2

3

A B

Figura 4.9: Correspondencia

Es claro que la representación del ejemplo anterior es posible por trabajarcon conjuntos finitos (y con pocos elementos). Si los conjuntos son infinitos, lascorrespondencias (no finitas) se tienen que dar definiendo propiedades de los paresque la componen. Por ejemplo, si A = Z, B = N una correspondencia es G ={(x, y) | x es par, y es impar}.

85

Relación

Sea A un conjunto. Una relación R definida en A es una corres-pondencia de A en sí mismo.

Ejemplo 4.2.3. Sea A = {a, b, c}. Entonces R = {(a, a), (a, c), (b, c)} es unarelación en A.

Si el par (x, y) ∈ A × A está en R, diremos que x está R–relacionado con y, orelacionado con y por R. Esto se notará frecuentemente x Ry (nótese que el ordenes importante).

Sea R una relación en A. Entonces diremos que R es:

(a) Reflexiva cuando para todo x ∈ A se tiene que x Rx .

(b) Simétrica cuando x Ry siempre implica y Rx .

(c) Antisimétrica cuando, si tenemos x Ry e y Rx , entoncesx = y necesariamente.

(d) Transitiva si tenemos x Ry e y Rz siempre es x Rz.

Relaciones de orden y de equivalencia

Las relaciones reflexivas, simétricas y transitivas se denominanrelaciones de equivalencia. Las relaciones reflexivas, antisimé-tricas y transitivas se denominan relaciones de orden.

Ejemplo 4.2.4. 1) En el conjunto Z definimos las relaciones siguientes:

x Ry ⇐⇒ x ≤ y, x Sy ⇐⇒ x − y es par, xT y ⇐⇒ x divide a y

a) R es una relación de orden (de hecho, las relaciones de orden se denominan asípor ser éste el ejemplo fundamental). En efecto:

Reflexiva: ∀n ∈ Z se tiene que n ≤ n, luego nRn.

86

Antisimétrica: Si nRm y m Rn se tiene que n ≤ m y m ≤ n, luego n = m.

Transitiva: Si nRm y m Rs es n ≤ m ≤ s, luego nRs.

b) S es una relación de equivalencia.

Reflexiva: ∀n ∈ Z se tiene que n − n = 0 es par, luego nSn.

Simétrica: si nSm es n − m par, luego m − n es par y, por tanto, mSn.

Transitiva: si nSm y mSp se tiene que n − m y m − p son pares. Sumandose tiene que n − p es par, luego nSp.

c) T no es ni de orden ni de equivalencia, pues T no verifica la propiedad antisi-métrica ni la simétrica.

Notemos que S es de equivalencia si sustituimos la condición “x − y es par”por la condición “x − y es múltiplo de p”, para cualquier número p que fijemoscon antelación.2) Sea A un conjunto fijo. En P(U) definimos la relación R :

∀B,C ∈ P(U), BRC si A ∩ B = A ∩ C.

Veamos que es una relación de equivalencia.

Reflexiva: ∀B ∈ P(U), A ∩ B = A ∩ B, es decir BRB.

Simétrica: si BRC, es A ∩ B = A ∩ C, luego A ∩ C = A ∩ B y CRB.

Transitiva: si BRC y CRD se tiene que A ∩ B = A ∩ C = A ∩ D, luegoBRD.

3) En el conjunto Z la relación definida por el menor estricto, x Ry ⇐⇒ x < y,

verifica la propiedad antisimétrica ya que no existe ningún par de enteros n,m

tales que nRm y m Rn. La relación es también transitiva, pero no es reflexiva nisimétrica.

Clase de equivalencia

Si R es una relación de equivalencia en A, denominamos clasede equivalencia de un elemento x ∈ A al conjunto de todos loselementos de A relacionados con x , esto es,

x = R(x) = {y ∈ A | x Ry},

donde la primera notación se usa si R se sobreentiende, y la se-gunda si no es así.

87

Ejemplo 4.2.5. Vamos a calcular las clases de equivalencia de las relaciones delejemplo anterior.1) En Z consideramos la relación de equivalencia S, nSm si n − m es par. Sea n

un número par. Entonces m ∈ Z está relacionado con n si m − n = 2k es par,luego m = n + 2k es par. Luego todos los elementos de la clase de equivalenciade n son pares. Recíprocamente, si m es par se tiene que n − m es par. Por tanto,la clase de equivalencia de n, S(n), es el conjunto de todos los números pares.

Si n es impar, es fácil ver que la clase de equivalencia S(n) es el conjunto detodos los números impares.

Notar que si n1 y n2 son ambos números pares (impares) entonces S(n1) =S(n2). De aquíse sigue que en este ejemplo sólo tenemos dos clases de equiva-lencia, por ejemplo S(0) = {enteros pares} y S(1) = {enteros impares}. Nótesetambién que S(0) ∩ S(1) = ∅ y que Z = S(0) ∪ S(1). En el teorema siguiente seprobará que estas propiedades se verifican en cualquier relación de equivalencia.2) Calcularemos las clases de equivalencia de la relación, en P(U), definida por:∀B,C ∈ P(U), BRC si A ∩ B = A ∩ C, siendo A un conjunto fijo. Estudia-remos, primero, un caso particular que nos servirá para entender mejor el casogeneral. Supongamos que el conjunto A que fijamos tiene sólo dos elementos,A = {x, y}. Veamos que, en este caso, sólo existen 4 clases de equivalencia:R(∅),R(A),R({x}) y R({y}). En efecto: sea B un conjunto cualquiera. Las po-sibilidades para A ∩ B son

A ∩ B = ∅ = A ∩ ∅, de donde BR∅ y B ∈ R(∅).

A ∩ B = A = A ∩ A, de donde BRA y B ∈ R(A).

A ∩ B = {x} = A ∩ {x}, de donde BR{x} y B ∈ R({x}).

A ∩ B = {y} = A ∩ {y}, de donde BR{y} y B ∈ R({y}).

Observemos que en este ejemplo también se tiene que las cuatro clases ante-riores no tienen ningún elemento en común y que la unión de todas ellas es P(U).

Pasemos al caso general. Sea A un conjunto cualquiera. Veamos que exis-ten tantas clases de equivalencia como subconjuntos de A, es decir tantas como♯(P(A)).

2-1) Si A1, A2 ⊂ A son distintos, entonces R(A1) 6= R(A2). En efecto: A1 yA2 no están relacionados ya que A ∩ A1 = A1 6= A2 = A ∩ A2.

2-2) Todo conjunto B pertenece a la clase de equivalencia de un subconjuntode A. En efecto: basta tomarA ∩ B ⊂ A, entonces A ∩ (A ∩ B) = (A ∩ A)∩ B =A ∩ B, luego B ∈ R(A ∩ B).

Hemos visto en los ejemplos anteriores que las clases de equivalencia distin-tas no tienen ningún elemento en común, y que la unión de todas la clases es el

88

conjunto total. Veamos que esta es una propiedad de cualquier relación de equiva-lencia.

Sea A un conjunto, R una relación de equivalencia en A. Entoncesse verifican las siguientes propiedades:

(a) Todo elemento pertenece a una clase de equivalencia.

(b) Dos clases de equivalencia son disjuntas o iguales.

Esto es, la relación R divide completamente al conjunto A ensubconjuntos disjuntos (las clases de equivalencia).

PRUEBA: La afirmación (a) es trivial, ya que R es reflexiva. Para probar (b)supongamos que tenemos dos clases de equivalencia R(x) y R(y) de tal formaque existe z ∈ R(x) ∩ R(y). Tenemos que demostrar entonces que R(x) = R(y),y lo haremos por doble inclusión. De hecho, sólo probaremos que R(x) ⊂ R(y),porque la otra inclusión es absolutamente simétrica.

Tomamos entonces a ∈ R(x). Como z ∈ R(x), tenemos que aRx y x Rz, porlo que aRz. De la misma forma, como z ∈ R(y), se verifica que z Ry. Así tenemosaRy, luego a ∈ R(y). Observemos que hemos usado tanto la propiedad simétricacomo la transitiva para demostrar (b). �

Corolario 4.2.6. Sea A un conjunto, R una relación de equivalencia en A, x, y ∈A. Se tiene que las clases de equivalencia de x e y son iguales, R(x) = R(y), si

y sólo si x Ry.

Conjunto cociente

Dada una relación de equivalencia R definida sobre un conjuntoA, el conjunto cuyos elementos son las clases de equivalencia deA por R se denomina conjunto cociente de A por R. La notaciónusual es

A/R = {R(x) | x ∈ A}.

Ejemplo 4.2.7. Veamos los conjuntos cocientes de los ejemplos anteriores.

89

a) Sea la relación de equivalencia S, en Z, dada por nSm si n − m es par.Entonces

Z/S = {S(0), S(1)}

En general, si fijamos un entero p y consideramos

x Sy ⇐⇒ x − y es múltiplo de p,

se tiene que, para todo x ∈ Z

S(x) = {y ∈ Z | x e y dan el mismo resto al dividirlos entre p},

por lo queZ/S = {S(0), S(1), ..., S(p − 1)}.

b) Consideremos la relación de equivalencia, en P(U), definida por:

∀B,C ∈ P(U), BRC si A ∩ B = A ∩ C,

siendo A un conjunto fijo. En este caso

P(U)/R = {R(D) | D ∈ P(A)}.

4.3. Aplicaciones

Aplicación

Una aplicación f de A en B es una correspondencia donde todoelemento de A tiene asociado un único elemento de B. Esto es, ennotación matemática, una correspondencia G es una aplicación siy sólo si se verifica que

∀a ∈ A ∃!b ∈ B tal que (a, b) ∈ G.

Nota 4.3.1. Es habitual denotar una aplicación entre A y B de la forma f : A −→B. En estas condiciones, dado a ∈ A el único b ∈ B verificando (a, b) ∈ f sedenota f (a) y se denomina imagen de a (por f ).

De esta notación surge la terminología, comúnmente usada, de llamar a A

conjunto original (o dominio) y a B conjunto imagen.

90

Ejemplo 4.3.2. 1) Sea f : R → R la correspondencia dada por

(a, b) ∈ f si b2 = a.

La correspondencia f no es aplicación, pues no todos los elementos de R poseenuna imagen (si a < 0, no existe b ∈ R con b2 = a.)

2) Consideremos la correspondencia anterior donde la primera componente la su-ponemos en R+ (los números reales positivos), es decir f ⊂ R+ × R. En estecaso, todos los elementos de R+ tienen una imagen, pero f no es aplicación, puesla imagen no es única. Por ejemplo, (4, 2) ∈ f y (4,−2) ∈ f.

3) Si consideramos f : R+ → R+, definida por

f (a) = b si b2 = a,

si es aplicación.

4) La correspondencia

f : Z − {1} → Q, f (n) = n

n − 1

es aplicación.

5) Sea A un conjunto fijo. Definimos

f, g : P(U) → P(U) f (B) = A ∩ B, g(B) = A ∪ B.

Ambas son aplicaciones.

6) Sea X un conjunto cualquiera. Siempre se tiene la aplicación

f : X → X, definida por f (x) = x, ∀x ∈ X,

que llamaremos aplicación identidad y notaremos por 1X .

7) Sean X, Y conjuntos cualesquiera, y0 ∈ Y un elemento fijo. Siempre se tiene laaplicación

g : X → Y definida por g(x) = y0, ∀x ∈ X,

que llamaremos aplicación constante.

91

Imagen y anti-imagen

Dada una aplicación f : X −→ Y y subconjuntos A ⊂ X yB ⊂ Y , definimos:

(a) La imagen de A (o imagen directa de A), notada f (A),como

f (A) = {y ∈ Y | ∃x ∈ A con f (x) = y} ⊂ Y,

esto es, el conjunto de elementos del conjunto imagen queson imagen de un elemento de A. Si A = X se denotaf (X) = im( f ) y se denomina imagen de f.

(b) La anti–imagen (o contraimagen, o imagen recíproca oimagen inversa) de B, notada f −1(B), como

f −1(B) = {x ∈ X | f (x) ∈ B} ⊂ X,

esto es, el conjunto de elementos del conjunto original cuyaimagen está en B.

Nota 4.3.3. En general, si f : X → Y es una aplicación, f (X) 6= Y. Basta tomarla última aplicación del ejemplo anterior. Sí se verifica siempre que f −1(Y ) = X.

Ejemplo 4.3.4. 1) Consideremos la aplicación

f : Z → Z definida por f (n) = 2n,

y A = {−1, 0, 4, 5}. Entonces f (A) = {−2, 0, 8, 10}, y la imagen de f esim( f ) = {enteros pares}.Sean B1 = {2, 3, 8,−4,−1}, B2 = {1, 3}. Se tiene que

f −1(B1) = {1, 4,−2}, f −1(B2) = ∅.

2) Sea la aplicación

f : R → R definida por f (x) = x2,

A = [0, 2]. Entonces f (A) = [0, 4], pues ∀x ∈ [0, 4], existe√

x ∈ [0, 2] talque f (

√x) = x . En este caso, la imagen de f es im( f ) = [0,+∞), los números

reales no negativos.

92

Proposición 4.3.5. Sea f : X −→ Y una aplicación, A1, A2 ⊂ X y B1, B2 ⊂ Y .

Se verifica:

(a) f (A1 ∪ A2) = f (A1) ∪ f (A2), f (A1 ∩ A2) ⊂ f (A1) ∩ f (A2).

(b) f −1(B1∪B2) = f −1(B1)∪ f −1(B2), f −1(B1∩B2) = f −1(B1)∩ f −1(B2).

(c) f ( f −1(B1)) ⊂ B1, A1 ⊂ f −1( f (A1)).

PRUEBA: Vamos a probar, por ejemplo, la segunda afirmación de (a) y laprimera de (b) y (c). Las demás son similares.

(a) Consideremos y ∈ f (A1 ∩ A2). Entonces existe x ∈ A1 ∩ A2 tal quey = f (x). Por tanto, y ∈ f (A1) e y ∈ f (A2), por lo que se tiene el resultado.

Es importante entender que, para afirmar que la otra inclusión no es cierta,basta con dar un contraejemplo; esto es, un caso particular donde no sea cierto elenunciado. Para ello consideremos f : N −→ N definida por

f (x) ={

x/2 + 1 si x es parx + 2 si x es impar

Tomamos A1 = {1, 3, 5}, A2 = {2, 4, 6}. Claramente f (A1 ∩ A2) = f (∅) =∅, pero f (A1) ∩ f (A2) = {3}.

(b) Sea x un elemento de f −1(B1 ∪ B2). Entonces

x ∈ f −1(B1 ∪ B2) ⇔ f (x) ∈ B1 ∪ B2 ⇔ f (x) ∈ B1 ó f (x) ∈ B2 ⇔

⇔ x ∈ f −1(B1) ó x ∈ f −1(B2) ⇔ x ∈ f −1(B1) ∪ f −1(B2).

(c) Probemos ahora que f ( f −1(B1)) ⊂ B1. Si y ∈ f ( f −1(B1)), es porqueexiste x ∈ f −1(B1) tal que y = f (x). Pero, al ser x ∈ f −1(B1), por definicióntenemos que y = f (x) ∈ B1.

Para demostrar que la inclusión contraria no es cierta en general podemostomar la misma aplicación que en el caso anterior y considerar B1 = {1, 3, 5}nuevamente. Entonces f −1(B1) = {1, 3, 4, 8} (por convenio, no incluimos el 0 enN). Pero f ( f −1(B1)) = {3, 5}, por lo que hemos acabado.

Veamos que A1 ⊂ f −1( f (A1)). Pongamos C = f (A1). Sea x ∈ A1, lue-go f (x) ∈ C. Esto quiere decir, por la definición de contraimagen, que x ∈f −1(C) = f −1( f (A1)).

Para demostrar que la inclusión contraria no es cierta en general consideramosla aplicación constante f : X → Y dada por f (x) = y0, para un elemento y0 ∈ Y

fijado. Sea A cualquier subconjunto propio de X. Entonces

f −1( f (A)) = f −1({y0}) = X 6⊂ A.

93

Sea una aplicación f : X −→ Y .

(a) f se dice inyectiva si dos elementos distintos de X siempretienen imágenes distintas. Dicho de otro modo, f es inyec-tiva si, de f (x) = f (x ′), para x, x ′ ∈ X , se deduce quex = x ′.

(b) f se dice sobreyectiva (o sobre) si todo elemento de Y

es imagen de algún elemento de X . O sea, f es sobre sif (X) = im( f ) = Y .

(c) f se dice biyectiva si es inyectiva y sobreyectiva.

Ejemplo 4.3.6. 1) Sea f : R → R la aplicación definida por f (x) = x2. Estaaplicación no es inyectiva, pues f (x) = f (−x). Tampoco es sobreyectiva, puesim( f ) = [0,+∞) 6= R.2) Sea f : Z → Z la aplicación definida por f (n) = 2n. Esta aplicación esinyectiva ya que, si f (n) = f (m), entonces 2n = 2m, y de aquí se tiene quen = m. La aplicación no es sobreyectiva pues im( f ) = {números pares} 6= Z.3) Sea A 6= ∅,U un conjunto fijo. Sea f : P(U) → P(A) la aplicación definidapor f (B) = A ∩ B. Esta aplicación no es inyectiva, pues si f (B) = f (C),

tenemos que A ∩ B = A ∩ C, y de aquí no se deduce que B = C. Basta tomardos conjuntos distintos B,C ⊂ A. Entonces se verifica que A ∩ B = ∅ = A ∩ C

y B 6= C.

Veamos que esta aplicación es sobreyectiva. Sea D ∈ P(A) y pongamos B =D. Entonces

f (B) = A ∩ B = A ∩ D = D.

Notar que también podemos tomar B = A ∪ D, pues

f (B) = A ∩ B = A ∩ (A ∪ D) = (A ∩ A) ∪ (A ∩ D) = ∅ ∪ D = D.

Esto nos da otra forma de ver que la aplicación no es inyectiva.4) La aplicación identidad es biyectiva.5) Sea f : Z → Z la aplicación definida por f (n) = n + 3. Veamos que estaaplicación es biyectiva.

Inyectiva: si f (n) = f (m) ⇒ n + 3 = m + 3 ⇒ n = m.

Sobreyectiva: si m ∈ Z, tomando n = m − 3 se tiene que f (n) = m.

Nota 4.3.7. Así, podemos decir que:

94

(a) f es inyectiva si y sólo si para todo y ∈ Y f −1({y}) consta, a lo más, de unelemento.

(b) f es sobre si y sólo si para todo y ∈ Y f −1({y}) consta, a lo menos, de unelemento.

(c) f es biyectiva si y sólo si para todo y ∈ Y f −1({y}) consta, exactamente,de un elemento.

Aplicación inversa

Sea f : X −→ Y una aplicación biyectiva. La aplicación inversade f , notada f −1 : Y −→ X , está definida por f −1(y) = x

siendo x el único elemento de X que verifica f (x) = y.

Ejemplo 4.3.8. 1) La aplicación inversa de la identidad es la identidad.2) Sea la aplicación

f : Z → Z definida por f (n) = n + 3.

Su inversa es la aplicación

f −1 : Z → Z definida por f −1(m) = m − 3.

3) Si la aplicación no es biyectiva no se puede definir la inversa. Consideremos

f : N → Z dada por f (n) = 2 − n.

Si existiese la inversa f −1 : Z → N, se tendría que, por ejemplo, f −1(5) ∈ N.Pero decir que f −1(5) = n ∈ N es decir que f (n) = 2 − n = 5, luego n = −3 ∈N.

Composición de aplicaciones

Dadas dos aplicaciones f : X −→ Y y g : Y −→ Z se define lacomposición de f y g, notada g ◦ f , de X en Z como

(g ◦ f )(x) = g( f (x)), para todo x ∈ X.

Obviamente g ◦ f es una aplicación.

95

Ejemplo 4.3.9. 1) Sean las aplicaciones f : Z → Q, g : Q → R definidas por

f (n) = n

2, g(x) =

√x2 + 3.

La composición de f y g es

g ◦ f : Z → R dada por (g ◦ f )(n) =√(n

2

)2+ 3,

pues

(g ◦ f )(n) = g( f (n)) = g(n

2

)=√(n

2

)2+ 3.

2) Sea A un conjunto fijo y consideremos las aplicaciones

f, g : P(U) → P(U) definidas por f (B) = A ∩ B, g(B) = A ∪ B.

En este caso podemos calcular la composición de f y g y la composición de g yf .

Calculamos g ◦ f :

(g◦ f )(B) = g( f (B)) = g(A∩B) = A∪(A∩B) = (A∪A)∩(A∪B) = U∩(A∪B) = A∪B,

luego la composición de f y g es la aplicación

g ◦ f : P(U) → P(U), (g ◦ f )(B) = A ∪ B, ∀B ∈ P(U).

Por otro lado, f ◦ g :

( f ◦g)(B) = f (g(B)) = f (A∪B) = A∩(A∪B) = (A∩A)∪(A∩B) = ∅∪(A∩B) = A∩B,

luego la composición de g y f es

f ◦ g : P(U) → P(U), ( f ◦ g)(B) = A ∩ B, ∀B ∈ P(U).

Nótese que f ◦ g 6= g ◦ f.

Nota 4.3.10. Dadas aplicaciones entre conjuntos

X1f−→ X2

g−→ X3h−→ X4,

es elemental comprobar que (h ◦ g) ◦ f = h ◦ (g ◦ f ) (asociatividad de la com-posición de aplicaciones).

96

Proposición 4.3.11. Sea f : X → Y una aplicación. Se verifica que f es biyec-

tiva si y sólo si existe una aplicación g : Y → X verificando

g ◦ f = 1X y f ◦ g = 1Y .

En este caso se tiene que f −1 = g.

PRUEBA: Si f es biyectiva basta tomar g = f −1.

Recíprocamente, supongamos la existencia de g. Veamos que f es biyectiva:Inyectiva: si f (a) = f (b), aplicando g tenemos g( f (a)) = g( f (b)), luego

a = b por ser g ◦ f = 1X .

Sobreyectiva: sea y ∈ Y y consideremos x = g(y) ∈ X.Aplicando f tenemosque f (x) = f (g(y)) = 1Y (y) = y, luego f es sobreyectiva. �

Restricción de una aplicación

Dada una aplicación f : X −→ Y y un subconjunto A ⊂ X , sedefine la restricción de f a A como la aplicación

f|A : A −→ Y

x 7−→ f|A(x) = f (x)

Esto es, f|A actúa exactamente como f , pero sólo sobre los elementos de A.

Esto pone de manifiesto (o debería) lo importante que es, a la hora de definiruna aplicación, determinar los conjuntos de original e imagen y no sólo cómo secalcula la imagen de un elemento.

Ejemplo 4.3.12. Sea A un conjunto fijo y consideremos la aplicación f : P(U) →P(U) definidas por f (B) = A ∩ B. La restricción de f a P(A), f : P(A) →P(U) es

f|P(A)(B) = f (B) = A ∩ B = B, ya que B ⊂ A.

Ejemplo 4.3.13. Terminamos el capítulo viendo un ejemplo que pone de mani-fiesto la importancia de, a la hora de definir una función, definir correctamente losconjuntos original e imagen de la aplicación. Consideremos f : A → B dada porf (x) = x2. Entonces:

Si A = B = R, la función anterior no es ni inyectiva ni sobreyectiva.

Si A = R y B = R+, f es sobreyectiva y no inyectiva.

Si A = [0, 1] y B = R, f es inyectiva y no sobreyectiva.

Si A = B = [0, 1], f es biyectiva.

97

98

Capítulo 5

Grupos

5.1. Grupos: Definiciones y ejemplos.

Operación interna y binaria

Una operación interna y binaria en un conjunto A es una apli-cación α : A × A → A.

Nota 5.1.1. En un lenguaje más coloquial, una operación interna y binaria en A esuna regla que asocia a cada par ordenado (a, b) de elementos de A otro elementode A, α(a, b).

Normalmente, si α : A × A → A es una operación interna y binaria en A, escostumbre elegir algún símbolo (por ejemplo ⋆) para notar

a ⋆ b := α(a, b).

Nota 5.1.2. Para estudiar un conjunto A con “pocos” elementos dotado de unaoperación interna y binaria ⋆, podemos trabajar con la tabla de la operación.Esta tabla es un cuadro de doble entrada en el que se colocan los elementos deA en la línea horizontal de arriba y vertical de la izquierda. En cada casilla librecorrespondiente al par ordenado (a, b) ∈ A × A se coloca el elemento a ⋆ b. Porejemplo, si A = {a, b} y la operación viene determinada por a ⋆ a = a, a ⋆ b = b,b ⋆ a = b y b ⋆ b = a, la tabla será:

⋆ a b

a a b

b b a

99

Ejemplo 5.1.3. Algunas operaciones binarias internas bien conocidas.

1. Si a0 es un elemento fijo de un conjunto A, la aplicación (a, b) ∈ A × A 7→a0 es una operación interna y binaria constante.

2. La suma y el producto usuales son operaciones internas y binarias en losconjuntos de números N, Z, Q, R, C y Z/Zn, así como en los polinomioscon coeficientes en estos conjuntos.

3. La suma es una operación interna y binaria en el conjunto de los vectoresRn o de las matrices m × n de números.

4. Cualquier función de dos variables reales f : R × R → R define una ope-ración interna y binaria en R.

5. Dado un número natural n ≥ 1, consideremos el conjuntoZn = {0, 1, . . . , n−1} y en él la operación interna y binaria cuya tabla es:

⋆ 0 1 2 · · · n − 2 n − 1

0 0 1 2 · · · n − 2 n − 11 1 2 3 · · · n − 1 02 2 3 4 · · · 0 1...

......

.... . .

......

n − 2 n − 2 n − 1 0 · · · n − 4 n − 3n − 1 n − 1 0 1 · · · n − 3 n − 2

6. Dado un conjunto X , consideremos el conjunto AX de las aplicaciones deX en sí mismo. La composición de aplicaciones es una operación interna ybinaria en AX .

7. Dado un conjunto X , la unión y la intersección con operaciones internas ybinarias en P(X).

Nota 5.1.4. En lo que sigue, “operación en A"significa “operación interna y bina-ria en A."

Definición 5.1.5. Dada una operación ⋆ sobre un conjunto A, diremos que:

1. Es conmutativa si a ⋆ b = b ⋆ a para todo a, b ∈ A.

2. Es asociativa si a ⋆ (b ⋆ c) = (a ⋆ b) ⋆ c para todo a, b, c ∈ A.

100

Elemento neutro

Dada una operación ⋆ sobre un conjunto A, diremos que un ele-mento e ∈ A es elemento neutro si e ⋆ a = a ⋆ e = a para todoa ∈ A.

Proposición 5.1.6. Si una operación en A tiene elemento neutro, éste es único.

PRUEBA: Sea un conjunto A con una operación binaria ⋆. Sean e ∈ A unelemento neutro a la izquierda y e′ ∈ A un elemento neutro a la derecha. Por sere elemento neutro a la izquierda se tiene

e ⋆ e′ = e′,

por ser e′ elemento neutro a la derecha se tiene

e ⋆ e′ = e.

De donde e = e′. �

Elemento simétrico

Dado un conjunto A dotado de una operación ⋆ con un elementoneutro e, y dado un elemento x ∈ A, diremos que x ′ es simétrico

de x si x ′ ⋆ x = x ⋆ x ′ = e.

Proposición 5.1.7. En las condiciones de la definición anterior, se tiene lo si-

guiente:

1. Si la operación ⋆ es asociativa, x ′ es simétrico de x e y′ es simétrico de y,

entonces y′ ⋆ x ′ es simétrico de x ⋆ y.

2. Si la operación ⋆ es asociativa, entonces el simétrico de un elemento, si

existe, es único.

PRUEBA: Para probar 2, supongamos que x ′ y x ′′ son simétricos de x , enton-ces, usando la asociatividad,

x ′′ = (x ′ ⋆ x) ⋆ x ′′ = x ′ ⋆ (x ⋆ x ′′) = x ′.

101

Grupo

Un grupo es un par (G, ⋆), donde G es un conjunto y ⋆ es unaoperación interna y binaria sobre G verificando las siguentes pro-piedades:

1. La operación es asociativa.

2. La operación tiene elemento neutro.

3. Cada elemento de G posee un simétrico.

Si además la operación es conmutativa entonces se dice que elgrupo es abeliano o conmutativo.

Ejemplo 5.1.8. Algunos grupos bien conocidos

1. Z, Q, R, C y Z/Zn son grupos abelianos con la adición.

2. Q∗ = Q \ {0}, R∗ = R \ {0} y C∗ = C \ {0} son grupos abelianos con lamultiplicación.

3. Si p es primo (Z/Zp)∗ es grupo abeliano con la multiplicación.

4. El conjunto SA de las biyecciones de A en A es un grupo con la composi-ción. Si A tiene más de 2 elementos, SA no es abeliano. Si A = {1, . . . , n},se nota indistintamente Sn o SA.

5. El conjunto de las funciones (continuas, diferenciables,...) definidas en unabierto de R con valores reales, con la suma “punto a punto”, es un grupoabeliano.

6. El conjunto de las matrices n × n, con elementos en un cuerpo k y de-terminante no nulo, GL(n, k), es un grupo (no abeliano si n ≥ 2) con lamultiplicación de matrices.

Nota 5.1.9. Cuando usemos la notación aditiva o la multiplicativa, el elementoneutro y el simétrico de x serán notados de la siguiente forma:

elemento neutro elemento simétrico de x

+ 0 −x (opuesto de x)· 1 x−1 (inverso de x)

102

Orden de un grupo

Sea (G, ⋆) un grupo. Definimos su orden, que notaremos por |G|,como el cardinal del conjunto G.

5.2. Subgrupos

Subgrupo

Sea (G, ⋆) un grupo. Un subconjunto no vacío H de G se diceque es un subgrupo de (G, ⋆) si (H, ⋆) es un grupo. Es decir, queefectivamente un subgrupo es un grupo dentro de otro grupo conla misma operación.

Proposición 5.2.1. Sean (G, ⋆) un grupo y H ⊂ G un subconjunto no vacío. Las

condiciones siguientes son equivalentes:

1. H es un subgrupo de (G, ⋆).

2. ∀x, y ∈ H, x ⋆ y′ ∈ H.

PRUEBA: Veamos primero 1 ⇒ 2. Supongamos que H es un subgrupo y seanx, y ∈ H . Como H es subgrupo contiene los simétricos de todos sus elementos,en particular y′ ∈ H . De nuevo como H es subgrupo, ⋆ es una operación interna,de donde x · y′ ∈ H , como queríamos.

Probemos ahora 2 ⇒ 1: Como H ⊂ G, los elementos de H verifican lapropiedad asociativa. Como H es no vacío, sea x ∈ H . Aplicando 2) obtenemos

x ⋆ x ′ = e ∈ H.

Si x ∈ H , aplicando de nuevo 2) para e y x , tenemos

e ⋆ x ′ = x ′ ∈ H,

luego H contiene los simétricos de todos sus elementos. Sean x, y ∈ H , aplicando2) esta vez para x, y′ se tiene

x ⋆ (y′)′ = x ⋆ y ∈ H. (5.2.1)

Luego H es subgrupo de (G, ⋆). �

103

Nota 5.2.2. De ahora en adelante si escribimos el “grupo G” en lugar de el “grupo

(G, ⋆)”, sobreentendemos que la operación binaria la notamos con el símbolo ⋆.

Ejemplo 5.2.3. 1. Para todo grupo G, {e} y G son subgrupos de G y se deno-minan subgrupos triviales de G.

2. Subgrupos de (Z,+): Dado n ∈ Z, n ≥ 0, sea Zn = {k · n | k ∈ Z}. Setiene:

a) Zn es un subgrupo de Z.

b) Todo subgrupo de Z es de la forma Zn para algún n ≥ 0.

3. Raíces n–ésimas de la unidad dentro de C∗.

4. Si C ⊂ A, el conjunto { f ∈ SA | f (a) = a, ∀a ∈ C} es un subgrupo deSA.

Proposición 5.2.4. Sean G un grupo, {Hi | i ∈ I } una familia de subgrupos de

G. Entonces ∩i∈I Hi es un subgrupo de G.

PRUEBA: La intersección de subgrupos es no vacía porque el elemento neutroestá en todos los subgrupos. Además,

x, y ∈⋂

i∈I

Hi ⇒ x, y ∈ Hi ∀i ∈ I ⇒ x ⋆ y′ ∈ Hi ∀i ∈ I ⇒ x ⋆ y′ ∈⋂

i∈I

Hi .

Subgrupo generado

Dado un subconjunto A de un grupo G, llamamos subgrupo ge-nerado por A al subgrupo de G:

〈A〉 =⋂

{H | H subgrupo de G y A ⊂ H}.

Proposición 5.2.5. Sean G un grupo y A ⊂ G un subconjunto, entonces 〈A〉 es

el menor subgrupo de G que contiene a A.

PRUEBA: Es inmediato de la definición de 〈A〉: Si H es un subgrupo quecontiene a A, es evidente que 〈A〉 ⊂ H . �

104

Definición 5.2.6. Se dice que A ⊂ G es un sistema de generadores de un grupoG si G = 〈A〉.

Un caso particular, e importante, de sistema de generadores de un grupo escuando A = {a} posee un sólo elemento. Éstos se estudian en una sección poste-rior.

Proposición 5.2.7. Sean G un grupo y A ⊂ G un subconjunto. Sea A′ = {x ′ |x ∈ A}. Entonces

〈A〉 = {x1 ⋆ x2 ⋆ · · · ⋆ xn | xi ∈ A ∪ A′, n ≥ 1}.

PRUEBA: Se tiene que A ∪ A′ ⊂ 〈A〉. De aquí se deduce que

{x1 ⋆ x2 ⋆ · · · ⋆ xn | xi ∈ A ∪ A′, n ≥ 1} ⊂ 〈A〉.

(probar ambas afirmaciones)

Para la otra inclusión usaremos que 〈A〉 es el menor subgrupo que contiene aA. Se comprueba fácilmente que A ⊂ {x1 ⋆ x2 ⋆ · · · ⋆ xn | xi ∈ A ∪ A′, n ≥ 1} yque {x1 ⋆ x2 ⋆ · · · ⋆ xn | xi ∈ A ∪ A′, n ≥ 1} es un subgrupo. De donde

〈A〉 ⊂ {x1 ⋆ x2 ⋆ · · · ⋆ xn | xi ∈ A ∪ A′, n ≥ 1}.

5.3. Orden de un elemento de un grupo

Definición 5.3.1. Sea (G, ⋆) un grupo. Definimos

am =

e si m = 0

(m veces)a ⋆ · · · ⋆ a si m > 0

(−m veces)

a′ ⋆ · · · ⋆ a′ si m < 0

Si G es un grupo cuya operación se nota multiplicativamente, entonces

am =

1 si m = 0

(m veces)a · · · · · a si m > 0

(−m veces)

a−1 · · · · · a−1 si m < 0

105

Si la notación es aditiva, entonces

ma =

0 si m = 0

(m veces)a + · · · + a si m > 0

(−m veces)

(−a)+ · · · + (−a) si m < 0

Nota 5.3.2. Nótese que an ⋆ am = an+m, y por tanto an ⋆ am = am ⋆ an, (an)′ =(a′)n = a−n.

Definición 5.3.3. Sean G un grupo y a ∈ G. Diremos que

1. a tiene orden infinito si todas las potencias de a son distintas entre sí.

2. a tiene orden finito si existen 0 ≤ m < n tales que an = am .

Ejemplo 5.3.4. Obviamente todo elemento de un grupo finito ha de tener ordenfinito. En grupos infinitos podemos tener tanto órdenes finitos como infinitos.

1. Sea a ∈ Z, a 6= 0. Entonces a tiene orden infinito.

2. El elemento

A =(

i 00 i

)∈ GL(2,C)

tiene orden finito. Notemos que el grupo es, en este caso, infinito.

Nota 5.3.5. Sea a ∈ G. El subgrupo generado por {a} es

〈a〉 = 〈{a}〉 = {am | m ∈ Z}.

Proposición 5.3.6. Sean G un grupo y a ∈ G. Consideremos el subgrupo 〈a〉.

1. Si a es de orden infinito, entonces

a) an = e ⇔ n = 0.

b) La aplicación ϕ : Z → 〈a〉 dada por ϕ(n) = an es biyectiva.

c) 〈a〉 es un grupo infinito.

2. Si a es de orden finito, entones

a) Existe n > 0 tal que an = e.

106

b) Sea m el menor entero estrictamente positivo tal que am = 1. Entonces

los ai , 0 ≤ i ≤ m − 1 son distintos entre sí y

〈a〉 = {1, a, a2, . . . , am−1}.

PRUEBA: Casi todas las afirmaciones son directas.

1. Si a es de orden infinito, las propiedades a), b) y c) se prueban fácilmente.

2. Supongamos que a tiene orden finito.

a) Si a tiene orden finito existen dos enteros 0 ≤ k < l tales que ak = al .Sea n = l − k, entonces

an = al−k = al ⋆ a−k = al ⋆ a′k al=ak

= ak ⋆ a′k = e. (5.3.1)

b) Sea m > 0 el menor tal que am = 1. Sean 0 ≤ i ≤ j ≤ m − 1dos enteros tales que ai = a j , es decir, tales que a j−i = e. Comoj − i < m, debe ser j − i = 0, es decir, i = j . Luego todos los ai ,0 ≤ i ≤ m − 1 son distintos.

Es evidente que 〈a〉 ⊃ {1, a, a2, . . . , am−1}. Sea an un elemento cual-quiera de 〈a〉, escribamos n = q · m + r , 0 ≤ r ≤ m − 1, la divisióneuclídea de n entre m, entonces

an = aq·m+r = aq·m ⋆ ar = (am)q ⋆ ar = ar . (5.3.2)

Luego 〈a〉 ⊂ {1, a, a2, . . . , am−1}.

Orden de un elemento

Sean G un grupo y a ∈ G de orden finito. El orden de a, notadopor o(a), es el menor entero estrictamente positivo, m, tal queam = e.

Proposición 5.3.7. Sean G un grupo y a ∈ G. Se tienen las siguientes propieda-

des:

1. o(a) = 1 ⇐⇒ a = e.

2. Si a ∈ G tiene orden finito, entonces o(a) = o(a′).

107

3. Si a ∈ G tiene orden infinito, a′ tiene orden infinito.

4. Si G es finito, todo elemento de G tiene orden finito.

5. Si o(a) = m y an = e, entonces m | n.

PRUEBA: Los primeros cuatro apartados se obtienen inmediatamente de lasdefiniciones. Para el apartado 5) basta realizar la división euclídea de n entre m,obteniendo n = q · m + r , con 0 ≤ r ≤ m − 1, de donde

e = an = aq·m+r = aq·m ⋆ ar = (am)q ⋆ ar = ar .

Como m es el menor estrictamente positivo tal que am = e, debe ser r = 0 y,por tanto, m | n. �

El siguiente resultado nos da el orden de todas las potencias de un elementode orden finito.

Proposición 5.3.8. Sea a ∈ G un elemento de orden finito n. Entonces, ∀m, 0 ≤m < n, se verifica que

o(am) = n

mcd(n,m).

PRUEBA: Sea

d = mcd(m, n), m = m ′d, n = n′d.

En primer lugar tenemos que (am)n′ = amn′ = (an)m

′ = e. Supongamos que(am)t = amt = e. Por definición de orden es n | mt , es decir mt = nk. Dividiendopor d,

m ′t = n′k H⇒ n′ | m ′t .

Como m ′ y n′ son primos entre sí, es n′ | t . �

5.4. Grupos cíclicos

Grupo cíclico

Se dice que un grupo G es cíclico si existe a ∈ G tal que

G = 〈a〉 = 〈{a}〉 = {am | m ∈ Z}.

108

La notación habitual para este tipo de grupos, cuando la operación es el pro-ducto, es Cn (cuando G tiene n elementos) o C∞ (cuando tiene infinitos elemen-tos).

Lema 5.4.1. Si G es un grupo cíclico entonces G es abeliano.

Proposición 5.4.2. Todo subgrupo de un grupo cíclico es cíclico.

PRUEBA: Sea H ⊂ G = 〈a〉 un subgrupo. Sea S = {k > 0 | ak ∈ H}. S 6= ∅y está acotado inferiormente, luego posee un mínimo. Sea s = min {k > 0 | ak ∈H}. Veamos que H = 〈as〉 por doble inclusión.

Como as ∈ H , entonces 〈as〉 ⊂ H. En otro sentido, sea h ∈ H. Como h ∈ G,h = am , para algún entero positivo m. (En caso contrario razonaríamos con h′.)

Por el algoritmo de la división tenemos m = qs + r , con 0 ≤ r < s. Entoncesam = (as)q ⋆ ar , de donde ar ∈ H. Como s es el menor entero no nulo con esapropiedad ha de ser r = 0, y am = (as)q ∈ 〈as〉. �

Proposición 5.4.3. Sea G = 〈a〉 un grupo cíclico finito de orden m, H = 〈as〉 un

subgrupo de G, d = mcd(s,m). Entonces H = 〈ad〉.

PRUEBA: Probaremos el resultado por doble inclusión.Por Bezout sabemos que d = αs + βm, entonces ad = aαs+βm = (as)α ⋆

(am)β = (as)α ∈ H, luego 〈ad〉 ⊂ H.

Recíprocamente, como d|s, ponemos s = dd ′, y entonces as = add ′ =(ad)d

′ ∈ 〈ad〉, luego H ⊂ 〈ad〉. �

Nota 5.4.4. Sea G = 〈a〉 un grupo cíclico finito de orden m. Los subgrupos de G

son cíclicos generados por an con n|m.Gracias a este resultado podemos estudiar con detalle todos los subgrupos de

un grupo cíclico.

Proposición 5.4.5. Sea G = 〈a〉 un grupo cíclico finito de orden m. Para todo

divisor n de m existe un único subgrupo de G de orden n.

PRUEBA: Sea n un divisor de m y pongamos d = m/n y consideremos elsubgrupo H = 〈ad〉. Sabemos que

|H | = o(ad) = m

mcd(d,m)= m

d= n,

luego para cada divisor n de m existe un subgrupo de orden n.

109

Sea K = 〈ar 〉, 0 ≤ r ≤ m, r |m otro subgrupo de G de orden n. Se tiene que

n = o(ar ) = m

mcd(r,m)= m

r,

luego d = r, es decir, K = H. �

5.5. Teorema de Lagrange

Definición 5.5.1. Sean G un grupo y H ⊂ G un subgrupo. Sobre G definimos lasrelaciones ∼H y H ∼ de la manera siguiente: Dados x, y ∈ G,

x ∼H y ⇔ x ′ ⋆ y ∈ H x H ∼ y ⇔ y ⋆ x ′ ∈ H.

Proposición 5.5.2. En las condiciones de la definición anterior, las relaciones

∼H y H ∼ son relaciones de equivalencia.

PRUEBA: Se comprueba que ambas relaciones verifican las propiedades:

1. Reflexiva: ∀x ∈ G, x ∼ x .

2. Simétrica: ∀x, y ∈ G, x ∼ y ⇒ y ∼ x .

3. Transitiva: ∀x, y, z ∈ G, x ∼ y, y ∼ z ⇒ x ∼ z.

Proposición 5.5.3. Sean G un grupo y a ∈ G. Consideremos los conjuntos

a ⋆ H = {a ⋆ h | h ∈ H}, H ⋆ a = {h ⋆ a | h ∈ H}.

Se tiene:

1. a ⋆ H es la clase de equivalencia de a para la relación ∼H .

2. H ⋆ a es la clase de equivalencia de a para la relación H ∼.

PRUEBA: Basta probar el primer apartado, pues el segundo es análogo. Seaa ∈ G y llamemos a a su clase de equivalencia por ∼H , es decir,

a = {b ∈ G | a ∼H b} = {b ∈ G | a′ ⋆ b ∈ H}.

Probaremos por doble inclusión que a = a · H . Si b ∈ a, entonces a′ ⋆ b ∈ H ,es decir, existe h ∈ H tal que a′ ⋆ b = h, de donde

b = a ⋆ h ∈ a ⋆ H.

110

Si b ∈ a ⋆ H , existe h ∈ H tal que b = a ⋆ h, de donde

a′ ⋆ b = h ∈ H ⇒ a ∼H b.

Proposición 5.5.4. Si G es un grupo abeliano, entonces ∼H y H ∼ coinciden.

Sean G un grupo y H un subgrupo, notaremos

G : H = G

∼H

, H : G = G

H ∼.

Nota 5.5.5. Las clases de equivalencia de una relación de equivalencia son unapartición del conjunto total, es decir, dadas dos clases de equivalencia, o son dis-juntas, o coinciden. En consecuencia, si tomamos x, y ∈ G, tenemos que, o bienx ⋆ H = y ⋆ H , o bien x ⋆ H ∩ y ⋆ H = ∅. Análogamente se tiene que, dadosx, y ∈ G, o bien H ⋆ x = H ⋆ y, o bien H ⋆ x ∩ H ⋆ y = ∅.

Ejemplo 5.5.6. Algunas relaciones de equivalencia de este tipo.

1. Sea n ∈ Z, n > 0. Se tiene

Z : Zn = Zn : Z = {0 + Zn, . . . , (n − 1)+ Zn},

donde las clases anteriores son distintas entre sí.

2. Consideremos el subgrupo H ⊂GL(2,C) dado por

H ={(

λ 00 λ

): λ = 1,−1, i,−i

}.

Para todo A ∈GL(2,C), A · H = H · A. Por tanto ∼H=H∼, aún sin serGL(2,C) un grupo abeliano.

3. Sea H ⊂GL(2,C) el subgrupo

H ={(

1 00 1

),

(0 i

i 0

),

(−1 00 −1

),

(0 −i

−i 0

)}.

Sea la matriz

A =(

3 25 4

),

se tiene que:

A · H ={(

3 25 4

),

(2i 3i

4i 5i

),

(−3 −2−5 −4

),

(−2i −3i

−4i −5i

)}

111

H · A ={(

3 25 4

),

(5i 4i

3i 2i

),

(−3 −2−5 −4

),

(−5i −4i

−2i −2i

)}.

Como A · H 6= H · A, es ∼H 6=H∼.

Teorema de Lagrange

Sea G un grupo finito, H ⊂ G un subgrupo. Entonces |H | dividea |G|.

PRUEBA: Consideremos la relación ∼H sobre G. Como G es finito, habrá sóloun número finito de clases de equivalencia distintas. Sean éstas a1⋆H, . . . , ar ⋆H .Como G es unión disjuntas de estas clases, será

|G| = #(a1 ⋆ H)+ · · · + #(ar ⋆ H).

Sea H = {h1, . . . , hn}, entonces ai ⋆ H = {ai ⋆ h1, . . . , ai ⋆ hn}, 1 ≤ i ≤ r .Veamos que #(ai ⋆ H) = |H |, 1 ≤ i ≤ r. En efecto, si ai ⋆ h j = ai ⋆ hl sededuce que, multiplicando a izquierda por el simétrico de ai , h j = hl . Por tantolos elementos de la clase ai · H son todos distintos. Luego |G| = r · |H |. �

Corolario 5.5.7. Sean G un grupo de orden finito y H ⊂ G un subgrupo. El

número de clases de equivalencia para ∼H coincide con el número de clases de

equivalencia para H ∼ y es igual a |G|/|H |.

PRUEBA: La demostración del teorema de Lagrange podía haberse hecho conla relación H ∼. �

Definición 5.5.8. Sean G un grupo y H ⊂ G un subgrupo. Se llama índice de H

en G al número de clases de equivalencia para la relación ∼H (o H ∼), es decir, alnúmero

i(G : H) = |G||H | .

Corolario 5.5.9. Sean G un grupo finito y H, K ⊂ G subgrupos. Se tienen las

siguientes propiedades:

1. Para cada a ∈ G se tiene que o(a) divide a |G|.

2. Si el orden de G es primo, entonces G es cíclico y no tiene más subgrupos

que los triviales.

112

3. Si |H | y |K | son primos entre sí, entonces H ∩ K = {e}.

PRUEBA: Todos son consecuencias casi inmediatas del Teorema de Lagrange.

1. Sea a ∈ G y consideremos el subgrupo 〈a〉 ⊂ G. Sabemos que o(a) =|〈a〉|. Por otro lado, el teorema de Lagrange dice que |〈a〉| divide a |G|.

2. Sea a ∈ G, a 6= e. El subgrupo 〈a〉 ⊂ G no es trivial y su orden divide alnúmero primo |G|, luego debe ser o(a) = |G|. De donde G = 〈a〉. Si noexiste a ∈ G, a 6= e, entonces G = {e} es cíclico.

3. H ∩ K es un subgrupo de H y de K , luego |H ∩ K | debe dividir a |H | y a|K |, que son primos entre sí. De donde |H ∩ K | = 1 y H ∩ K = {e}.

5.6. Subgrupos normales. Grupo cociente y grupoproducto

Si G es un grupo y H es un subgrupo, hemos visto en la sección anterior quelos conjuntos cocientes G : H y H : G son generalmente distintos y no siempreheredan la estructura de grupo de G. Nos interesa estudiar los subgrupos para loscuales esto no ocurre.

Comenzamos con un lema técnico que usaremos a lo largo de esta sección.

Lema 5.6.1. Sean H1 ⊆ H2 subconjuntos de un grupo G. Entonces ∀g, g ∈ G,

se verifica que g ⋆ H1 ⋆ g ⊆ g ⋆ H2 ⋆ g.

Proposición 5.6.2. Sea H un subgrupo de un grupo G. Las condiciones siguientes

son equivalentes:

1. Las relaciones ∼H y H ∼ coinciden, es decir, x ⋆ H = H ⋆ x para todo

x ∈ G.

2. Para todo x ∈ G, se tiene x ⋆ H ⋆ x ′ ⊂ H.

3. Para todo x ∈ G, se tiene x ⋆ H ⋆ x ′ = H.

PRUEBA: Seguiremos el esquema 1 ⇒ 2 ⇒ 3 ⇒ 1.

1 ⇒ 2 Supongamos que x ⋆H = H ⋆ x para todo x ∈ G. Sea x ⋆h ⋆ x ′ ∈ x ⋆H ⋆ x ′.Como x ⋆ h ∈ x ⋆ H = H ⋆ x , se tiene que ∃h ∈ H tal que x ⋆ h = h ⋆ x .

Entonces x ⋆ h ⋆ x ′ = h ⋆ x ⋆ x ′ = h ∈ H.

113

2 ⇒ 3 Supongamos que, para todo x ∈ G, x ⋆ H ⋆ x ′ ⊂ H . Por el lema tenemosque x ′ ⋆ x ⋆ H ⋆ x ′ ⋆ x ⊂ x ′ ⋆ H ⋆ x, ∀x ∈ G, y por tanto x ⋆ H ⋆ x ′ = H .

3 ⇒ 1 Supongamos por último que para todo x ∈ G se tiene x ⋆ H ⋆ x ′ = H . Porel lema tenemos que x ⋆ H = x ⋆ H ⋆ x ′ ⋆ x = H ⋆ x .

Subgrupo normal

Un subgrupo H de G se dice normal en G si satisface alguna delas condiciones anteriores, y lo notaremos H ⊳ G.

Grupo cociente

Sea H es un subgrupo normal de G, el conjunto cociente G : H =H : G, que notaremos G/H , es un grupo con la operación indu-cida por la de G.

PRUEBA: El producto de clases se define de la siguiente manera:

(x ⋆ H) ⋆ (y ⋆ H) = (x ⋆ y) ⋆ H, ∀x, y ∈ G.

Veamos que esta operación está bien definida, es decir, no depende del repre-sentante elegido. En efecto, sean x ⋆ H = x ⋆ H, y ⋆ H = y ⋆ H , tenemos queprobar que (x ⋆ y) ⋆ H = (x ⋆ y) ⋆ H , o, equivalentemente, que y′ ⋆ x ′ ⋆ x ⋆ y ∈ H.

Como x ′ ⋆ x ∈ H , es

x ′ ⋆ x ⋆ y ∈ H ⋆ y = y ⋆ H = y ⋆ H.

Luego, multiplicando por y′ a la izquierda se tiene que

y′ ⋆ x ′ ⋆ x ⋆ y ∈ H.

El neutro es e ⋆ H = H , y el simétrico de x ⋆ H es x ′ ⋆ H. Además G/H seráabeliano si G lo es.

Ejemplo 5.6.3. Algunos grupos normales y no normales.

114

1. {1} ⊳ G.

2. Todos los subgrupos de un grupo abeliano.

3. El conjunto de todas las matrices diagonales regulares es un subgrupo no

normal del grupo lineal GL(n,Q).

4. El conjunto de las matrices escalares λI , con λ ∈ Q, es un subgrupo normaldel grupo lineal GL(n,Q).

A diferencia de la operación cociente, la operación de producto de grupos esmucho más natural y sencilla.

Producto de grupos

Sean (G1, ⋆1), . . . , (Gn, ⋆n) grupos. En el conjunto G1×· · ·×Gn

definimos la siguiente operación binaria:

(a1, . . . , an) ⋆ (b1, . . . , bn) = (a1 ⋆1 b1, . . . , an ⋆n bn).

(G1 × · · · × Gn, ⋆) es un grupo.

PRUEBA: Se verifican las propiedades de manera casi directa:

1. La operación ⋆ es asociativa por serlo cada una de las operaciones ⋆i , i =1, . . . , n.

2. Si ei es el elemento neutro del grupo (Gi , ⋆i ), con i = 1, . . . , n, entonces(e1, . . . , en) es el elemento neutro de (G1 × · · · × Gn, ⋆).

3. El simétrico de un elemento (a1, . . . , an) ∈ G1 × · · · × Gn es (a′1, . . . , a′

n),donde cada a′

i es el simétrico de ai en el grupo (Gi , ⋆i ), con i = 1, . . . , n.

Proposición 5.6.4. En las condiciones anteriores, (G1 ×· · ·× Gn, ⋆) es abeliano

si y sólo si cada (Gi , ⋆i ), con i = 1, . . . , n, lo es.

PRUEBA: Es inmediato. �

Proposición 5.6.5. Dados dos grupos cíclicos Cn y Cm , se tiene que Cn × Cm es

cíclico si y sólo si mcd(n,m)=1

115

PRUEBA: Supongamos, en primer lugar, Cn = 〈a〉 y Cm = 〈b〉 siendo n y m

primos entre sí y notaremos 1 el elemento neutro en ambos grupos. Consideramosentonces (a, b) ∈ Cn × Cm . Entonces tenemos que

(a, b)r = (1, 1) H⇒ ar = 1, br = 1 H⇒ n|r, m|r

y, por ser entones mcd(n,m) = 1, ha de ser nm|r . Como (a, b)nm = 1 concluimosque Cn × Cm = 〈(a, b)〉.

En el otro sentido, supondremos que mcd(n,m) = d > 1. Entonces es sencillocomprobar que, para cualesquiera r, s ∈ N,

(ar , bs

)nm/d =(

an(rm/d), bm(sn/d))

= (1, 1),

luego ningún elemento tiene orden nm y el grupo producto no es cíclico. �

5.7. Homomorfismos de grupos

Cuando definimos aplicaciones entre grupos, nos interesan especialmente aqué-llas que conservan las operaciones. Éstas son los homomorfismos de grupos.

Sean (G, ⋆) y (S, •) dos grupos, de elementos neutros eG y eS , donde notare-mos por g′ el inverso de g si g ∈ G, y por s si s ∈ S.

Homomorfismo de grupos

Un homomorfismo de grupos de G en S es una aplicaciónf : G → S tal que

f (x ⋆ y) = f (x) • f (y)

para cualesquiera x, y ∈ G.

Algunos tipos especiales de homomorfismos son:

1. Cuando G = S, f se dice un endomorfismo.

2. Llamamos monomorfismos a los homomorfismos inyectivos y epimorfis-mos a los homomorfismos sobreyectivos de grupos.

3. Cuando f : G −→ S es biyectivo, se dice un isomorfismo.

116

4. Cuando f es un endomorfismo biyectivo de G, se dice un automorfismo deG.

Proposición 5.7.1. Si f : G −→ S es un homomorfismo, se tiene que f (eG) = eS

y que f (x ′) = f (x), ∀x ∈ G.

PRUEBA: Para ver la primera propiedad, tomamos g ∈ G cualquiera. Enton-ces

f (g) = f (eG ⋆ g) = f (eG) • f (g) H⇒ f (eG) = eS.

La otra propiedad se deduce inmediatamente de ésta. �

Ejemplo 5.7.2. Algunos homomorfismo de grupos sencillos.

1. La aplicación constante f : G −→ S, f (x) = eS ∀x ∈ G, es un homomor-fismo.

2. Sea G un grupo y x ∈ G. La aplicación ix : G → G, ix(y) = x ⋆ y ⋆ x ′ esun homomorfismo. Además ix es biyectiva y (ix)

−1 = ix ′ .

3. Si H ⊂ G es un subgrupo, la inclusión de H en G es un homomorfismoinyectivo.

4. Si H ⊳ G, la proyección canónica π : G → G/H , π(x) = x ⋆ H , es unhomomorfismo sobreyectivo de grupos.

El conjunto de los automorfismos de un grupo G, Aut(G), es un grupo conla composición de aplicaciones. La aplicación i : G 7−→ Aut(G) definida pori(x) = ix , para cada x ∈ G, es también un homomorfismo de grupos.

Núcleo de un homomorfismo

Sea f : G −→ S un homomorfismo de grupos. Definimos el nú-cleo de f , que notaremos por ker( f ), al subconjunto de G dadopor

ker( f ) = {g ∈ G | f (g) = eS}.

Proposición 5.7.3. Sea f : G −→ S un homomorfismo de grupos:

1. Si H ⊂ G es un subgrupo, f (H) es un subgrupo de S. En particular, la

imagen Im( f ) = { f (g) | g ∈ G} es un subgrupo de S.

117

2. Si T ⊂ S es un subgrupo (normal), f −1(T ) es un subgrupo (normal) de G.

En particular, el núcleo de f ,

ker( f ) = f −1 ({eS}) ,

es un subgrupo normal de G.

3. f es un monomorfismo si y sólo si ker( f ) = {eG}.PRUEBA: Fijamos f : G −→ S y las notaciones anteriores.

1. f (H) = {s ∈ S | ∃x ∈ G tal que f (x) = s}. Como eS = f (eG) ∈ f (H),f (H) es no vacío. Sean s, t ∈ f (H), sean x, y ∈ H tales que f (x) = s yf (y) = t . Entonces

s • t = f (x) • f (y) = f (x) • f (y′) = f (x ⋆ y′) ∈ f (H)

pues, por ser H subgrupo, x ⋆ y′ ∈ H .

2. La prueba de que

f −1(T ) = {x ∈ G | f (x) ∈ T }

es un subgrupo de G es análoga a la del apartado anterior. Veamos que siT ⊳ S entonces f −1(T ) ⊳ G. Basta demostrar que

x ⋆ f −1(T ) ⋆ x ′ ⊂ f −1(T ) ∀x ∈ G.

Sea x ⋆ y ⋆ x ′ ∈ x ⋆ f −1(T ) ⋆ x ′, con f (y) ∈ T . Entonces

f (x ⋆ y ⋆ x ′) = f (x) • f (y) • f (x) ∈ f (x) ⋆ T ⋆ f (x) ⊂ T

por ser T ⊳ S. De donde x ⋆ y ⋆ x ′ ∈ f −1(T ) y f −1(T ) ⊳ G.

3. Supongamos en primer lugar que f es inyectiva, es decir, si f (x) = f (y)

entonces x = y. Sea x ∈ ker( f ), entonces

f (x) = eS = f (eG) ,

de donde x = eG y ker( f ) = {eG}.

Supongamos ahora que ker( f ) = {eG} y sean x, y ∈ G tales que f (x) =f (y), entonces:

f (x) = f (y) H⇒ eS = f (x) • f (y) = f (x ⋆ y′) H⇒

H⇒ x ⋆ y′ ∈ ker( f ) = {eG} H⇒ x ⋆ y′ = eG H⇒ x = y.

Luego f es inyectiva.

118

5.8. Teoremas de isomorfía

Nota 5.8.1. Por conveniencia, notaremos a partir de ahora la composición de ho-momorfismos por simple yuxtaposición. Es un ejercicio sencillo comprobar que,si

Gf−→ S

g−→ X

son homomorfismos de grupos, g f : G 7−→ X también lo es.

Lema 5.8.2. Sean f : G −→ S un homomorfismo de grupos y H ⊳ G tal que

H ⊂ ker( f ). Existe un único homomorfismo f ′ : G/H −→ S tal que f = f ′π ,

donde π es la proyección canónica que lleva x en x ⋆ H.

PRUEBA: Sea la aplicación

f ′ : G/H −→ S

x ⋆ H 7−→ f ′(x ⋆ H) = f (x)

Veamos que está bien definida, es decir, si tomamos y ∈ G tal que y ⋆ H =x ⋆ H , entonces f ′(y ⋆ H) = f ′(x ⋆ H). Por definición, f ′(y ⋆ H) = f (y) yf ′(x ⋆H) = f (x), luego nos preguntamos si, en estas condiciones, f (y) = f (x).Sabemos, por ser H ⊳ G, que

y ⋆ H = x ⋆ H ⇔ x ′ ⋆ y ∈ H ⊂ ker( f ).

De donde eS = f (x ′ ⋆ y) = f (x) • f (y) y, por tanto, f (y) = f (x).Comprobemos ahora que f ′ es homomorfismo:

f ′((x⋆H)⋆(y⋆H)) = f ′((x⋆y)⋆H) = f (x⋆y) = f (x)• f (y) = f ′(x⋆H)• f ′(y⋆H).

Falta ver que es único. Sea g : G/H 7−→ S tal que f = gπ . Entonces, paratodo x ∈ G,

f ′(x ⋆ H) = f (x) = gπ(x) = g(π(x)) = g(x ⋆ H).

Luego f ′ = g. �

Primer teorema de isomorfía

Sea f : G −→ S un homomorfismo de grupos. Se induce de mo-do natural un isomorfismo

f : G/ker( f ) −→ Im( f )

que factoriza f = i f π , siendo π el epimorfismo de G sobreG/ker( f ) e i la inclusión de Im( f ) en S.

119

PRUEBA: Basta definir f como se definió f ′ en el lema anterior.

f : G/ker( f ) −→ Im( f )

x ⋆ ker( f ) 7−→ f (x ⋆ ker( f )) = f (x)

De igual manera que en el lema anterior, se comprueba que f está bien defi-nida y que es un homomorfismo.

Sea x ∈ G tal que f (x ⋆ ker( f )) = eS , es decir, sea x ⋆ ker( f ) ∈ ker( f ).Entonces

eS = f (x ⋆ ker( f )) = f (x) H⇒ x ∈ ker( f ) H⇒ x ⋆ ker( f ) = eG ⋆ ker( f ).

Luego ker( f ) = eG ⋆ ker( f ) y f es inyectiva.

Por otro lado, si s ∈ Im( f ), existe x ∈ G tal que f (x) = s, luego f (x ⋆

ker( f )) = s y f es sobreyectiva. �

Segundo teorema de isomorfía

Sea f : G −→ S un homomorfismo sobreyectivo de grupos. SeaJ ⊳ S y pongamos H = f −1(J ). Entonces f induce un isomor-fismo de G/H en S/J .

PRUEBA: Sea π la proyección de S en S/J , que es un homorfismo sobre-yectivo. Luego la composición π f es un homomorfismo sobreyectivo de G enS/J .

Sea x ∈ G tal que π f (x) = eS • J , es decir, x ∈ ker(π f ). Entonces

eS • J = π f (x) = π( f (x)) = f (x) • J ⇐⇒ f (x) ∈ J ⇐⇒ x ∈ H.

Luego ker(π f ) = H y, aplicando el primer teorema de isomorfía, se tiene unisomorfismo de G/H en S/J . �

Corolario 5.8.3. Si H1 y H2 son subgrupos normales de G tales que H1 ⊂ H2,

se tiene:

1. H2/H1 es un subgrupo normal de G/H1.

2. (G/H1)/(H2/H1) es isomorfo a G/H2.

120

PRUEBA: Veamos ambos enunciados por separado.

1. Primero hemos de ver que H1 ⊳ H2. Sea x ∈ H2 ⊂ G, como H1 ⊳ G, setiene x ⋆ H1 = H1 ⋆ x . de donde H1 ⊳ H2.

Luego podemos considerar el cociente H2/H1, que es un subgrupo de G/H1.Consideremos entonces

(x ⋆ H1) ⋆ (y ⋆ H1) ⋆(x ′ ⋆ H1

)∈ (x ⋆ H1) ⋆ (H2/H1) ⋆

(x ′ ⋆ H1

),

con x ∈ G e y ∈ H2 arbitarios. Por ser H1 ⊳ G, se tiene

(x ⋆ H1) ⋆ (y ⋆ H1) ⋆(x ′ ⋆ H1

)=(x ⋆ y ⋆ x ′) ⋆ H1.

Como H2 ⊳ G, se tiene x ⋆ H2 ⋆ x ′ ⊂ H2. Luego

(x ⋆ y ⋆ x ′) ⋆ H1 ∈ H2/H1,

de donde H2/H1 ⊳ G/H1.

2. Basta considerar el epimorfismo proyección π : G −→ G/H1 para concluirque (G/H1)/(H2/H1) y G/H2 son isomorfos.

Tercer teorema de isomorfía

Sean G un grupo y N y H subgrupos de G. Supongamos queN ⊳ G. Entonces:

1. (N ∩ H) ⊳ H y N ⊳ (N H).

2. La inclusión de H en N H induce un isomorfismo deH/(N ∩ H) en (N H)/N .

PRUEBA: Se deja como ejercicio probar (N ∩ H) ⊳ H y N ⊳ (N H). La com-posición de la inclusión de H en N H con la proyección de N H sobre (N H)/N

es un epimorfismo cuyo núcleo coincide con N ∩ H , de donde el resultado es unaconsecuencia directa del primer teorema de isomorfía. �

121

5.9. El grupo de las permutaciones

Permutaciones

Consideremos el conjunto A = {1, 2, ..., n} y sea

Sn = { f : A −→ A | f biyectiva }.

El conjunto Sn se denomina conjunto de permutaciones de n ele-mentos.

Ejemplo 5.9.1. Sea A = {1, 2, 3, 4, 5}. La aplicación f : A → A definida por

f (1) = 4, f (2) = 3, f (3) = 2, f (4) = 1, f (5) = 5

es una permutación de cinco elementos.

1

2

3

A A

4

5

1

2

3

4

5

f

Figura 5.1: Permutación

Proposición 5.9.2. Sn tiene n! elementos.

PRUEBA: Vamos a contar el número de elementos de Sn . El 1 puede transfor-marse en cualquier elemento a1 de {1, . . . , n}. Esto nos da n elecciones para a1.Una vez hecha esta elección, para evitar duplicación, el transformado del 2, a2, lodebemos elegir entre los n − 1 números distintos de a1. Esto nos da n − 1 elec-ciones para a2. Una vez elegidos los transformados del 1 y del 2, tenemos n − 2elecciones para a3, n − 3 elecciones para a4, . . . , 2 elecciones para an−1 y unapara an. Así, |Sn | = n!.

De la caracterización estudiada para las aplicaciones biyectivas se sigue quela composición de dos aplicaciones biyectivas es de nuevo biyectiva. Por tanto en

122

Sn podemos definir una operación interna, que no es más que la composición deaplicaciones.

Proposición 5.9.3. (Sn, ◦) es un grupo.

PRUEBA: Sabemos que la composición de aplicaciones es asociativa.Elemento neutro: la aplicación

1A : A −→ A

i 7−→ i

verifica que, para todo σ ∈ Sn ,

σ ◦ 1A = 1A ◦ σ = σ.

Elemento simétrico: dada σ ∈ Sn , se tiene que σ−1 ∈ Sn también, y verifica

σ ◦ σ−1 = σ−1 ◦ σ = 1A.

Nota 5.9.4. A partir de ahora a la permutación identidad 1A la notaremos por 1.

De hecho, es un grupo no abeliano. Casi cualquier ejemplo no trivial de S3

sirve para ver que, en general, si σ, τ ∈ Sn , se tiene que σ ◦ τ 6= τ ◦ σ .

Nota 5.9.5. Adoptaremos las siguientes notaciones indistintamente

σ ◦ τ = σ · τ = στ

σ ◦ ... ◦ σ (r veces) = σ r

Es posible entender cada aplicación de Sn como una reordenación del conjunto{1, ..., n}. De aquí es usual denotar los elementos de Sn como una tabla con dosfilas: en la primera aparecen los números del 1 al n (para saber cuál es el conjuntooriginal) y en la segunda aparece, bajo cada original, su imagen. Por ejemplo:

σ =[

1 2 3 4 54 3 2 1 5

]

es la aplicación de {1, 2, 3, 4, 5} en sí mismo que envía 1 en 4, 2 en 3, 3 en 2, 4 en1 y 5 en sí mismo.

En general, si σ ∈ Sn donde σ(1) = a1, . . . , σ (n) = an, se escribirá

σ =[

1 2 . . . n − 1 n

a1 a2 . . . an−1 an

]

123

entendiéndose que σ hace corresponder a cada uno de los números que están enla primera fila el que está debajo.

Para la multiplicación de permutaciones se usará el mismo convenio (de de-recha a izquierda) que para la composición de aplicaciones. Por ejemplo, en S3

si

σ =[

1 2 32 1 3

], y τ =

[1 2 32 3 1

],

entonces

τ ◦ σ =[

1 2 32 3 1

]·[

1 2 32 1 3

]=[

1 2 33 2 1

].

sA

1

2

3

A A

1

2

3

t

1

2

3

t±s

Figura 5.2: Producto de permutaciones

Ejemplo 5.9.6. Los elementos de S3 son los siguientes:

1 =[

1 2 31 2 3

], σ2 =

[1 2 31 3 2

], σ3 =

[1 2 32 1 3

]

σ4 =[

1 2 32 3 1

], σ5 =

[1 2 33 1 2

], σ6 =

[1 2 33 2 1

]

y su tabla de multiplicar es:

· 1 σ2 σ3 σ4 σ5 σ6

1 1 σ2 σ3 σ4 σ5 σ6

σ2 σ2 1 σ4 σ3 σ6 σ5

σ3 σ3 σ5 1 σ6 σ2 σ4

σ4 σ4 σ6 σ2 σ5 1 σ3

σ5 σ5 σ3 σ6 1 σ4 σ2

σ6 σ6 σ4 σ5 σ3 σ2 1

124

Vamos ahora a dar una cierta estructura al conjunto de las permutaciones. Enprimer lugar nos fijaremos en un tipo muy concreto (e interesante).

Ciclo

Un ciclo de longitud r en Sn es una permutación σ tal que existen{a1, ..., ar } ⊂ {1, ..., n}, todos ellos distintos, verificando:

σ(a j ) = a j+1 para j = 1, ..., r − 1, y σ(ar ) = a1.

σ(i) = i para todo i /∈ {a1, ..., ar }.

Esto es, los r elementos no fijos de σ pueden recorrerse todosyendo de original a imagen, empezando por uno cualquiera.

Los ciclos de longitud 2 se denominan trasposiciones.

Nota 5.9.7. Un ciclo como el anterior se denotará, abreviadamente

σ = (a1 ... ar ) ,

indicando con ello σ(a j ) = a j+1 para j = 1, ..., r − 1, y σ(ar ) = a1.

Ejemplo 5.9.8. El ejemplo visto anteriormente

σ =[

1 2 3 4 54 3 2 1 5

]

no es un ciclo. Hay cuatro elementos no fijos en σ y no pueden recorrerse yendode original a imagen.

La permutación inversa de un ciclo es un ciclo de la misma longitud. De hecho

(a1 a2 ... ar )−1 = (ar ... a2 a1),

y, en particular, (i j )−1 = (i j ).

Nota 5.9.9. Dos ciclos σ = (a1 ... ar ) y τ = (b1 ... bs) tales que

{a1, ..., ar } ∩ {b1, ..., bs} = ∅

verifican que σ ◦ τ = τ ◦ σ . Estos ciclos se dicen disjuntos.

Proposición 5.9.10. Toda permutación distinta de la identidad se puede descom-

poner en producto de ciclos disjuntos, de manera única (salvo reordenación de

los ciclos).

125

PRUEBA: Haremos la prueba por inducción en r , que será el número de ele-mentos no fijos de σ . Si r = 0 no hay nada que probar, y σ = 1. Claramente r nopuede ser 1, por la biyectividad de σ . Y, si r = 2, entonces llamamos {i, j } a loselementos no fijos de σ y tenemos que tener, forzosamente

σ(i) = j, σ ( j ) = i H⇒ σ = (i j ).

Sea σ ∈ Sn dada por

σ =[

1 2 ... n

a1 a2 ... an

]

y supongamos que tiene r elementos no fijos.Comenzamos por el primer número i tal que ai 6= i y vamos creando la si-

guiente lista:

i 7−→ σ(i) = ai 7−→ σ 2(i) 7−→ σ 3(i) 7−→ ...

Dado que σ ∈ Sn , existirán s, t ∈ N (pongamos s < t) tal que

σ s(i) = σ t (i)

y, componiendo con (σ−1)s obtenemos

i = σ t−s(i).

Sea r el menor entero positivo tal que i = σ r (i). Entonces el ciclo de longitudr

(i σ(i) ... σ r−1(i))

actúa, por construcción, de la misma forma que σ sobre el conjunto {i, σ (i), ..., σ r−1(i)}.Sólo resta aplicar el mismo razonamiento (hipótesis de inducción) a la permu-

tación τ , definida por

τ( j ) ={σ( j ) si j /∈ {i, σ (i), ..., σ r−1(i)}j si j ∈ {i, σ (i), ..., σ r−1(i)}

Ejemplo 5.9.11. En el ejemplo anterior

σ =[

1 2 3 4 54 3 2 1 5

]= (1 4) (2 3).

126

Nota 5.9.12. Si admitimos ciclos de longitud 1 (con la definición obvia) podemosobtener una descripción más precisa de la permutación. En efecto,

(1 4) (2 3)

puede ser la permutación del ejemplo anterior. Pero también puede ser[

1 2 3 4 5 64 3 2 1 5 6

]∈ S6.

Si queremos evitar estas confusiones, escribiremos el ejemplo del principiocomo

(1 4) (2 3) (5).

Llamaremos orden de una permutación σ , notado o(σ ), al menor entero r talque σ r = 1, es decir, al orden como elemento del grupo Sn.

Podemos hallar fácilmente el orden de una permutación a partir de su descom-posición en ciclos disjuntos.

Proposición 5.9.13. Un ciclo de longitud l en Sn tiene orden l.

PRUEBA: Si j es un elemento no fijo por C , es evidente por la definición deciclo que

C l( j ) = j, Cs( j ) 6= j para s < l.

Como los elementos fijos por C lo son también por C l , se tiene que C l = 1, yCs 6= 1 para cualquier s < l. �

Proposición 5.9.14. Sea σ ∈ Sn , con descomposición en ciclos disjuntos dada

por

σ = C1 · C2 · ... · Cr ,

donde la longitud de Ci es, pongamos li . Entonces

o(σ ) = mcm(l1, ..., lr ).

PRUEBA: Dado que al componer ciclos disjuntos es irrelevante el orden tene-mos que, para todo s ∈ N

σ s = Cs1 · Cs

2 · ... · Csr .

Como los Ci actúan de forma no trivial sobre elementos distintos de {1, ..., n},para que σ s = 1 tiene que ser Cs

i = 1 para i = 1, ..., s. Así pues el orden de σserá el menor múltiplo común de los órdenes de los Ci . �

Podemos dar otro tipo de descomposición para las permutaciones de Sn .

127

Proposición 5.9.15. Toda permutación se puede descomponer en producto de

trasposiciones.

PRUEBA: Esta demostración es mucho más simple, dado que basta probarlopara un ciclo, y esto es muy sencillo. Sólo hay que comprobar

(a1 a2 ... ar ) = (a1 ar ) ... (a1 a3) (a1 a2).

Nota 5.9.16. La descomposición anterior, sin embargo, no es única. Por ejemplo,

(1 2 3) = (1 3) (1 2) = (3 2) (1 3).

Sin embargo, no es casual el hecho de que ambas descomposiciones constende dos trasposiciones.

Proposición 5.9.17. Sea σ ∈ Sn una permutación. Entonces todas las posibles

descomposiciones de σ como producto de trasposiciones consta de, bien un nú-

mero par, bien un número impar de factores.

PRUEBA: La demostración es interesante porque sigue un camino indirecto:en lugar de trabajar con las permutaciones como objetos en sí, usaremos cómo laspermutaciones actúan sobre otro objeto, en este caso un polinomio en n variables.

Consideremos el polinomio

F(x1, ..., xn) =∏

i< j

(xi − x j

)= (x1−x2) · ... ·(x1−xn) ·(x2−x3) · ... ·(xn−1−xn).

Entonces hacemos actuar σ sobre F de la siguiente manera

σ(F) = F(xσ(1), ..., xσ(n)

),

es decir, renombramos las variables en F siguiendo a σ . Del mismo modo tenemos

σ(F) =∏

i< j

(xσ(i) − xσ( j)

).

Ahora bien, notemos que una trasposición (r s) (pongamos con r < s) verificaque

(r s)(F) = −F.

Veamos esto en la descomposición de F en factores (xi − x j ):

Si {r, s} ∩ {i, j } = ∅, entonces (xi − x j ) no se ve afectado por (r s).

128

Si i < r < s = j , entonces (xi − x j ) va en (xi − xr ) y (xi − xr ) va en(xi − xs) = (xi − x j ).

Si r < i < s = j , entonces (xi − x j ) va en (xi − xr ) y (xr − xi ) va en(xs − xi ) = (x j − xi ), con lo cual el producto de ambos factores permaneceinalterado por la acción de (r s).

Si r < s = i < j , entonces (x j − xi ) va en (xr − xi ) y (xr − xi ) va en(xs − xi ) = (x j − xi ).

Por último (r s)(xr − xs) = −(xr − xs).

Por tanto, cada trasposición cambia de signo F al actuar sobre él. Así σ , alser producto de trasposiciones, puede dejar F invariante o cambiarlo de signo,dependiendo de si σ se escribe como producto de una cantidad par o impar detrasposiciones, respectivamente. Pero la acción de σ sobre F es independiente decómo se escriba σ como producto de trasposiciones, luego la cantidad de factoresha de ser siempre par o siempre impar.

Nota 5.9.18. Una cierta forma de medir cuánto altera una permutación σ ∈ Sn elorden natural en {1, 2, ..., n} es ver el número de inversiones que σ efectúa: paracada i ∈ {1, 2, ..., n} se cuenta una inversión por cada j > i tal que σ(i) > σ( j ).En nuestro ejemplo anterior

σ =[

1 2 3 4 54 3 2 1 5

]= (1 4) (2 3).

tenemos que contar:

Tres inversiones porque σ(1) > σ(2), σ (3), σ (4).

Dos inversiones porque σ(2) > σ(3), σ (4).

Una inversión porque σ(3) > σ(4).

Luego el número de inversiones de σ es 6. Este concepto será útil para la defi-nición de determinante, pero además está íntimamente ligado a la descomposiciónen producto de trasposiciones.

El número de inversiones también puede contarse al revés: esto es, contar unainversión por cada j > i tal que σ(i) < σ( j ).

Proposición 5.9.19. Sea σ ∈ Sn una permutación con k inversiones. Entonces

existe una descomposición de σ en producto de k trasposiciones.

129

PRUEBA: Supongamos que tenemos

σ =[

1 2 ... n

a1 a2 ... an

],

y supongamos que a1 = r 6= 1. Esto quiere decir que 1 aporta r − 1 inver-siones, dado que los elementos 1, ..., r − 1, menores que r verificarán que susanti–imágenes, pongamos x1 < ... < xr−1 son mayores que la de r , que es 1.

Entonces podemos darnos cuenta de que

(r σ(xr−1)) ... (r σ(x1))σ

es una permutación, cuya diferencia con r consiste en que hemos movido r hastasituarlo como imagen de r , para lo cual hemos usado r − 1 trasposiciones, exac-tamente el número de inversiones que aporta 1 (o el que aporta r si las contamosal revés). Repitiendo el proceso con la imagen de 2 (y sucesivamente) llegamos auna expresión de la forma

τ1 · ...τk · σ = 1,

donde recordemos que k es el número de inversiones de σ . De aquí se deducefácilmente que

σ = τ−1 · ... · τ−1k = τ1 · ... · τk,

como queríamos.�

130

Capítulo 6

Anillos y cuerpos

6.1. Anillos (I): Unidades y divisores de cero

Anillo

Un anillo es una terna (A,+, ·) formada por un conjunto A y dosoperaciones internas y binarias +, · verificando:

1. El par (A,+) es un grupo abeliano, cuyo elemento neutrollamaremos normalmente “cero (0)".

2. La operación binaria · es asociativa y tiene elemento neutro,que llamaremos normalmente “uno (1)".

3. La operación · es distributiva a la derecha y a la izquierdarespecto de la operación +, i.e. para todos x, y, z ∈ A, setiene (x + y) · z = x · z + y · z, x · (y + z) = x · y + x · z.

Si además la operación · es conmutativa, diremos que el anillo esconmutativo.

Nota 6.1.1. Algunas notas a la definición.

1. En general se usará la expresión “sea A un anillo", sobreentendiendo lasoperaciones. La operación · se notará normalmente por simple yuxtaposi-ción.

131

2. En un anillo A se tiene 0 · x = x · 0 = 0 para todo x ∈ A.

3. Si en un anillo A se tiene 1 = 0, entonces A = {0}.

4. Para todo x, y ∈ A, ese tiene x(−y) = (−x)y = −(xy).

5. Si A1, . . . , An son anillos, el producto cartesiano A1 × · · · × An posee unaestructura natural de anillo, donde las operaciones están definidas compo-nente a componente.

Ejemplo 6.1.2. Anillos bien conocidos.

1. Z, Q, R, C son anillos conmutativos. La estructura de anillo de Z vienedeterminada por la de grupo aditivo: el producto de dos enteros xy coincidecon el múltiplo de y con coeficiente x . Así pues, la estructura de anillo de Zno añade nada nuevo a la de grupo. Esto es falso para Q, R y C en los que,obviamente, la estructura multiplicativa no viene determinada por la aditiva.

2. Las congruencias módulo m, Z/Zm son un anillo conmutativo con la sumay el producto que hemos definido en el tema 2.

3. El conjunto M(n) de las matrices n × n sobre Z, Z/Zp, Q, R o C es unanillo, con respecto a la adición y la multiplicación ordinaria de matrices.No es conmutativo.

4. Si A es un anillo conmutativo, el conjunto A[x1, . . . , xn] de los polinomiosen n indeterminadas con coeficientes en A es también un anillo conmutati-vo.

Unidad

Sea A un anillo. Una unidad es un elemento que posee un simé-trico multiplicativo (a la izquierda y a la derecha), que llamare-mos inverso. El conjunto de las unidades de A es un grupo parael producto y se notará A∗.

Cuerpo

Un cuerpo es un anillo conmutativo tal que todo elemento distin-to de cero es una unidad, i.e. A∗ = A − {0}.

132

Ejemplo 6.1.3. Algunos casos sencillos de unidades.

1. Las unidades de Z son 1,−1.

2. Las unidades de Z/Zn son los elementos a + Zn tales que mcd(a, n) = 1.

3. Los anillos Q, R, C son cuerpos. El anillo Z/Zn lo es si y sólo si n es primo.

4. El grupo de las unidades del anillo M(n, k) con k = Q, R ó C es GL(n, k).

Nota 6.1.4. A partir de ahora sólo trabajaremos con anillos conmutativos. Asípues, la palabra ‘anillo’ significará siempre anillo conmutativo.

Dominio de integridad

Sea A un anillo. Un elemento x ∈ A se llamará un divisor decero si y sólo si es distinto de cero y existe y ∈ A, y 6= 0, tal quexy = 0. Un anillo sin divisores de cero se llama un dominio deintegridad.

Un elemento x ∈ A se llamará nilpotente si es distinto de cero y existe unentero n > 0 tal que xn = 0.

Nota 6.1.5. En un dominio de integridad se da la propiedad cancelativa por elproducto de elementos no nulos:

a 6= 0, ab = ac ⇒ b = c.

lo cual hace que estos anillos sean particularmente cómodos a la hora de hacercálculos.

Ejemplo 6.1.6. Divisores de cero y elementos nilpotentes.

1. Las unidades no son divisores de cero, ya que si x es ambas cosas existiríany, z ∈ A, con z 6= 0 tales que yx = 1 y xz = 0, de donde

z = 1 · z = yxz = y · 0 = 0.

Así, todo cuerpo es un dominio de integridad.

2. Z es un dominio de integridad.

3. El anillo Z/Z4 no es un dominio de integridad. El elemento 2 es nilpotenteen Z/Z4.

4. Todos los elementos no nulos de Z/Zn son unidades o divisores de cero,pero esto no es cierto en todos los anillos (no lo es, por ejemplo, en Z o enk[x]).

133

6.2. Anillos (II): Ideales

El concepto equivalente a subgrupo para anillos no es, como podría esperarse,el de subanillo. En efecto, si R ⊂ A son dos anillos (con las mismas operaciones)no se puede definir, en general, una estructura coherente de anillo en el grupocociente A/R.

A mediados del siglo XIX, Dedekind buscaba una generalización de la facto-rización única en primos que se tiene en Z para unos anillos denominados anillosde enteros algebraicos. Estos anillos, que contienen a Q y están contenidos en C,no verifican en general que exista una factorización única en elementos irreduci-bles. Por ello, Dedekind pensó sustituir la factorización tradicional, en producto deelementos del anillo, por un concepto que denomin´elementos ideales. Convienedestacar que la idea original ya la tuvo Kummer algunos años antes, buscando lademostración del Teorema de Fermat.

Sin embargo, para mantener las propiedades de la divisibilidad tradicional,Dedekind pensó que sus elementos ideales debían verificar las propiedades análo-gas a la divisibilidad. Esto es:

1. Si a|b y a|c, entonces a|(b + c).

2. Si a|b, entonces a|bc, para todo c.

El resultado de esta magnífica idea fue el concepto que hoy denominamosideal de un anillo.

Ideal

Sea A un anillo. Un ideal de A es un subconjunto I de A queverifica:

1. I es un subgrupo del grupo aditivo de A.

2. Para todo a ∈ I , x ∈ A se tiene xa ∈ I .

En realidad no hace falta comprobar que I es un subgrupo aditivo. Para ver siI es ideal es suficiente probar (comparar con las propiedades que buscaba Dede-kind):

1. Si a, b ∈ I , entonces a + b ∈ I .

2. Si a ∈ I y c ∈ A, entonces ac ∈ I .

Nota 6.2.1. Sea I ⊂ A un ideal de A. Se tiene:

134

1. Si I contiene una unidad, entonces I = A.

2. A es un cuerpo si y sólo si sus únicos ideales son {0} y A.

3. Los ideales de Z y los subgrupos son la misma cosa, pues la estructuramultiplicativa viene determinada por la aditiva. El apartado anterior pruebaentonces de nuevo que Z/Zn es un anillo.

Asombrosamente, el concepto de Dedekind es precisamente el que permitedotar de estructura de anillo a los cocientes.

Anillo cociente

El grupo cociente A/I admite una estructura canónica de anillo.

PRUEBA: En efecto, basta ver que la fórmula

(a + I )(b + I ) = ab + I

define una operación en A/I .Si a + I = a′ + I y b + I = b′ + I es a − a′ ∈ I , y b − b′ ∈ I . Así

ab − a′b′ = ab − ab′ + ab′ − a′b′ = a(b − b′)+ (a − a′)b′ ∈ I,

lo que prueba nuestro aserto. �

Homomorfismo de anillos

Sean A, B anillos, f : A → B una aplicación. Se dirá que f esun homomorfismo de anillos si verifica:

1. Para cualesquiera x, y ∈ A, es f (x + y) = f (x)+ f (y).

2. Para cualesquiera x, y ∈ A, es f (xy) = f (x) f (y).

3. f (1) = 1.

Un homomorfismo biyectivo se llama un isomorfismo y los anillos entre loscuales se puede establecer un isomorfismo se llaman anillos isomorfos.

135

Proposición 6.2.2. Sea f : A −→ B un homomorfismo de anillos. Se tienen las

siguientes propiedades:

1. El conjunto

ker( f ) = {a ∈ A | f (a) = 0}es un ideal de A, y f es inyectivo si y sólo si ker( f ) = {0}.

2. Si u ∈ A es una unidad, entonces f (u) es una unidad en B. En particular

cualquier homomorfismo (de anillos) entre cuerpos es inyectivo.

3. El conjunto

im( f ) = {b ∈ B | ∃a ∈ A, f (a) = b}es un subanillo de B (esto es, un anillo dentro de B, con las mismas opera-

ciones).

Primer teorema de isomorfía

Sea f : A −→ B un morfismo de anillos. Entonces A/ ker( f ) esisomorfo a im( f ).

Segundo teorema de isomorfía

Sea A un anillo, I ⊂ A un ideal, y B ⊂ A un subanillo. EntoncesB + I = {b + a : b ∈ B, a ∈ I } es un subanillo de A, I es unideal de B + I , B ∩ I es un ideal de B, y existe un isomorfismode anillos

(B + I )/I ∼= B/(B ∩ I ).

Tercer teorema de isomorfía

Sea A un anillo y sean I, J ideales de A con I ⊂ J . EntoncesJ/I es un ideal de A/I y A/J es isomorfo a (A/I )/(J/I ).

Las tres demostraciones son análogas a las hechas en el tema anterior parahomomorfismos de grupos.

Hay que tener cuidado, porque no todas las propiedades de los homomorfis-mos de grupos se amplían directamente a los homomorfismo de anillos.

136

Proposición 6.2.3. Sea f :−→ B un homomorfismo de anillos.

1. Si I ⊂ A es un ideal, f (I ) no es, en general, un ideal de B.

2. Si I ⊂ A es un ideal y f es sobreyectiva, f (I ) es un ideal de B.

3. Si J ⊂ B es un ideal, f −1(J ) es un ideal de A.

PRUEBA: Un contraejemplo sencillo para el primer apartado lo da la inclusióni : Z −→ Q, dado que i(Z) no es un ideal en Q (al ser cuerpo, sólo {0} y Q loson).

En cuando al caso en que f sea sobreyectiva, tomemos b1, b2 ∈ f (I ). Enton-ces tenemos a1, a2 ∈ I tales que f (ai ) = bi para i = 1, 2 y, en ese caso

b1 + b2 = f (a1)+ f (a2) = f (a1 + a2) ∈ f (I ).

Notemos que no hemos usado la sobreyectividad de f aún. Ahora, si tomamosun y ∈ B cualquiera, tenemos que debe existir x ∈ A con f (x) = y y entonces

yb1 = f (x) f (a1) = f (xa1) ∈ f (I ).

Para demostrar la tercera propiedad, tomemos a1, a2 ∈ f −1(I ). Entoncesf (ai ) ∈ I , para i = 1, 2, y

f (a1 + a2) = f (a1)+ f (a2) ∈ I,

luego a1 + a2 ∈ f −1(I ). Por otra parte, si x ∈ A tenemos que

f (xa1) = f (x) f (a1) ∈ I,

de donde xa1 ∈ f −1(I ) y hemos terminado.�

6.3. Cuerpo de fracciones. Característica

Terminamos el desarrollo teórico con dos conceptos importantes: el cuerpo defracciones, que permite construir un cuerpo a partir de un dominio de integridad,y la característica, que es un elemento crucial a la hora de clasificar cuerpos.

Sea A un dominio de integridad y llamemos A∗ = A \ {0}. Consideremos larelación binaria ∼ definida en A × A∗ por

(a, b) ∼ (a′, b′) ⇔ ab′ = a′b.

137

Es fácil verificar que ∼ es una relación de equivalencia. Llamamos Q(A) alconjunto cociente (A × A′)/ ∼, y los elementos de Q(A) los notaremos como a

b,

representando así la clase de equivalencia de (a, b).Se tienen las siguientes operaciones definidas en Q(A):

Suma:a

b+ c

d= ad + bc

bd.

Producto:a

b· c

d= ac

bd.

Proposición 6.3.1. Las operaciones están bien definidas, esto es, si ab′ = a′b y

cd ′ = c′d, entonces

ad + bc

bd= a′d ′ + b′c′

b′d ′ ,ac

bd= a′c′

b′d ′ .

Proposición 6.3.2. Q(A) es un cuerpo, denominado cuerpo de cocientes o frac-

ciones de A.

Proposición 6.3.3. prop Sea A un dominio de integridad y Q(A) su cuerpo de

fracciones. Se verifica:

1. La aplicación ϕ : A → Q(A) definida por ϕ(a) = a1 es un homomorfismo

inyectivo de anillos.

2. (Propiedad universal de Q(A)) Si K es un cuerpo cualquiera, todo homo-

morfismo inyectivo de anillos ψ : A → K factoriza por ϕ, es decir, existe

un único homomorfismo de anillos 8 : Q(A) → K que hace conmutativo

el siguiente diagrama:

A K

Q(A)

ψ

ϕ 8

3. Si L es un cuerpo que verifica la propiedad anterior de Q(A), entonces L

es isomorfo a Q(A).

Se tiene, por tanto, que Q(A) es el menor cuerpo que contiene a un dominio

de integridad isomorfo a A, salvo isomorfismo. Dicho de otro modo, todo cuerpo

que contiene a un dominio isomorfo a A, contiene también a un cuerpo isomorfo

a Q(A).

138

PRUEBA: El primer apartado es trivial. Para el segundo, definimos8mediantela expresión

8(a

b

)= ψ(a)ψ(b)−1.

Hay que verificar que 8 está bien definida:

a

b= a′

b′ H⇒ ab′ = a′b H⇒ ψ(a)ψ(b′) = ψ(a′)ψ(b) H⇒ ψ(a)ψ(b)−1 = ψ(a′)ψ(b′)−1

lo cual prueba que lo está. También tenemos que ver que es un homomorfismo deanillos:

8

(a

b+ a′

b′

)= 8

(ab′ + a′b

bb′

)= ψ(ab′ + a′b)ψ(bb′)−1 =

= ψ(a)ψ(b)−1 + ψ(a′)ψ(b′)−1 = 8(a

b

)+8

(a′

b′

),

y análogamente conserva el producto y el elemento unidad. Se comprueba fácil-mente que 8 hace conmutativo el diagrama, y de hecho es la única definiciónposible para que esto se cumpla, puesto que:

8(a

b

)= 8

(a

1· 1

b

)= 8

(a

1

)·8

(1

b

)= 8ϕ(a)8ϕ(b)−1 = ψ(a)ψ(b)−1.

Veamos por último la unicidad del cuerpo de fracciones. Sea L un cuerpoverificando la propiedad universal, con ϕ′ : A → L . Tomando K = Q(A), existeφ′ : L → Q(A) tal que ϕ = φ′ϕ′.

Aplicando 2) a K = L y ϕ′, se tiene que ϕ′ = 8ϕ. De ambas, se tieneϕ = 8′8ϕ. Pero aplicando 2) a K = Q(A) y ϕ, se tiene que 8′8 y la identidadhacen conmutativo el correspondiente diagrama; por la unicidad se tiene que

8′8 = id .

Análogamente se tiene que 88′ = id, luego 8 es el isomorfismo buscado.�

Nota 6.3.4. Sea K un cuerpo. Todo homomorfismo de anillos ϕ de Z en K , llevael elemento unidad de Z en el elemento unidad de K . Esto define unívocamente aϕ. Por tanto existe un único homomorfismo de anillos ϕ de Z en K .

Si el homomorfismo ϕ de Z en K es inyectivo, se tiene que K contiene a sucuerpo de fracciones Q. En ese caso diremos que K es un cuerpo de característicacero.

139

Los cuerpos Q, R y C son de característica cero, puesto que contienen a Z.Además todo subcuerpo K de C es de característica cero. En otro caso el homo-morfismo ϕ : Z → K no inyectivo se extiende a C, contradicción. Por tanto, todosubcuerpo de C contiene a Q.

Si ϕ por el contrario no es inyectivo, ker(ϕ) es un ideal Zp, con p > 0. Porel primer teorema de isomorfía Z/Zp es isomorfo a un subanillo de K , luego notiene divisores de cero. AsíZ/Zp es un dominio de integridad, o equivalentementeun cuerpo, y además, p es un número primo. Diremos entonces que K es uncuerpo de característica p. En ese caso se verifica que px = 0, para cada x ∈ K .

El ejemplo más simple de cuerpo de característica p es, obviamente, el propioZ/Zp. De hecho, dar otro ejemplo no trivial es complejo y corresponde a losobjetivos de la asignatura Estructuras Algebraicas.

6.4. Epílogo: El problema de la factorización

Finalizamos el contenido teórico de este curso presentando un problema yamencionado, que esperamos que sirva como motivación para el alumno, al quele presentaremos un problema completamente natural pero que necesitará de másdesarrollo teórico para abordar. Es el problema de la factorización en elementosirreducibles.

Definición 6.4.1. Sea A un anillo. Diremos que x ∈ A es un elemento irreduciblecuando no es una unidad y, si x = ab, se tiene forzosamente que a o b sonnecesariamente unidades.

Los elementos irreducibles en Z son, obviamente, los números primos, mien-tras que los elementos irreducibles de k[x] son, precisamente, los polinomios irre-ducibles (de ahí su nombre).

Ejemplo 6.4.2. Consideremos el elemento√

−5 ∈ C. Vamos a formar un anillocon su ayuda, concretamente

R = Z[√

−5] ={

a + b√

−5 | a, b ∈ Z}.

Es muy sencillo comprobar que, con la suma y el producto naturales (hereda-dos de C, por ejemplo), R es un anillo. Así mismo, podemos quedarnos con elconcepto de norma, proveniente del módulo de un número complejo:

N (a + b√

−5) = (a + b√

−5)(a − b√

−5) = a2 + 5b2.

o, escrito en notación compleja, N (x) = x x .No es complicado de ver que la norma verifica las siguientes propiedades:

140

1. N : R −→ N.

2. N es una aplicación multiplicativa, esto es N (xy) = N (x)N (y).

La norma puede ayudarnos a entender cómo son los elementos de un anillo deeste tipo.

Proposición 6.4.3. Se verifican las siguientes propiedades:

1. x ∈ R es una unidad si y sólo si N (X) = ±1.

2. x e y son asociados si y sólo x |y y N (x) = N (y).

3. Si N (x) es primo, entonces.x es irreducible.

PRUEBA: Si x ∈ R es unidad, entonces existe y ∈ R tal que xy = 1, de donde

N (xy) = N (x)N (y) = N (1) = 1,

y por tanto, N (x) = ±1. Al revés, si N (x) = ±1 construimos explícitamente uninverso de x = a + b

√−5,

x−1 = x

N (x)∈ R.

La segunda afirmación se sigue directamente de la primera (y de la definiciónde elementos asociados).

Ahora, si N (x) es primo y x = ab, entonces N (x) = N (a)N (b), por lo quebien N (a), bien N (b), por ser enteros, han de ser ±1 y por tanto, bien a, bien b

son unidad.�

Fijémonos entonces en cómo podríamos factorizar elementos en R. Obvia-mente, la demostración de que existe una factorización en producto de irreduciblessigue siendo válida. En efecto, partimos de x y, si es irreducible, hemos terminadoy si no es producto de dos elementos de norma estrictamente menor, lo que nospermite aplicar la inducción.

Sin embargo, lo que no está tan claro es que la factorización en irreduciblessea única. Por ejemplo, podemos escribir

6 = 2 · 3 =(

1 +√

−5)

·(

1 −√

−5).

Claramente no son la misma factorización porque

N (2) = 4, N (3) = 9, N(

1 ±√

−5)

= 6,

141

de forma que los factores que hemos encontrado no son asociados. Aún así, bienpodría haber alguna factorización más detallada, o sea, algún irreducible p quedividiese, por ejemplo, a 2 y a 1 +

√−5. Pero p no puede ser entero, porque 2

es primo, y no puede tener parte compleja, porque entonces N (p) ≥ 5 luego nopuede dividir a 2.

Por tanto, independientemente de si 2, 3 y 1 ±√

−5 son o no irreducibles, lasdescomposiciones anteriores nos llevarán a dos factorizaciones distintas.

Dominio de factorización única

Un anillo A, sin divisores de cero, en el cual todo elemento sepuede descomponer de manera única (salvo unidadaes) como pro-ducto de irreducibles se denomina un dominio de factorizaciónúnica (abreviadamente DFU).

En general el problema de determinar si un anillo posee o no factorizaciónúnica no es sencillo, aunque sabemos algunos ejemplos muy especiales.

Proposición 6.4.4. Sea A un anillo en el que todo ideal puede ser generado por un

sólo elemento (estos anillos se llaman dominios de ideales principales o DIP).

Entonces A es un DFU.

PRUEBA: La demostración no es complicada, pero sí un poco larga. Los pasosson los siguientes:

1. Primero demostramos que, si A es un DIP, entonces toda cadena de idealescreciente

I1 ⊂ I2 ⊂ ... ⊂ In ⊂ ...

es estacionaria, esto es, existe un r ∈ N tal que Ir = Is para todo s > n.

2. Utilizando esto, demostramos que todo elemento se descompone en factoresirreducibles de manera finita.

3. Dados dos elementos x, y ∈ A, como existe d tal que 〈x, y〉 = 〈d〉, proba-mos que un tal d es un máximo común divisor de x e y. Y probamos el Teo-rema de Euclides: si p es un irreducible tal que p|xy pero mcd(p, x) = 1,entonces p|y.

4. Finalmente, probamos que el Teorema de Euclides es equivalente a la uni-cidad de la factorización.

142

Dominio euclídeo

Sea A un dominio tal que existe una función µ : A −→ N ∪ {0}verificando:

1. Para cualesquiera x ∈ A, y ∈ A \ {0}, existe unos únicosq, r ∈ A tales que

a = qb + r, con µ(r) < µ(b).

2. µ(a) = 0 ⇐⇒ a = 0.

A este procedimiento se le llama división euclídea de A y, enestas condiciones, A se denomina un dominio euclídeo (abrevia-damente DE).

Z y k[x] son DE, como hemos visto durante el curso, tomando respectiva-mente, µ = | · | y µ =grado+1. Pero muy pocos anillos lo son, en realidad. Porejemplo k[x, y] no lo es, como veremos ahora.

Proposición 6.4.5. Un DE es un DIP (y, por tanto, un DFU).

PRUEBA: La demostración consiste en, dado un ideal I , tomar d ∈ I tal que

µ(d) = mKınx∈I

{µ(x) | x ∈ I } ,

y probar (no es complicado) que I = 〈d〉.�

El anillo k[x, y] no es un DE porque no es un DIP, como se puede ver consi-derando 〈x, y〉.

En la construcción de DFU, curiosamente, los DE juegan un papel destacado,gracias al resultado siguiente, con el que terminamos esta sección.

Teorema 6.4.6. Sea A un DFU. Entonces A[x] también es un DFU.

PRUEBA: Comenzamos por definir, como hicimos en el tema 4, el contenidode un polinomio como el mcd de sus coeficientes. A partir de aquí definimos elconcepto de polinomio primitivo (exactamente igual) y probamos que

c( f g) = c( f )c(g),

143

así como el Lema de Gauss (el producto de polinomios primitivos es primitivo).Con esto, dado un polinomio primitivo f (x) ∈ A[x] lo factorizamos en Q(A)[x]en producto de irreducibles, cosa que podemos hacer porque Q(A)[x] es un DE ypor tanto un DFU:

f (x) = p1(x)...pr (x),

y extraemos un mcm de los denominadores que aparecen en los factores, paraescribir

f (x) = 1

mq1(x)...qr (x),

con m ∈ A y q1(x), ..., qr (x) irreducibles en A[x]. Ahora bien, por ser f (x)

primitivo se tiene que ha de ser m = 1, luego pi (x) = qi (x) para cada i = 1, ..., r .Con esto aseguramos la factorización, mientras que la unicidad viene dada

porque dos factorizaciones distintas en A[x] inducen dos factorizaciones distintasen Q(A)[x], lo cual es imposible por ser Q(A)[x] un DFU. �

144