dinÁmica simbÓlica - universidad nacional de salta · uno de duración semestral con una carga...

106

Upload: dokhanh

Post on 03-Oct-2018

226 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

Universidad Nacional de Salta

Facultad de Ciencias Exactas

Departamento de Matemática

DINÁMICA SIMBÓLICA

APUNTES DE CÁTEDRA

ENERO DE 2017

JORGE YAZLLE CAMILO JADUR

Page 2: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

A la memoria de nuestro querido Amigo y Profesor,el Dr. Thomas Nathaniel Hibbard

(14/03/1929 11/02/2016)

Page 3: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

i

PREFACIO

El presente texto tiene por objeto llevar a los estudiantes de habla hispana tópicos deDinámica Simbólica, área relativamente reciente de la Matemática sobre la que resulta difícilencontrar bibliografía en ese idioma; notará el lector, sin embargo, que muchos términos delinglés original se han mantenido (por ejemplo, espacios shift) para no caer en construccionesforzadas y para conservar la terminología que muchas veces suele emplearse cuando se realizanexposiciones orales sobre el tema en lengua española. Versiones preliminares de estos apuntessurgieron a raíz de un seminario realizado en el Departamento de Matemática de la UniversidadNacional de Salta, bajo la dirección del Dr. T. N. Hibbard, y consistieron originalmente entraducciones de las primeras partes del excelente libro Symbolic Dynamics and Coding, deDouglas Lind y Brian Marcus. Posteriormente, fueron engrosándose con más traducciones deesa fascinante obra, a lo que se fueron sumando pequeños aportes producto de las discusionesen aquel seminario y en el dictado de asignaturas sobre estos tópicos. No es la intención infringirleyes de derechos de autor o de editor, ni tampoco enriquecer lo que ya de por sí es de unariqueza ilimitada y ampliamente reconocida a nivel internacional como lo es el libro de Lindy Marcus. Los cambios menores que se plantean, como por ejemplo algunos aspectos de lapresentación del tema de los desdoblamientos de estados o la ubicación en el programa dela topología básica en espacios shift, son resultado de la experiencia durante el dictado de dosasignaturas optativas para el último año de las carreras de grado de Licenciatura en Matemáticay Profesorado en Matemática de la Universidad Nacional de Salta. En esos dos cursos, cadauno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, sellega a cubrir un porcentaje considerable sólo de los seis primeros capítulos de aquel libro, concierto nivel de detalle, y es la parte que este apunte pretende reejar. Se espera que los tópicoscubiertos estimulen a los estudiantes por aprender mucho más sobre el tema, en igual gradoque el que los autores han sido estimulados a partir del libro.

Page 4: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

Índice general

Capítulo 1. ESPACIOS SHIFT 11. Deniciones básicas 12. Full shifts 23. Los Espacios Shift 34. Lenguajes 55. Shifts de bloques 86. Códigos de ventana deslizante 11EJERCICIOS 19

Capítulo 2. SHIFTS DE TIPO FINITO 231. Restricciones de tipo nito 232. Grafos y sus shifts 263. Representación de shifts de tipo nito por medio de grafos 314. Desdoblamiento de estados 345. El almacenamiento de datos y los STF 41EJERCICIOS 43

Capítulo 3. SHIFTS SÓFICOS 461. Presentaciones de shifts sócos 462. Caracterizaciones de shifts sócos 503. Presentaciones resolventes a derecha 54EJERCICIOS 60

Capítulo 4. ASPECTOS TOPOLÓGICOS Y DINÁMICOS DE LOS ESPACIOS SHIFT 621. Una métrica para AZ 622. Sucesiones 643. Cilindros. Conexidad 664. Continuidad 675. Sistemas dinámicos 69EJERCICIOS 72

Capítulo 5. ENTROPÍA 731. Denición y propiedades básicas 732. Cálculo de la entropía de shifts sócos irreducibles 753. Cálculo de la entropía de shifts sócos 784. Los puntos periódicos y la entropía 81EJERCICIOS 84

Capítulo 6. CÓDIGOS DE ESTADOS FINITOS 861. Coloreo de rutas y presentaciones cerrantes a derecha 862. Códigos de estados nitos 913. Autovectores aproximados 924. Construcción de códigos de estados nitos 96EJERCICIOS 101

ii

Page 5: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

Capítulo 1

ESPACIOS SHIFT

En este capítulo introductorio, deniremos el objeto principal de estudio de la DinámicaSimbólica: los espacios shift. A tal n, presentaremos primero algunas nociones básicas de lateoría de lenguajes formales (que resultarán familiares para quienes han tenido algún contactoprevio con ciencias de la computación). Veremos luego algunas propiedades elementales de losobjetos denidos, como también maneras alternativas de presentarlos. Concluiremos introdu-ciendo las funciones que más naturalmente surgen entre los espacios shift: los códigos de ventanadeslizante.

1. Deniciones básicas

Un alfabeto es un conjunto nito, cuyos elementos se denominan símbolos, o tambiénletras. Un bloque, o palabra, sobre un alfabeto A es una sucesión nita (posiblementevacía) de letras de A. Formalmente, una palabra u sobre A es una función u del conjuntox ∈ N : 1 ≤ x ≤ n en A (para algún entero n ≥ 0). En el caso n = 0, se tiene la funciónvacía, o sucesión vacía, que llamaremos palabra vacía y denotaremos por ε. La longitud (olargo, o tamaño) de la palabra es n, es decir, la cantidad de términos de la sucesión, y sedenota por |u|. La palabra vacía tiene largo 0. Para una palabra no vacía u, el k-ésimo términode la sucesión se denota, como es costumbre, mediante uk. Entonces, una palabra no vacía delargo n sobre A es u1u2 · · ·un, con ui ∈ A para todo i ∈ 1, . . . , n. Un bloque de longitud nse llama un n-bloque. Dos palabras u y v son iguales si tienen el mismo largo n y, para todoj entre 1 y n, es uj = vj.

El conjunto de todas las palabras de largo n sobre un alfabeto A se designa por An, y elconjunto de todas las palabras sobre A se designa por A∗. Es decir, A∗ =

⋃∞n=0An. Notar

que, para todo n ≥ 0, An es un conjunto nito, en tanto que A∗ es un conjunto que tiene unacantidad innita de elementos.

Un alfabeto que a menudo usaremos es A = 0, 1, y las palabras que sobre él puedenformarse se llaman sucesiones binarias. Tenemos que, en este caso, es A0 = ε, A1 =0, 1, A2 = 00, 01, 10, 11, A3 = 000, 001, 010, 011, 100, 101, 110, 111, etc. Además, A∗ =ε, 0, 1, 00, 01, 10, 11, . . ..

Sea u un bloque. Un subbloque (o subpalabra) de u es una palabra w tal que existei ≥ 1 tal que ∀k ∈ Z, 1 ≤ k ≤ |w| ⇒ wk = ui+k−1. De la denición, se desprende que lapalabra vacía es subbloque de cualquier palabra, y que si u = u1 · · ·un es un n-bloque novacío, sus subpalabras no vacías son de la forma ui · · ·uj, en donde i, j son enteros tales que1 ≤ i ≤ j ≤ n. Si w es subbloque de u, escribimos w v u, y decimos que w ocurre en u.Obviamente, w v u⇒ |w| ≤ |u|.

Si u y v son dos bloques sobre A, la concatenación de u y v es la nueva palabra quese obtiene al escribir los símbolos de u y, a continuación, los de v, sin ningún signo especialintermedio. La concatenación de u y v se escribe uv. Notar que, en general, uv 6= vu. Es directover que |uv| = |u|+|v|. De manera análoga, la concatenación de tres o más bloques es la palabraque se obtiene de escribir los respectivos símbolos consecutivamente. La concatenación de unbloque u consigo mismo una cantidad n de veces se designa por un. Formalmente:

un =

ε si n = 0uun−1 si n > 0

Por ejemplo, (01)3 = 010101, y 013 = 0111.

1

Page 6: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

2 1. ESPACIOS SHIFT

Se cumple que para todo bloque u ∈ A∗ y enteros no negativos m y n, es umun = um+n y(um)n = umn.

2. Full shifts

Dado un alfabeto A, se denomina full shift sobre el alfabeto A, o full A-shift, alconjunto de todas las funciones de Z en A. El full shift sobre A se denota por AZ.

Una función de Z en A no es más que una sucesión bi-innita de símbolos de A, que puedeescribirse así:

x = (xn)n∈Z = · · ·x−2x−1x0x1x2x3 · · ·Un ejemplo de tales sucesiones bi-innitas para A = 0, 1 es la que tiene 0 en sus términosimpares, y 1 en sus pares, es decir, · · · 01010101010 · · · .

Para tener una idea de cuál es la coordenada 0 de x, escribiremos un signo de puntuacióna la izquierda de x0, así:

· · ·x−2x−1.x0x1x2 · · ·En nuestro ejemplo anterior, escribimos · · · 010.10101010 · · · .

Debe quedar claro que el signo de puntuación no es un elemento del alfabeto, ni un términode la sucesión x; es sólo una manera de representar a · · ·x−2x−1x0x1x2 · · · de modo de teneruna referencia a sus posiciones.

Los elementos de AZ reciben el nombre de puntos. Cada punto es, entonces, una sucesiónbi-innita (o tirilla bi-innita) de símbolos. Dos puntos x = (xi)i∈Z e y = (yi)i∈Z son iguales si,y sólo si, xi = yi para todo entero i.

Notar que AZ no contiene palabras, sino sucesiones bi-innitas. A∗ y AZ no tienen ningúnelemento en común.

Dado x = · · ·x−2x−1x0x1x2x3 · · · ∈ AZ, designamos por x[i,j] a la sucesión (nita) de lossímbolos de x que van desde la coordenada i hasta la coordenada j, ambas inclusive. Es decir,x[i,j] = xixi+1 · · ·xj−1xj. Adoptamos la convención de que para i > j, x[i,j] = ε (formalmente,x[i,j] es la función u con dominio n ∈ Z : 1 ≤ n ≤ j − i+ 1 y codominio A tal que un =xi+n−1). Denotamos por x[i,∞) a la sucesión innita a derecha xixi+1 · · · , mientras que x(−∞,i]es la sucesión innita a izquierda · · ·xi−1xi. Dados u ∈ A∗ y x ∈ AZ, decimos que u ocurreen x, o también que u es palabra (o bloque) de x (y lo escribimos u v x) si existen enterosi, j tales que x[i,j] = u. Notar que la palabra vacía ocurre en cualquier punto del full shift:∀x ∈ AZ, x[1,0] = ε. El (2k + 1)-bloque central de x es x[−k,k].

Para un bloque no vacío u = u0 · · ·un−1 ∈ A∗ − ε, designamos por u∞ al punto x ∈ AZque resulta de la concatenación innita (hacia ambos lados) de la palabra u consigo misma, demodo que ∀i ∈ Z, xi = ui mod n (i mod n representa el resto de la división de i por n):

u∞ = · · ·uuuuu.uuuuuu · · · = · · ·u0 · · ·un−1u0 · · ·un−1.u0 · · ·un−1u0 · · ·un−1 · · ·

Obsérvese que la coordenada 0 de u∞ es u0. Por ejemplo, si u = 011, entonces

u∞ = · · · 011011.011011011 · · ·

que no es el mismo que · · · 0110110.11011011 · · · = (110)∞.

2.1. La transformación shift. Se puede pensar en el subíndice i de una sucesión (xi)i∈Zcomo indicador del tiempo, de modo que xi representa el valor de la sucesión en el minuto i.El paso de una unidad de tiempo equivale entonces a desplazar (shift) cada coordenada dela sucesión un lugar hacia la izquierda. Esto dene una transformación natural de AZ en AZ,llamada transformación shift y denotada por σ, del siguiente modo:

σ : AZ → AZx 7→ y = σ(x) con yi = xi+1

Por ejemplo, si x = · · · 00111.0011100111 · · · , entonces σ(x) = · · · 001110.011100111 · · ·

Page 7: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

3. LOS ESPACIOS SHIFT 3

Conforme a la costumbre en teoría de sistemas dinámicos, y a n de no sobrecargar lanotación con excesivo uso de paréntesis, a veces usaremos σx para σ(x), y σxi para (σ(x))i.

σ es una función biyectiva. Su inversa, σ−1, desplaza cada posición de una sucesión un lugarhacia la derecha. Si k es un entero positivo, σk designa a la composición de σ consigo mismak veces, y produce el efecto de desplazar todas las coordenadas de una sucesión k lugares a laizquierda (σkxi = xi+k), mientras que σ−k es la composición de σ−1 consigo misma k veces,y mueve k lugares a la derecha (σ−kxi = xi−k). σ0 se dene como la función identidad. Sepuede resumir todo diciendo que σkxi = xi+k, sea k positivo o no. Nótese que, en consecuencia,xi = σkxi−k. Por ser composición de biyecciones, σk es una biyección de AZ, para cualquierk ∈ Z.

Proposición 1.1. Sean u ∈ A∗, x ∈ AZ y k ∈ Z; se tiene que u v x⇔ u v σkx.

Demostración. Puesto que x[i,j] = σkx[i−k,j−k], se tiene que

u v x⇔ ∃i, j ∈ Z : u = x[i,j] = σkx[i−k,j−k] ⇔ u v σkx

Un punto x ∈ AZ para el cual existe un n ≥ 1 tal que σnx = x, se llama punto periódicopara σ, y, en ese caso, n es un período de x. Para el caso particular en que n = 1 (esdecir, σx = x), x se llama punto jo para σ. Todo punto periódico es de la forma u∞, conu ∈ A∗−ε. En particular, un punto jo para σ es de la forma a∞, para algún a ∈ A. Si x esperiódico de período n, también es periódico de período 2n, 3n, . . .. El menor de los númerospositivos k tales que σkx = x se llama período mínimo de x.

Lema 1.2. Sea x un punto periódico para σ de período mínimo n0. Entonces, para cualquierentero positivo k, x tiene período kn0.

Demostración. Por inducción sobre k. Para k = 1, se cumple pues n0 es un período dex. Supongamos que σkn0x = x. Es σ(k+1)n0x = σn0

(σkn0x

)= σn0x = x, por lo que (k + 1)n0 es

un período de x.

Proposición 1.3. Sea x un punto periódico para σ de período mínimo n0. x tiene períodon si, y sólo si, n es múltiplo de n0.

Demostración. Para la ida, supongamos que x tiene período n. Sean k y r tales quen = kn0 + r con 0 ≤ r < n0. Por el lema 1.2, vemos que x = σr

(σkn0x

)= σrx, pero como

r < n0 debe ser r = 0, y entonces n es múltiplo de n0.La vuelta es el contenido del lema 1.2.

3. Los Espacios Shift

Definición 1.4. Sea F una colección de bloques sobre un alfabeto A, es decir, F ⊆ A∗.Designamos por XF al subconjunto de AZ formado por todos aquellos puntos en los que noocurre ningún bloque de F . Es decir,

XF =x ∈ AZ : ∀f ∈ F , f no ocurre en x

=

x ∈ AZ : ∀i, j ∈ Z, x[i,j] /∈ F

Obsérvese que x /∈ XF ⇔ ∃i, j ∈ Z : x[i,j] ∈ F .A continuación, algunos ejemplos sobre A = 0, 1:

Ejemplo 1.5. Si F1 = ∅, es XF1 = AZ, pues trivialmente se tiene que ∀x ∈ AZ,∀i, j ∈Z, x[i,j] /∈ F1.

Ejemplo 1.6. Si F2 = 0, 1, es XF2 = ∅, pues ∀x ∈ AZ, x[0,0] ∈ F2.

Ejemplo 1.7. Si F3 = ε, es XF3 = ∅, pues ∀x ∈ AZ, x[1,0] = ε ∈ F3.

Page 8: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

4 1. ESPACIOS SHIFT

Ejemplo 1.8. Si F4 = 0, es XF4 = 1∞, pues cualquier punto x distinto de 1∞ poseeuna coordenada i tal que xi = 0, y entonces x[i,i] ∈ F4.

Ejemplo 1.9. Si F5 = 00, 01, es XF5 = 1∞ pues si un punto x tiene una coordenadaxi = 0, es xi+1 = 0 o xi+1 = 1, y en cualquier caso x[i,i+1] ∈ F5.

Ejemplo 1.10. Si F6 = 11, algunos puntos de XF6 son (01)∞, (010)∞, (00100010)∞,· · · 0000.10000 · · · , · · · 00100000.00000 · · · , · · · 00001000100101.010010001000010000010 · · · . XF6

es precisamente el conjunto de puntos de AZ que no contienen dos 1 consecutivos. Este espacioshift es conocido como el shift de la razón de oro.

Ejemplo 1.11. Si F7 = 1n : n ≥ 2, es XF7 = XF6 .

Ejemplo 1.12. Si F8 = A∗, es XF8 = ∅.

Ejemplo 1.13. Si F9 = 102n+11 : n ∈ N, XF9 es precisamente el conjunto de puntos deAZ tales que entre dos ocurrencias consecutivas de 1 hay una cantidad par de 0 (es decir,aquellos puntos x ∈ AZ tales que 10n1 v x⇒ n es par). Este espacio shift es conocido como elshift par.

Proposición 1.14. Sean F y F ′ subconjuntos de A∗. Entonces:1. XF∪F ′ = XF ∩ XF ′2. XF∩F ′ ⊇ XF ∪ XF ′3. Si F ⊆ F ′, entonces XF ⊇ XF ′.Demostración. Para la primera aserción, x ∈ XF∪F ′ ⇐⇒ ∀u v x, u /∈ F ∪ F ′ ⇐⇒

∀u v x, u /∈ F ∧ u /∈ F ′ ⇐⇒ x ∈ XF ∧ x ∈ XF ′ ⇐⇒ x ∈ XF ∩ XF ′ .Para la segunda, si x ∈ XF y u v x, se tiene que u /∈ F , por lo que u /∈ F ∩ F ′, y entonces

x ∈ XF∩F ′ ; de aquí que XF ⊆ XF∩F ′ . Análogamente, XF ′ ⊆ XF∩F ′ , y, de las dos contencionesanteriores, es XF ∪ XF ′ ⊆ XF∩F ′ .

Para la tercera, si x ∈ XF ′ y u v x, u /∈ F ′ ⊇ F , y entonces u /∈ F . Por lo tanto, x ∈ XF . Dado F ⊆ A∗, de la denición de XF resulta claro que XF ⊆ AZ. Ahora bien, dado un

subconjunto cualquiera X de AZ, ¾existirá siempre un F ⊆ A∗ tal que X = XF? Resulta queno siempre, y aquellos X para los que sí existe tal F reciben un nombre especial y son objetode nuestro estudio.

Definición 1.15. Un espacio shift sobre el alfabeto A es un conjunto X ⊆ AZ tal queexiste un F ⊆ A∗ tal que X = XF .

Pensamos en F como en un conjunto de bloques prohibidos para X.Antes de ver ejemplos de subconjuntos de AZ que son o no espacios shift, veamos una

propiedad importante que cumplen los conjuntos que sí lo son.

Proposición 1.16. Sean X un espacio shift, x ∈ X y k ∈ Z. Entonces σkx tambiénpertenece a X.

Demostración. Sea F tal que X = XF . Consideremos un bloque arbitrario u que ocurraen σkx. Por la proposición 1.1, tenemos que también u ocurre en x, luego u no puede pertenecera F . Como u era un bloque arbitrario de σkx, vemos que ningún bloque de σkx está en F , porlo que σkx ∈ XF , es decir, σkx ∈ X.

Corolario 1.17. Sea X ⊆ AZ, y supongamos que existen x ∈ X y k ∈ Z tales queσkx /∈ X. Entonces X no es un espacio shift.

Corolario 1.18. Si X es un espacio shift y k ∈ Z, entonces σk(X) = X.

Demostración. Si y ∈ σk(X), existe x ∈ X tal que y = σkx, que, de acuerdo a laproposición 1.16, está en X; luego σk(X) ⊆ X. Esto también muestra que σ−k(X) ⊆ X, porlo que σk

(σ−k(X)

)⊆ σk(X); pero como σk es biyectiva, se tiene que σk

(σ−k(X)

)= X, y

entonces tenemos que X ⊆ σk(X).

Page 9: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

4. LENGUAJES 5

La propiedad de ser σ(X) = X se llama invariancia por shift o shift invariancia. Loscorolarios anteriores dicen que todo espacio shift es shift invariante, o, igualmente, que unconjunto que no es shift invariante no puede ser un espacio shift. Por ejemplo, el conjuntounitario X = (01)∞ no es un espacio shift pues σ(01)∞ = (10)∞ /∈ X. Sin embargo, la shiftinvariancia de un conjunto no garantiza que éste sea un espacio shift.

Ejemplo 1.19. Sea X el conjunto de todas las sucesiones bi-innitas sobre 0, 1 en lasque hay exactamente una coordenada 1 y el resto son todas 0. Es decir,

X =

(xi)i∈Z : ∃k ∈ Z : (xk = 1 ∧ ∀i 6= k, xi = 0)

Si x ∈ X, σx también pertenece a X, es decir, X es invariante por shift. Sin embargo, veamosque X no es espacio shift. Para arribar a una contradicción, supongamos que lo fuera. Quieredecir que existiría un F tal que X = XF . Debe ocurrir que ∀k ≥ 1, 0k /∈ F (pues ∀k ≥ 1, 0k v· · · 000000.1000000 · · · ∈ X). Pero entonces 0∞ pertenecería a XF , con lo cual 0∞ ∈ X, quecontradice la denición de X. La contradicción proviene de suponer la existencia del conjuntoF , es decir, de suponer que X es un espacio shift.

Ejemplo 1.20. El conjunto vacío y el full shift 0, 1Z son espacios shift, según se mostróen los ejemplos 1.5 y 1.6. En general, cualquier full shift es un espacio shift. Los conjuntos XF4

y XF6 de los ejemplos 1.8 y 1.10 son también espacios shift. Los ejemplos 1.8 y 1.9 muestranque un mismo espacio shift puede ser descripto a través de diferentes colecciones de bloquesprohibidos.

La restricción de σ a un espacio shift X será denotada por σX . En vistas del corolario1.18, σX es una biyección de X en X. Las deniciones anteriormente dadas para puntos jos yperiódicos de AZ para σ son igualmente aplicables a un espacio shift X y su respectiva σX .

El siguiente resultado será útil en lo sucesivo, pues arma que el conjunto de bloques prohi-bidos para un espacio shift puede verse como constituido por palabras de longitud al menos N ,donde N es cualquier entero positivo.

Proposición 1.21. Sean X un espacio shift y N un entero positivo. Entonces, existe F ⊆A∗ tal que todo bloque en F tiene longitud al menos N , y X = XF .

Demostración. Siendo X un espacio shift, hay un F ′ ⊆ A∗ tal que X = XF ′ . Hagamos

F1 =w ∈ AN : ∃u ∈ F ′ : u v w

F2 = u ∈ F ′ : |u| > N

F = F1 ∪ F2

Es decir, F consta de todas las palabras de F ′ que tengan largo mayor que N , más todasaquellas palabras de largo N sobre el alfabeto que contengan una subpalabra que esté en F ′.Observar que F1∩F2 = ∅. Es directo ver que todo bloque en F tiene largo al menos N . Veamosque X = XF :

x /∈ XF ⇔ ∃i, j ∈ Z : x[i,j] ∈ F⇔ ∃i, j ∈ Z : x[i,j] ∈ F1 ∨ x[i,j] ∈ F2

⇔ ∃i, j ∈ Z :(j − i+ 1 = N ∧ ∃u ∈ F ′ : u v x[i,j]

)∨(j − i+ 1 > N ∧ x[i,j] ∈ F ′

)⇔ ∃u ∈ F ′ : u v x

⇔ x /∈ XF ′ = X

4. Lenguajes

Definición 1.22. Un lenguaje sobre un alfabeto A es cualquier subconjunto de A∗.

Page 10: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

6 1. ESPACIOS SHIFT

En adelante, si L es un lenguaje, designaremos por Lc a su complemento en A∗, es decir, elconjunto de todas las palabras de A∗ que no pertenecen a L.

Si X es un subconjunto de AZ (no necesariamente un espacio shift) y n un entero nonegativo, denotamos por Bn(X) al conjunto de bloques de longitud n que ocurren en puntos deX, es decir,

Bn(X) = u ∈ An : ∃x ∈ X : u v xPor ejemplo, si X = AZ, entonces Bn (X) es precisamente An. Si X = X11, es B0(X) = ε,B1(X) = 0, 1, B2(X) = 00, 01, 10, B3(X) = 000, 001, 010, 100, 101.

Nótese que si X = XF y f ∈ F , no puede haber un n tal que f ∈ Bn(X). Es decir,∀n ∈ N,F ∩ Bn(X) = ∅. Sin embargo, bien puede ocurrir que un bloque de longitud n que noesté en F tampoco esté en Bn (X).

Definición 1.23. Sea X un subconjunto de AZ . El lenguaje de X, denotado por B(X),es el conjunto de todos los bloques que ocurren en puntos de X. En otras palabras,

B(X) = u ∈ A∗ : ∃x ∈ X : u v x =∞⋃n=0

Bn(X)

Ejemplo 1.24. B(X11

)= ε, 0, 1, 00, 01, 10, 000, 001, 010, 100, 101, . . ..

Ejemplo 1.25. Sean X1 = (01)∞, (10)∞ y X2 = (01)∞; se tiene que

B (X1) = ε, 0, 1, 01, 10, 010, 101, 0101, 1010, . . . = B (X2)

a pesar de que X1 6= X2; notar, sin embargo, que X1 es un espacio shift, mientras que X2 no loes.

Así como F se interpretaba como un conjunto de bloques prohibidos para XF , B (XF) es elconjunto de bloques permitidos para XF . Cuando un bloque está en el lenguaje de un espacioshift X, decimos de él que ocurre en X, o que aparece en X, o que está en X, o que estápermitido en X.

Una consideración análoga a la de más arriba: si X = XF , entonces F ∩ B(X) = ∅. Sinembargo, bien puede ocurrir que un bloque que no esté en F tampoco esté en B(X).

Si un bloque está en el lenguaje de un espacio shift, la denición nos dice que hay unpunto del espacio en el cual, en determinada posición, encontramos ese bloque. Sin embargo,usando shift invariancia, podemos ver que el bloque aparece en algún punto del espacio en lacoordenada que uno quiera.

Proposición 1.26. Sean X un espacio shift, u un bloque en B(X), y k un entero. Entonces,existe x ∈ X tal que x[k,k+|u|−1] = u.

Demostración. Dado que u ∈ B(X), existe x′ ∈ X tal que u v x′, es decir, hay uni ∈ Z tal que x′[i,i+|u|−1] = u. Hagamos x = σi−kx′. Por la proposición 1.16, x pertenece a X, yx[k,k+|u|−1] = σi−kx′[k,k+|u|−1] = x′[i,i+|u|−1] = u.

No cualquier lenguaje (en el sentido de la denición 1.22) es el lenguaje de algún espacioshift. Por ejemplo, resulta directo ver que el lenguaje de un espacio shift no vacío es un conjuntoinnito, de modo que un subconjunto nito no vacío de A∗ no puede ser el lenguaje de ningúnespacio shift sobre A. Buscamos caracterizar a aquellos lenguajes que son los lenguajes de losespacios shift.

Proposición 1.27. Sean X un espacio shift y B(X) su lenguaje. Si v ∈ B(X), entonces:

1. cualquier subbloque de v pertenece también a B(X).2. hay bloques u y w no vacíos en B(X) tales que uvw ∈ B(X).

Page 11: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

4. LENGUAJES 7

Demostración. Como v ∈ B(X), existen i, j ∈ Z y x ∈ X tales que v = x[i,j]. Si v′ v v,v′ ocurre también en x, de modo que v′ ∈ B(X). Además, haciendo u = xi−1 y w = xj+1, setiene que u y w son bloques no vacíos que están en B(X) y que uvw = x[i−1,j+1] v x, por loque uvw ∈ B(X).

La proposición anterior establece condiciones necesarias para los bloques del lenguaje deun espacio shift. Resulta que esas condiciones son también sucientes: cualquier lenguaje cuyaspalabras satisfagan esas condiciones, es el lenguaje de algún espacio shift.

Proposición 1.28. Sea L un lenguaje con la propiedad de que para todo v ∈ L: (a) cualquiersubbloque de v está en L, y (b) hay bloques no vacíos u y w en L tales que uvw está en L.Entonces L es el lenguaje de algún espacio shift.

Demostración. Consideremos el espacio shift X = XLc , y veriquemos que B(X) = L.Lo haremos por doble inclusión:

Si v ∈ B(X), existe x ∈ X tal que v v x, de modo que v /∈ Lc, o sea que v ∈ L.Sea ahora v un bloque de longitud n en L, digamos v = x0 · · · xn − 1. Por aplicación de

la condición (b), hay bloques u y w, cuyos símbolos denotaremos, respectivamente, x−j · · ·x−1

y xn · · ·xk tales que el bloque v′ = uvw = x−j · · ·x−1x0 · · ·xn−1xn · · ·xk está en L. Aplicandonuevamente la condición (b) a v′ hay bloques u′ = x−j′ · · · x−j−1 y w′ = xk+1 · · ·xk′ tales queel bloque x−j′ · · · x−j−1x−j · · ·x−1x0 · · ·xn−1xn · · ·xkxk+1 · · ·xk′ está en L. Continuando de estamanera, tenemos denido xi para todo entero i, de modo tal que el punto x = (xi)i∈Z cumpleque todos sus bloques están en L, y v = x[0,n−1]. Luego, x ∈ XLc , ya que ningún bloque de xestá en Lc, y v v x, por lo que v ∈ B (XLc) = B(X).

De las dos proposiciones anteriores, vemos que un subconjunto de A∗ es el lenguaje de algúnespacio shift si, y sólo si, todos sus bloques cumplen las propiedades (a) y (b) enunciadas en laproposición 1.28.

Hay una correspondencia biunívoca entre el conjunto de todos los espacios shift y el conjuntode todos los lenguajes de espacios shift. Es decir, el lenguaje de un espacio shift determinacompletamente a ese espacio shift. Dicho de otro modo, no hay dos espacios shift distintos quetengan el mismo lenguaje, según veremos a continuación.

Proposición 1.29. Sea X ⊆ AZ. X es un espacio shift si, y sólo si, X = XB(X)c.

Demostración. La vuelta es consecuencia inmediata de la denición de espacio shift.Demostraremos la ida por doble inclusión:

Si x ∈ X, todos sus bloques están en B(X) (por la denición de B(X)), de modo queninguno de ellos está en B(X)c, y así x ∈ XB(X)c .

Para la otra contención, dado que X es un espacio shift, hay un F tal que X = XF . Six ∈ XB(X)c y v v x, v /∈ B(X)c, es decir, v ∈ B(X), por lo que v /∈ F . Como v era un bloquearbitrario de x, hemos demostrado que ningún bloque de x está en F , por lo que x ∈ XF = X,quedando probada la otra inclusión.

Corolario 1.30. Sean X1 y X2 espacios shift. Entonces, X1 = X2 ⇔ B (X1) = B (X2).

Demostración. La ida es inmediata de la denición de lenguaje de un espacio shift.Para la vuelta, suponiendo que B (X1) = B (X2), tenemos que B (X1)c = B (X2)c, y, por laproposición anterior, X1 = XB(X1)c = XB(X2)c = X2.

En este corolario, es esencial que X1 y X2 sean espacios shift (ver el ejemplo 1.25).Todos estos resultados muestran que si bien un mismo espacio shift X puede ser descripto

a través de varios conjuntos prohibidos, hay un conjunto de bloques prohibidos maximal, quees el complemento del lenguaje de ese espacio shift: cualquier F tal que X = XF cumple conque F ⊆ B(X)c, pues ya sabemos que F ∩ B(X) = ∅.

Page 12: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

8 1. ESPACIOS SHIFT

Resumimos la correspondencia entre espacios shift y lenguajes de espacios shift a través delas siguientes ecuaciones:

L = B (XLc) X = XB(X)c

La proposición 1.29 tiene otro útil corolario, que dice que si un punto x de AZ tiene todos susbloques en el lenguaje de un espacio shift X, entonces el punto x necesariamente pertenece aX.

Corolario 1.31. Sea X un subconjunto de AZ. X es un espacio shift si, y sólo si,(∀x ∈ AZ,

(∀i, j ∈ Z, x[i,j] ∈ B(X)

)⇒ x ∈ X

)Demostración. Notemos que

(∀x ∈ AZ,

(∀i, j ∈ Z, x[i,j] ∈ B(X)

)⇒ x ∈ X

)si, y sólo si,

X = XB(X)c , de modo que el corolario se deduce directamente de la proposición 1.29.

4.1. Irreductibilidad. Supongamos que X es un espacio shift, y que v ∈ B(X). Por laproposición 1.28, v puede ser extendido hacia ambos lados para formar un bloque uvw quetambién está en el lenguaje de X. Ahora bien, dados dos bloques u y w en B(X), puede no serposible encontrar un bloque v tal que uvw esté en B(X).

Ejemplo 1.32. Sea X = X11, y tomemos u y w en B(X). Ni u ni w pueden contener dos1 consecutivos. Entonces, el punto · · · 00000u0w0000000 · · · no contiene dos 1 consecutivos, ypor eso el bloque u0w está en B(X).

Ejemplo 1.33. Sea X = 0∞, 1∞. Se tiene que u = 1 y w = 0 están ambos en B(X).Sin embargo, no hay ningún bloque v tal que 1v0 esté en el lenguaje, pues ningún punto de Xcontiene simultáneamente un 0 y un 1.

Los espacios shift en los que dos bloques del lenguaje pueden ser enganchados a través deun tercer bloque forman una clase importante de espacios shift.

Definición 1.34. Un espacio shift X es irreducible si para cualquier par de bloques u yw en B(X), existe un bloque v en B(X) tal que uvw pertenece a B(X). Un espacio shift queno es irreducible se llama reducible.

El espacio shift del ejemplo 1.32 es irreducible, en tanto que el del ejemplo 1.33 es reducible.

5. Shifts de bloques

Hemos denido un alfabeto como un conjunto nito de símbolos, sin exigir nada en especiala los símbolos. Si A es un alfabeto y N es un entero positivo, cae también en la categoríade alfabeto el conjunto AN . Por claridad notacional, cuando estemos pensando en AN comoalfabeto, representaremos sus símbolos de la forma

aN...a2

a1

en lugar de a1a2 · · · aN . Nótese que cada ai ∈ A.

Ya que AN es un alfabeto (cuyos elementos son en realidad bloques sobre otro alfabeto),tenemos derecho a pensar en el full AN -shift, es decir,

(AN)Z. Dado un punto x de AZ, hay

dos puntos de(AN)Z

que de manera bastante natural pueden asociarse a x. Los llamaremos,

Page 13: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

5. SHIFTS DE BLOQUES 9

respectivamente, βN(x) y γN(x). El siguiente diagrama ilustra cómo se obtienen a partir de x:

x = · · · x−1 . x0 x1 x2 x3 · · ·

βN (x) = · · ·

xN−2...x0

x−1

.

xN−1...x1

x0

xN...x2

x1

xN+1...x3

x2

xN+2...x4

x3

· · ·

γN (x) = · · ·

x−1...

x−N+1

x−N

.

xN−1...x1

x0

x2N−1

...xN+1

xN

x3N−1

...x2N+1

x2N

x4N−1

...x3N+1

x3N

· · ·

Nótese que, a partir de βN(x), es posible recuperar x, leyendo los símbolos inferiores de cadaposición.

Formalizamos la denición de βN y de γN : Ambas son funciones de AZ en(AN)Z, y se

denen mediante:

(βN(x))i =

xi+N−1

...xi+1

xi

(γN(x))i =

x(i+1)N−1

...xiN+1

xiN

βN(x) se llama la presentación de x en N-bloques con solape. El término solape sereere al hecho de que dos coordenadas consecutivas cualesquiera de βN(x) consisten en bloquesu = u1 · · ·uN y v = v1 · · · vN con u2 · · ·uN = v1 · · · vN−1. Cuando dos bloques u y v cumplenesto, es decir, que la cola de u (lo que queda de u luego de eliminar el primer símbolo) esigual a la cabecera de v (lo que queda de v luego de eliminar el último símbolo), decimosque u y v solapan progresivamente. Entonces, dos símbolos consecutivos de βN(x), vistoscomo bloques sobre A, solapan progresivamente, y de allí el nombre para βN . γN(x) se llamala presentación de x en N-bloques sin solape, por la razón de que no necesariamente secumple la condición de solape progresivo entre coordenadas consecutivas de γN(x).

Las deniciones anteriores pueden generalizarse de la siguiente manera:

Definición 1.35. Sean X un espacio shift y N un entero positivo. Hagamos ANX = BN(X).Se dene la función βN : X →

(ANX)Z

mediante

(βN(x))i =

xi+N−1

...xi+1

xi

La imagen de X a través de βN se llama presentación de X en N-bloques con solape, yse denota X [N ]. Es decir,

X [N ] = βN(x) : x ∈ X = βN(X)

Análogamente, se dene la función γN : X →(ANX)Z

mediante

(γN(x))i =

x(i+1)N−1

...xiN+1

xiN

Page 14: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

10 1. ESPACIOS SHIFT

La imagen de X a través de γN se llama presentación de X en N-bloques sin solape, yse denota XN . Es decir,

XN = γN(x) : x ∈ X = γN(X)

Ejemplo 1.36. Sea X = X11. Entonces, A2X =

[00

],

[10

],

[01

].

Si x = · · · 000.01010 · · · , entonces

β2 (x) = · · ·[

00

] [00

] [00

].

[10

] [01

] [10

] [01

]· · ·

γ2 (x) = · · ·[

00

].

[10

] [10

]· · ·

Se puede mostrar que X [2] = XF1 y que X2 = XF2 con

F1 =

[00

] [01

],

[10

] [00

],

[10

] [10

],

[01

] [01

]F2 =

[10

] [01

](notar que F1 tiene cuatro elementos, y F2 sólo uno).

Por cuestiones de codicación que más adelante detallaremos, de ahora en más estaremosmás interesados en las presentaciones con solape que en las sin solape. Nótese que la funciónβN actúa inyectivamente, de modo que es una biyección entre X y X [N ]. De este modo, β−1

N esuna función bien denida desde X [N ] hacia X, o, más generalmente, desde el conjunto de todoslos puntos de

(AN)Z

cuyos símbolos consecutivos solapan progresivamente, hacia AZ.Será conveniente sobrecargar el símbolo βN , de manera que la función βN se pueda con-

siderar también para actuar sobre bloques de tamaño mayor o igual que N , de la siguientemanera: para w = w1 · · ·wm con m ≥ N , denimos

βN (w) =

wN...w2

w1

wN+1...w3

w2

· · ·

wm...

wm−N+2

wm−N+1

Es directo ver que βN actúa sobre bloques en forma inyectiva: u 6= u′ ⇒ βN(u) 6= βN (u′).Las presentaciones con (o sin) solape de cualquier espacio shift son también espacios shift.

Proposición 1.37. Sea X un espacio shift sobre el alfabeto A. Para todo N ≥ 1, X [N ] esun espacio shift sobre el alfabeto BN(X).

Demostración. Sea F ′ tal que X = XF ′ . En virtud de la proposición 1.21, podemossuponer que cada bloque de F ′ tiene largo al menos N . Hagamos

F1 = βN (w) : w ∈ F ′ F2 =uv ∈ (BN(X))2 : u y v no solapan progresivamente

F = F1 ∪ F2

y veriquemos que X [N ] = XF , con lo que quedará establecido que X [N ] es un espacio shift.

Primero veamos que X [N ] ⊆ XF1 . Sea x ∈ X [N ], y u un bloque en x. Existe x ∈ X talque βN(x) = x, por lo que hay un bloque u de x tal que βN(u) = u. Dado que que βNes inyectiva y que u /∈ F ′, vemos que u /∈ F1. Como u era arbitrario, x ∈ XF1 .

Ahora veamos que X [N ] ⊆ XF2 : sabemos que si x ∈ X [N ], ocurre que ∀i ∈ Z, xi yxi+1 solapan progresivamente. Entonces, ningún bloque de x de tamaño 2 puede estaren F2 (que tiene sólo bloques de tamaño 2), por lo que x ∈ XF2 .

Page 15: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

6. CÓDIGOS DE VENTANA DESLIZANTE 11

Como X [N ] ⊆ XF1 y X [N ] ⊆ XF2 , se tiene, usando la proposición 1.14, que X [N ] ⊆XF1 ∩ XF2 = XF1∪F2 = XF .Veamos ahora que XF ⊆ X [N ]: sea x ∈ XF = XF1∪F2 = XF1 ∩XF2 . Entonces, x ∈ XF1 yx ∈ XF2 . Como x ∈ XF2 , podemos hacer x = β−1

N (x), el cual pertenece a AZ; pero dadoque x ∈ XF1 , debe ser x ∈ XF ′ = X, y entonces x ∈ X [N ].

6. Códigos de ventana deslizante

En Teoría de Códigos, interesan las maneras que hay de traducir un mensaje (fuente) sobreun alfabeto A en mensaje sobre otro alfabeto U (posiblemente el mismo que el del mensajefuente). Esto puede ser visto (sobre todo si el mensaje fuente es largo) como una manera detransformar puntos de un espacio shift en puntos de otro espacio shift, a través de una función.De las maneras en que esto se puede hacer, hay una clásica que explicamos seguidamente.

Supongamos dados dos enteros m y n, con m + n ≥ 0, y supongamos también dada unafunción Φ que transforma bloques de tamaño m + n + 1 sobre A en símbolos de U . Entonces,una manera de transformar un x ∈ AZ en un y ∈ UZ es mirar el bloque que hay en unaventana de ancho m+ n+ 1 alrededor de la coordenada i-ésima de x y aplicarle a ese bloquela función Φ para obtener la correspondiente coordenada del transformado. Más concretamente,la i-ésima coordenada de y será Φ

(x[i−m,i+n]

). Para calcular luego la (i+ 1)-ésima coordenada

de y, desplazamos toda la ventana una posición a la derecha, y repetimos. Llevando esto acabo para todo i ∈ Z, obtenemos el transformado de x. Esta operación de ver el contenido dela ventana, transformar usando Φ y deslizar, motiva que la función transformadora reciba elnombre de código de ventana deslizante, que abreviaremos CVD. Formalmente:

Definición 1.38. Sean m,n ∈ Z con m+n ≥ 0, A y U alfabetos, X un espacio shift sobreA, y Φ una función de Bm+n+1(X) en U . El código de ventana deslizante con memoriam y anticipación n inducido por Φ es la transformación φ : X → UZ denida por y = φ(x)con yi = Φ

(x[i−m,i+n]

)para todo entero i.

Al igual que con la transformación shift σ, si φ es un CVD, emplearemos (aunque noobligatoriamente) la notación φx para φ(x) y φxi para (φ(x))i.

Notar, en la denición de arriba, la distinción tipográca entre φ (que transforma tirillasbi-innitas) y Φ (que transforma bloques de tamaño m+ n+ 1). Decimos que φ es inducida

por Φ, o que Φ induce a φ, y, para expresar este hecho, escribimos φ = Φ[−m,n]∞ . La función

Φ se llama función de bloques, o función inductora, de φ. De los números m y n decimosque son, respectivamente, la memoria y la anticipación de φ (o también de Φ), por el hechode que indican cuántas coordenadas del pasado y del futuro hay que conocer para obtenerel transformado en la posición que corresponde al presente.

Ejemplo 1.39. A = 0, 1,U = A,B,C,m = 1, n = 2, X = X110,101,Φ : B4(X) → Udada por

Φ (0000) = A Φ (0001) = A Φ (0010) = B Φ (0011) = AΦ (0100) = C Φ (1000) = B Φ (1001) = C Φ (1111) = A

Entonces, si φ = Φ[−m,n]∞ y x = · · · 001.000010010001 · · · , tenemos que

φ(x) = · · ·BC.BAABCCBCBA · · ·

pues φ(x)−2 = Φ(x[−2−m,−2+n]

)= Φ

(x[−3,0]

)= Φ(0010) = B, φ(x)−1 = Φ

(x[−1−m,−1+n]

)=

Φ(x[−2,1]

)= Φ(0100) = C, φ(x)0 = Φ

(x[0−m,0+n]

)= Φ

(x[−1,2]

)= Φ(1000) = B, φ(x)1 =

Φ(x[1−m,1+n]

)= Φ

(x[0,2]

)= Φ(0000) = A, y así.

Ejemplo 1.40. A,U , X, x y Φ iguales que en el ejemplo anterior, pero ahora m = 0, n = 3.En este caso, φ(x) = · · ·BCB.AABCCBCBA · · · .

Page 16: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

12 1. ESPACIOS SHIFT

Ejemplo 1.41. A = 0, 1 = U , X = AZ,m = 0 = n,Φ : B1(X)→ U dada por Φ(0) = 1 =

Φ(1), y F = Φ[−m,n]∞ . Entonces, para todo x ∈ AZ, F (x) = 1∞.

Ejemplo 1.42. A cualquier alfabeto, X cualquier espacio shift sobre A, U = A,m = 0, n =

1,Φ(ab) = b, φ = Φ[−m,n]∞ . Entonces, φ = σX , pues, para x ∈ X,φxi = Φ (xixi+1) = xi+1 =

σXxi.

Ejemplo 1.43. A cualquier alfabeto, X cualquier espacio shift sobre A, U = A,m = 1, n =

0,Φ(ab) = a, φ = Φ[−m,n]∞ . Entonces, φ = σ−1

X , pues, para x ∈ X,φxi = Φ (xi−1xi) = xi−1 =σ−1X xi.

Ejemplo 1.44. A cualquier alfabeto, U = AN (N ≥ 1), X cualquier espacio shift sobre A,y φ = βN (la presentación en N -bloques con solape de X). Entonces φ es un CVD con memoria0 y anticipación N − 1 inducido por Φ denida como

Φ (a1 · · · aN) =

aN...a1

Ejemplo 1.45. En relación al ejemplo anterior, β−1N es también un CVD desde X [N ] hacia

X, con memoria y anticipación 0, inducido por Φ denida como

Φ

aN...a1

= a1

Los CVD para los cuales m = 0 = n se llaman códigos monobloque, dado que actúanmirando bloques que tienen un solo símbolo (el que corresponde al presente).

Si un CVD φ con dominio X es tal que φ(X) es un subconjunto de algún espacio shiftY ⊆ UZ, podemos mirar a φ como una función entre los espacios shift X e Y , y diremosentonces que el CVD es un código entre los espacios shift X e Y .

No cualquier función φ entre dos espacios shift X e Y es un CVD. Para que lo sea, de-bemos encontrar un m, un n y una Φ : Bm+n+1(X) → B1(Y ) tal que ∀x ∈ X, ∀i ∈ Z, φxi =Φ(x[i−m,i+n]

). Si no es posible el hallazgo de una función inductora, φ no es un CVD.

Ejemplo 1.46. A = 0, 1 = U , X = AZ, Y = UZ, φ : X → Y denida por

φ (x) =

0∞ si x = 0∞

1∞ si x 6= 0∞

Veamos que φ no es un CVD. Supongamos que lo fuera. Debe haber una función inductora Φcon memoria m y anticipación n. Sea x = (xi)i∈Z denido por xn+1 = 1, y xi = 0 para todoi 6= n + 1. Ya que es (φ0∞)0 = 0 (pues φ0∞ = 0∞), debe ser Φ (0m+n+1) = 0. Pero entoncesφx0 = Φ

(x[−m,n]

)= Φ (0m+n+1) = 0. Contradicción, pues por la denición de φ se tiene que

φ(x) = 1∞, de donde φx0 = 1. La contradicción proviene de suponer que φ es CVD.

A veces será conveniente agrandar el ancho de la ventana para la función inductora (sinmodicar, obviamente, el CVD en cuestión). Para hacer esto, simplemente debemos ignorar lascoordenadas añadidas a la ventana. Esto es lo que dice el siguiente resultado:

Proposición 1.47. Sea φ : X → Y un código de ventana deslizante con memoria my anticipación n. Sean M ≥ m y N ≥ n. Entonces existe un código de ventana deslizante

φ : X → Y con memoria M y anticipación N tal que φ = φ.

Page 17: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

6. CÓDIGOS DE VENTANA DESLIZANTE 13

Demostración. Sea Φ : Bm+n+1(X) → B1(Y ) la función inductora de φ. DenamosΦ : BM+N+1(X)→ B1(Y ) mediante

Φ (a−Ma−M+1 · · · a−m · · · a−1a0a1 · · · an · · · aN) = Φ (a−m · · · a0 · · · an)

y hagamos φ = Φ[−M,N ]∞ . Sea x ∈ X. Para cualquier i ∈ Z, se tiene que φxi = Φ

(x[i−M,i+N ]

)=

Φ(x[i−m,i+n]

)= φxi, y entonces φx = φx. Como x es arbitrario, se sigue que φ = φ.

Corolario 1.48. Dado un código de ventana deslizante, se puede suponer que su memoriaes igual a su anticipación.

Dado un CVD con memoria m y anticipación n inducido por una transformación de bloquesΦ (que transforma bloques de tamaño m + n + 1 en símbolos), se puede denir, de maneranatural, una función Φ∗ que transforma bloques de tamaño m+ n+ k (k ≥ 1), haciendo

Φ∗ (a−m · · · a0a1 · · · anan+1 · · · an+k−1) = Φ (a−m · · · an) Φ (a−m+1 · · · an+1) · · ·Φ (ak−m−1,n+k−1)

Si además convenimos en que Φ∗, aplicado a un bloque de tamaño menor que m+n+1 producela palabra vacía, tenemos que, para p ≥ 0, es

Φ∗ (a1 · · · ap) =

ε si p < m+ n+ 1Φ (a1 · · · am+n+1) Φ∗ (a2 · · · ap) si p ≥ m+ n+ 1

Notar que φx[i,j] = Φ∗(x[i−m,j+n]

), cualesquiera sean i, j ∈ Z y x ∈ X.

Φ y Φ∗ son funcionalmente tan parecidas que en general usaremos la misma notación Φpara referirnos a ambas.

Un hecho importante a tener en cuenta es que la composición de CVD es otro CVD.

Proposición 1.49. Sean X, Y y Z espacios shift, y supongamos que φ1 : X → Y yφ2 : Y → Z son códigos de ventana deslizante. Entonces φ2 φ1 es un código de ventanadeslizante desde X hacia Z.

Demostración. Supongamos φ1 inducido por Φ1 con memoria m1 y anticipación n1, y φ2

inducido por Φ2 con memoria m2 y anticipación n2. Sea φ : X → Z denido por φx = φ2 (φ1x).Designemos por φ′ al CVD con memoria m1 +m2 y anticipación n1 +n2 inducido por la funciónΦ : Bm1+m2+n1+n2+1(X)→ B1(Z) denida por

Φ (a−m1−m2 · · · a0 · · · an1+n2) = Φ2 (Φ1 (a−m1−m2 · · · a0 · · · an1+n2))

(nótese que Φ1 corresponde en realidad a Φ∗1 como se denió antes). Para x ∈ X y paracualquier i ∈ Z es

φ′xi = Φ(x[i−m2−m1,i+n2+n1]

)= Φ2

(Φ1

(x[i−m2−m1,i+n2+n1]

))= Φ2

((φ1x)[i−m2,i+n2]

)= φ2 (φ1x)i = φxi

de modo que φ′x = φx. Luego, φ = φ2 φ1 es un CVD.

El enunciado anterior, junto a los ejemplos 1.42 y 1.43, permite ver que para cualquierespacio shift X y cualquier k ≥ 1, σkX y σ−kX son CVD.

Si φ : X → Y es un CVD y x ∈ X, entonces calcular φ a la sucesión desplazada σXx da lomismo que desplazar la sucesión φx usando σY . Esta propiedad de conmutar con las σ es unade las claves para saber si una transformación es un CVD.

Proposición 1.50. Sean X e Y dos espacios shift, y k un entero. Si φ es un código deventana deslizante, entonces φ σkX = σkY φ, es decir, el siguiente diagrama conmuta:

XσkX−→ X

↓ φ φ ↓

YσkY−→ Y

Page 18: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

14 1. ESPACIOS SHIFT

Demostración. Supongamos que φ es inducido por Φ con memoria m y anticipaciónn. Debemos probar que ∀x ∈ X,φ

(σkX(x)

)= σkY (φ(x)). Sea entonces i ∈ Z. Se tiene que

φ(σkX(x)

)i

= Φ((σkX(x)

)[i−m,i+n]

)= Φ

(x[i−m+k,i+n+k]

)= Φ

(x[(i+k)−m,(i+k)+n]

)= (φx)i+k =

σkY (φx)i. Como i es arbitrario, se tiene lo deseado.

La condición de conmutar con σ es necesaria, pero no suciente, para que una transformaciónsea CVD. El ejemplo 1.46 sirve para demostrarlo, pues ya hemos visto que la función allíestudiada no es un CVD, y sin embargo conmuta con σ: sea x ∈ 0, 1Z; si x = 0∞, es σx = 0∞ =φx, por lo que σ (φx) = 0∞ = φ (σx); y si x 6= 0∞, es σx 6= 0∞, por lo que φx = φ (σx) = 1∞,teniendo entonces que σ (φx) = 1∞ = φ (σx); resumiendo, ∀x ∈ 0, 1Z, σ (φx) = φ (σx).

Los siguientes resultados establecen condiciones necesarias y sucientes para que una trans-formación entre dos espacios shift sea un CVD.

Lema 1.51. Sean X e Y dos espacios shift, y φ una función de X en Y tal que φσX = σY φ.Entonces φ σ−1

X = σ−1Y φ.

Demostración. Puesto que σX y σY son biyecciones, se tiene que σ−1Y σY y σY σ−1

Y

son la identidad en Y , así como σ−1X σX y σX σ−1

X son la identidad en X. De allí queφ σ−1

X =(σ−1Y σY

)(φ σ−1

X

)= σ−1

Y (σY φ) σ−1X = σ−1

Y (φ σX) σ−1X =

(σ−1Y φ

)(

σX σ−1X

)= σ−1

Y φ, como se quería probar.

Lema 1.52. Sean X e Y dos espacios shift, y φ una función de X en Y tal que φσX = σY φ.Entonces, para todo k ∈ Z, φ σkX = σkY φ.

Demostración. Ya que σ0X y σ0

Y son, respectivamente, la identidad en X y en Y , laproposición se cumple para k = 0. Lo que resta probar es, entonces, que ∀k ≥ 1, φσkX = σkY φy φ σ−kX = σ−kY φ. Lo haremos por inducción sobre k. Para k = 1, es cierto por hipótesis ypor el lema 1.51. Suponiendo válido para k, veamos que vale para k + 1:

φ σk+1X =

(φ σkX

) σX =

(σkY φ

) σX = σkY (φ σX) = σkY (σY φ) = σk+1

Y φφ σ−k−1

X =(φ σ−kX

) σ−1

X =(σ−kY φ

) σ−1

X = σ−kY (φ σ−1

X

)= σ−kY

(σ−1Y φ

)=

σ−k−1Y φ

Proposición 1.53. Sean X e Y dos espacios shift, y φ una función de X en Y . φ es uncódigo de ventana deslizante si, y sólo si, las dos condiciones siguientes se satisfacen simultá-neamente:

1. φ σX = σY φ.2. Existen un entero N ≥ 0 y una función Φ : B2N+1(X) → B1(Y ) tales que para todox ∈ X, (φx)0 = Φ

(x[−N,N ]

).

Demostración. Para la ida, supongamos que φ es inducida por Φ con memoria y anti-cipación N (hemos apelado al corolario 1.48), de modo que para cualquier x en X, (φx)0 =Φ(x[−N,N ]

). Además, la proposición 1.50 con k = 1 muestra que φ σX = σY φ.

Para la vuelta, supongamos que φ σX = σY φ y que existen N ≥ 0 y una funciónΦ : B2N+1(X) → B1(Y ) tales que para todo x ∈ X, (φx)0 = Φ

(x[−N,N ]

). Sean x ∈ X e i ∈ Z.

Por el lema 1.52, se tiene que

(φx)i =(σiY (φx)

)0

=(φ(σiXx

))0

= Φ((σiXx)[−N,N ]

)= Φ

(x[i−N,i+N ]

)lo cual muestra que φ es CVD inducido por Φ con memoria y anticipación N .

La segunda condición de la proposición anterior establece que existe N ≥ 0 tal que (φx)0

es función de lo que x contiene entre las coordenadas −N y N . La negación de esta condiciónsignica que para todo N ≥ 0, existen x, y ∈ X tales que x[−N,N ] = y[−N,N ] pero (φx)0 6= (φx)0.

Page 19: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

6. CÓDIGOS DE VENTANA DESLIZANTE 15

6.1. Inmersiones, factores y conjugaciones. Para las siguientes deniciones, sean Xe Y dos espacios shift, y φ una función de X en Y .

Definición 1.54. φ es una inmersión de X en Y si φ es un código de ventana deslizanteinyectivo. Se dice que X está inmerso en Y si existe una inmersión de X en Y .

Definición 1.55. φ es un código factor de X sobre Y si φ es un código de ventanadeslizante sobreyectivo. Se dice que Y es un factor de X si existe un código factor de X sobreY .

Definición 1.56. φ es una conjugación de X a Y si φ es un código de ventana deslizantebiyectivo. Se dice que X es conjugado a Y (simbolizado X ∼ Y ) si existe una conjugaciónde X a Y .

Por ejemplo, σX y σ−1X son conjugaciones de X a X, βN es una conjugación de X a X [N ], y

β−1N es una conjugación de X [N ] a X.De la denición, se ve que toda conjugación es una función biyectiva. Sin embargo, no es

cierto en general que cualquier función biyectiva entre dos espacios shift sea una conjugación.Por ejemplo, sean X = 0∞, 1∞ , Y = (01)∞, (10)∞ y φ : X → Y dada por φ (0∞) =(01)∞, φ (1∞) = (10)∞. φ es una función biyectiva, pero no es una conjugación pues no esun CVD (condición indispensable para ser conjugación), ya que σY (φ (0∞)) = σY ((01)∞) =(10)∞ 6= (01)∞ = φ (0∞) = φ (σX (0∞)), es decir, φ no conmuta con σ.

La denición establece que una conjugación es un CVD biyectivo (por lo cual, toda conju-gación es también un código factor y una inmersión), y esto nos permite garantizar sólo quesu inversa es una función biyectiva (pero, por lo visto hasta aquí, no necesariamente un CVD).Más adelante, demostraremos que si φ es conjugación, φ−1 es un CVD (y, en consecuencia,también es una conjugación).

Proposición 1.57. La composición de dos conjugaciones es otra conjugación.

Demostración. Se deduce directamente de la proposición 1.49 y del hecho que la compo-sición de funciones biyectivas es una función biyectiva.

Como consecuencia, σkX y σ−kX son también conjugaciones de X a X, para cualquier espacioshift X y cualquier k ≥ 0, pues σX y σ−1

X lo son.Veamos la acción de un CVD sobre los puntos periódicos de un espacio shift. El siguiente

resultado muestra que las inmersiones (y en consecuencia las conjugaciones) preservan el mínimoperíodo de un punto periódico.

Proposición 1.58. Sean φ : X → Y un código de ventana deslizante, x ∈ X un puntoperiódico de período n para σX , e y = φx. Entonces y tiene también período n para σY , y elmínimo período de y divide al mínimo período de x. Si φ es además una inmersión, el períodomínimo de y es igual al período mínimo de x.

Demostración. Ya que σnX(x) = x, tenemos que, por la propiedad de conmutar φ conσ, φx = φ (σnX(x)) = σnY (φx), es decir, y = σnY (y). Entonces y tiene período n para σY . Si xtiene mínimo período n0, entonces y tiene período n0, y el mínimo período de y divide a n0. Siφ es inyectiva, tenemos que σnX(x) = x si, y sólo si, σnY (φx) = φx (la ida está demostrada alprincipio, y para la vuelta: σnY (φx) = φx ⇒ φ (σnX(x)) = φx ⇒ σnX(x) = x por la inyectividadde φ). Entonces, x tiene período n si, y sólo si, y tiene período n. Dicho de otro modo, elconjunto de períodos para x es el mismo que el conjunto de períodos para y, de manera que elperíodo mínimo de x es el mismo que el período mínimo de y.

De esta proposición se deduce que dos espacios shift que no tienen la misma cantidadde puntos periódicos de período n (cualquiera sea n) no pueden ser conjugados. Es decir, lacantidad de puntos de período n de un espacio shift es un invariante por conjugación:∀n > 0, X ∼ Y ⇒ |x ∈ X : x tiene período n| = |x ∈ Y : x tiene período n|.

Page 20: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

16 1. ESPACIOS SHIFT

6.1.1. Recodicación a códigos monobloque. Sea φ : X → Y un CVD. Mostraremos cómoes posible recodicar X a un shift X conjugado a X y φ a un CVD monobloque φ de X aY . Este procedimiento se denomina recodicación de φ a un código monobloque, y seráusado en varias demostraciones posteriores.

Proposición 1.59. Sea φ : X → Y un código de ventana deslizante. Entonces existe unespacio shift X, una conjugación ξ de X a X y un código de ventana deslizante monobloque

φ : X → Y tales que ξ−1 es una conjugación y φ ξ = φ. Si además φ es una conjugación, φtambién lo es.

Demostración. Supongamos que φ es inducida por Φ con memoria m y anticipación n.Tomemos X = X [m+n+1] y ξ = σ−m

X βm+n+1. Dado que σ−m

Xy βm+n+1 son conjugaciones, y

teniendo en cuenta la proposición 1.57, ξ es conjugación de X a X. Su inversa ξ−1 : X → Xestá dada por ξ−1 = β−1

m+n+1 σmX , y es otra conjugación pues β−1m+n+1 y σm

Xlo son. Denamos

φ : X → Y mediante φ = φξ−1. Tenemos que φ es CVD, por ser la composición de dos CVD, y

cumple que φξ = φξ−1ξ = φ. Además, una función inductora para φ es Φ : B1

(X)→ B1(Y )

denida por

Φ

an...a0...

a−m

= Φ (a−m · · · a0 · · · an)

pues para x =

xi+n...xi...

xi−m

i∈Z

∈ X se tiene que

σmX

(x) =

xi+n+m

...xi+m...xi

i∈Z

β−1m+n+1

(σmX

(x))

= (xi)i∈Z ∈ X

y entonces, para cualquier entero j se cumple que

φxj = φ(ξ−1x

)j

= Φ((β−1m+n+1

(σmX

(x)))

[j−m,j+n]

)= Φ

(x[j−m,j+n]

)= Φ

xj+n...xj...

xj−m

de donde se ve que φ es un CVD monobloque.

Si se tiene además que φ es una conjugación, siendo φ la composición de la conjugación ξ−1

con φ, por la proposición 1.57, es φ una conjugación de X a Y .

6.2. Imagen de un espacio shift por un código de ventana deslizante. Hastaahora, hemos visto que un CVD φ actúa transformando puntos de un espacio shift X enpuntos de algún full shift UZ. Cabe preguntarse cómo actúa globalmente φ, en el sentido dequé características tiene φ(X) como subconjunto de UZ. Mostraremos ahora que φ(X) es unespacio shift sobre el alfabeto U .

Page 21: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

6. CÓDIGOS DE VENTANA DESLIZANTE 17

Lema 1.60. Sea φ un código de ventana deslizante monobloque desde un espacio shift Xhacia un full shift UZ. Entonces, φ(X) es un espacio shift sobre el alfabeto U .

Demostración. Llamemos A al alfabeto de X. Supongamos que φ está inducida porΦ : B1(X) → U . Hagamos L = Φ(w) : w ∈ B(X), y veriquemos que φ(X) = XLc , con loque quedará probado que φ(X) es un espacio shift.

1. Sea y ∈ φ(X). Existe x ∈ X tal que y = φx. Sea u tal que u v y. Entonces existeni, j ∈ Z tales que u = y[i,j] = (φx)[i,j] = Φ

(x[i,j]

), es decir, u = Φ(w) con w ∈ B(X).

Luego, u ∈ L, por lo que u /∈ Lc. Como u era un bloque arbitrario de y, vemos quey ∈ XLc . Entonces, φ(X) ⊆ XLc .

2. Sea y ∈ XLc . Entonces todo bloque de y está en L, de donde se deduce que para todon ≥ 0, existe w ∈ B(X) tal que y[−n,n] = Φ(w). Por lo tanto, para todo n ≥ 0, existe

x(n) ∈ X tal que x(n)[−n,n] = w y

(φx(n)

)[−n,n]

= Φ(x

(n)[−n,n]

)= y[−n,n]. Usaremos la sucesión

x(n)n∈N para encontrar un punto x ∈ X tal que φx = y, con lo que quedará probado

que y ∈ φ(X), y, con ello, que XLc ⊆ φ(X). Como A es nito, hay una letra a0 ∈ A yuna cantidad innita de n tales que x(n) tienen al símbolo a0 en la posición 0. Sea S0

el conjunto de todos esos n. Como A3 es nito, hay un subconjunto innito S1 de S0

y símbolos a−1 y a1 tales que ∀n ∈ S1, x(n)[−1,1] = a−1a0a1. Continuando de esta manera,

para cada k ≥ 1 conseguimos un subconjunto innito Sk de Sk−1 y símbolos a−k yak tales que ∀n ∈ Sk, x

(n)[−k,k] = a−k · · · a0 · · · ak. Denamos x = (ak)k∈Z. Ocurrirá que

∀k ≥ 0,∀n ∈ Sk, x(n)[−k,k] = x[−k,k]. Si u = x[i,j] para algunos enteros i y j, haciendo

k = max |i|, |j| será x[−k,k] = x(n)[−k,k] para cualquier n ∈ Sk, por lo que existe n ≥ 0

tal que u v x(n) ∈ X, es decir, u ∈ B(X); puesto que cualquier bloque de x está en ellenguaje del espacio shift X, se tiene que, por el corolario 1.31, x ∈ X. Sea ahora k ≥ 0.Tomemos n ∈ Sk tal que n ≥ k (tal elección es posible pues Sk es un conjunto innito).Tenemos que

(φx)[−k,k] = Φ(x[−k,k]

)= Φ

(x

(n)[−k,k]

)= y[−k,k]

Es decir, ∀k ≥ 0, (φx)[−k,k] = y[−k,k]. Entonces, φx = y.

Teorema 1.61. Sea φ un código de ventana deslizante desde un espacio shift X hacia unfull shift UZ. Entonces, φ(X) es un espacio shift sobre el alfabeto U .

Demostración. Por la proposición 1.59, existe un espacio shift X, una conjugación ξ :

X → X y un CVD monobloque φ : X → Y tales que φ = φ ξ. Como ξ es conjugación, es

ξ(X) = X. Entonces, φ(X) = φ (ξ(X)) = φ(X), que, por lema 1.60, es un espacio shift, y en

consecuencia φ(X) es espacio shift sobre U .

6.3. Inversa de una conjugación. Mostremos ahora que la inversa de una conjugaciónes siempre una conjugación.

Lema 1.62. Sea φ una conjugación monobloque del espacio shift X al espacio shift Y .Entonces, φ−1 es una conjugación de Y a X.

Demostración. Sean A el alfabeto para X y U el de Y . Supongamos que φ está inducidapor Φ : B1(X)→ B1(Y ). Hagamos ψ = φ−1. Debemos mostrar que ψ es un CVD biyectivo deY a X. Por ser la inversa de una función biyectiva, ψ es también biyectiva, así que sólo restavericar que es CVD, para lo que usaremos la proposición 1.53.

1. Por ser φ un CVD, tenemos que φσX = σY φ, por lo que ψφσX ψ = ψσY φψ,y entonces σX ψ = ψ σY . Por lo tanto, ψ cumple la condición de conmutar con σ.

Page 22: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

18 1. ESPACIOS SHIFT

2. Supongamos que no existe un N ≥ 0 tal que para todo y ∈ Y , (ψy)0 dependa dey[−N,N ]. Esto quiere decir que para cada n ≥ 0 existen y(n) e y(n) en Y tales que y(n)

[−n,n] =

y(n)[−n,n] pero ψ

(y(n))

06= ψ

(y(n))

0. Llamemos x(n) = ψ

(y(n))y x(n) = ψ

(y(n)). Tenemos

que, para cada n ≥ 0, tanto x(n) como x(n) están en X, y además x(n) 6= x(n) puesambos dieren en la coordenada 0. Consideremos las dos sucesiones en X,

x(n)n∈N y

x(n)n∈N. Como A es nito, debe haber un símbolo a0 ∈ A, y un conjunto innito S ′0

de enteros tal que ∀n ∈ S ′0,(x(n))

0= a0; nótese que ∀n ∈ S ′0,

(x(n))

06= a0. Puesto que

A es nito, debe haber un símbolo b0 6= a0 y un subconjunto innito S0 de S ′0 tal que∀n ∈ S0,

(x(n))

0= b0. Observar que, entonces, ∀n ∈ S0,

(x(n))

0= a0 6= b0 =

(x(n))

0.

Como la cantidad de bloques en A3 es nita, debe haber un subconjunto innito S ′1 deS0 y símbolos a−1 y a1 tales que ∀n ∈ S ′1,

(x(n))

[−1,1]= a−1a0a1, y consecuentemente

debe haber un subconjunto innito S1 de S ′1 y símbolos b−1 y b1 tales que ∀n ∈ S1,(x(n))

0= b−1b0b1. Notar que ∀n ∈ S1,

(x(n))

[−1,1]= a−1a0a1 6= b−1b0b1 =

(x(n))

[−1,1].

Continuando de esta manera, para cada k ≥ 1 encontramos un subconjunto innito Skde Sk−1 y símbolos a−k, ak, b−k y bk tales que ∀n ∈ Sk,

(x(n))

[−k,k]= a−k · · · a0 · · · ak 6=

b−k · · · b0 · · · bk =(x(n))

[−k,k]. Tomemos x = (ak)k∈Z y x = (bk)k∈Z. Obsérvese que ∀k ≥

0,∀n ∈ Sk, x[−k,k] = x(n)[−k,k] y x[−k,k] = x

(n)[−k,k]. Si u = x[i,j] para algunos enteros i y j,

haciendo k = max |i|, |j| será x[−k,k] = x(n)[−k,k] para cualquier n ∈ Sk, por lo que existe

n ≥ 0 tal que u v x(n) ∈ X, es decir, u ∈ B(X); puesto que cualquier bloque de x estáen el lenguaje del espacio shift X, se tiene que, por el corolario 1.31, x ∈ X. Igualmente,x ∈ X. Además, x 6= x pues x0 = a0 6= b0 = x0. Sea ahora k ≥ 0. Tomemos n ∈ Sk talque n ≥ k (tal elección es posible pues Sk es un conjunto innito). Tenemos que

(φx)[−k,k] = Φ(x[−k,k]

)= Φ

(x

(n)[−k,k]

)= y

(n)[−k,k] = y

(n)[−k,k]

= Φ(x

(n)[−k,k]

)= Φ

(x[−k,k]

)= (φx)[−k,k]

Es decir, ∀k ≥ 0, (φx)[−k,k] = (φx)[−k,k]. De allí, tendríamos que φx = φx pese a serx 6= x. Contradicción a la inyectividad de φ. La contradicción proviene de suponer queno hay un N ≥ 0 tal que ψy0 es función de y[−N,N ].

Teorema 1.63. Sea φ una conjugación del espacio shift X al espacio shift Y . Entonces,φ−1 es una conjugación de Y a X.

Demostración. Por la proposición 1.59, existe un espacio shift X, una conjugación ξ :

X → X y una conjugación monobloque φ : X → Y tales que ξ−1 es conjugación y φ = φ ξ.Entonces φ−1 = ξ−1 φ−1, y, por aplicación del lema 1.62 y la proposición 1.57, φ−1 resulta sertambién una conjugación.

Page 23: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

1. ESPACIOS SHIFT 19

EJERCICIOS

1. Para A = 0, 1 y n entero positivo, cuente la cantidad de puntos periódicos de períodon que hay en AZ. ¾Cuántos de ellos tienen período mínimo 8? ¾En cuántos de estosúltimos ocurre el bloque 011101?

2. Considere A = Z2, dotado con la operación de suma módulo 2. Denamos la operación∗ : AZ×AZ → AZ estableciendo (x ∗ y)i = xi + yi (mod 2) (∀x, y ∈ AZ, i ∈ Z). Mostrarque

(AZ, ∗

)tiene estructura de grupo. Muestre que esto mismo ocurre también si (A, ·)

es cualquier grupo nito y (x ∗ y)i = xi · yi.3. Analice si las siguientes operaciones ∗ denidas para x, y ∈ 0, 1Z son operaciones

binarias en AZ. En tal caso, analice si son asociativas y si tienen elemento neutro.

a) (x ∗ y)i =

xnyn si ∃n ∈ Z : n2 = i0 en cualquier otro caso

b) (x ∗ y)i = xi−1 + xi + xi+1 + yi−1 + yi + yi+1 (mod 2)4. Para A alfabeto nito, sea la función d : AZ ×AZ → R denida por

d(x, y) =

0 si x = y2−mın|k|:xk 6=yk si x 6= y

a) Muestre que d es una métrica para AZ.b) ¾Es (AZ, d) un espacio acotado?c) ¾Cuándo dos puntos x, y ∈ AZ están a distancia menor que 1/16 para esta métrica?d) Dado un entero k, ¾cuándo dos puntos x, y ∈ AZ están a distancia menor que 2k

para esta métrica?e) Dado un real ε > 0 y x ∈ AZ, caracterice, para este espacio, el entorno de radio ε

alrededor de x ∈ AZ en términos de los símbolos de x.5. Sobre A = 0, 1, 2, dé tres ejemplos de conjuntos F tales que:

a) F sea nito y XF también.b) F sea nito y XF sea innito.c) F sea innito y XF sea nito.d) F sea innito y XF también.

6. Muestre que cada uno de los siguientes conjuntos X es un espacio shift sobre 0, 1,encontrando F tal que X = XF :a) X es el conjunto de todas las sucesiones bi-innitas tales que entre dos ocurrencias

consecutivas de 1 hay una cantidad par de 0 (X se llama el shift par).b) X es el conjunto de todas las sucesiones bi-innitas tales que la cantidad de 0 entre

dos ocurrencias consecutivas de 1 es 1, 2 o 3.c) X es el conjunto de todas las sucesiones bi-innitas tales que los 1 ocurren con

frecuencia innita en ambas direcciones, y la cantidad de 0 entre dos ocurrenciasconsecutivas de 1 es 1, 2 o 3 (X se llama el shift de paso limitado 1− 3).

7. Muestre que los siguientes conjuntos X no son espacios shift sobre 0, 1, a pesar de serσ-invariantes. Obtenga, en cada caso, B(X) y un espacio shift X ′ tal que B(X ′) = B(X)(describa también en forma coloquial a X ′).a) X es el conjunto de todas las sucesiones bi-innitas en las que al menos una coor-

denada es 1.b) X es el conjunto de todas las sucesiones bi-innitas en las que exactamente dos

coordenadas valen 1.8. Suponga que X es un espacio shift sobre el alfabeto A y que este último es subconjunto

de otro alfabeto A′. Demuestre que X es también un espacio shift sobre A′.9. a) Encuentre dos espacios shift XF1 y XF2 tales que XF1 ∪ XF2 XF1∩F2 .

b) Encuentre dos espacios shift XF1 y XF2 tales que XF1 ∪ XF2 = XF1∩F2 .

Page 24: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

20 1. ESPACIOS SHIFT

10. Sea A un alfabeto, I un conjunto arbitrario (de índices), y para cada λ ∈ I, supóngasedenido Fλ ⊂ A∗. Muestre que⋂

λ∈I

XFλ = X⋃λ∈I Fλ

11. Sea X = XF , y w un bloque sobre el correspondiente alfabeto.a) Suponga que ningún subbloque de w pertenece a F . ¾Garantiza ésto que w ∈ B(X)?b) Suponga que todo bloque de F es más largo que w. ¾Garantiza ésto que w ∈ B(X)?

12. Sea A un alfabeto.a) Suponga que X1 y X2 son espacios shift tales que X1 ∪ X2 = AZ. Muestre que

entonces debe ser X1 = AZ o X2 = AZ. ¾Es AZ un espacio shift irreducible?b) Suponga que para cada λ en un conjunto arbitrario I está denido un espacio shift

Xλ. Muestre que si⋃λ∈I Xλ = AZ, entonces existe λ ∈ I tal que Xλ = AZ.

c) Encuentre un espacio shift X que puede descomponerse como la unión de dos espa-cios shift X1 y X2 de modo tal que ni X1 ni X2 son iguales a X. ¾Es X irreducible?

13. Muestre que si X es un espacio shift irreducible, entonces para cualquier par de bloquesu,w ∈ B(X) existe un bloque no vacío v ∈ B(X) tal que uvw ∈ B(X).

14. Considere A = 0, 1, y los siguientes subconjuntos X1, X2, X3 de AZ:

X1 =x ∈ AZ : ∀i ∈ Z, xi 6= xi+1

X2 =

x ∈ AZ : ∃k ∈ Z : (xi = 0⇔ i ≤ k)

X3 =

x ∈ AZ : (∀i ∈ Z, xi = 0) ∨ ∃!k ∈ Z : xk = 1

a) Especique si 0∞ pertenece o no a cada uno de los conjuntos.b) Sólo uno de los tres conjuntos no es un espacio shift. Especique cuál es (Sugerencia:

especique un punto que no esté en el conjunto, pero que tenga todos sus bloques enel lenguaje del conjunto). Para cada uno de los que sí son espacios shift, especiqueexplícitamente una familia de bloques prohibidos.

c) Decida si los conjuntos que son espacios shift son o no irreducibles.15. Sean X1 y X2 espacios shift sobre A.

a) Muestre que B(X1) ∪ B(X2) es el lenguaje de algún espacio shift. (Sugerencia: usela caracterización de los lenguajes de los espacios shift.)

b) Pruebe que X1 ∪X2 es un espacio shift.16. Sea X un espacio shift. Una palabra w se llama primer ofensor para X si w /∈ B(X)

pero todo subbloque propio de w pertenece a B(X).a) Muestre que si hacemos O = w : w es primer ofensor para X, entonces X = XO.b) Demuestre que si X = XF , entonces para todo w ∈ O existe f ∈ F tal que w v f .

17. Sean X1 el shift de la razón de oro, y X2 el shift par.a) Especique el alfabeto de X [3]

1 y X [3]2 .

b) Encuentre F1 y F2 tales que X[3]1 = XF1 y X

[3]2 = XF2 .

18. Sean X e Y espacios shift sobre un mismo alfabeto, y N entero positivo. Muestre que

(X ∩ Y )[N ] = X [N ] ∩ Y [N ] (X ∪ Y )[N ] = X [N ] ∪ Y [N ]

19. Demuestre que si X es un espacio shift y N es un entero positivo, entonces βN σX =σX[N ] βN .

20. En cada uno de los siguientes casos, se dene una función φ de AZ en UZ, y se pidedeterminar si φ es un CVD, y si φ conmuta con las respectivas dinámicas. En caso de serun CVD, muestre una función inductora, con su correspondiente memoria y anticipación.a) A = 0, 1 = U , y para x ∈ AZ e i ∈ Z,

(φ(x)

)i

= xi−1xi + xi+2 (mod 2).b) A = 0, 1 = U , y para x ∈ AZ e i ∈ Z,(

φ(x))i

=

xi−1 si i es parxi+1 si i es impar

Page 25: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

1. ESPACIOS SHIFT 21

c) A = 0, 1 = U , y

φ(x) =

0∞ si ∃!k ∈ Z : xk = 11∞ si no

d) A = 0, 1, 2, U = a, b, y

φ(x) =

(ab)∞ si x0 = 2(ba)∞ si x[0,1] = 00(aab)∞ si x[0,1] = 01(aaba)∞ si x[0,1] = 10(aabaa)∞ si x[0,1] = 11

e) A = 0, 1 = U , y

φ(x) =

0∞ si x0 = 01∞ si x0 = 1

21. Sea A = 0, 1 = U , y X = X01,10. Sea φ : X → UZ denida por

φ(x) =

0∞ si x0 = 01∞ si x0 = 1

¾Es φ un CVD? De serlo, muestre una función inductora, indicando memoria y antici-pación.

22. Sea X un espacio shift sobre A, y φ un CVD denido en X, inducido por Φ con memoriam y anticipación n. Sea φ′ el CVD inducido por esa misma Φ, pero con memoria m′ yanticipación n′ (siendo m′ + n′ = m+ n). ¾Qué relación hay entre φ y φ′?

23. Para A = 0, 1, considere Φ : A2 → A según la siguiente tabla:

w 00 01 10 11Φ(w) 0 1 1 0

Sea φ el CVD sobre AZ con memoria 0 y anticipación 1 inducido por Φ, y considereu = 0010110001.a) Obtenga Φ(u).b) Encuentre una función Φ1 que induzca a φ con memoria 1 y anticipación 2. Obtenga

Φ1(u).c) Encuentre una función Φ2 que induzca a φ de modo que la memoria y la anticipación

sean iguales. Obtenga Φ2(u).d) ¾Existe una función Φ3 : A → A que induzca a φ con memoria y anticipación 0?e) Recodique Φ1 a un código monobloque.f ) ¾Es φ φ un CVD? De serlo, encuentre una función inductora, especicando su

memoria y anticipación.g) Vista como función de AZ en AZ, ¾es φ una transformación factor? ¾Una inmersión?

¾Una conjugación?24. Suponga que X e Y son dos espacios shift sobre los alfabetos A y U respectivamente,

y que φ es un CVD de X a Y de memoria m y anticipación n inducido por Φ :Bm+n+1(X) → B1(Y ). ¾Qué relación hay entre la inyectividad de φ y la de Φ? ¾Entrela sobreyectivdad de ambas funciones? ¾Entre la biyectividad de ambas funciones?

25. Sean X e Y espacios shift conjugados. Muestre que X es irreducible si, y sólo si, Y loes.

26. ¾Es 0, 1Z conjugado a 0, 1, 2Z? ¾Es el shift de la razón de oro conjugado al shiftpar?

27. En 0, 1Z, denamos el CVD φ de memoria 1 y anticipación 2 inducido por

Φ(abcd) = b+ a(c+ 1)d (mod 2)

Page 26: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

22 1. ESPACIOS SHIFT

Muestre que φ es una conjugación, viendo que φφ es la identidad. (Sugerencia: describala acción de φ sobre x ∈ 0, 1Z en términos de los bloques 1001 y 1101 que aparecenen x.)

28. Sea φ un CVD entre los espacios shift X e Y , y sea Z un subshift de Y . Muestre queφ−1(Z) es un subshift de X.

29. a) Demuestre que la conjugación de espacios shift establece una relación de equivalenciaen la familia de todos los espacios shift.

b) Sea S un subconjunto innito de los enteros no negativos. Sea X(S) el conjunto detodas las sucesiones binarias bi-innitas x tales que si 10k1 v x, entonces k ∈ S.Muestre que X(S) es un espacio shift.

c) Pruebe que si S1 y S2 son dos subconjuntos innitos de N, con S1 6= S2, entoncesX(S1) y X(S2) no son conjugados (Sugerencia: analice puntos periódicos). En rela-ción al ítem 29a, concluya que hay una cantidad innita no numerable de clases deequivalencia.

Page 27: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

Capítulo 2

SHIFTS DE TIPO FINITO

Los espacios shift que pueden ser descriptos por un conjunto nito de bloques prohibidosse llaman shifts de tipo nito (abreviado STF). A pesar de ser los más simples, juegan un rolfundamental en ciertas áreas de la Matemática, tales como sistemas dinámicos. Su estudio tam-bién ha proporcionado soluciones a problemas prácticos de importancia, tales como encontraresquemas de codicación ecientes para almacenar datos en discos de computadoras.

Una razón por la que los STF son tan útiles es que tienen una representación sencillausando un grafo nito dirigido. Preguntas sobre el shift pueden, a menudo, reformularse comopreguntas sobre la matriz de adyacencia del grafo. Resultados básicos del álgebra lineal nosayudan a analizar esta matriz y encontrar respuestas.

En este capítulo, primero presentamos los STF, y damos algunos ejemplos típicos. Luegose explica las conexiones con los grafos dirigidos y las matrices, e introducimos la fundamentaloperación de desdoblamiento de estados. Concluimos con una breve descripción sobre el almace-namiento magnético, indicando por qué los shifts de paso limitado constituyen la característicacentral de la mayoría de los métodos más usados para el almacenamiento de datos en discosrígidos de computadoras.

1. Restricciones de tipo nito

Primero denimos shifts de tipo nito, y luego explicamos el hecho de que tienen unapropiedad (markoviana) de memoria nita.

Definición 2.1. Un shift de tipo nito (STF) es un espacio shift que puede describirsepor un conjunto nito de bloques prohibidos, es decir, un espacio shift X para el cual existealgún conjunto nito F de bloques tal que X = XF .

Ya hemos tratado antes con varios STF.

Ejemplo 2.2. El full shift AZ es un STF: podemos tomar simplemente F = ∅ pues nadaestá prohibido, de modo que AZ = XF .

Ejemplo 2.3. El shift de la razón de oro X (ejemplo 1.10) es un STF, pues podemos tomarF = 11, obteniendo X = XF .

Ejemplo 2.4. Sea X el conjunto de todos los puntos de e, f, gZ tales que e puede serseguido sólo por e o por f , f puede ser seguido sólo por g, y g puede ser seguido sólo por e o porf . Entonces X es el espacio shift que resulta de tomar F = eg, fe, ff, gg, y, en consecuencia,es un STF.

Notemos que un STFX podría también describirse mediante un conjunto innito de bloquesprohibidos. De hecho, la proposición 1.29 muestra que ésto puede ocurrir siempre que X no seael full shift, pues el complemento del lenguaje de X es innito. La denición de STF sólo pideque exista algún F adecuado.

Supongamos que X ⊆ AZ es STF, y que X = XF para una colección nita F de bloques.Sea N la longitud del bloque más largo en F . Si formamos la colección FN de todos los bloquesde longitud N sobre A que contienen algún subbloque en F , entonces tendremos que XFN = XF(prop. 1.21) y los bloques de FN tienen todos la misma longitud N . Por ejemplo, si A = 0, 1y F = 11, 000, entonces F3 = 110, 111, 011, 000. A veces, será conveniente asumir que

23

Page 28: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

24 2. SHIFTS DE TIPO FINITO

este procedimiento ya ha sido llevado a cabo, y que todos los bloques prohibidos tienen iguallongitud.

Si todos los bloques en F tienen longitud N , entonces x ∈ AZ está en XF exactamentecuando x[i,i+N−1] /∈ F para todo i ∈ Z, o, equivalentemente, cuando x[i,i+N−1] ∈ BN(XF) paratodo i ∈ Z (Supongamos que ∀i ∈ Z, x[i,i+N−1] /∈ F . Sea u un bloque de x. Si |u| 6= N, u /∈ Fpues F tiene sólo bloques de tamaño N , y si |u| = N, u /∈ F por la hipótesis; entonces ningúnbloque de x está en F , por lo que x ∈ XF y ∀i ∈ Z, xi,i+N−1] ∈ B (XF). Recíprocamente, si unbloque de tamaño N está en BN (XF), no puede estar en F). Luego, para determinar si x estáo no en XF , sólo necesitamos escanear las coordenadas de x con una ventana de ancho N , yvericar que cada bloque visto a través de esta ventana está en la colección permitida BN(X).Esta observación es, a menudo, útil cuando se debe decidir si un dado espacio shift es o no detipo nito.

Ejemplo 2.5. El shift par X (ejemplo 1.13) no es un STF, pues, si lo fuera, existiría N ≥ 1y una colección de N -bloques tal que X = XF . En dicha colección, no puede haber bloquesde la forma 0k, ni 0k10l para ningún k, l ≥ 0, ya que · · · 000010000 · · · ∈ X. Pero entonces· · · 0000102N+110000 · · · ∈ XF pues ninguno de sus N -bloques está en F . Sin embargo, esepunto no pertenece a X por la denición del shift par.

Hay también una noción de memoria para un STF.

Definición 2.6. Un shift de tipo nito es de memoria M si puede describirse medianteuna colección de bloques prohibidos que tienen todos longitud M + 1.

Para motivar esta denición, supongamos que todos los bloques de F tienen longitudM+1.Sea u = a1a2 · · · an un bloque con longitud n mucho mayor que M . Supongamos que unamáquina lee los símbolos de u uno por vez, de izquierda a derecha. Para que esta máquinadetecte si u contiene o no un bloque prohibido, sólo debe recordar los previos M símbolosleídos, es decir, necesita sólo M espacios de memoria.

Observación 2.7. Sea X un STF de memoria M , descripto a través de un conjunto F debloques de longitud M + 1.

1. Sea u un bloque de A∗ que no contiene ningún subbloque en F . Esto no garantiza queu ∈ B(X). Por ejemplo: F = 10, 11, u = 001. u no contiene subbloques en F , perou /∈ B(X) pues X = 0∞.

2. Sea F ′ = AM+1−B (XF). Entonces, F ⊆ F ′, y XF ′ = XF . Para ver la primera aserción,si f ∈ F , |f | = M + 1 y f /∈ B (XF), luego f ∈ F ′. Para la segunda, ya que F ⊆ F ′,se tiene que XF ′ ⊆ XF . Si x ∈ XF y u es un bloque de longitud M + 1 que ocurre enx, u ∈ B (XF), por lo que u /∈ F ′. Luego x no contiene bloques en F ′, mostrando quex ∈ XF ′ y, consecuentemente, XF ⊆ XF ′ .

Notar que un STF de memoria M es también de memoria K para todo K ≥ M . Un STFde memoria 0 es simplemente un full shift, pues prohibir bloques de tamaño 1 es meramentequitar letras del alfabeto. Se puede pensar en un STF de memoria 1 como en uno dado poruna colección de símbolos junto con una descripción de cuáles símbolos pueden seguir a cuáles,como en el ejemplo 2.4. Posteriormente veremos muchos ejemplos de tales STF de memoria 1.

Proposición 2.8. Si X es un shift de tipo nito, entonces hay un M ≥ 0 tal que X es dememoria M .

Demostración. Ya que X es de tipo nito, X = XF para alguna colección nita debloques F . Si F = ∅, sea M = 0. Si F 6= ∅, sea M igual a la longitud del bloque más largo enF , menos 1. Nuestra discusión anterior muestra que X es descripto por FM+1 (el conjunto detodas las palabras de largo M + 1 que contienen algún subbloque en F), por lo que X es dememoria M .

Page 29: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

1. RESTRICCIONES DE TIPO FINITO 25

El lenguaje de un STF está caracterizado por la propiedad de que si dos palabras se solapanlo suciente, pueden ser unidas a lo largo del solape para formar otra palabra en el lenguaje.

Teorema 2.9. Sea X un espacio shift sobre el alfabeto A, y M ≥ 0. X es STF de memoriaM si, y sólo si, ∀u, v, w ∈ A∗, uv ∈ B(X) ∧ vw ∈ B(X) ∧ |v| ≥M ⇒ uvw ∈ B(X)

Demostración. Para la necesidad de la condición, sea F una colección de bloques detamaño M + 1 tal que X = XF . Sean u, v y w en A∗ tales que uv y vw estén en B(X) con|v| ≥ M . Existen x e y en X tales que x[i,i+|uv|−1] = uv, y[j,j+|vw|−1] = vw. Consideremos elpunto z = x(−∞,i+|uv|−1]y[j+|v|,∞) = · · ·xi−2xi−1uvwyj+|vw|yj+|vw|+1 · · · . No puede contener unbloque en F pues, al ser |v| ≥M , una ventana de ancho M + 1 no puede ver simultáneamentesímbolos de u, v y w, por lo que todo bloque que esta ventana vea corresponde a un bloque enx o en y. Entonces z ∈ X y uvw ∈ B(X).

Para la suciencia, denamos F = AM+1 − BM+1(X), y veamos que X = XF . Si x ∈ X ei ∈ Z, x[i,i+M ] ∈ BM+1(X), es decir, ∀i, x[i,i+M ] /∈ F . Luego x ∈ XF , y se deduce que X ⊆ XF .Ahora, sea x ∈ XF . Mostremos, por inducción sobre n, que ∀n ≥ M,x[0,n] ∈ B(X). Paran = M es cierto pues x[0,M ] /∈ F , por lo que x[0,M ] ∈ BM+1(X), y, de allí, x[0,M ] ∈ B(X);esto muestra también que ∀n ∈ 0, . . . ,M − 1, x[0,n] ∈ B(X). Supongamos que x[0,n] ∈ B(X).Hagamos u = x[0,n−M ], v = x[n−M+1,n] y w = xn+1. Observemos que uv = x[0,n] ∈ B(X),vw = x[n−M+1,n+1] /∈ F y |vw| = M + 1, por lo que vw ∈ BM+1(X) ⊆ B(X). Además, |v| = M .Entonces uvw ∈ B(X), es decir, x[0,n+1] ∈ B(X). Un razonamiento análogo en la otra direcciónmuestra que ∀m,n ∈ Z, x[m,n] ∈ B(X), es decir, cualquier bloque en x está en B(X), y, siendoX espacio shift, x ∈ X, por lo que XF ⊆ X.

Ejemplo 2.10. El teorema anterior da otra forma de ver que el shift par X no es de tiponito. Pues si lo fuera, sería de memoria M para algún M ≥ 1. Ya que 102M+1 ∈ B(X) y que02M+11 ∈ B(X), deberíamos tener que 102M+11 ∈ B(X), lo que violaría la denición de shiftpar.

Consideremos el CVD φ con memoria 0 y anticipación 1 que tiene por dominio el shift de larazón de oroX, inducido por Φ tal que Φ(00) = 1,Φ(01) = 0 = Φ(10). Ocurre que Φ(u) = 10k1si, y sólo si, existe n ≥ 0 tal que u = 0(01)2n00, por lo que k = 2n. Luego, φ(X) ⊆ Y , dondeY es el shift par. Además, si y ∈ Y , es posible construir x ∈ X tal que y = φ(x) (teniendoen cuenta que si y[i,i+2k+1] = 102k1, entonces debe ser x[i,i+2k+2] = 0(01)k00). Entonces, φ esun código factor del shift de la razón de oro en el shift par, siendo el primero de tipo nitoy el segundo no. Es fácil construir también códigos de ventana deslizante sobreyectivos desdeespacios shift que no son de tipo nito hacia otros que sí lo son (por ejemplo, desde el shift parhacia 0∞ por el CVD de memoria 0 y anticipación 0 inducido por Φ(0) = Φ(1) = 0). Sinembargo, las conjugaciones preservan el carácter de tipo nito.

Teorema 2.11. Sea X un shift de tipo nito, e Y un espacio shift conjugado a X. EntoncesY es un shift de tipo nito.

Demostración. Sean A y U los alfabetos para X e Y respectivamente. Supongamos queX es un STF de memoria M . Sea φ : X → Y una conjugación inducida por Φ, y ψ : Y → Xsu inversa, inducida por Ψ. Podemos suponer que φ y ψ tienen ambas la misma memoria yanticipación l. Sabemos que ψφ es código de ventana deslizante con memoria y anticipación 2l,y que una función inductora es Ψ Φ : B4l+1(X)→ B1(X). Dicha composición de inductoras,aplicada a un bloque a−2l · · · a0 · · · a2l devuelve el carácter central a0; como consecuencia deésto, si s, t y w son bloques con |s| = |t| = 2l, Φ Ψ(swt) = w. Mostraremos que Y esun STF de memoria M + 4l, usando el teorema anterior. Sean u, v, w ∈ U∗ tales que uv ∈B(Y ), vw ∈ B(Y ), |v| ≥ M + 4l, digamos v = v1 · · · vk con k ≥ M + 4l. Existen s, t ∈ B(Y ) :suv ∈ B(Y ), vwt ∈ B(Y ), |s| = |t| = 2l. Sea u′ = Ψ(suv1 · · · v2l), w

′ = Ψ(vk−2l+1 · · · vkwt).Entonces Ψ(suv) = u′Ψ(v) ∈ B(X),Ψ(vwt) = Ψ(v)w′ ∈ B(X). Como |v| ≥ M + 4, será|Ψ(v)| = |v| − 2l ≥M . Luego Ψ(suvwt) = u′Ψ(v)w′ ∈ B(X). Por ello, Φ (Ψ(suvwt)) ∈ B(Y ),es decir, uvw ∈ B(Y ).

Page 30: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

26 2. SHIFTS DE TIPO FINITO

2. Grafos y sus shifts

Un método fundamental para construir shifts de tipo nito se basa en un grafo nito diri-gido, considerando la colección de todos los caminos bi-innitos (es decir, sucesiones de aristasconsecutivas) en el grafo. En un sentido que precisaremos más adelante, cualquier shift de tiponito puede ser recodicado en un shift de aristas. En esta sección, introducimos los shifts dearistas, y usamos la matriz de adyacencia del grafo para responder preguntas sobre su shift.Realmente, la razón por la que un shift de aristas puede ser entendido mucho mejor que unshift general es que podemos aplicar la potente maquinaria del álgebra lineal a su matriz deadyacencia.

Comenzamos con las deniciones básicas concernientes a la teoría de grafos.

Definición 2.12. Un grafo nito dirigido G es una cuaterna (V,Σ, i, t) donde:V es un conjunto nito cuyos elementos llamaremos vértices, nodos o estados.Σ es un conjunto nito cuyos elementos llamaremos aristas o arcos.i es una función de Σ en V . Para una arista a, i(a) se llama vértice inicial de a. También

decimos que la arista a arranca en el nodo i(a).t es una función de Σ en V . Para una arista a, t(a) se llama vértice terminal de a.

También decimos que la arista a termina en el nodo t(a).

Una manera cómoda de visualizar un grafo es mediante un dibujo donde los nodos serepresentan por círculos (con el nombre del nodo en su interior) y cada arista a medianteuna echa desde i(a) hasta t(a), con un rótulo que indica su nombre. La gura 1 muestraun grafo con V = I, J y ocho aristas, teniéndose que, por ejemplo, i(e) = I, t(e) = J ,i(f) = t(f) = i(g) = t(g) = J , etc.

Figura 1. Un grafo típico

Muchas veces, cuando hagamos referencia a distintos grafos en forma simultánea, emplea-remos la notación V (G), Σ(G), iG y tG para indicar conjuntos de nodos, aristas y funcionesinicial y terminal de un grafo G en particular.

Definición 2.13. Sea G = (V,Σ, i, t) un grafo.

Para nodos I, J de G, denotaremos por ΣI al conjunto de todas las aristas de G quearrancan en I, es decir, ΣI = a ∈ Σ : i(a) = I. Similarmente, ΣJ denotará al conjuntode todas las aristas de G que terminan en J , es decir, ΣJ = a ∈ Σ : t(a) = J.Reservamos el símbolo ΣJ

I para el conjunto de todas las aristas de G que empiezan enI y terminan en J , es decir ΣJ

I = a ∈ Σ : i(a) = I, t(a) = J. Llamamos grado desalida de I a |ΣI |, la cantidad de aristas que arrancan en I, y grado de entrada de Ja∣∣ΣJ∣∣, la cantidad de aristas que llegan a J . La matriz de adyacencia AG del grafo

G se dene como la matriz cuadrada de |V | × |V | indizada por V , cuyo elemento en laposición IJ es (AG)IJ =

∣∣ΣJI

∣∣. Es decir, (AG)IJ es la cantidad de aristas de I a J en G.Un lazo, bucle o rulo en G es una arista a tal que i(a) = t(a).Un camino π en el grafo G es una sucesión nita de aristas π = e1e2 · · · ek tal que∀i ∈ 1, . . . , k − 1, t (ei) = i (ei+1). Denimos el vértice inicial del camino π comoi(π) = i (e1), el vértice inicial de la primera arista del camino, y el vértice nal deπ como t(π) = t (ek), el vértice nal de la última arista del camino. La longitud del

Page 31: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

2. GRAFOS Y SUS SHIFTS 27

camino π es la cantidad de aristas que contiene, denotada por |π|. Es decir, |π| = k. Lasucesión vacía cumple también con la denición de camino, con longitud 0 y vérticesinicial y nal idénticos, pudiendo ser cualquiera de los nodos de G. Un ciclo en G es uncamino π en G tal que i(π) = t(π). Un ciclo simple en G es un ciclo π = e1 · · · ek talque los estados i (e1) , . . . , i (ek) son distintos.

Desde el punto de vista de la dinámica simbólica, interesa la conectividad de las aristas deun grafo, no los nombres de las mismas ni de los vértices del grafo. Por ello, grafos diferentespueden en realidad representar un mismo objeto desde ese punto de vista.

Definición 2.14. Dados dos grafos G y H, un homomorsmo de G a H es un par defunciones (∂,Φ) con ∂ : V (G) → V (H) y Φ : Σ(G) → Σ(H) tales que ∀e ∈ Σ(G), iH (Φ(e)) =∂ (iG(e)) y tH (Φ(e)) = ∂ (tG(e)). En caso de ser ambas funciones inyectivas, el homomorsmose llama inmersión de G en H. Si ambas funciones son biyectivas, se llama isomorsmoentre G y H. Dos grafos se dicen isomorfos si hay un isomorsmo entre ellos, y en ese casoescribimos G ∼= H. Un isomorsmo es, a los nes prácticos, simplemente un cambio de nombrede nodos y aristas. La relación de ser isomorfos es una relación de equivalencia entre grafos.

Definición 2.15. Un subgrafo H del grafo G es un grafo tal que V (H) ⊆ V (G), Σ(H) ⊆Σ(G), y las funciones iH y tH son, respectivamente, las restricciones de iG y tG a Σ(H).

En términos de matrices de adyacencia, si H es subgrafo de G se tiene que (AH)I,J ≤ (AG)I,Jpara toda pareja de vértices I, J ∈ V (H).

En cuanto a los isomorsmos, se tiene que dos grafos G y H son isomorfos si, y sólo si,existe una matriz de permutación P tal que AG = PAHP−1. Recordemos que una matriz depermutación es una matriz cuadrada con entradas 0 o 1 que tiene exactamente un 1 en cadala, y exactamente un 1 en cada columna. Es fácil demostrar si P es matriz de permutación,P−1 también lo es, y P−1 = P T . Si (∂,Φ) es un isomorsmo entre G = (V,Σ, iG, tG) y H =(W,Σ′, iH , tH), se dene P con las indizadas según V (G) y columnas indizadas según V (H)mediante

PI,J =

1 si ∂(I) = J0 si ∂(I) 6= J

Resulta directo chequear que P es matriz de permutación. Además, teniendo en cuenta que e ∈ΣJI ⇐⇒ Φ(e) ∈ Σ∂J

∂I , a través de un cálculo rutinario se puede ver que (AGP )I,J = (PAH)I,Jpara todos I, J , de modo que AG = PAHP−1.

Recíprocamente, si G y H son grafos tales que admiten una matriz de permutación P talque AG = PAHP−1, considerando a las las de P en el mismo orden que las de AG y a lascolumnas de P en el mismo orden que las de AH , se dene ∂I = J ⇐⇒ PI,J = 1. De lacondición AG = PAHP−1, se deduce que (AG)I,J = (AH)∂I,∂J , con lo que los grafos G y H sonisomorfos.

2.1. Shifts de aristas. A continuación deniremos el espacio shift generado por un grafo.

Definición 2.16. Sea G un grafo con matriz de adyacencia A. El shift de aristas de G,denotado por XG o XA, es el conjunto de todos los caminos bi-innitos de G. Es decir:

XG = x = (xk)k∈Z : ∀k ∈ Z, xk ∈ Σ ∧ t(xk) = i (xk+1)

Como puede verse, XG es un subconjunto del full shift ΣZ, que tiene como alfabeto elconjunto Σ de aristas del grafo.

Ejemplo 2.17. Sean G1 y G2 los grafos mostrados en la gura 2.Entonces, XG1 es el full shift sobre el alfabeto 0, 1, . . . , r−1, mientras que XG2 es el espacio

shift Xeg,fe,ff,gg del ejemplo 2.4.

Justiquemos que el uso del término shift para los shifts de aristas es adecuado.

Page 32: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

28 2. SHIFTS DE TIPO FINITO

G1 G2

Figura 2. Grafos del ejemplo 2.17

Proposición 2.18. Si G = (V,Σ, i, t) es un grafo, entonces XG es un espacio shift. Másaún, es un shift de tipo nito de memoria 1.

Demostración. Consideremos la colección nita

F = ef ∈ Σ2 : t(e) 6= i(f)y mostremos que XG = XF : Sea x ∈ XG, y k ∈ Z. Debe ser t(xk) = i(xk+1) por la denición deXG. Luego xkxk+1 /∈ F . Entonces, ningún bloque de x está en F , y x ∈ XF . Recíprocamente,sea x ∈ XF , y k ∈ Z. xkxk+1 /∈ F , por lo que t(xk) = i(xk+1). Como esto ocurre para todok ∈ Z, se ve que x ∈ XG.

Como F tiene todos sus bloques de tamaño 2, XG es un shift de tipo nito de memoria1.

Es sencillo demostrar que si G y H son isomorfos, entonces XG y XH son conjugados: si(∂,Φ) es un isomorsmo entre G y H, Φ puede verse como la función inductora (biyectiva) deun código de ventana deslizante de memoria y anticipación 0, que, en vistas de la biyectividadde Φ, resultará ser una conjugación entre XG y XH .

También es fácil ver que si H es subgrafo de G, XH ⊆ XG.Observemos el grafo de la gura 3. En él, la arista a no forma parte de ningún camino

bi-innito, pues desde I = t(a) no arranca ninguna arista. Podemos pensar en el nodo I comoen un nodo muerto. Una situación análoga ocurre con el nodo J , al cual no llega ningunaarista, de modo que las aristas b y c que arrancan en J tampoco pueden formar parte de uncamino bi-innito.

Figura 3. Un grafo con nodos muertos

Definición 2.19. Un nodo de un grafo se llama nodo muerto si a él no llega, o de él nosale, ninguna arista.

Page 33: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

2. GRAFOS Y SUS SHIFTS 29

Los nodos muertos de un grafo G pueden eliminarse, conjuntamente con todas las aristasque a él llegan o salen, sin alterar el shift de aristas asociado. En el subgrafo que resulta de estaeliminación, pueden a su vez haber quedado nodos muertos. Sin embargo, repitiendo el procesode eliminación sobre el subgrafo la cantidad de veces que sea necesaria hasta que no quedennodos muertos, se obtiene como resultado un subgrafo del grafo original que contiene todas lasaristas que forman parte de algún camino bi-innito en G.

Ejemplo 2.20. La gura 4 muestra el resultado del proceso de eliminación de nodos muertosdel grafo de la gura 3.

Figura 4. Eliminación sucesiva de nodos muertos

Definición 2.21. Un grafo se llama esencial si no contiene nodos muertos.

Es fácil ver que si u1 · · ·uk es un bloque de largo k que está en el lenguaje de XG, entoncesu es un camino en G (si u v x ∈ XG, existe j ∈ Z tal que x[j+1,j+k] = u1 · · ·uk, de donde, paracualquier n ∈ 1, . . . , k − 1, es t(un) = t(xj+n) = i(xj+n+1) = i(un+1), por lo que u1 · · ·uk escamino en G). Sin embargo, no es cierto que cualquier camino en un grafo G sea un bloquedel lenguaje de XG. Por ejemplo, cualquier arista vinculada a un nodo muerto en un grafo noesencial es un camino de longitud 1 en G, pero no puede formar parte de un camino bi-innitoen G, por lo que no pertenece a B1 (XG). Sin embargo, todo camino sucientemente largo en ungrafo tiene un subcamino que, con seguridad, pertenece al lenguaje del shift de aristas asociadoa ese grafo.

Lema 2.22. Sea G = (V,Σ, i, t) un grafo, y sea π un camino de longitud mayor o igual que|V | en G. Entonces, existen en G caminos π′, τ, π′′ tales que π = π′τπ′′, donde τ es un ciclo novacío, y, por lo tanto, pertenece a B (XG).

Demostración. Sea n = |π| ≥ |V |. Para cada k ∈ 1, . . . , n, hagamos Ik−1 = i (πk). SeaIn = t(π). Es decir, I0, I1, . . . , In es la sucesión de n + 1 vértices que visita π en su recorrido,desde el estado inicial hasta el nal. Como el grafo tiene a lo sumo n vértices, deben existir j, l,con 0 ≤ j < l ≤ n, tales que Ij = Il. Hagamos π′ = π1 · · · πj (π′ = ε si j = 0), τ = πj+1 · · · πly π′′ = πl+1 · · · πn (π′′ = ε si l = n). Notar que |τ | = l − (j + 1) + 1 = l − j ≥ 1 y que τ es unsubcamino de π, teniendo vértices inicial y nal iguales a Ii. Entonces, τ es un ciclo de largoal menos 1 en G, y, en consecuencia, τ∞ es camino biinnito en G en el que ocurre τ . Luego,τ ∈ B (XG).

Si un grafo es esencial, hay correspondencia entre los caminos del grafo y los bloques dellenguaje del shift de aristas.

Lema 2.23. Sea G un grafo esencial. Entonces, el conjunto de los caminos (nitos) en Ges un precisamente el conjunto de bloques en el lenguaje de XG.

Page 34: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

30 2. SHIFTS DE TIPO FINITO

Demostración. Por nuestros comentarios anteriores, ya sabemos que los bloques en ellenguaje de XG son caminos en G. Probemos ahora que, bajo la hipótesis de que G es esencial,los caminos de G son bloques en el lenguaje de XG. Sea π un camino en G. Por ser G esencial,hay una arista a1 que llega a i(π) y una arista b1 saliendo de t(π). Inductivamente, para cadak ≥ 2, hay una arista ak llegando a i(ak−1) y una arista bk−1 saliendo de t(bk). Entonces,· · · a2a1πb1b2 · · · es camino bi-innito en G, y π ocurre en él. Luego, π está en B (XG).

Proposición 2.24. Si G =(V (G),Σ(G), iG, tG

)es un grafo, existe un único subgrafo H

de G tal que H esencial y XG = XH .

Demostración. Sea Σ(H) = B1 (XG), es decir, el conjunto de todas las aristas de G queintervienen en algún camino bi-innito en G. Hagamos V (H) = i(a) : a ∈ Σ(H), el conjuntode nodos visitados por las aristas de H, y sean iH y tH las respectivas restricciones de iG y tGa Σ(H). Entonces H es subgrafo de G, y, en consecuencia, cualquier camino bi-innito en H estambién camino bi-innito en G, así que XH ⊆ XG.

Veamos que también XG ⊆ XH : si x ∈ XG, se tiene que para todo k ∈ Z, xk y xk+1 estánambos en B1 (XG), y además tG(xk) = iG(xk+1). Luego, para todo k ∈ Z, es xk ∈ Σ(H) yademás tH(xk) = tG(xk) = iG(xk+1) = iH(xk+1), de donde x ∈ XH .

Además, H es esencial, pues si I ∈ V (H), debe haber una arista a ∈ Σ(H) tal que I = iG(a).Como a ∈ B1 (XG), existe x ∈ XG tal que xk = a para algún k ∈ Z. Entonces tH(xk−1) =tG(xk−1) = iG(xk) = iH(xk) = I, mostrando que la arista xk−1 llega a I y la arista xk sale desdeI.

Para ver que H es único, consideremos cualquier subgrafo esencial H ′ de G tal que XH′ =XG. Si hubiera una arista en H que no esté en H ′ o una en H ′ que no esté en H, seríaB1 (XH) 6= B1 (XH′) (lema 2.23, considerando que H y H ′ son esenciales), por lo que B (XG) =B (XH) 6= B (XH′), es decir, sería XG 6= XH′ , y tendríamos una contradicción. Luego, H yH ′ tienen las mismas aristas, y siendo ambos esenciales, tienen también los mismos nodos, dedonde concluimos que ambos son iguales.

Ya que el subgrafo H de la proposición anterior contiene la única parte de G usada para ladinámica simbólica, usualmente restringiremos nuestra atención a los grafos esenciales.

La matriz de adyacencia de un grafo puede usarse para obtener información sobre la cantidadde caminos de longitud n ≥ 0 en el grafo, y, consecuentemente, si el grafo es esencial, paraobtener la cantidad de bloques de tamaño n en B (XG), esto es, |Bn (XG)|.

Proposición 2.25. Sea G un grafo con matriz de adyacencia A, y sea n ≥ 0. Entonces:

1. Para vértices I, J cualesquiera en G, el número de caminos de longitud n desde I hastaJ en G es (An)IJ , es decir, la posición IJ de la matriz An.

2. El número de ciclos de longitud n en G es tr(An), la traza de An, y es igual al númerode puntos periódicos de XG de período n.

Demostración.

1. Probamos por inducción sobre n. Sean I, J ∈ V (G). Si I = J , (A0)IJ = 1, y el únicocamino de I a J de longitud 0 es el camino vacío; si I 6= J , (A0)IJ = 0 y no hay caminoen G de I a J de longitud 0. Luego, la proposición es verdadera para n = 0. Supongamosque la proposición es cierta para n. Un camino de I a J de longitud n + 1 consiste enun camino de longitud n de I a K seguido de una arista desde K hasta J , donde K esalgún nodo. La cantidad de caminos de longitud n+ 1 de I a J cuyo penúltimo vérticevisitado es K es entonces la cantidad de caminos de longitud n de I a K multiplicadapor la cantidad de aristas de K a J , que por hipótesis inductiva y denición de matrizde adyacencia es (An)IK AKJ . Para obtener todos los caminos desde I a J en G delongitud n+ 1 hacemos variar a K en el conjunto de nodos de G y sumamos. Es decir,

Page 35: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

3. REPRESENTACIÓN DE SHIFTS DE TIPO FINITO POR MEDIO DE GRAFOS 31

la cantidad de caminos de longitud n+ 1 de I a J es∑K∈V (G)

(An)IK AKJ

que es precisamente la denición de (An+1)IJ , con lo que queda demostrada la primeraparte.

2. La primera parte del enunciado se sigue del ítem anterior y de la denición de ciclo.Para la segunda parte, notar que que si π es un ciclo de longitud n en G, entonces π∞ esun punto periódico en XG de período n, mientras que si x ∈ XG es un punto periódicode período n, entonces x[0,n−1] debe ser un ciclo de longitud n en G. Esto establece unacorrespondencia 1 a 1 entre los ciclos en G de longitud n y los puntos en XG de períodon.

Recordemos que un espacio shift X se dice irreducible si para cualquier pareja de bloquesu,w ∈ B(X), existe v ∈ B(X) tal que uvw ∈ B(X). Es fácil caracterizar a los grafos que danlugar a shifts de aristas irreducibles.

Definición 2.26. Un grafo G se dice irreducible si para cualquier pareja I, J de vérticesen G, existe un camino π en G tal que i(π) = I y t(π) = J . Si G no es irreducible, se llamareducible.

La gura 5 muestra un ejemplo de grafo reducible, ya que no hay en él un camino desde Ihasta J .

Figura 5. Un grafo reducible

Proposición 2.27. Sea G un grafo esencial. G es irreducible si, y sólo si, XG es un espacioshift irreducible.

Demostración. Primero supongamos G irreducible. Sean u,w ∈ B (XG). Entonces u y wson caminos en G (lema 2.23). Por ser G irreducible, hay un camino v en G desde t(u) hastai(w), por lo que uvw es camino en G y, nuevamente por el lema 2.23, uvw ∈ B (XG).

Supongamos ahora que XG es irreducible. Sean I, J vértices en G, y sean a y b aristas enG tales que t(a) = I, i(b) = J . Tales aristas existen pues G es esencial. Por el lema 2.23, a yb están en B (XG). Por irreductibilidad de XG, existe v ∈ B (XG) tal que avb ∈ B (XG). Tal vdebe ser entonces camino en G desde t(a) hasta i(b), es decir, camino desde I hasta J . Luego,G es irreducible.

3. Representación de shifts de tipo nito por medio de grafos

Hemos presentado, en la sección anterior, los shifts de aristas, que resultaron ser STF dememoria 1. Por lo tanto, un STF que no tenga memoria 1 no puede ser un shift de aristas. Másaún, el siguiente ejemplo muestra que hay STF de memoria 1 que no son shifts de aristas.

Page 36: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

32 2. SHIFTS DE TIPO FINITO

Ejemplo 2.28. No existe un grafo G tal que XG sea el shift de la razón de oro. Paraverlo, supongamos que G cumple que XG = X11. Por prop. 2.24, podríamos suponer que G esesencial. Entonces debería contener exactamente dos aristas llamadas 0 y 1. La arista 1 deberíainiciar en un nodo y terminar en otro distinto (de lo contrario, 1∞ estaría en XG, lo que nopuede ser) y entonces la arista 0 debería ir desde t(1) hasta i(1) (pues en otro caso G no seríaesencial). Pero entonces XG 6= X11, contradicción que proviene de suponer la existencia de talG.

A pesar de que los shifts de aristas aparecen como particulares shifts de tipo nito, mostra-remos ahora que todo shift de tipo nito puede recodicarse a un shift de aristas.

Teorema 2.29. Si X es un shift de tipo nito de memoria M , entonces X [M+1] es un shiftde aristas. En consecuencia, todo shift de tipo nito es conjugado a un shift de aristas.

Demostración. Sea X un STF de memoria M . Podemos suponer M ≥ 1. Sea F tal queX = XF , siendo todos los bloques en F de largoM+1. Hagamos V = BM(X) y Σ = BM+1(X).Para a = a1a2 · · · aMaM+1 ∈ Σ, denamos i(a) = a1 · · · aM y t(a) = a2 · · · aMaM+1. Puedeverse que i(a) y t(a) están en V , ya que son subbloques de a1 · · · aMaM+1 ∈ B(X). DenamosG = (V,Σ, i, t). Notar que, dados vértices I = a1 · · · aM y J = b1 · · · bM , hay una única aristade I a J si, y sólo si, a2 · · · aM = b1 · · · bM−1 y a1 · · · aMbM ∈ BM+1(X). Es decir, hay arista deI a J si, y sólo si, I y J solapan progresivamente y el bloque obtenido de agregar a I el últimosímbolo de J está en BM+1(X).

Veriquemos ahora que XG = X [M+1].Sea x ∈ XG. Se tiene que, para todo k ∈ Z, xk ∈ Σ (es decir, xk es un bloque de tamañoM+1

en el lenguaje deX), y t (xk) = i (xk+1). Pero si xk = a1 · · · aM+1 y xk+1 = b1 · · · bM+1, es t (xk) =a2 · · · aM+1 e i (xk+1) = b1 · · · bM . Se tiene entonces que xk y xk+1 solapan progresivamente.Denamos entonces x = β−1

M+1(x). Para cualquier k ∈ Z, x[k,k+M ] = xk ∈ BM+1(X), por lo quex no tiene bloques en F , es decir, x ∈ X, y entonces x = βM+1(x) pertenece a X [M+1].

Ahora sea x ∈ X [M+1]. Sea x tal que βM+1(x) = x. Se tiene que, para cualquier k ∈ Z,es xk = xk · · ·xk+M y xk+1 = xk+1 · · ·xk+M+1, por lo que xk ∈ BM+1(X) = Σ y t(xk) =xk+1 · · ·xk+M = i(xk+1) de acuerdo a la denición de G. Entonces, x ∈ XG.

La última armación del teorema se deduce del hecho de que X ∼ X [M+1].

Ejemplo 2.30. Si X = X11, X es STF de memoria 1. Tenemos que B1(X) = 0, 1 = Vy que B2(X) = 00, 01, 10 = Σ. Denimos i(00) = i(01) = 0, i(10) = 1, t(00) = t(10) = 0 yt(01) = 1. El grafo (V,Σ, i, t) mostrado en la gura 6 es precisamente X [2].

Figura 6. Grafo del shift de la razón de oro recodicado

Dado un shift de aristas XG, nos preguntamos si las presentaciones con solape de XG sontambién shifts de aristas, y, en caso de serlo, si podemos construir los correspondientes grafosdirectamente a partir de G.

Definición 2.31. Sea G un grafo, y sea N un entero positivo. Se dene el grafo G[N ],llamado N-ésimo grafo de bloques de aristas de G del siguiente modo:

G[1] = G.

Page 37: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

3. REPRESENTACIÓN DE SHIFTS DE TIPO FINITO POR MEDIO DE GRAFOS 33

para N ≥ 2, los vértices de G[N ] son los caminos en G de longitud N − 1, y las aristasde G[N ] son los caminos en G de longitud N . Si a = a1 · · · aN es una arista, denimosiG[N ](a) = a1 · · · aN−1 y tG[N ](a) = a2 · · · aN . Obsérvese queG[N ] es un grafo bien denido.

Ejemplo 2.32. Sea G = (V,Σ, i, t) con V = I, J, Σ = e, f, g, i(e = i(f) = I,i(g) = J , t(e) = t(g) = I, t(f) = J . G[1] es el propio G. G[2] tiene vértices e, f, g y aristasee, ef, fg, ge, gf. G[3] tiene vértices ee, ef, fg, ge, gf y aristas eee, eef, efg, fge, fgf, gee,gef, gfg. Todos ellos se muestran en la gura 7.

G[1] G[2] G[3]

Figura 7. Grafos de bloques de aristas

Proposición 2.33. Si G es un grafo esencial y N es un entero positivo, entonces (XG)[N ] =XG[N ].

Demostración. Los símbolos para (XG)[N ] son los N -bloques de XG, que son los caminosde largo N en G (lema 2.23). Pero éstos son precisamente los símbolos para XG[N ] . Una sucesiónbi-innita de estos símbolos está en ambos espacios shift precisamente cuando dos símbolosconsecutivos solapan progresivamente, de donde se concluye el resultado.

Un camino bi-innito en un grafo G determina una sucesión bi-innita de vértices de esegrafo, a saber, los vértices que el camino bi-innito atraviesa (pero a una sucesión bi-innitade vértices puede corresponderle más de un camino bi-innito, a menos que el grafo no poseaaristas en paralelo entre dos nodos). Formalmente, sea G = (V,Σ, i, t) un grafo, y sea (xk)k∈Z unpunto de XG. Entonces, la sucesión bi-innita de vértices que este camino bi-innito determinaes el punto (i(xk))k∈Z, que pertenece al full shift V

Z.Para considerar estos recorridos bi-innitos, introducimos la matriz de incidencia de un

grafo.

Definición 2.34. Sea G = (V,Σ, i, t) un grafo con matriz de adyacencia AG. La matrizde incidencia de G es la matriz B, de tamaño |V | × |V | con las y columnas indizadas porV , tal que, para vértices m,n ∈ V ,

Bmn =

1 si (AG)mn > 00 si (AG)mn = 0

Es decir, la entrada (m,n) de la matriz de incidencia es 1 o 0, dependiendo de si hay o noarista en G desde m hacia n (en caso de haber, no importa cuántas hay).

Ahora consideraremos el conjunto de todas las sucesiones bi-innitas de vértices que deter-minan los caminos bi-innitos en G, y que resultará ser también un espacio shift.

Definición 2.35. Sea G = (V,Σ, i, t) un grafo con matriz de incidencia B. El shift devértices de G es el conjunto

XG =

(xk)k∈Z ∈ V Z : ∀k ∈ Z, Bxkxk+1= 1

Page 38: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

34 2. SHIFTS DE TIPO FINITO

Proposición 2.36. Los shifts de vértices son shifts de tipo nito de memoria 1.

Demostración. Sea G = (V,Σ, i, t) un grafo con matriz de incidencia B. ConsideremosF = mn ∈ V 2 : Bmn = 0, y veamos que XG = XF .

Sea x ∈ XG, y consideremos j, k ∈ Z. Si k − j + 1 6= 2, x[j,k] /∈ F (pues F contiene sólopalabras de largo 2). Y si k−j+1 = 2, es x[j,k] = xjxj+1, pero, por estar x en XG, es Bxjxj+1

= 1,por lo que x[i,j] /∈ F . Entonces ningún bloque de x pertenece a F , es decir, x ∈ XF .

Recíprocamente, si x ∈ XF , se tiene que, para todo j ∈ Z, x[j,j+1] /∈ F , de donde Bxjxj+1= 1,

por lo que x ∈ XG.Ya que todos los bloques de F tienen largo 2, se sigue que XG es un STF de memoria 1.

Proposición 2.37.

1. La familia de todos los shifts de tipo nito de memoria 1 es la familia de todos los shiftsde vértices.

2. Cualquier shift de aristas es un shift de vértices (en un grafo diferente).3. Si X es un shift de tipo nito de memoria M , X [M ] es un shift de vértices. De hecho,

existe un grafo G tal que XG = X [M ] y XG = X [M+1].

Demostración.

1. La proposición 2.36 muestra que cualquier shift de vértices es un SFT de memoria 1.Ahora, sea XF un espacio shift con todos los bloques en F de largo 2. Denamos ungrafo G como sigue: su conjunto de vértices es V = B1 (XG), y para m,n ∈ V , pongamosuna única arista mn de m a n si, y sólo si, mn /∈ F . La matriz de incidencia de G tendráentonces, en la posición (m,n), un 1 si mn /∈ F , y un 0 si mn ∈ F . Luego, un punto deV Z está en XG precisamente cuando para todo k ∈ Z, Bxkxk+1

= 1, o, equivalentemente,cuando xkxk+1 /∈ F , mostrando que XG = XF .

2. El enunciado es consecuencia directa del ítem anterior y del hecho de que todo shift dearistas es un STF de memoria 1.

3. Veamos que el grafo G construido en la prueba del teorema 2.29, aparte de satisfacerque XG = X [M+1], cumple que XG = X [M ].

Recordemos que el grafo G construido tiene conjunto de vértices V = BM(X), y entrelos vértices I = a1 · · · aM y J = b1 · · · bM hay arista si, y sólo si, a2 · · · aM = b1 · · · bM−1

y a1 · · · aMbM ∈ BM+1(X). Es decir, llamando B a la matriz de incidencia, se tiene queBIJ = 1 si, y sólo si, I y J solapan progresivamente y el bloque obtenido de agregar aI el último símbolo de J está en BM+1(X).

Recordemos también que es X = XF para alguna colección F de bloques de tamañoM + 1.

Sea x ∈ XG. Se tiene que, para todo k ∈ Z, xk ∈ V , y Bxkxk+1= 1, de donde xk

y xk+1 solapan progresivamente. Denamos x = β−1M (x). Se tiene que, para cualquier

k ∈ Z, xk · · ·xk+M ∈ BM+1(X) (pues es el bloque que resulta de agregar a xk el últimosímbolo de xk+1), es decir, xk · · ·xk+M /∈ F , y entonces x ∈ X, así que x ∈ X [M ].

Ahora sea x ∈ X [M ]. Sea x tal que βM(x) = x. Se tiene que, para cualquier k ∈ Z,es xk = xk · · ·xk+M−1 ∈ BM(X), xk+1 = xk+1 · · ·xk+M ∈ BM(X), y xk · · ·xk+M ∈BM+1(X), por lo que Bxkxk+1

= 1. Luego, x ∈ XG.

4. Desdoblamiento de estados

El desdoblamiento de estados es un procedimiento para construir nuevos grafos a partir deuno dado. Comenzando con una partición del conjunto de aristas, cada estado es desdobladoen una cierta cantidad de estados derivados. Aunque el grafo resultante puede parecer muydistinto del original, ambos tienen shifts de aristas conjugados. Hay una operación inversa del

Page 39: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

4. DESDOBLAMIENTO DE ESTADOS 35

desdoblamiento, llamada amalgama de estados. Resulta ser que cualquier conjugación entreshifts de aristas puede dividirse en una sucesión nita de desdoblamientos y amalgamas deestados. Esto, junto a aplicaciones para la producción de códigos de estados nitos, explica lacrucial importancia del desdoblamiento de estados en dinámica simbólica.

Comenzamos con una descripción del desdoblamiento de un solo estado, operación quedenominaremos desdoblamiento elemental. Sea G un grafo con conjunto de estados V y conjuntode aristas Σ. Fijemos un estado I ∈ V , y supongamos, por el momento, que no hay bucles en I.Hagamos una partición del conjunto de aristas salientes de I (es decir, ΣI) en dos subconjuntosdisjuntos no vacíos Σ1

I y Σ2I . Construimos un nuevo grafo H, basándonos en esta partición, como

sigue: el conjunto de estados es W = (V − I) ∪ I1, I2. Para cada arista e ∈ ΣiI (donde i

es 1 o 2), pongamos una arista en H desde I i hasta t(e) llevando el mismo nombre e (notarque, como no hay bucles en I, t(e) 6= I, de modo que t(e) ∈ W ). Para cada f en ΣI (es decir,cada arista f llegando a I), pongamos dos aristas f 1 desde i(f) hasta I1 y f 2 desde i(f) hastaI2. Todas las otras aristas de G (es decir, las que no están vinculadas al nodo I) se copianen H con el mismo nombre e idénticos nodos inicial y terminal. Queda entonces completa laconstrucción de H. Hablando sin precisión, desdoblamos las aristas salientes y reproducimoslas aristas entrantes a I. La gura 8 muestra cómo es la operación.

Figura 8. Esquema del desdoblamiento de un estado

Ejemplo 2.38. Sea G el grafo de la izquierda en la gura 9, y consideremos la partición deΣI dada por Σ1

I = a y Σ2I = b, c. A la derecha de esa gura se muestra el grafo resultante

de desdoblar el estado I con esa partición.

Figura 9. Desdoblamiento elemental de estados

Supongamos que H se forma a partir de G desdoblando el estado I, como se describiómás arriba. A continuación construimos una conjugación entre sus shifts de aristas XG y XH .

Page 40: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

36 2. SHIFTS DE TIPO FINITO

Denamos la transformación monobloque Ψ : B1(XH)→ B1(XG) mediante Ψ(f i) = f si f ∈ ΣI

y Ψ(e) = e si e /∈ ΣI . En otras palabras, Ψ simplemente borra supraíndices. Es posible chequear(lo haremos más adelante) que borrar supraíndices de los caminos en H produce caminos enG, de modo que Ψ induce un código de ventana deslizante monobloque ψ : XH → XG. Ahoradenamos un código 2-bloque Φ : B2(XG)→ B1(XH) mediante:

Φ(fe) =

f si f /∈ ΣI

f 1 si f ∈ ΣI y e ∈ Σ1I

f 2 si f ∈ ΣI y e ∈ Σ2I

Es decir, Φ se anticipa un símbolo y puede añadir un supraíndice, dependiendo de lo que ve.Es factible chequear (también lo haremos más adelante) que Φ transforma caminos de G encaminos de H, y, por lo tanto, induce un CVD φ de XG en XH con memoria 0 y anticipación 1.

Puesto que agregar y eliminar supraíndices no tiene efecto, vemos que ψ(φ(x)

)= x para todo

x ∈ XG. Recíprocamente, los supraíndices están unívocamente determinados por la deniciónde Φ, ya que Σ1

I y Σ2I son una partición de ΣI , de modo que φ

(ψ(y)

)= y para todo y ∈ XH .

Luego, φ es una conjugación de XG en XH .

Ejemplo 2.39. Las acciones de φ y ψ sobre puntos típicos x ∈ XG, y ∈ XH del ejemplo2.38 se muestran a continuación:

x = · · · d a d b d c e . a d c e b d · · ·

φ ↓ ↑ ψ

y = · · · d1 a d2 b d2 c e1 . a d2 c e2 b · · ·

Notar que no gura el símbolo en y debajo de la última d de x, pues para ello hace falta conocerel símbolo a la derecha de dicha d.

El procedimiento general de desdoblamiento de estados es una extensión, en dos sentidos,del proceso elemental recientemente descripto: por un lado, las aristas salientes de un estadopueden particionarse en una cantidad de conjuntos que no necesariamente sea 2, y, por otrolado, se puede particionar simultáneamente los conjuntos de aristas salientes de todos los estados(incluyendo los que presentan bucles).

Definición 2.40. Sea G = (V,Σ, iG, tG) un grafo. Para cada estado I ∈ V , sean denidosun entero positivo m(I) tal que m(I) ≤ |

∑I |, y una partición de ΣI en conjuntos disjuntos

(no vacíos) Σ1I , Σ2

I , . . . , Σm(I)I (es decir, m(I) ≥ 1 es la cantidad de átomos en la partición de

ΣI). Sea P la partición resultante de Σ. El grafo de estados desdoblados G[P] formado apartir de G usando P es el grafo (W,Σ′, iH , tH) denido como sigue:

Conjunto de estados: W =Ik : I ∈ V ∧ 1 ≤ k ≤ m(I)

.

Conjunto de aristas: Σ′ =ej : e ∈ Σ ∧ 1 ≤ j ≤ m

(tG(e)

).

Función de nodos iniciales: iH (ej) = (iG(e))n donde n es tal que e ∈ ΣniG(e).

Función de nodos terminales: tH (ej) = (tG(e))j.

Es decir, si e ∈ Σ va de I a J en G, entonces existe n tal que e ∈ ΣnI , y el estado inicial de ej

en G[P] es In y el terminal es J j; es decir, ej va de In a J j.Un desdoblamiento elemental de G por el estado I ocurre cuando m(I) = 2 y m(J) =

1 para todo J 6= I.

Cuando para algún estado J se tiene que m(J) = 1, los supraíndices 1 (en el nombre delestado y de las aristas entrantes a J1 en el grafo desdoblado) se vuelven redundantes, y no hayproblemas en omitirlos (pues se obtiene un grafo isomorfo), como hicimos en nuestras primerasdiscusiones respecto de los desdoblamientos elementales.

Page 41: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

4. DESDOBLAMIENTO DE ESTADOS 37

Asumiremos que los elementos de las particiones de aristas salientes de cada nodo nuncason vacíos. Esto garantiza que el grafo obtenido de desdoblar estados en un grafo esencial (oirreducible) es también esencial (o irreducible).

Observación 2.41. De la denición del grafo desdoblado, se desprende que una arista ej

va de In hasta Jk si, y sólo si, e ∈ ΣnI (lo cual implica que iG(e) = I), tG(e) = J y j = k. Por

ello, la cantidad de aristas desde In hasta Jk en el grafo desdoblado es precisamente la cantidadde aristas en Σn

I que terminan en J en el grafo G. Es decir,∣∣∣Σ′In ∩ Σ′Jk∣∣∣ =

∣∣ΣnI ∩ ΣJ

∣∣para todos k ∈ 1, . . . ,m(J), n ∈ 1, . . . ,m(I), I, J ∈ V (G).

Ejemplo 2.42. Sea G el grafo de la izquierda en la gura 10, de modo que ΣI = e, f yΣJ = g. Tomemos las siguientes particiones: Σ1

I = e, Σ2I = f y Σ1

J = g, por lo quem(I) = 2 y m(J) = 1. Entonces P = Σ1

I ,Σ2I ,Σ

1J. El grafo resultante del desdoblamiento se

muestra a la derecha en esa misma gura. Notar que, en particular, el bucle e en el estado I sedesdobla en un bucle e1 en el estado I1 y otra arista e2 desde I1 hasta I2.

Figura 10. Un ejemplo de desdoblamiento de estados

Ejemplo 2.43. La gura 11 muestra a la izquierda un grafo del full shift e, fZ. Esen-cialmente, hay una sola partición no trivial de ΣI , a saber, Σ1

I = e y Σ2I = f. El grafo

resultante del desdoblamiento se muestra en la misma gura a la derecha, y puede advertirseque, salvo cambio de nombres, es esencialmente la presentación del full shift en bloques detamaño 2 con solape.

Figura 11. Un desdoblamiento de estados del full 2-shift

Ejemplo 2.44. Para el grafo G a la izquierda en la gura 12, sea P denida por Σ1I = a,

Σ2I = b, c, Σ1

J = d, Σ1K = e y Σ2

K = f. El grafo G[P] se muestra a la derecha de esamisma gura.

Page 42: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

38 2. SHIFTS DE TIPO FINITO

Figura 12. Un desdoblamiento de estados general

Como la construcción de G[P] usa particiones de conjuntos de aristas salientes, decimosque G[P] es el grafo de desdoblamiento de salidas formado a partir de G usando P. Hayuna correspondiente noción de desdoblamientos de entradas, usando particiones de conjuntosde aristas entrantes.

Definición 2.45. Sea G = (V,Σ, i, t) un grafo. Para cada estado I ∈ V , sea denida unapartición de ΣI en conjuntos disjuntos (no vacíos) ΣI

1, ΣI2, . . . , ΣI

m(I), donde m(I) ≥ 1 es la can-tidad de conjuntos en la partición de ΣI . SeaP la partición resultante de Σ. El grafo de desdo-blamiento de entradas G[P] formado a partir de G usando P tiene como conjunto de esta-dos a Ik : I ∈ V ∧ 1 ≤ k ≤ m(I) y como conjunto de aristas a

ej : e ∈ Σ ∧ 1 ≤ j ≤ m

(i(e)).

Si e ∈ Σ va de I a J en G, entonces existe j tal que e ∈ ΣJj , y el estado inicial de ei en G[P] es

Ii y el terminal es Jj.

Ejemplo 2.46. Sea G el grafo a la izquierda en la gura 13. Denamos P mediante ΣI1 =

e, ΣI2 = g y ΣJ

1 = f. El correspondiente G[P] se muestra en esa misma gura, a laderecha.

Figura 13. Un ejemplo de desdoblamiento de entradas

Será conveniente considerar a un grafo isomorfo a G[P] también como un desdoblamiento desalidas de G (y similarmente para los desdoblamientos de entradas). También es apropiado darun nombre a la operación inversa del desdoblamiento.

Definición 2.47. Un grafoH es un desdoblamiento de un grafoG, yG es una amalgamade H, si H es isomorfo a G[P] o a G[P], para alguna partición P del conjunto de aristas de G.

Si hace falta mayor precisión, emplearemos los términos desdoblamiento de salidas, desdobla-miento de entradas, amalgama de salidas o amalgama de entradas. Notar que los isomorsmosde grafos, de acuerdo a nuestra denición, pueden ser vistos como cualquiera de estas cuatrooperaciones.

Page 43: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

4. DESDOBLAMIENTO DE ESTADOS 39

Al igual que en los desdoblamientos elementales, los desdoblamientos en general producengrafos cuyos shifts de aristas son conjugados a los del grafo inicial.

Teorema 2.48. Si un grafo H es un desdoblamiento de un grafo G, entonces los shifts dearistas XG y XH son conjugados.

Demostración. Probaremos sólo para el caso de los desdoblamientos de salida, siendo elotro caso similar.

Ya que los isomorsmos de grafos establecen conjugaciones, y que la composición de con-jugaciones es otra conjugación, alcanza con probar el resultado para el caso en que H = G[P].Mostraremos, en sucesivos pasos, que existen CVD ψ : XH → XG y φ : XG → XH tales queφ = ψ−1, con lo que quedará demostrado que φ es una conjugación, y, por lo tanto, XG ∼ XH .

Denamos la transformación monobloque Ψ : B1 (XH)→ B1 (XG) mediante Ψ (ej) = e,y consideremos ψ = Ψ

[0,0]∞ .

Sea y ∈ XH , y tomemos k ∈ Z. Debe ser yk = ej, yk+1 = fm con e, f ∈ Σ ytH (ej) = iH (fm); por denición de H, esto implica que (tG(e))j = (iG(f))n con n talque f ∈ Σn

iG(f), de donde concluimos que tG(e) = iG(f) (es decir, ef es camino en G) y

que j = n, es decir, f ∈ ΣjiG(f). Por lo tanto,

tG ((ψy)k) = tG (Ψ(yk)) = tG(Ψ(ej)

)= tG(e) = iG(f) = iG (Ψ(fm)) = iG ((ψy)k+1)

mostrando que ψ(y) ∈ XG, y entonces ψ (XH) ⊆ XG, por lo que ψ : XH → XG es unCVD monobloque bien denido.Ahora denamos la transformación de bloques Φ : B2 (XG)→ B1 (XH) por medio de losiguiente: si ef ∈ B2 (XG), entonces existe un único j tal que f ∈ Σj

iG(f), y denimos

Φ(ef) = ej. Consideremos φ = Φ[0,1]∞ .

Sea x ∈ XG, y tomemos k ∈ Z. Tenemos que xk, xk+1, xk+2 ∈ Σ, xkxk+1, xk+1xx+2 ∈B2 (XG), y existen I, J ∈ V tales que tG(xk) = iG(xk+1) = I, tG(xk+1) = iG(xk+2) = J .Sean n1 y n2 tales que xk+1 ∈ Σn1

I y xk+2 ∈ Σn2J . Entonces Φ(xkxk + 1) = xn1

k yΦ(xk+1xk+2) = xn2

k+1. Luego,

tH ((φx)k) = tH (Φ(xkxk+1)) = tH (xn1k ) = (tG(xk))

n1 = In1

iH ((φx)k+1) = iH (Φ(xk+1xk+2)) = iH(xn2k+1

)= (iG(xk+1))n1 = In1

mostrando que φ(x) ∈ XH , y entonces φ (XG) ⊆ XH , por lo que φ : XG → XH es unCVD bien denido.Sean x ∈ XG y k ∈ Z. Entonces (φx)k = Φ (xkxk+1) = xnk para algún n, y entonces(ψ(φx))k = Ψ ((φx)k) = Ψ (xnk) = xk. En consecuencia, (ψ φ)(x) = x para todox ∈ XG.

Recíprocamente, sean y ∈ XH y k ∈ Z. Razonando como antes, debe ser ykyk+1 =ejfm con f ∈ Σj

iG(f), por lo que (ψy)[k,k+1] = ef (con ef ∈ B2 (XG) pues ψ(y) ∈ XG)y entonces Φ(ef) = ej, así que (φ(ψy))k = Φ

((ψy)[k,k+1]

)= Φ(ef) = ej = yk. En

consecuencia, (φ ψ)(y) = y para todo y ∈ XH .Queda entonces demostrado que φ : XG → XH es código de ventana deslizante que posee funcióninversa que es también código de ventana deslizante, por lo que XG y XH son conjugados.

La demostración anterior muestra que si H es un desdoblamiento de salidas de G, hay uncódigo monobloque desde XH a XG, que se denomina código de amalgama de salidas, cuyoinverso es un código con memoria 0 y anticipación 1 llamado código de de desdoblamientode salidas. Análogamente, si H es un desdoblamiento de entradas de G, tenemos un código deamalgama de entradas monobloque con inverso denominado código de desdoblamientode entradas que tiene memoria 0 y anticipación 1.

Del teorema previo, se deduce que si un grafo H puede ser obtenido por una sucesión(nita) de desdoblamientos y amalgamas de un grafo G, entonces XH ∼ XG (la conjugación es

Page 44: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

40 2. SHIFTS DE TIPO FINITO

la composición de los sucesivos códigos de desdoblamiento o amalgama). Aunque no lo haremosaquí, es posible probar también el recíproco: cualquier conjugación entre shifts de aristas puedeescribirse como una composición de códigos de desdoblamientos y amalgamas. Este importanteresultado se conoce como Teorema de la Descomposición.

4.1. Los desdoblamientos y las matrices de adyacencia. Consideremos el ejem-plo 2.44. Los estados de G y de su desdoblado son, respectivamente, V = I, J,K y W =I1, I2, J1, K1, K2. Podemos representar cómo los estados en W se derivan a partir de los es-tados en V por medio de la siguiente matriz D con las indizadas por V y columnas indizadaspor W (en el orden dado):

D =

1 1 0 0 00 0 1 0 00 0 0 1 1

Por ejemplo, DI,I1 = 1 = DI,I2 pues I1 e I2 resultan de desdoblar el estado I, mientras queDI,J1 = 0 pues J1 no procede del desdoblamiento de I.

Por otro lado, podemos especicar las cantidades de aristas en cada partición que terminanen un estado dado, por medio de la siguiente matriz E con las indizadas por W y columnasindizadas por V (en el orden dado):

E =

0 1 00 1 11 0 00 1 01 0 0

donde, por ejemplo, EI1,J es la cantidad de aristas en Σ1

I que terminan en J , en este caso unasola arista.

Un cómputo directo muestra que el producto DE es igual a la matriz de adyacencia de G,y que ED da la matriz de adyacencia del grafo desdoblado. Veremos ahora que esta situaciónse cumple en general.

Definición 2.49. Sea G = (V,Σ, i, t) un grafo, P una partición de salida de Σ, y H = G[P].Designemos por W al conjunto de vértices de H. La matriz de división D para P es lamatriz sobre V ×W denida por

DI,Jk =

1 si I = J0 si I 6= J

La matriz de aristas E para P es la matriz sobre W × V denida por

EIn,J =∣∣Σn

I ∩ ΣJ∣∣

De la observación 2.41, surge que EIn,J corresponde a la cantidad de aristas en el grafodesdoblado que van desde desde In hasta Jk (cualquiera sea k ∈ 1, . . . ,m(J)).

Las matrices de división y de aristas permiten obtener las matrices de adyacencia de losgrafos involucrados en un desdoblamiento, de acuerdo al siguiente resultado.

Teorema 2.50. Sean G, P, H, D y E como en la denición anterior. Entonces,

DE = AG ED = AH

Page 45: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

5. EL ALMACENAMIENTO DE DATOS Y LOS STF 41

Demostración. Se tiene que

(DE)I,J =∑K∈W

DI,KEK,J =∑L∈V

m(L)∑i=1

DI,LiELi,J =

m(I)∑i=1

DI,IiEIi,J =

m(I)∑i=1

EIi,J

=

m(I)∑i=1

∣∣ΣiI ∩ ΣJ

∣∣ =

∣∣∣∣∣∣m(I)⋃i=1

(ΣiI ∩ ΣJ

)∣∣∣∣∣∣ =

∣∣∣∣∣∣m(I)⋃

i=1

ΣiI

∩ ΣJ

∣∣∣∣∣∣=

∣∣ΣI ∩ ΣJ∣∣ = (AG)I,J

mostrando que DE = AG. Por otro lado,

(ED)Ii,Jj =∑K∈V

EIi,KDK,Jj = EIi,JDJ,Jj = EIi,J

=∣∣Σi

I ∩ ΣJ∣∣ =

∣∣∣Σ′Ii ∩ Σ′Jj∣∣∣ = (AH)Ii,Jj

por lo que ED = AH .

5. El almacenamiento de datos y los STF

Las computadoras almacenan datos de cualquier clase como sucesiones de 0 y 1, o bits (delinglés binary digits). El lector tal vez esté familiarizado con el código ASCII, que convierteletras, signos de puntuación y otros caracteres en sucesiones de 8 bits. Podría pensarse queestos bits son almacenados en una unidad de disco literalmente (es decir, secuencialmente talcomo aparecen), pero esto no es así, pues consideraciones de orden práctico requieren esquemasmás sutiles, que conducen directamente a los shifts de tipo nito.

Para comprender la necesidad de esos esquemas más sutiles, primero debemos entenderalgo de la manera en que trabajan los dispositivos de almacenamiento magnético, tales comolas unidades de discos exibles y rígidos. Los discos contienen una o más bandejas que giranrápidamente, revestidas con un medio magnético. Cada bandeja se divide en pistas circularesconcéntricas. Un cabezal eléctrico de lecto-escritura ota sobre la bandeja en un colchón deaire de espesor cercano a un centésimo del grosor de un cabello humano. El cabezal se mueveradialmente para acceder a diferentes pistas, pero restringiremos nuestra atención a una pistaindividual.

Una corriente eléctrica que pasa a través del cabezal magnetizará una porción de la pista,produciendo en consecuencia una pequeña barra imantada a lo largo de la pista. Revirtiendo lacorriente, se crea una barra imantada adyacente cuyos polos norte y sur están invertidos. Losdatos son escritos por una sucesión de reversiones de corriente, creando el equivalente a unasucesión de barras imantadas de distintas longitudes y polaridad alternante. Esto es ilustradoen la parte superior de la gura 14, donde N y S muestran los polos norte y sur de cada imán.

Figura 14. Almacenamiento magnético de datos digitales

Page 46: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

42 2. SHIFTS DE TIPO FINITO

La lectura de los datos se hace por el proceso inverso. Las inversiones de polaridad a lo largode la pista generan pulsos de voltaje en el cabezal a medida que el mismo pasa sobre ellas. Unesquema denominado detección de picos determina si ocurre un pulso dentro de un intervalode tiempo llamado ventana de detección de longitud L. Un pulso es interpretado como un 1,mientras que la ausencia de pulso representa un 0. La detección de picos usa sólo las reversionesde polaridad, no las polaridades reales; intercambiar N y S produciría los mismos datos. Laparte inferior de la gura 14 muestra cómo es la lectura de los datos.

El más directo de los métodos para almacenar una sucesión de bits sería dividir la pista enceldas de igual longitud L, y escribir un cambio en la polaridad en cada celda que almacene un1, y no alterar la polaridad en las celdas que almacenen un 0. Hay dos serios problemas coneste enfoque.

El primer problema es llamado interferencia intersímbolos. Si hay cambios de polaridad muypróximos entre sí, las líneas de fuerza magnética tienden a anularse, y los pulsos producidos enel cabezal son más débiles, más difíciles de detectar y tienen sus picos desplazados (ver gura15). En base a las características físicas del medio magnético y la sensibilidad de los dispositivoselectrónicos, cada sistema de discos tiene una distancia de separación mínima ∆ entre cambiosde polaridad para una operación conable. En el método de almacenamiento literal, la ventanade detección L debe ser al menos ∆ pues podrían ocurrir dos 1 en celdas adyacentes. A travésdel uso de esquemas en los cuales dos 1 consecutivos estén separados por al menos d ceros,podremos usar una ventana de detección de longitud L = ∆/(d + 1) y contener más datos encada pista.

Figura 15. Interferencia intersímbolos

El segundo problema es el error del reloj. El bloque 10n1 es leído como dos pulsos separadospor un intervalo de tiempo. La longitud de este intervalo es (n+ 1)L, y determina el número nde ceros. Cualquier error en el dispositivo usado para medir ese tiempo resultaría en un valorerróneo para n, por lo que no conviene que el intervalo de tiempo entre dos pulsos (es decir,la cantidad de 0 entre dos 1) sea muy grande. Entonces, una restricción típica para corregirlos errores de reloj es que entre dos 1 sucesivos no haya más de k ceros. Relojes más exactospermiten valores más grandes de k.

En suma, para corregir simultáneamente la interferencia intersímbolos y el error de reloj,debemos ser capaces de codicar cualquier sucesión arbitraria w ∈ 0, 1∗ en una sucesión w′

que satisfaga las restricciones de tener al menos d ceros y no más de k ceros entre dos ocurrenciassucesivas de 1; tal w′ es la que se almacenará en el medio magnético. Por supuesto, queremosser capaces de decodicar w′ (es decir, recuperar w a partir de w′) para realizar la lectura delos datos almacenados. Hay varias maneras de hacer el proceso de codicación/decodicaciónde datos para el almacenamiento, y estudiaremos, en el capítulo 6, esquemas ecientes que sonproducto del ingenio de cientícos de importantes empresas como IBM, Bell Systems y otras.

Page 47: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

2. SHIFTS DE TIPO FINITO 43

EJERCICIOS

1. Shifts de paso limitado y de lagunas. Para los siguientes espacios, se considera elalfabeto A = 0, 1.a) SeaX el conjunto de todas las sucesiones binarias biinnitas en las que los 1 aparecen

con frecuencia innita en ambas direcciones y, entre dos ocurrencias sucesivas de 1,la cantidad de 0 es al menos uno y no más de tres. Por ej., (01001010001)∞ ∈ X,mientras que · · · 0000000.100000 · · · , (00011)∞, · · · 1010000.10001 · · · no están enX. X se llama shift de paso limitado (1, 3). Muestre que X es un STF.

b) Sea X el conjunto de todas las sucesiones binarias biinnitas en las que entre dosocurrencias sucesivas de 1, la cantidad de 0 es al menos uno y no más de tres. Porej., (01001010001)∞ y · · · 0000000.100000 · · · están en X, mientras que (00011)∞ y· · · 1010000.10001 · · · no están en X. Muestre que X es un espacio shift pero no esun STF.

c) Para generalizar la shift de paso limitado (1, 3), sean d y k dos enteros no negativos,con d ≤ k. Sea X el conjunto de todas las sucesiones binarias biinnitas en las quelos 1 aparecen con frecuencia innita en ambas direcciones y, entre dos ocurrenciassucesivas de 1, la cantidad de 0 es al menos d y no más de k. X se llama shift depaso limitado (d, k). Muestre que X es un STF.

d) Sean d y k dos enteros no negativos, con d ≤ k. Sea X el conjunto de todas lassucesiones binarias biinnitas en las que entre dos ocurrencias sucesivas de 1, lacantidad de 0 es al menos d y no más de k. Muestre que X es un espacio shift, perono es STF.

e) Para generalizar las shifts de paso limitado, sea S un subconjunto nito de losenteros no negativos. Sea X el conjunto de todas las sucesiones binarias biinnitasen las que los 1 aparecen con frecuencia innita en ambas direcciones y, entre dosocurrencias sucesivas de 1, la cantidad de 0 es un número en S. X se llama shiftde lagunas en S. Muestre que X es un STF.

f ) Sea S un subconjunto nito de los enteros no negativos. Sea X el conjunto de todaslas sucesiones binarias biinnitas en las que entre dos ocurrencias sucesivas de 1, lacantidad de 0 es un número en S. Muestre que X es un espacio shift, pero no unSTF.

g) Sea S un subconjunto innito de los enteros no negativos. Sea X el conjunto detodas las sucesiones binarias biinnitas en las que entre dos ocurrencias sucesivasde 1, la cantidad de 0 es un número en S. También en este caso, X se llama shiftde lagunas en S. Muestre que X es un espacio shift. Dar un ejemplo de S parael cual el correspondiente shift sea de tipo nito, y otro ejemplo para el cual no.Justique.

h) Sea S un subconjunto innito de los enteros no negativos. Sea X el conjunto detodas las sucesiones binarias biinnitas en las que los 1 aparecen con frecuenciainnita en ambas direcciones y, entre dos ocurrencias sucesivas de 1, la cantidad de0 es un número en S. Demuestre que X no es un espacio shift.

2. Para el alfabeto A = a, b, c, sea X el conjunto de sucesiones biinnitas en las que elbloque abkcma puede ocurrir sólo si k = m. Muestre que X es un espacio shift, pero queno es un STF. X se llama shift libre de contexto.

3. Muestre que si X e Y son STF sobre A, también lo es X ∩ Y . ¾Qué puede decir deX ∪ Y ?

4. Un problema de maximalidad.a) Sean F1 = 10, 11 y F2 = 01, 10, 11. Demuestre que XF1 = XF2 . Observe que

todos los bloques, tanto en F1 como en F2, tienen largo 2.

Page 48: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

44 2. SHIFTS DE TIPO FINITO

b) Sea X un STF de memoria M , digamos X = XF con todos los bloques en F delargo a lo sumo M + 1. Sea u un bloque de longitud n ≥M + 1 tal que ninguno desus subbloques está en F . ¾Debe necesariamente u pertenecer a B(X)?

c) Sea X un STF de memoria M , y u un bloque de longitud n ≥M + 1. Muestre queu está en B(X) si, y sólo si, todo subbloque de largo M + 1 en u está en B(X).

d) Sea X un STF de memoria M . De todas las familias F de palabras de largo M + 1tales que X = XF , encuentre una que sea maximal en el sentido de la contenciónde conjuntos.

5. Especique formalmente el grafo que se muestra en la gura 16, y obtenga su matrizde adyacencia. Observando la matriz de adyacencia, obtenga el grado de entrada y desalida de cada nodo, y el número total de aristas del grafo.

Figura 16. Grafo del ejercicio 5

6. SiH es un subgrafo de G, ¾qué relación hay entre las respectivas matrices de adyacencia?7. Sobre A = 0, 1, considere el STF X = X0000,111.

a) Muestre que X no es shift de aristas.b) Encuentre un entero M ≥ 0 y un grafo G tales que X [M ] = XG.c) ¾Es XG conjugado a X? En caso armativo, muestre una conjugación.

8. Dibuje el grafoG = (V,Σ, i, t) con V = 1, 2, 3, 4, 5, 6, 7, Σ = a, b, c, d, e, f, g, h, i, j, k, l,m,y funciones inicial y terminal denidas en la siguiente tabla:

arista a b c d e f g h i j k l minicial 3 1 1 1 2 2 3 4 3 6 7 2 6terminal 1 3 1 2 1 4 4 5 5 7 7 1 7

Identique el subgrafo esencial maximal G′ tal que XG′ = XG. Obtenga las matrices deadyacencia de G y de G′, y extraiga conclusiones acerca de las mismas.

9. Resuelva el mismo ejercicio anterior, pero agregando a G una arista n desde el estado 5al 6.

10. Considere el grafoG = (V,Σ, i, t) con V = 1, 2, 3, 4, 5, 6, Σ = a, b, c, d, e, f, g, h, i, j, k,y funciones inicial y terminal denidas en la siguiente tabla:

arista a b c d e f g h i j kinicial 1 1 4 3 3 3 1 2 5 6 6terminal 1 4 1 4 4 2 2 3 6 6 5

Page 49: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

2. SHIFTS DE TIPO FINITO 45

Construya G[3] y muestre una conjugación entre (XG)[3] y XG[3] .11. Sea A la matriz de adyacencia de un grafo con los nodos en un cierto orden, y A′ la del

mismo grafo con los nodos listados en otro orden. ¾Qué relación hay entre A y A′?12. Sean A = 0, 1, F = 000, 111 y X = XF . Construya dos grafos G y G′ tales que XG

y XG′ sean, respectivamente, presentaciones en bloques con solape de X. Use la matrizde adyacencia de G para calcular el número de puntos de X con período 5.

13. Sea X un shift de tipo nito de memoria 1. Para cada símbolo a ∈ B1(X), sea FX(a)el conjunto de símbolos b tales que ab ∈ B2(X). Muestre que, salvo cambio de nombresen los símbolos, X es un shift de aristas si, y sólo si, FX(a) y FX(c) son o bien igualeso bien disjuntos toda vez que a y c son símbolos en B1(X).

14. Sea G el grafo especicado en la siguiente tabla:

arista a b c d e f g h iinicial A A B B B D A C Cterminal A B B C D B C D D

Obtenga el grafo desdoblado G[P] que resulta de considerar m(A) = 2, m(B) = 3,m(C) = 2, m(D) = 1 y la partición P siguiente:

Σ1A = a, g,Σ2

A = b

Σ1B = c,Σ2

B = d,Σ3B = e

Σ1C = h,Σ2

C = i

Σ1D = f

Determine la matriz de adyacencia del grafo desdoblado, las matrices de división y dearistas para P , y establezca las relaciones entre las cuatro matrices.

15. Dadas las siguientes matrices:

A =

[1 11 0

]B =

0 1 11 1 01 0 0

C =

1 1 00 0 11 1 0

D = [2]

Decida cuáles de ellas se pueden obtener a partir de un proceso sucesivo de desdobla-mientos y amalgamas de estados de grafos representados por las otras. (Sugerencia:considere puntos periódicos.)

16. Muestre que el grafo obtenido a partir del desdoblamiento de estados de un grafo irre-ducible es también un grafo irreducible.

Page 50: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

Capítulo 3

SHIFTS SÓFICOS

Supongamos que las aristas de un grafo son rotuladas con símbolos de algún alfabeto A,con la posibilidad de que dos o más aristas puedan llevar el mismo rótulo. Cualquier caminobiinnito en el grafo produce un punto en el full shift AZ por lectura de los rótulos de susaristas, y el conjunto de todos los puntos que así pueden obtenerse se llama un shift sóco.

Los shifts sócos son importantes por varias razones. Veremos en este capítulo que sonprecisamente aquellos espacios shift que son factores de shifts de tipo nito. Así, la clase de losshifts sócos es la más pequeña colección de espacios shift que contiene a los STF y que tambiéncontiene a todos los factores de cada espacio de la colección. Los shifts sócos son los análogosde los lenguajes regulares de la teoría de autómatas, y varios de los algoritmos que sobre ellospueden ejecutarse son adaptaciones de los de autómatas de estados nitos. Los shifts de tiponito y los sócos son modelos naturales para almacenamiento y transmisión de la información;estudiaremos su uso en los códigos de estados nitos en el capítulo 6.

1. Presentaciones de shifts sócos

Los shifts sócos se denen usando grafos a cuyas aristas se asignan rótulos, donde variasaristas pueden llevar el mismo rótulo.

Definición 3.1. Un grafo rotulado G es un par (G,L), donde G es un grafo con conjuntode aristas Σ, y la rotuladora L : Σ → A es una función que asigna a cada arista e de G unrótulo L(e) del alfabeto A. A G se lo denomina el grafo subyacente de G. Un grafo rotuladose dice irreducible si su grafo subyacente es irreducible.

A veces nos referiremos a un grafo rotulado simplemente como un grafo, y a estados o aristasdel grafo subyacente G de un grafo rotulado G como estados o aristas de G.

La rotuladora L puede ser cualquier asignación de letras de un alfabeto A a las aristas de G.En un extremo, podríamos tener A = Σ y L(e) = e para toda e ∈ Σ, dando una rotulación unoa uno de aristas por sus nombres. En el otro extremo, A podría consistir de una única letra ay todas las aristas estarían rotuladas con a, es decir, L(e) = a para toda e ∈ Σ. Usualmente, Lserá no inyectiva, de modo que varias aristas llevarán el mismo rótulo. Aunque L no necesita sersobreyectiva, sólo se usarán las letras que están en la imagen de L. Utilizaremos normalmentecaracteres como e, f o g para los nombres de las aristas, y a, b, c o enteros pequeños para susrótulos. La gura 1 muestra dos ejemplos de grafos rotulados típicos.

Figura 1. Grafos rotulados típicos

46

Page 51: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

1. PRESENTACIONES DE SHIFTS SÓFICOS 47

Así como un grafo G es convenientemente descripto por su matriz de adyacencia AG, ungrafo rotulado G tiene como análogo una matriz de adyacencia simbólica AG, cuya entrada(I, J) contiene la suma formal de los rótulos de todas las aristas que van de I a J , o uncarácter ∅ si no hay tal arista. Por ejemplo, si G y H son los grafos rotulados de la gura 1 aizquierda y derecha respectivamente, entonces

AG =

[a bb a

]AH =

a c b∅ b a+ ba c ∅

Hay un análogo del homomorsmo de grafos para grafos rotulados, que añade el requisito deque los rótulos se preserven.

Definición 3.2. Sean G = (G,LG) y H = (H,LH) grafos rotulados. Un homomorsmode grafos rotulados desde G a H es un homomorsmo de grafos (∂Φ,Φ) : G → H tal queLH(Φ(e)) = LG(e) para toda arista e ∈ Σ(G). En este caso, escribimos (∂Φ,Φ) : G → H. Siambas ∂Φ y Φ son biyecciones, entonces (∂Φ,Φ) se llama isomorsmo de grafos rotulados,denotado mediante (∂Φ,Φ) : G ∼= H. Dos grafos rotulados son isomorfos como grafosrotulados (o simplemente isomorfos) si existe un isomorsmo de grafos rotulados entre ellos.

Se puede pensar que dos grafos rotulados isomorfos son el mismo para nuestros propósitos.Si G = (G,L) es un grafo rotulado, entonces L puede ser usada para rotular caminos y

caminos biinnitos del grafo subyacente G. Denimos el rótulo de un camino π = e1e2 . . . ende G mediante

L(π) = L(e1)L(e2) . . .L(en)

que es un n-bloque sobre A, y al cual a veces nos referiremos como un bloque rotulado o uncamino rotulado. Para el camino vacío ε, denimos L(ε) = ε, la palabra vacía sobre A. Siξ = . . . e−1e0e1 . . . es un camino biinnito en G, de modo que ξ es un punto del shift de aristasXG, denimos el rótulo del camino ξ como

L∞(ξ) = (L(ξi))i∈Z = . . .L(e−1)L(e0)L(e1) . . . ∈ AZ

El conjunto de los rótulos de todos los caminos biinnitos en G es denotado por

XG =x ∈ AZ : x = L∞(ξ) para algún ξ ∈ XG

= L∞(ξ) : ξ ∈ XG = L∞ (XG)

Así, XG es un subconjunto del full A-shift. Por ejemplo, si G es el grafo rotulado de la izquierdaen la gura 1, entonces XG es el full a, b-shift; el grafo rotulado H de la derecha produce unsubconjunto propio del full a, b, c-shift (¾por qué?). Notar también que si G yH son isomorfos,entonces XG = XH.

Este capítulo trata sobre los espacios shift que surgen de grafos rotulados.

Definición 3.3. Un subconjunto X de un full shift es un shift sóco si X = XG paraalgún grafo rotulado G. Una presentación de un shift sóco X es un grafo rotulado G para elcual XG = X. La transformación shift en XG es denotada por σG.

El término sóco fue acuñado por Benjamin Weiss (quien introdujo esta clase de espacios),y se deriva de la palabra que en hebreo se usa para nito.

Es importante darse cuenta de que un shift sóco dado tiene muchas presentaciones dife-rentes. Por ejemplo, la gura 2 muestra cuatro presentaciones del full 2-shift, ninguna de lascuales son isomorfas entre sí (aunque los grafos subyacentes de (b) y (c) son grafos isomorfos).

Si X es un shift sóco presentado por G = (G,L) y w es un bloque en B(X), decimos queun camino π en G es una presentación de w si L(π) = w. Un bloque w dado puede tenervarios caminos diferentes que lo presenten. Por ejemplo, en la gura 2 (d), el bloque 010001tiene tres presentaciones, una empezando en cada uno de los tres vértices. Si x ∈ XG, decimos

Page 52: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

48 3. SHIFTS SÓFICOS

Figura 2. Presentaciones del full 2-shift

que un camino biinnito ξ en XG es una presentación de x si L∞(ξ) = x. Al igual que con loscaminos, un punto de XG puede tener varias presentaciones diferentes.

Para un grafo rotulado G = (G,L), cualquier bloque en el lenguaje de XG es un caminorotulado en G. Sin embargo, si π es un camino en G, no necesariamente L(π) ∈ B (XG) (porejemplo, las aristas vinculadas a nodos muertos del grafo subyacente no forman parte de ningúncamino biinnito rotulado). Pero si L(π) ∈ B(X), donde X es algún espacio shift tal que cadaelemento en B(X) es un camino rotulado en G, entonces es seguro que L(π) está en el lenguajede XG.

Lema 3.4. Sea G = (G,L) un grafo rotulado, y sea X un espacio shift tal que B(X) ⊆L(π) : π es camino en G. Entonces, B(X) ⊆ B (XG)

Demostración. Llamemos r a la cantidad de vértices en G.Sea u un bloque arbitrario en B(X). Como u es extensible a izquierda y a derecha en B(X),

existen v, v′ ∈ Br(X) tales que vuv′ ∈ B(X). Por hipótesis, hay un camino Ω en G tal queL(Ω) = vuv′. Sea π la parte de ese camino que presenta a v, ρ la que presenta a u y δ la quepresenta a v′. Como el largo de los caminos π y δ es r, por el lema 2.22, podemos escribirπ = π′τπ′′ y δ = δ′τ ′δ′′ donde τ y τ ′ son ciclos no vacíos. Entonces Ω = π′τπ′′ρδ′τ ′δ′′. De todoesto se desprende que la concatenación innita ξ = · · · τττπ′′ρδ′τ ′τ ′τ ′ · · · es camino biinnitoen G, así que L∞(ξ) ∈ XG, y como u = L(ρ) v L∞(ξ), tenemos que u ∈ B (XG).

Nuestra denición de shift sóco no requiere que sea un espacio shift. Sin embargo, siemprelo es.

Teorema 3.5. Los shifts sócos son espacios shift.

Demostración. Sea X un shift sóco sobre A, y G = (G,L) una presentación de X.Entonces L : Σ → A induce un código monobloque L∞ : XG → XG, de modo que su imagenL∞(XG) = X es un espacio shift por el teorema 1.61.

Nótese que los shifts de aristas son shifts sócos, pues podemos simplemente usar el conjuntode aristas Σ como alfabeto y, como rotuladora, la función identidad L : Σ → Σ dada porL(e) = e. El siguiente resultado extiende esta observación para mostrar que los shifts de tiponito son sócos.

Teorema 3.6. Todo shift de tipo nito es un shift sóco.

Demostración. Sea X un STF, digamos de memoria M ≥ 0. Sea G el grafo construidosegún la demostración del teorema 2.29, de modo que X [M+1] = XG. Recordemos que V (G) =BM(X), Σ(G) = BM+1(X) y cada arista e1 . . . eM+1 va desde e1 . . . eM hasta e2 . . . eM+1. Para

Page 53: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

1. PRESENTACIONES DE SHIFTS SÓFICOS 49

cada arista α = e1 . . . eM+1, hagamos L(α) = e1. Mostraremos que el grafo rotulado G = (G,L)es una presentación de X, es decir, X = XG.

Si x ∈ X, βM+1(x) ∈ X [M+1] = XG, por lo que existe ξ ∈ XG tal que ξ = βM+1(x), es decir,ξi = x[i,i+M ] para cualquier i ∈ Z, y entonces L∞(ξ)i = L (ξi) = xi para todo i ∈ Z. Luego,L∞(ξ) = x, mostrando que x ∈ XG.

Por otro lado, sea x ∈ XG. Por denición de XG, existe ξ ∈ XG tal que x = L∞(ξ). ComoXG = X [M+1], es ξ = βM+1(y) para algún y ∈ X, y entonces ∀i ∈ Z, ξi = y[i,i+M ]. Luego,

∀i ∈ Z, xi = L∞(ξ)i = L(ξi) = L(y[i,i+M ]

)= yi

es decir, x = y ∈ X, mostrando que x ∈ X.

En la demostración previa, el código monobloque L∞ es el inverso de la conjugación βM+1,y corresponde a la idea de que x puede ser reconstruido a partir de βM+1(x) por lectura de lasletras inferiores.

No cualquier shift sóco tiene tipo nito. La gura 3 muestra dos grafos rotulados. Elshift sóco presentado por el grafo (a) es el shift par, que ya hemos demostrado que no tienetipo nito. Un razonamiento similar se aplica al grafo en (b), ya que 30M y 0M1 son bloquespermitidos para cualquier M ∈ N, pero 30M1 no lo es, lo que, por el teorema 2.9, muestraque este shift sóco no tiene tipo nito. Un shift sóco que no tiene tipo nito se llama shiftestrictamente sóco.

Figura 3. Presentaciones de shifts estrictamente sócos

El siguiente resultado ofrece otra perspectiva de la diferencia entre shifts de tipo nito yshifts estrictamente sócos.

Proposición 3.7. Un shift sóco es un shift de tipo nito si, y sólo si, tiene una presen-tación (G,L) tal que L∞ es una conjugación.

Demostración. Si X es un shift sóco presentado por (G,L) y L∞ es una conjugación,entonces X es conjugado al shift de tipo nito XG, y entonces, por el teorema 2.11, es de tiponito.

Recíprocamente, si X es un shift de tipo nito, tiene memoria M ≥ 0. Entonces, la pre-sentación mostrada en el teorema 3.6 es la buscada, pues L∞ y βM+1 son códigos de ventanadeslizante inversos entre sí, de donde resulta que L∞ es una conjugación.

Resulta que hay muchos espacios shift que no son sócos. De hecho, si consideramos que lacantidad de grafos es numerable salvo isomorsmo y la cantidad de formas de rotular a cada unocon letras de A es nita, vemos que la cantidad de espacios shift sócos es numerable, mientrasque la cantidad de espacios shift es innita no numerable. A continuación, presentamos unespacio shift no sóco.

Ejemplo 3.8. Sea X el shift libre de contexto, donde A = a, b, c y F = abmcna : m 6= n.Mostraremos por el absurdo que X no es sóco. Supongamos que lo fuera, y sea G = (G,L)una presentación. Sea r el número de estados en G. Ya que w = abrcra está permitido, hayun camino biinnito en G que contiene un camino π que presenta a w. Sea e la primera aristade π, δ el subcamino de π que presenta a br, ρ el que presenta a cr y f la última arista de π,siendo entonces π = eδρf . Como G tiene r estados y |δ| = r, por el lema 2.22 es δ = π′τπ′′

Page 54: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

50 3. SHIFTS SÓFICOS

donde τ es un ciclo no vacío. Entonces π′ττπ′′ es también camino en G, con L(π′ττπ′′) = br+s

(siendo s = |τ | ≥ 1). En consecuencia, eπ′ττπ′′fρf es subcamino de un camino biinnito enG, con rótulo L(eπ′ττπ′′fρf) = abr+scra. Pero este bloque no está permitido pues r + s > r.Contradicción. Luego, X no puede ser sóco.

La gura 4 muestra cómo se relacionan las distintas clases de espacios shift que hemos idoencontrando, desde el punto de vista de la contención de conjuntos. También se ve en cadaclase un ejemplo de espacio shift de esa clase, que no pertenece a clases más reducidas.

Espacios Shift

• Shift libre de contexto

Shifts Sóficos

• Shift par

Shifts de Tipo Finito

• Shift de la razón de oro

Shifts de aristas

• Xeg,fe,ff,gg

Full shifts

• e, f, gZ

Figura 4. Contenciones entre clases de espacios shift

Sobre grafos rotulados, es posible realizar varias operaciones análogas a las que se realizansobre grafos comunes. En particular, la muy importante noción de desdoblamiento de estados.

Definición 3.9. Sea G = (G,L) un grafo rotulado, y supongamos que H es un grafo queresulta de un desdoblamiento de salidas de G (recordar que cada arista de H es de la formaej, donde e es una arista en G y j algún entero positivo). Sea L′ la rotulación para H denidapor L′ (ej) = L(e). Entonces, el grafo rotulado H = (H,L′) se llama un desdoblamiento desalidas de G, y G es una amalgama de salidas de H.

De manera análoga se denen los desdoblamientos y amalgamas de entradas de grafosrotulados.

Cualquier desdoblamiento de un grafo rotulado presenta el mismo espacio shift que el graforotulado original.

Teorema 3.10. Si H es un desdoblamiento del grafo rotulado G, entonces XH = XG.

Queda de ejercicio la demostración del importante resultado anterior.

2. Caracterizaciones de shifts sócos

Supongamos tener un espacio shift X descripto a través de un conjunto de bloques prohi-bidos. ¾Cómo podemos distinguir si es o no un shift sóco? En esta sección, proporcionaremosdos maneras de responder a la pregunta.

Page 55: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

2. CARACTERIZACIONES DE SHIFTS SÓFICOS 51

La primera manera es que X es sóco si, y sólo si, es un factor de un shift de tipo nito. Aconsecuencia de ello, la colección de los shifts sócos es la más pequeña colección de espaciosshift que contiene a los STF y que es cerrada bajo la operación de tomar factores. De hecho,esta propiedad de los shifts sócos fue la motivación original de Weiss para introducirlos.

La segunda manera usa el lenguaje de X. Si w es una palabra en B(X), entonces la familiade todas las palabras que pueden seguir a w en X es un subconjunto de B(X) que depende dew. Podría haber una cantidad innita de tales familias diferentes según w varía en B(X), peroveremos que X es sóco precisamente cuando hay sólo una cantidad nita de tales familias.

Comenzamos con el criterio de los códigos factores.

Teorema 3.11. Un espacio shift es sóco si, y sólo si, es un factor de un shift de tiponito.

Demostración. Si X es sóco, existe G = (G,L) tal que X = XG = L∞ (XG), siendo L∞un código de ventana deslizante monobloque (inducido por L) sobreyectivo sobre su imagen.Luego, X es factor de XG, que es un STF.

Recíprocamente, supongamos que X es un espacio shift que es factor de algún STF Y dememoria M . Es decir, existe un espacio shift Y y un CVD factor φ : Y → X. Sean m y n lamemoria y anticipación de φ, y Φ la respectiva función inductora. Incrementando M , m o n,podemos suponer que Y es de memoria m+ n.

Denamosψ : Y → Y [m+n+1]

ψ(y)i = y[i−m,i+n]

Es decir, ψ = σiβm+n+1, y ψ(Y ) = Y [m+n+1] dado que ψ es conjugación por ser la composiciónde dos conjugaciones.

Ya que Y es de memoria m + n, hay un grafo G = (V,Σ, i, t) tal que XG = Y [m+n+1], y lasaristas de G son los bloques en Bm+n+1(Y ).

Denamos para G la función rotuladora L : Σ → B1(X) mediante L(e) = Φ(e), y veri-quemos que G = (G,L) es una presentación para X, con lo que quedará probado que X es unshift sóco.

Notemos para ello que L∞ ψ = φ, pues, para cualquier y ∈ Y y cualquier i ∈ Z,L∞ ψ(y)i = L∞ (ψ(y))i = L (ψ(y)i) = L

(y[i−m,i+n]

)= Φ

(y[i−m,i+n]

)= φ(y)i

Entonces, L∞ (XG) = L∞(Y [m+n+1]

)= L∞(ψ(Y )) = φ(Y ) = X, de modo que (G,L) es una

presentación para X.

Corolario 3.12. Cualquier factor de un shift sóco es un espacio shift sóco.

Demostración. Si Y es factor de un shift sóco X, hay un código factor φ : X → Ysobreyectivo. Siendo X sóco, por el teorema 3.11 existe un shift de tipo nito Z y un códigofactor ψ : Z → X. Entonces, el CVD ψ φ : Z → Y es sobreyectivo y, por lo tanto, códigofactor de Z hacia Y , es decir, Y es factor del STF Z. Luego, nuevamente por el teorema 3.11,Y es sóco.

Corolario 3.13. Cualquier espacio shift conjugado a un shift sóco es también sóco.

Demostración. Si un espacio shift es conjugado a un shift sóco, es factor de ese shiftsóco, por lo que, por el corolario 3.12, es también sóco.

Vamos ahora con el criterio de los lenguajes para caracterización de los shifts sócos.

Definición 3.14. Sea X un espacio shift y w una palabra en B(X). El conjunto deseguidores de w en X, denotado FX(w), es el conjunto de todas las palabras que puedenseguir a w en X, es decir

FX(w) = v ∈ B(X) : wv ∈ B(X)

Page 56: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

52 3. SHIFTS SÓFICOS

La colección de todos los conjuntos de seguidores en X es

CX = FX(w) : w ∈ B(X)− ε

Cada conjunto de seguidores es un conjunto innito de palabras, ya que cada palabra enB(X) puede ser extendida a la derecha con bloques arbitrariamente largos. Sin embargo, muchaspalabras pueden tener el mismo conjunto de seguidores. A través de ejemplos, mostraremos queesto puede resultar en que, en algunos casos, haya sólo una cantidad nita de conjuntos deseguidores (es decir, que CX sea un conjunto nito), y, en otros casos, la cantidad de conjuntosde seguidores sea innita.

Ejemplo 3.15. Sean X = 0, 1Z y w ∈ B(X). Como cualquier palabra puede seguir acualquier otra en el full shift, tenemos que el conjunto de seguidores de w es todo el lenguaje deX, es decir, FX(w) = 0, 1∗. Luego, CX = 0, 1∗, es decir, CX consta de un solo elemento.

Ejemplo 3.16. Sea G el grafo esencial mostrado en la gura 5 (a), y sea X = XG, quetiene alfabeto e, f, g, h. Si π es un camino en G (es decir, una palabra en B (XG)), entoncesel conjunto de seguidores de π es el conjunto de todos los caminos en G que comienzan enel vértice terminal de π. Sean C0 el conjunto de caminos de G que comienzan en 0, y C1 elconjunto de caminos que comienzan en 1. Entonces, CX = C0, C1. Por ejemplo,

FX(e) = FX(fg) = FX(hhgee) = C0

yFX(f) = FX(gefh) = FX

(h100

)= C1

Las mismas consideraciones muestran que si G es cualquier grafo esencial que tiene r vértices,entonces CXG consta de exactamente r conjuntos, uno correspondiente a cada vértice.

Figura 5. Grafos para conjuntos de seguidores

Ejemplo 3.17. Sea G el grafo rotulado de la gura 5 (b), de modo que X = XG es el shiftpar. Hay tres conjuntos de seguidores distintos, dados por

C0 = FX(0) = ε, 0, 1, 00, 01, 10, 11, 000, 001, 010, 011, 100, 110, 111, . . .,

C1 = FX(1) = ε, 0, 1, 00, 10, 11, 000, 001, 100, 110, 111, . . .,C2 = FX(10) = ε, 0, 00, 01, 000, 010, 011, . . .,

Para cualquier w ∈ B(X), es fácil chequear que

FX(w) =

C0 si w no contiene 1C1 si w termina en 102k para algún k ≥ 0C2 si w termina en 102k+1 para algún k ≥ 0

Luego, C0, C1 y C2 son los únicos conjuntos de seguidores posibles, es decir, CX = C0, C1, C2.

Ejemplo 3.18. Sea X el shift libre de contexto, con alfabeto A = a, b, c y para el cualabmcka está permitido exactamente cuando m = k. Luego, cka está en FX (abm) si, y sólo si,k = m. Esto signica que, para m = 1, 2, 3, . . ., los conjuntos de seguidores de FX (abm) son dosa dos diferentes, de modo que CX consta de innitos conjuntos.

Page 57: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

2. CARACTERIZACIONES DE SHIFTS SÓFICOS 53

Supongamos que X es un espacio shift sobre A tal que CX es un conjunto nito. Construi-remos un grafo rotulado G = (G,L) como explicamos a continuación. Los vértices de G son loselementos en CX . Sea I = FX(w) un vértice en G y a una letra en A. Si wa es un bloque enB(X), entonces J = FX(wa) está en CX , y en consecuencia es un vértice en G; poner en estecaso una arista rotulada a desde I hasta J . Si wa /∈ B(X), no habrá ninguna arista en G quelleve rótulo a saliendo de I. Ejecutando esta acción para cada vértice en G y cada letra en elalfabeto, obtenemos el grafo rotulado G, que denominaremos el grafo de los conjuntos deseguidores para X.

Por ejemplo, Sea X el shift par, de modo que CX = C0, C1, C2 según el ejemplo 3.17. Yaque C0 = FX(0), el grafo de los conjuntos de seguidores para X tiene una arista rotulada 0desde C0 hasta FX(00) = C0 y una arista rotulada 1 desde C0 hasta FX(01) = C1. El grafocompleto de los conjuntos de seguidores para X se muestra en la gura 6.

Figura 6. Grafo de los conjuntos de seguidores para el shift par

Al denir el grafo de los conjuntos de seguidores, hemos pasado por alto un punto esencial:supongamos que I = FX(w) = FX(w′) para otra palabra w′, y que hubiésemos usado w′ enlugar de w al construir el grafo. ¾Produciría ésto un grafo diferente? Para ver que no, notarprimero que wa ∈ B(X) si, y sólo si, a ∈ FX(w) = FX(w′) si, y sólo si, w′a ∈ B(X). Además,

FX(wa) = v ∈ B(X) : wav ∈ B(X)= v ∈ B(X) : av ∈ FX(w)= v ∈ B(X) : av ∈ FX(w′)= v ∈ B(X) : w′av ∈ B(X)= FX(w′a)

Esto signica que habríamos tomado la misma decisión de colocar o no arista rotulada a arran-cando en FX(w′) = FX(w), y, de hacerlo, lo haríamos hacia FX(w′a) = FX(wa). Por lo tanto,el grafo obtenido habría sido el mismo.

Ahora mostraremos que si X es un espacio shift para el cual |CX | < ∞, el grafo de losconjuntos de seguidores para X es una presentación del espacio shift.

Proposición 3.19. Si X es un espacio shift con una cantidad nita de conjuntos de se-guidores, y G = (G,L) es el grafo de los conjuntos de seguidores para X, entonces G es unapresentación para X. Por lo tanto, X es sóco.

Demostración. Dado que el lenguaje de un espacio shift caracteriza al espacio, bastamostrar que B(X) = B (XG).

Sea u = a1a2 · · · an ∈ B (XG). Entonces hay un camino π en G tal que L(π) = u. Como i(π)es un vértice, existe w ∈ B(X) tal que i(π) = FX(w). Dado que hay una arista rotulada a1

saliendo de FX(w), la propia denición de G muestra que wa1 ∈ B(X). El vértice terminal de esaarista es FX(wa1), y de él sale una arista rotulada a2, de donde deducimos que wa1a2 ∈ B(X).Así continuando, vemos que wa1 · · · an = wu ∈ B(X), por lo que u ∈ B(X).

Page 58: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

54 3. SHIFTS SÓFICOS

Ahora, sea u = a1a2 · · · an ∈ B(X). Como u es extensible a izquierda en B(X), existew ∈ B(X) tal que wu ∈ B(X), por lo que a1 ∈ FX(w), y entonces en G hay una arista rotuladaa1 desde FX(w) hasta FX(wa1); análogamente, hay en G una arista rotulada a2 desde FX(wa1)hasta FX(wa1a2), y así sucesivamente. De este modo, vemos que hay en G un camino cuyorótulo es a1a2 · · · an = u. Entonces, por el lema 3.4, tenemos que u ∈ B (XG).

La propiedad de poseer una cantidad nita de conjuntos de seguidores es, de hecho, carac-terística de los shifts sócos.

Teorema 3.20. Un espacio shift es sóco si, y sólo si, posee una cantidad nita de conjuntosde seguidores.

Demostración. Para la ida, supongamos que X es un espacio shift sóco, y, por lo tanto,tiene una presentación G = (G,L), con G = (V,Σ, i, t). Para cada w ∈ B(X), designemos porT (w) al conjunto de todos los vértices de G en los que terminan todas las presentaciones de w.Es decir,

T (w) = t(π) : L(π) = wEs casi directo chequear que el conjunto de seguidores de w en X es el formado por los rótulosde todos los caminos de G que comienzan en algún vértice en T (w), es decir,

FX(w) = L(π) : i(π) ∈ T (w)Por lo tanto, FX(w) queda determinado por T (w), y dos palabras w,w′ tales que T (w) = T (w′)tienen el mismo conjunto de seguidores. Como la familia de subconjuntos de V es nita, todoesto implica que sólo puede haber una cantidad nita de conjuntos de seguidores.

La implicación recíproca está establecida en la proposición 3.19.

En el ejemplo 3.18, vimos que el shift libre de contexto tiene una cantidad innita de con-juntos de seguidores, y entonces, por el teorema anterior, no puede ser sóco. Esta demostraciónes mucho menos trabajosa que la que ofrecimos en el ejemplo 3.8 para mostrar que el shift librede contexto no es sóco.

La demostración del teorema 3.20 sugiere un método para construir el grafo de los conjuntosde seguidores a partir de una presentación del shift sóco: cada conjunto de seguidores corres-ponde a algún subconjunto del conjunto de vértices. Sin embargo, para seguir este método senecesita identicar cuáles subconjuntos corresponden efectivamente a conjuntos de seguidores,e identicar también cuándo dos subconjuntos corresponden al mismo conjunto de seguidores.

3. Presentaciones resolventes a derecha

Un grafo rotulado se dice resolvente a derecha si, para cada vértice del grafo, las aristasque salen de él llevan rótulos diferentes. Un grafo resolvente a derecha es determinista, en elsentido de que dado un bloque w y un vértice I, existe a lo sumo un camino comenzando enI con rótulo w. Entonces, la ambigüedad de la existencia de múltiples presentaciones para unbloque cualquiera queda relegada sólo a la elección del vértice de arranque. Estudiaremos enesta sección las presentaciones resolventes a derecha de los shifts sócos.

Recordemos que para un grafo G = (V,Σ, i, t), el símbolo ΣI denota al conjunto de todaslas aristas que comienzan en el vértice I.

Definición 3.21. Un grafo rotulado G = (G,L), con G = (V,Σ, i, t), es resolvente aderecha si, para cada vértice I ∈ V , las aristas que comienzan en I llevan diferentes rótulos.En otras palabras, G es resolvente a derecha si, para cada I, la restricción de L a ΣI es unafunción inyectiva. Una presentación resolvente a derecha de un shift sóco es un graforotulado resolvente a derecha que presenta al shift.

Por ejemplo, los grafos rotulados (a), (b) y (d) mostrados en la gura 2 son presentacionesresolventes a derecha del full shift sobre 0, 1, mientras que el (c) de esa misma gura es unapresentación de 0, 1Z que no es resolvente a derecha.

Page 59: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

3. PRESENTACIONES RESOLVENTES A DERECHA 55

Hemos denido resolvente a derecha en términos de aristas salientes desde los vértices.Existe la propiedad dual de resolvente a izquierda, en la cual todas las aristas entrantes a unmismo vértice llevan rótulos diferentes. El grafo rotulado (c) de la gura 2 es una presentaciónresolvente a izquierda de 0, 1Z. Hay presentaciones de 0, 1Z que no son resolventes ni aderecha ni a izquierda (ejercicio: construir una).

¾Admite cualquier espacio shift sóco una presentación resolvente a derecha? Ya tenemosuna respuesta armativa a esta pregunta si analizamos el grafo de los conjuntos de seguidorespara un espacio shift sóco, que, de acuerdo a su construcción, es resolvente a derecha y, segúnhemos demostrado antes, es una presentación de ese shift sóco. Sin embargo, la construcción delgrafo de los conjuntos de seguidores deja abierto el problema de cómo encontrar los conjuntos deseguidores, que con algún esfuerzo hemos desarrollado en los ejemplos que vimos. Describiremosun método alternativo para construir una presentación resolvente a derecha explícita de unshift sóco a partir de una presentación cualquiera del espacio, método que denominamosconstrucción de subconjuntos.

Definición 3.22. Sea G = (G,L) un grafo rotulado, con G = (V,Σ, i, t) y L : Σ → A.El grafo de subconjuntos de G es el grafo rotulado H = (H,L′), con H = (V ′,Σ′, i′, t′) yL′ : Σ′ → A, construido como sigue.

Los vértices de H son todos los subconjuntos no vacíos de V . Es decir, V ′ = P(V )− ∅.Consideremos un vértice I ′ ∈ V ′ y una letra a ∈ A jos. Sea J ′ el conjunto de todos los

vértices de G que son alcanzables desde algún nodo I ∈ I ′ ⊂ V mediante alguna arista rotuladaa. Es decir, J ′ = t(e) : i(e) ∈ I ′ ∧ L(e) = a. Si J ′ 6= ∅, colocamos una arista e′ en H desde I ′

hasta J ′ con rótulo L′(e′) = a; si J ′ = ∅, no habrá ninguna arista con rótulo a en H saliendo deI ′. Realizando este proceso para cada I ′ ∈ V ′ y cada a ∈ A, queda denido el grafo rotuladoH.

Observar que, por la construcción realizada, para cada vértice I ′ ∈ V ′ y cada a ∈ A, hay alo sumo una arista en H arrancando en I ′ con rótulo a, por lo que el grafo de subconjuntos esresolvente a derecha.

Ejemplo 3.23. Sea X el shift sóco presentado por el grafo G de la gura 7 (a). Realizandola construcción de subconjuntos, se obtiene el grafo H mostrado en (b) de la misma gura.Notar que, aunque G es irreducible, H no lo es (de hecho, el grafo subyacente ni siquiera esesencial). Sin embargo, hay un subgrafo irreducible H′ de H, obtenido por eliminar el vérticeb y la arista que sale de él, que también presenta a X.

Figura 7. La construcción de subconjuntos

El siguiente resultado relaciona los caminos rotulados de un grafo rotulado G y de su grafode subconjuntos H. Concretamente, enuncia que el vértice terminal de un camino rotulado uen H arrancando en un estado I ′ es el conjunto de todos los vértices de G a los que se puedellegar mediante un camino en G rotulado u que comienza en alguno de los estados de G quepertenecen a I ′.

Page 60: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

56 3. SHIFTS SÓFICOS

Lema 3.24. Sean G = (G,L) un grafo rotulado con G = (V,Σ, i, t) y L : Σ → A, yH = (H,L′) el grafo de subconjuntos de G, con H = (V ′,Σ′, i′, t′) y L′ : Σ′ → A. Sea τ uncamino en H con rótulo u ∈ A∗. Entonces,

t′(τ) = t(π) : π es camino en G, i(π) ∈ i′(τ),L(π) = u

Demostración. Haremos inducción en |τ | ≥ 0. Llamaremos I ′ al vértice inicial y J ′ alvértice terminal de τ . Debemos ver que

J ′ = t(π) : π es camino en G, i(π) ∈ I ′,L(π) = uSi |τ | = 0, τ es el camino vacío, por lo que J ′ = I ′, y, por otro lado, ya que ε es siemprecamino en G, que t(ε) = i(ε) y que L(ε) = ε sea cual fuere el vértice en G desde el quese considere arrancando el camino vacío, resulta que

t(ε) : ε es camino en G, i(ε) ∈ I ′,L(ε) = ε = t(ε) : i(ε) ∈ I ′= i(ε) : i(ε) ∈ I ′ = I ′

Así que la igualdad se cumple.Supongamos ahora el enunciado válido para cualquier camino de largo k ≥ 0, y asu-mamos que τ tiene largo k + 1, digamos τ = τ1 · · · τkτk+1, con rótulo u = u1 · · ·ukuk+1.Llamemos K ′ al vértice terminal de τ1 · · · τk en H. Notar que la arista τk+1 va desde K ′

hasta J ′ y lleva rótulo uk+1.Sea J ∈ J ′. Por construcción de H, hay en G un vértice K que pertenece a K ′ desde

el que sale una arista e con rótulo uk+1 que termina en J . Por hipótesis inductiva, existecamino ρ en G rotulado u1 · · ·uk tal que i(ρ) ∈ I ′ y t(ρ) = K. Luego, tomando π = ρe,tenemos que π es camino en G desde un vértice en I ′ hacia J rotulado u1 · · ·ukuk+1, esdecir, J ′ ⊆ t(π) : π es camino en G, i(π) ∈ I ′,L(π) = u.

Por otro lado, sea π un camino en G tal que i(π) ∈ I ′ y L(π) = u. Debemos verque t(π) ∈ J ′. Como |u| ≥ 1, debe ser π = π1 · · · πkπk+1. Llamemos K = t(π1 · · · πk).Por hipótesis inductiva, K ∈ K ′. Luego, siendo πk+1 una arista en G rotulada uk+1

saliendo desde un vértice de K ′, por construcción del grafo de subconjuntos, debe sert(πk+1) ∈ J ′, pues, si no fuese así, al construir H habríamos colocado desde K ′ otraarista diferente a τk+1 saliendo desde K ′ también con rótulo uk+1, lo que es imposiblepues H es resolvente a derecha. Luego, t(π) = t(πk+1) ∈ J ′.

Por lo tanto, J ′ = t(π) : π es camino en G, i(π) ∈ I ′,L(π) = u, y el resultado queda estable-cido.

Teorema 3.25. Cualquier shift sóco admite una presentación resolvente a derecha.

Demostración. Sea XG un shift sóco con G = (G,L), y sea H el grafo de subconjuntosde G. Como H es resolvente a derecha, el teorema quedará demostrado chequeando que H esuna presentación de XG, para lo que veremos que B (XG) = B (XH).

Sea u = a1 · · · an ∈ B (XG). Entonces hay un camino π = e1 · · · en en G tal que L(π) = u.Sean I = i(π) ∈ V y J ′0 = I ∈ V ′. Hagamos J ′1 = t(e) : i(e) ∈ J ′0 ∧ L(e) = a1, esdecir, J ′1 es el conjunto de vértices en G alcanzables desde I mediante una arista rotulada a1.Notar que J ′1 6= ∅ pues π1 sale de I y L(e1) = a1, así que, por construcción de H, hay unaarista desde J ′0 hasta J

′1 con rótulo a1. Continuando de esta forma, para cada m ≤ n denimos

J ′m = t(e) : i(e) ∈ J ′m−1 ∧ L(e) = am, siendo J ′m 6= ∅ pues t(e1 · · · em−1) ∈ J ′m−1 y, porconstrucción, hay en H una arista rotulada am desde J ′m−1 hasta J ′m. Así, queda denido uncamino τ en H que empieza en J ′0 y lleva rótulo u. Hemos demostrado entonces que cualquierbloque en B (XG) es un camino rotulado en H. Luego, por el lema 3.4, B (XG) ⊆ B (XH).

Recíprocamente, sea u ∈ B (XH). Entonces, hay un camino τ en H tal que L′(τ) = u. SeanI ′ y J ′ respectivamente los vértices inicial y nal de τ . Por el lema 3.24, J ′ es el conjunto devértices de G alcanzables desde los vértices de I ′ mediante caminos rotulados con u. ComoJ ′ 6= ∅, hay en G un camino cuyo rótulo es u, y entonces, por el lema 3.4, u ∈ B (XG).

Page 61: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

3. PRESENTACIONES RESOLVENTES A DERECHA 57

Si G es un grafo rotulado con r estados, la construcción de subconjuntos produce un graforotulado H resolvente a derecha con 2r − 1 estados. El precio de requerir una presentaciónresolvente a derecha es un gran incremento en el número de estados. Afortunadamente, esfrecuente que un subgrafo de H presente el mismo shift sóco, como ocurrió en el ejemplo 3.23.

Ahora dirigiremos nuestra atención a encontrar presentaciones resolventes a derecha pe-queñas de un shift sóco dado.

Definición 3.26. Una presentación resolvente a derecha minimal de un shift sócoX es una presentación resolvente a derecha de X que posee cantidad de vértices menor o igualque la cantidad de vértices de cualquier otra presentación resolvente a derecha de X.

Una característica importante de cualquier presentación resolvente a derecha minimal es que,para cada par de estados distintos, hay un bloque w que admite una presentación comenzandoen uno de los estados, pero no admite presentación comenzando desde el otro.

Definición 3.27. Sea G = (G,L) un grafo rotulado, con G = (V,Σ, i, t), e I un vértice. Elconjunto de seguidores de I en G, denotado FG(I), es la colección de rótulos de caminosde G que comienzan en I, es decir,

FG(I) = L(π) : π ∈ B (XG) , i(π) = I

Dos vértices I, J se dicen equivalentes si tienen el mismo conjunto de seguidores, es decir, siFG(I) = FG(J).

Decimos que G tiene seguidores separados cuando no posee estados distintos que seanequivalentes, es decir, cuando ∀I, J ∈ V, I 6= J ⇒ FG(I) 6= FG(J).

Por ejemplo, en la gura 2, los grafos (a) y (c) tienen seguidores separados, mientras que(b) y (d) no (ejercicio).

Si un grafo no tiene seguidores separados, mostraremos cómo fusionar estados para obtenerun grafo más pequeño (en cuanto a cantidad de vértices) que presenta al mismo shift sóco yque tiene seguidores separados. Notemos, para ello, que la relación de ser equivalentes es unarelación de equivalencia en el conjunto de vértices de G, el cual queda particionado en clasesI1, I2, . . . , Ir. A partir de G, denimos un grafo rotulado H como sigue: los vértices de H sonI1, I2, . . . , Ir, y hay una única arista en H rotulada a de Ii hacia Ij exactamente cuando hayvértices I ∈ Ii y J ∈ Ij tales que, en G, hay una arista rotulada a desde I hasta J . Llamamosa H el grafo fusionado a partir de G.

Lema 3.28. Sea G un grafo rotulado, y H el grafo fusionado a partir de G. Entonces, Htiene seguidores separados y XH = XG. Además, si G es irreducible, también lo es H, y si G esresolvente a derecha, H también lo es.

Demostración. Primero mostraremos que, para cualquier vértice I en G, se cumple queFG(I) = FH(I), siendo I la clase de equivalencia de I. Demostraremos la aserción por inducciónen el largo de los bloques.

Consideremos un vértice I arbitrario en G, y sea I su clase de equivalencia.

El único bloque de largo 0 es ε, que, por denición de conjuntos de seguidores, estátanto en FG(I) (pues consideramos el camino vacío arrancando en I, con rótulo ε) comoen FH(I). Así que la proposición se cumple para bloques de largo 0.Ahora, supongamos que la aserción se cumple para bloques de largo n, y sea u = aw unbloque de largo n+ 1, con a una letra y w bloque de largo n.• Si u ∈ FG(I), hay camino π = eτ (con e arista desde I hasta algún vértice de G,digamos J , y τ camino de largo n comenzando en J) cuyo rótulo es u. Esto implicaque L(e) = a y L(τ) = w. Sea J la clase de equivalencia de J . Por construcciónde H, hay arista de I hacia J rotulada a. Por hipótesis de inducción, siendo w =L(τ) ∈ FG(J), es L(τ) ∈ FH(J ). Por lo tanto, u = aw ∈ FH(I).

Page 62: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

58 3. SHIFTS SÓFICOS

• Recíprocamente, supongamos que u ∈ FH(I). Debe haber una arista rotulada asaliendo de I hacia algún vértice J de H, y un camino rotulado w saliendo desdeJ ; lo primero implica que, por construcción de H, hay en G una arista rotulada adesde algún K ∈ I hacia algún J ′ ∈ J , y lo segundo implica que w ∈ FH(J ). Comoa ∈ FG(K) = FG(I) (pues I y K están en la misma clase de equivalencia I), hayuna arista e en G desde I hasta algún J ∈ J . Puesto que FG(J) = FG(J

′) (por estarJ y J ′ en la misma clase de equivalencia J ), hay camino τ en G que arranca en Jy lleva rótulo w. Por lo tanto, eτ es camino en G que comienza en I y tiene rótuloaw = u, es decir, u ∈ FG(I).

Esto completa la inducción para mostrar que FG(I) = FH(I) cualquiera sea el vértice I de G.Ahora si I y J son vértices distintos en H, elijamos I ∈ I y J ∈ J ; ya que I y J

no son equivalentes, FG(I) 6= FG(J), y entonces, de acuerdo a lo demostrado previamente,FH(I) 6= FH(J ). Por lo tanto, H tiene seguidores separados.

Además, B (XG) es la unión de todos los FG(I) conforme I varía entre los vértices de G, ysimilarmente para B (XH). Como hay correspondencia entre los conjuntos de seguidores en G ylos de H, se deduce que B (XG) = B (XH) y, en consecuencia, XG = XH.

Supongamos ahora que G es irreducible, y sean I y J vértices en H. Elijamos vértices I ∈ Iy J ∈ J . Por irreductibilidad de G, hay camino de I a J en G; la existencia de este caminogarantiza, por construcción de H, la existencia de un camino desde I hasta J , por lo que H estambién irreducible.

Por último, sea I un vértice en H, y e′ una arista saliendo de I con rótulo a hacia unestado J . Por construcción de H, no puede haber otra arista desde I hacia J con rótulo a.Supongamos entonces que hay arista f ′ en H saliendo de I con rótulo a, digamos hacia unestado K 6= J . Debe haber estados I, I ′ ∈ I, J ∈ J y K ∈ K tales que, en G, hay aristase desde I hacia J y f desde I ′ hacia K con L(e) = L(f) = a. Puesto que J y K no sonequivalentes, FG(J) 6= FG(K); sin pérdida de generalidad, podemos suponer que hay un bloqueu en FG(J) que no está en FG(K). En ese caso, au es un seguidor de I, y, en consecuencia, de I ′

(ya que I e I ′ están en I). Pero la primera arista de cualquier camino que presente a au en Garrancando en I ′ no puede ser f , pues desde t(f) = K no sale ningún camino rotulado u. Luego,debe haber arista g 6= f en G desde I ′ con rótulo a, es decir, G no es resolvente a derecha. Estopermite concluir que si H no es resolvente a derecha, G tampoco lo es, o, equivalentemente, siG es resolvente a derecha, H también lo es.

La fusión de estados nos permite deducir la principal propiedad de las presentaciones resol-ventes a derecha minimales.

Proposición 3.29. Una presentación resolvente a derecha minimal de un espacio shift tieneseguidores separados.

Demostración. Sea G una presentación resolvente a derecha minimal de un shift sóco X.Si G no tiene seguidores separados, entonces el grafo fusionado H a partir de G tendría menosestados. Por el lema 3.28, H es una presentación resolvente a derecha de X, contradiciendo laminimalidad de G.

Ahora discutimos la relación entre la irreductibilidad de un shift sóco y la irreductibilidadde una presentación. Primero observemos que si G = (G,L) es un grafo rotulado irreducible,entonces el shift sóco XG debe ser irreducible. Porque si u, v ∈ B (XG), entonces hay caminosπ, τ en G con L(π) = u y L(τ) = v. Como G es irreducible, hay un camino ω en G desde t(π)hacia i(τ), por lo que πωτ es camino en G. Hagamos w = L(ω). Entonces

L(πωτ) = L(π)L(ω)L(τ) = uwv ∈ B (XG)

quedando establecida la irreductibilidad de XG. Esto signica que un shift sóco presentado porun grafo rotulado irreducible es irreducible.

Page 63: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

3. PRESENTACIONES RESOLVENTES A DERECHA 59

El recíproco, sin embargo, no es cierto en general. Por ejemplo, sea X irreducible y presen-tado por G. Sea H la unión de dos copias disjuntas de G. Entonces, aunque X es irreducibley es obviamente presentado por H, el grafo H es reducible. Sin embargo, podemos probar elrecíproco para el caso de las presentaciones resolventes a derecha minimales.

Lema 3.30. Sea X un shift sóco irreducible, y sea G = (G,L) una presentación resolventea derecha minimal de X. Entonces G es un grafo rotulado irreducible.

Demostración. Primero veamos que, para cualquier estado I en G, hay una palabrauI ∈ B (XG) tal que cualquier camino en G que presente a uI pasa por I. Si no fuera ése elcaso para algún vértice I, quitamos I y todas las aristas que se vinculan a él. Obtendríamosasí un subgrafo rotulado resolvente a derecha H que satisface claramente que B (XH) ⊆ B (XG),pero que también satisface la otra contención: por suposición, el rótulo de cualquier camino quepasa por I es también el rótulo de algún camino en G que no pasa por I y que, por lo tanto,no utiliza ninguna de las aristas eliminadas. Así, B (XH) = B (XG) y, en consecuencia, H esuna presentación resolvente a derecha de X pero con menos estados que G, lo que contradicela minimalidad de esta última.

Ahora, sean I y J vértices distintos en G, y sean uI y uJ las palabras correspondientesa cada uno según lo dicho previamente. Como X es irreducible, hay una palabra w tal queuIwuJ ∈ B (XG). Sea π un camino que presente en G a uIwuJ , debiendo ser π = τIωτJ conL(τI) = uI , L(ω) = w y L(τJ = uJ). Pero τI pasa por I, y τJ por J . Por lo tanto, π pasa porambos vértices, lo que implica que algún subcamino de π va de I a J . Esto muestra que G esirreducible.

Teorema 3.31. Un shift sóco es irreducible si, y sólo si, tiene una presentación irreducible.

Demostración. Si X tiene una presentación irreducible, entonces X es irreducible, segúnvimos en la discusión previa al lema 3.30, en tanto que el lema mencionado muestra que si Xes irreducible, entonces una presentación resolvente a derecha minimal de X es irreducible.

De acuerdo a la denición, podría haber varias presentaciones resolventes a derecha minima-les para un shift sóco dado. Sin embargo, aunque no lo haremos aquí, es factible mostrar quedos presentaciones resolventes a derecha minimales cualesquiera de un shift sóco irreducibleson isomorfas como grafos rotulados. Lamentablemente, la aseveración no puede ser extendida ashifts sócos en general: existen shifts sócos reducibles que admiten presentaciones resolventesa derecha minimales que no son isomorfas como grafos rotulados.

Page 64: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

60 3. SHIFTS SÓFICOS

EJERCICIOS

1. Dados G1 y G2 de acuerdo a la gura 8, muestre que XG1 es una presentación del shiftpar, y XG2 = 0, 1Z.

G1 G2

Figura 8. Grafos del ejercicio 1

2. Decida si los dos grafos rotulados de la gura 9 denen shifts sócos conjugados entresí. ¾Son isomorfos los grafos subyacentes? ¾Son isomorfos los grafos rotulados?

Figura 9. Grafos del ejercicio 2

3. Construya una presentación de 0, 1Z que no sea resolvente a derecha ni resolvente aizquierda.

4. Muestre que si dos grafos rotulados son isomorfos, entonces presentan el mismo shiftsóco.

5. Construya un grafo rotulado que sea una presentación para X11, y otro que presentea X11,0101.

6. Construya una familia innita de shifts sócos tal que dos shifts distintos de esa familiano sean conjugados.

7. Recuerde los shifts de lagunas de los ejercicios del capítulo 2: dado S ⊂ N, designamospor X(S) al conjunto de todos los puntos de 0, 1Z tales que la cantidad de 0 entre dosocurrencias sucesivas de 1 es un número en S, y, además, si S es nito, los 1 ocurrencon frecuencia innita a izquierda y a derecha. Dé una condición necesaria y sucienteexplícita en relación a S de modo que X(S) sea sóco. Use esta condición para mostrarque el shift de lagunas primas (que es el que se obtiene cuando S es el conjunto de losnúmeros primos) no es un shift sóco.

8. Sea G = (G,L) un grafo rotulado, G′ un desdoblamiento de salidas de G y L′ la rotu-lación para G′ dada por L′(ej) = L(e). Muestre que el grafo rotulado G ′ = (G′,L′) esotra presentación para XG.

Page 65: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

3. SHIFTS SÓFICOS 61

9. Sea G un grafo, y supongamos que a cada arista e de G le hacemos corresponder unapalabra w(e) sobre algún alfabeto A. Si · · · e−2e−1.e0e1e2 · · · es un camino biinnito enG, · · ·w(e−2)w(e−1).w(e0)w(e1)w(e2) · · · dene un punto enAZ. Muestre que el conjuntode todos los puntos que se obtiene de aplicar este procedimiento a cada uno de los puntosde XG es un espacio shift sóco sobre el alfabeto A.

10. Sea X un espacio shift sóco y N ≥ 1. Construya una presentación para X [N ].11. Muestre que la unión de dos shifts sócos es también un shift sóco.12. Sea X un espacio shift, y w ∈ B(X). Denamos el conjunto de predecesores de w en

X mediante PX(w) = u ∈ B(X) : uw ∈ B(X). Muestre que X es sóco si, y sólo si,PX(w) : w ∈ B(X) es un conjunto nito.

13. Construya el grafo de conjuntos de seguidores del shift sóco XG2 del ejercicio 1.14. Muestre que, en la gura 2, los grafos (a) y (c) tienen seguidores separados, mientras

que (b) y (d) no.15. Sea G = (G,L) un grafo rotulado, con G = (V,Σ, i, t), y tomemos X = XG. Para

cada w ∈ B(X), denamos Tw = I ∈ V : ∃π : L(π) = w ∧ t(π) = I, es decir, elconjunto de nodos terminales de las presentaciones de w en G. Muestre que si Tw = Tw′ ,entonces FX(w) = FX(w′). Dé un ejemplo que muestre que la implicación recíproca noes necesariamente cierta.

16. Sea X un shift sóco, y G = (G,L) su grafo de conjuntos de seguidores. Muestre que Xes de tipo nito si, y sólo si, L∞ es una conjugación.

17. Construya el grafo de subconjuntos para el grafo rotulado G2 del ejercicio 1.

Page 66: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

Capítulo 4

ASPECTOS TOPOLÓGICOS Y DINÁMICOS DE LOS ESPACIOSSHIFT

El objetivo de este capítulo es analizar a los espacios shift a través de sus característicastopológicas. Mediante la denición de una manera adecuada para medir distancias entre tirillasbiinnitas, podremos ver al full shift como un espacio métrico y estudiarla con las herramientasclásicas de la topología y el análisis. De ésto, resultará una caracterización de los espacios shifty de los códigos de ventana deslizante a través de propiedades topológicas. Esto forma parte deinvestigaciones más o menos recientes (alrededor de 1970) en el área de la Dinámica Simbólica,de modo que se trata de tópicos relativamente nuevos en Matemática, y en franco proceso deexpansión.

No se pretende dar aquí un estudio detallado de la teoría general de espacios métricos, sinomás bien enunciar las deniciones y propiedades básicas de los mismos con el único objetivo deaplicarlos al estudio de los espacios shift.

En el presente capítulo, primero deniremos una métrica para la full shift y veremos algunaspropiedades básicas importantes de la misma, para luego estudiar la convergencia de sucesionesy arribar a la conclusión de que los espacios shift están caracterizados por ser subconjuntoscompactos y shift-invariantes del full shift. Luego analizaremos la continuidad de acuerdo a lamétrica denida, encontrando que los códigos de ventana deslizante se caracterizan por ser lasfunciones entre espacios shift que son continuas y conmutan con la función shift.

1. Una métrica para AZ

Definición 4.1. Una métrica o función distancia para un conjunto X es una funciónd : X ×X → R+

0 con las siguientes propiedades:

1. d(x, y) = 0 ⇐⇒ x = y2. ∀x, y ∈ X, d(x, y) = d(y, x) (axioma de simetría)3. ∀x, y, z ∈ X, d(x, z) ≤ d(x, y) + d(y, z) (desigualdad triangular)

El par (X, d) se denomina espacio métrico.

Para llevar adelante el objetivo planteado en la introducción, debemos dotar a AZ de unamétrica adecuada. Para nuestros propósitos, adecuada va a querer decir que dos puntos x ey de AZ estarán tanto más cerca cuanto más grande sea el bloque central en que coinciden.Así, por ejemplo, · · · 00010.110101110000 · · · y · · · 10010.110101110010 · · · deberán estar entresí a una distancia menor que la distancia que haya entre los puntos · · · 00010.1101110000 · · · y· · · 00011.11111111 · · · . Para ello, deniremos d : AZ ×AZ→ R+

0 mediante

d(x, y) =

0 si x = y

2−mın|k|:xk 6=yk si x 6= y

En palabras, para encontrar la distancia entre dos puntos distintos x e y, hay que detectar lacoordenada entera k (positiva o negativa) en la que x e y dieren más cercana a la coordenada0, y evaluar 2−|k|.

Ejemplo 4.2. Encontremos la distancia entre los puntos

x = · · · 00010.110101110000 · · · y = · · · 10010.110101110010 · · ·62

Page 67: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

1. UNA MÉTRICA PARA AZ 63

A n de visualizar mejor, dispongamos ambos puntos uno debajo del otro, y marquemos con× las coordenadas en que xk 6= yk:

−5 −4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11x . . . 0 0 0 1 0 1 1 0 1 0 1 1 1 0 0 0 0 . . .

× × ×y . . . 1 0 0 0 0 1 1 0 1 0 1 1 1 0 0 1 0 . . .

La marca × más cercana a la coordenada 0 corresponde a k = −2, de modo que d(x, y) =2−|−2| = 1/4.

Notemos que, de acuerdo a esta denición, el mayor valor que puede tomar d es 1, quecorresponde al caso en que los dos puntos entre los que se está midiendo la distancia dierenen la coordenada 0.

Justiquemos que la función d así denida es efectivamente una métrica para AZ:Dados dos puntos x e y en AZ, o bien son iguales o bien son distintos. En el primercaso, es d(x, y) = 0 ∈ R+

0 . En el caso en que x 6= y, el conjunto k : xk 6= yk ⊆ Z es novacío, de modo que el conjunto |k| : xk 6= yk ⊆ N tampoco es vacío, y entonces tieneun mínimo elemento N . Ya que la función exponencial 2−t es estrictamente positivapara t ∈ R, d(x, y) = 2−N ∈ R+

0 . Esto muestra también que d(x, y) = 0 ⇐⇒ x = y.El cumplimiento del axioma de simetría es directo de ver.Para la desigualdad triangular, sean x, y, z ∈ AZ dos a dos distintos. Llamemos

Nxy = mın |k| : xk 6= yk Nyz = mın |k| : yk 6= zk Nxz = mın |k| : xk 6= zkTomemos N = mın Nxy, Nyz.• Si N = 0, es y0 6= x0 o y0 6= z0, de modo que d(x, y) = 1 o d(y, z) = 1, y por lotanto es d(x, y) + d(y, z) ≥ 1 ≥ d(x, z).• Si N > 0, es x[−N+1,N−1] = z[−N+1,N−1], pues si tomamos i tal que |i| < N , tenemosque |i| < Nxy y |i| < Nyz, de donde xi = yi e yi = zi, por lo que xi = zi. O sea queNxz ≥ N . Por lo tanto, observando que 2−Nxz ≤ 2−N y que es N = Nxy o N = Nyz,se tiene

d(x, z) = 2−Nxz ≤ 2−N ≤ 2−Nxy + 2−Nyz = d(x, y) + d(y, z)

Es decir, en cualquier caso se verica la desigualdad triangular.La función distancia puede restringirse de AZ×AZ a X ×X para cualquier subconjunto X dela full shift, y el par (X, d) sigue siendo un espacio métrico.

La métrica recientemente denida recibe el nombre de métrica usual para los espaciosshift, y es a la que haremos referencia por defecto siempre que hablemos de distancia en espaciosshift, a menos que especiquemos lo contrario.

Una condición necesaria y suciente para que dos puntos distintos estén a distancia menorque un ε estrictamente positivo es que ambos coincidan en una ventana central de tamaño2k + 1, en donde k =

⌊log 1

ε

⌋(a menos que especiquemos otra cosa, log siempre signicará

logaritmo en base 2; además, para r ∈ R, brc es la parte entera o piso de r, es decir, el mayorentero que no supera a r). Para probar la armación, notemos que

d (x, y) < ε⇔ 2−mın|k|:xk 6=yk < ε⇔ mın |k| : xk 6= yk > log1

ε

⇔ mın |k| : xk 6= yk >⌊

log1

ε

⌋⇔ x[−blog 1

εc,blog 1εc] = y[−blog 1

εc,blog 1εc]

Juntando esto con el hecho de que dos puntos del full shift que están a distancia 0 coincidenen el bloque central de tamaño 2k + 1 cualquiera sea k ∈ N, tenemos el siguiente resultado.

Proposición 4.3. Sean ε > 0, y x e y dos puntos de AZ. Se tiene que

d(x, y) < ε ⇐⇒ x[−blog 1εc,blog 1

εc] = y[−blog 1εc,blog 1

εc]

Page 68: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

64 4. ASPECTOS TOPOLÓGICOS Y DINÁMICOS DE LOS ESPACIOS SHIFT

En particular, para cualquier K ∈ N, tenemos que d(x, y) < 2−K ⇐⇒ x[−K,K] = y[−K,K].

Definición 4.4. Sean (X, d) un espacio métrico, x ∈ X y r ∈ R+. El entorno de radio rcon centro en x, denotado Br(x), es el conjunto de puntos del espacio cuya distancia a x esmenor que r.

En virtud de la proposición 4.3, el entorno de radio ε con centro en x ∈ X ⊆ AZ, para lamétrica usual, es

Bε (x) =y ∈ X : x[−blog 1

εc,blog 1εc] = y[−blog 1

εc,blog 1εc]

Particularmente, para K ∈ N, B2−K (x) =y ∈ X : x[−K,K] = y[−K,K]

.

Definición 4.5. Dado un subconjunto E de un espacio métrico (X, d), se dice que un puntox ∈ E es un punto interior a E si existe r > 0 tal que Br(x) ⊆ E. E es abierto en X sitodos sus puntos son puntos interiores a E.

Como caso particular, los entornos de cualquier espacio métrico son conjuntos abiertos.Puede demostrarse que cualquier conjunto abierto de un espacio métrico es una unión de en-tornos, y viceversa. Además, la unión arbitraria de conjuntos abiertos es un conjunto abierto,y la intersección nita de conjuntos abiertos es también un conjunto abierto.

En el caso particular del full shift, a partir de la denición de conjunto abierto y de lacaracterización de los entornos, se deduce que un subconjunto X de AZ es abierto si, y sólo si,para cada x ∈ X, existe K ∈ N tal que cualquier punto y ∈ AZ que satisface y[−K,K] = x[−K,K]

pertenece también a X. Tal K dependerá, en general, de x.

Definición 4.6. Dado un subconjunto E de un espacio métrico (X, d), se dice que un puntox ∈ X es un punto de acumulación de E si todo entorno con centro en x tiene un punto deE − x. E es cerrado si contiene a todos sus puntos de acumulación. La clausura de E esla unión de E con el conjunto de sus puntos de acumulación.

Se tiene que E es cerrado si, y sólo si, su complemento es abierto. Además, E es cerrado si,y sólo si, la clausura de E coincide con E. Puede verse, usando las leyes de De Morgan, que laintersección arbitraria de conjuntos cerrados es un conjunto cerrado, así como la unión nitade conjuntos cerrados es también un conjunto cerrado.

2. Sucesiones

Una sucesión en un espacio métrico (X, d) es una función de N en X. Denotaremos por xnal n-ésimo término de la sucesión, y por xnn∈N a la sucesión completa. Cuando el espaciométrico en cuestión sea un espacio shift, denotaremos x(n) al n-ésimo término de la sucesión,pues seguiremos usando xn para referirnos al símbolo que haya en la n-ésima coordenada de latirilla biinnita x.

Definición 4.7. Una sucesión xnn∈N en el espacio (X, d) se dice convergente en X siexiste p ∈ X tal que lımn→∞ d (xn, p) = 0. En este caso, escribimos lımn→∞ xn = p, o tambiénxn −→

n→∞p

Obsérvese que lımn→∞ xn = p si, y sólo si, ∀ε > 0,∃N ∈ N : ∀n ≥ N, d (xn, p) < ε.Caracterizaremos ahora la convergencia de sucesiones en espacios shift. Básicamente, una

sucesiónx(n)n∈N en un espacio shift converge a x ∈ AZ cuando para cualquier K natural,

por grande que sea, el bloque central de tamaño 2K + 1 de x coincide con el bloque central detamaño 2K + 1 de x(n), para todo n sucientemente grande.

Proposición 4.8. Seax(n)n∈N una sucesión en el espacio shift X con la métrica usual,

y x ∈ AZ. Se tiene que lımn→∞ x(n) = x si, y sólo si, ∀K ∈ N,∃N ∈ N : ∀n ≥ N, x

(n)[−K,K] =

x[−K,K].

Page 69: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

2. SUCESIONES 65

Demostración. Dado que la función exponencial a tasa menor que 1 tiende asintótica-mente a 0, por la proposición 4.3 tenemos que:

lımn→∞

x(n) = x⇔ ∀ε > 0,∃N ∈ N : ∀n ≥ N, d(x(n), x

)< ε⇔

∀K ∈ N,∃N ∈ N : ∀n ≥ N, d(x(n), x

)< 2−K ⇔

∀K ∈ N,∃N ∈ N : ∀n ≥ N, x(n)[−K,K] = x[−K,K]

Ejemplo 4.9. Estudiar la convergencia de la sucesiónx(n)n∈N en 0, 1Z denida por

x(n)i =

1 si |i| = n0 si |i| 6= n

Veamos el siguiente cuadro:

−4 −3 −2 −1 0 1 2 3 4x(0) · · · 0 0 0 0 1 0 0 0 0 · · ·x(1) · · · 0 0 0 1 0 1 0 0 0 · · ·x(2) · · · 0 0 1 0 0 0 1 0 0 · · ·x(3) · · · 0 1 0 0 0 0 0 1 0 · · ·...

Rápidamente nos damos cuenta que la ventana central de tamaño 2K + 1 de x(n) consta depuros 0, para todo n ≥ K + 1. Luego, de acuerdo al criterio de convergencia en espacios shift,el límite de la sucesión es el punto 0∞.

Ejemplo 4.10. Estudiar la convergencia de la sucesiónx(n)n∈N en 0, 1Z denida por

x(n) =

(0001)∞ si n es par(01)∞ si n es impar

Dispongamos los términos encolumnados, como antes:

−4 −3 −2 −1 0 1 2 3 4x(0) · · · 0 0 0 1 0 0 0 1 0 · · ·x(1) · · · 0 1 0 1 0 1 0 1 0 · · ·x(2) · · · 0 0 0 1 0 0 0 1 0 · · ·x(3) · · · 0 1 0 1 0 1 0 1 0 · · ·...

Aquí vemos que la coordenada 1, por ejemplo, no se estabiliza nunca: para cualquier N na-tural y a en el alfabeto 0, 1, existe n > N tal que x(n)

1 6= a. Entonces, esta sucesión no esconvergente.

Definición 4.11. Sean xnn∈N y zkk∈N dos sucesiones en el espacio métrico (X, d). Sedice que zkk∈N es subsucesión de xnn∈N si existe una sucesión de números naturalesestrictamente creciente nkk∈N tal que para todo k ∈ N, es zk = xnk .

Definición 4.12. Sea (X, d) un espacio métrico. Un subconjuntoK deX se dice compactosi toda sucesión en K posee subsucesión convergente en K.

Es bien sabido que un subconjunto K es compacto si, y sólo si, cualquier familia de abiertosque unidos cubren a K posee una subfamilia nita que también cubre a K. Además, todosubconjunto compacto de un espacio métrico es un conjunto cerrado, y si el espacio métrico escompacto, entonces la familia de los subconjuntos compactos del espacio es precisamente la delos subconjuntos cerrados.

El siguiente resultado muestra que cualquier espacio shift (en particular el full shift) escompacto para la métrica usual.

Page 70: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

66 4. ASPECTOS TOPOLÓGICOS Y DINÁMICOS DE LOS ESPACIOS SHIFT

Proposición 4.13. Sea X un espacio shift con la métrica usual. Entonces X es un sub-conjunto compacto de AZ.

Demostración. Seax(n)n∈N una sucesión en X. Ya que A es un conjunto nito, debe

existir a0 ∈ A y un subconjunto innito B0 de números naturales tal que para todo n ∈ B0,x

(n)0 = a0. Elijamos cualquier n0 ∈ B0. Como A3 es nito, deben existir a−1 y a1 en A,

y un subconjunto innito B1 ⊆ B0 tal que para todo n ∈ B1, x(n)[−1,1] = a−1a0a1. Elijamos

n1 ∈ B1 tal que n1 > n0 (tal elección es posible, pues B1 es un conjunto innito de núme-ros naturales, y por tanto no acotado). Siguiendo de esta manera, para cada k ∈ N, comoA2k+1 es nito, deben existir a−k y ak en A, y un subconjunto innito Bk ⊆ Bk−1 tal quepara todo n ∈ Bk, x

(n)[−k,k] = a−k · · · a0 · · · ak. Elijamos nk ∈ Bk tal que nk > nk−1. De es-

te modo, hemos denido (inductivamente) a−k, ak y nk para todo k ∈ N. Como nkk∈N escreciente,

x(nk)

k∈N es subsucesión de

x(n)n∈N. Denamos x = (ak)k∈Z. Dado que todo blo-

que de x ocurre en algún x(nk) ∈ X, tenemos que x pertenece al espacio shift X. Además,lımk→∞ x

(nk) = x, pues dado K ∈ N, tomando N = K, tenemos que para todo k ≥ N esx

(nk)[−K,K] = a−Ka−K+1 · · · a0 · · · aK−1aK = x[−K,K]. Entonces X es compacto.

La sola compacidad no caracteriza completamente a los espacios shift: por ejemplo, elconjunto unitario (01)∞ es un subconjunto compacto del full 0, 1-shift (como cualquierconjunto nito de cualquier espacio métrico) pero no es un espacio shift pues carece de lashift-invariancia. Precisamente, compacidad más shift-invariancia equivalen a tener carácter deespacio shift.

Teorema 4.14. Un subconjunto de AZ es un espacio shift si, y sólo si, es compacto (parala métrica usual de los espacios shift) y shift-invariante.

Demostración. La shift-invariancia de un espacio shift fue demostrada en el primer ca-pítulo, y la compacidad en la proposición 4.13.

Recíprocamente, supongamos que X es un subconjunto compacto y shift-invariante de AZ.Por ser compacto, X es cerrado, y entonces Xc es abierto. De allí que para cada y ∈ Xc existeK(y) ∈ N tal que B2−K(y)(y) está contenido en Xc. Tomemos F =

y[−K(y),K(y)] : y ∈ Xc

, y

veriquemos que X = XF .Si x ∈ Xc, entonces x[−K(x),K(x)] ∈ F , de donde x /∈ XF . Luego, XF ⊆ X.Si x /∈ XF , debe existir u ∈ F tal que u v x. Por denición de F , u debe ser de longitudimpar, es decir, |u| = 2n + 1 para algún n ∈ N. Entonces u ocurre en x desde algunaposición m ∈ Z, es decir, x[m,m+2n] = u. Llamando x′ = σm+n(x), es x′[−n,n] = u. Comou ∈ F , hay un y ∈ Xc tal que y[−K(y),K(y)] = u, debiendo entonces ser K(y) = n. Peroentonces x′[−n,n] = y[−n,n], de donde x′ ∈ B2−K(y)(y) ⊆ Xc, o sea, x′ /∈ X. Y, por la shiftinvariancia, x /∈ X. Luego, X ⊆ XF .

3. Cilindros. Conexidad

AZ puede ser visto como el producto cartesiano innito Xi∈ZA. Como en cualquier productocartesiano, se dene un cilindro como un subconjunto C del producto para el cual un númeronito de coordenadas están jas. En el caso particular de los espacios shift, nos van a interesarlos cilindros en que un número nito de coordenadas consecutivas están jas. Formalmente:

Definición 4.15. Sea A un alfabeto, X un espacio shift sobre A, u ∈ A∗ y k ∈ Z. Elcilindro en X asociado al bloque u en la posición k es el conjunto CX

k (u) denido por

CXk (u) =

x ∈ X : x[k,k+|u|−1] = u

Page 71: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

4. CONTINUIDAD 67

En palabras, en el espacio shift X, el cilindro asociado a u en la posición k es el conjunto depuntos del espacio X tales que el bloque u ocurre en la posición k. Obsérvese que para cualquiern ∈ Z, es σnX

(CXk (u)

)= CX

k−n(u). Además, CXk (u) = ∅ si, y sólo si, u /∈ B(X).

Si x es un punto del espacio shift X y ε es un real positivo, entonces

Bε(x) =y ∈ X : y[−blog 1

εc,blog 1εc] = x[−blog 1

εc,blog 1εc]

= CX−blog 1

εc(x[−blog 1

εc,blog 1εc])

En particular, para k ∈ N, se tiene queB2−k(x) =

y ∈ X : y[−k,k] = x[−k,k]

= CX

−k(x[−k,k]

)Como vemos, los entornos en un espacio shift son cilindros. La recíproca no es cierta en general:no todo cilindro es un entorno. Sin embargo, todo cilindro es un conjunto abierto. En efecto,sea x ∈ CX

k (u). Tomando N = max |k|, |k + |u| − 1|, se tiene que −N ≤ k ≤ k+ |u|−1 ≤ N ,de modo que

B2−N (x) = CX−N(x[−N,N ]

)=y ∈ X : y[−N,N ] = x[−N,N ]

y ∈ X : y[k,k+|u|−1] = x[k,k+|u|−1]

= CX

k (u)

Pero además los cilindros son cerrados, pues(CXk (u)

)c=

x ∈ X : x[k,k+|u|−1] 6= u

=

⋃v∈A|u|−u

x ∈ X : x[k,k+|u|−1] = v

=

⋃v∈A|u|−u

CXk (v)

Es decir, el complemento de un cilindro es una unión de conjuntos abiertos, y por lo tanto esun conjunto abierto; luego, el cilindro es cerrado.

Entonces, los cilindros en un espacio shift son conjuntos a la vez abiertos y cerrados. Estorevela otra característica topológica de los espacios shift: son conjuntos totalmente disco-nexos. Recordamos que una forma de caracterizar a los conjuntos disconexos de un espaciométrico es como aquellos conjuntos que poseen un subconjunto propio no vacío que es a la vezabierto y cerrado. Y un conjunto totalmente disconexo es aquel para el cual todo subconjuntode más de un punto es disconexo. El conjunto clásico de Cantor en la recta real tiene estamisma estructura: se trata de una nube de puntos no aislados en la cual ningún par de puntosdistintos pertenece a una misma pieza conexa.

4. Continuidad

Definición 4.16. Sean (X, dX) e (Y, dY ) dos espacios métricos. Una función φ : X → Yse dice continua en x ∈ X si para toda sucesión xnn∈N en X tal que lımn→∞ xn = x, setiene que lımn→∞ φ (xn) = φ(x). Si A ⊆ X, φ se dice continua en A si φ es continua en cadax ∈ A. Si φ es continua en X, biyectiva y además su función inversa es también continua, φ sedenomina un homeomorsmo entre X e Y , y los espacios X e Y se dicen homeomorfos.

Una función entre dos espacios métricos es continua en todo su dominio si, y sólo si, lapreimagen de cualquier subconjunto abierto del codominio es un subconjunto abierto del do-minio. La composición de funciones continuas es también una función continua.

La denición de continuidad que hemos dado corresponde en realidad a la denición de lacontinuidad secuencial o sucesional, y equivale a la clásica denición ε − δ de continuidad: φes continua en x si ∀ε > 0,∃δ > 0 : dX(y, x) < δ ⇒ dY (φ(y), φ(x)) < ε. Pero la continuidaddesde el punto de vista de las sucesiones es más fácil de manejar cuando el espacio métrico esun espacio shift, ya que tenemos completamente caracterizadas a las sucesiones que convergenen un espacio shift.

Proposición 4.17. Todo código de ventana deslizante entre dos espacios shift es una fun-ción continua en todo su dominio.

Page 72: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

68 4. ASPECTOS TOPOLÓGICOS Y DINÁMICOS DE LOS ESPACIOS SHIFT

Demostración. Sean X e Y dos espacios shift y φ : X → Y un CVD inducido porΦ con memoria y anticipación L ≥ 0. Sean x ∈ X y

x(n)n∈N una sucesión en X tal que

lımn→∞ x(n) = x. Debemos ver que ∀K ∈ N, ∃N ∈ N : ∀n ≥ N,

(φx(n)

)[−K,K]

= (φx)[−K,K].

Sea K ∈ N. Por la hipótesis de convergencia dex(n)n∈N a x, tenemos que existe N ∈ N tal

que ∀n ≥ N, x(n)[−K−L,K+L] = x[−K−L,K+L]. Veamos que para todo n ≥ N es

(φx(n)

)[−K,K]

=

(φx)[−K,K]: si i es un entero tal que −K ≤ i ≤ K, será −K − L ≤ i− L ≤ i+ L ≤ K + L, porlo que xn[i−L,i+L] = x[i−L,i+L], y entonces(

φx(n))i

= Φ(x

(n)[i−L,i+L]

)= Φ

(x[i−L,i+L]

)= (φx)i

Luego, lımn→∞ φ(x(n))

= φ(x), de donde se deduce que φ es continua en x, y ya que x esarbitrario, φ es continua en X.

La sola continuidad de una función entre dos espacios shift no garantiza que sea un CVD.Hace falta algo más: la conmutabilidad de la función con las shifts de los respectivos espacios.Este resultado se obtuvo por Hedlund y otros en el año 1969. Antes de demostrarlo, enunciemosalgunos resultados conocidos de la teoría general de espacios métricos, y cuyas demostracionesquedan de ejercicio.

Proposición 4.18. Sean A y B dos subconjuntos compactos disjuntos no vacíos de unespacio métrico. Existe un número real estrictamente positivo δ tal que para todos a ∈ A yb ∈ B, d(a, b) ≥ δ.

Corolario 4.19. Sea Aknk=1 una familia nita de subconjuntos compactos no vacíos deun espacio métrico, dos a dos disjuntos. Existe δ > 0 tal que si x ∈ Ai e y ∈ Aj con i 6= j,entonces d(x, y) ≥ δ.

Proposición 4.20. Sea φ una función continua entre los espacios métricos X e Y , conX compacto, y sea F un subconjunto compacto de Y . Entonces, φ−1(F ) es un subconjuntocompacto de X.

Teorema 4.21. (Curtis, Lyndon, Hedlund) Sean X e Y dos espacios shift, y φ unafunción de X en Y . φ es un código de ventana deslizante si, y sólo si, φ es una función continuatal que φ σX = σY φ.

Demostración. Sabemos, de los primeros capítulos, que si φ es un CVD, conmuta conlas σ, y la proposición 4.17 muestra que φ es continua.

Para la vuelta, recordemos otra caracterización de los CVD: φ es un CVD si, y sólo si,conmuta con las σ y existe un N ∈ N tal que φ(x)0 es función de x[−N,N ]. El hecho de conmutarcon σ lo tenemos por hipótesis, así que sólo resta probar la existencia de un tal N , para locual usaremos la hipótesis de la continuidad de φ. Sea U = B1 (φ(X)), el conjunto de símbolosque aparecen en los transformados de los puntos de X. Obviamente, U es un subconjuntodel alfabeto de Y . Para cada b ∈ U , el cilindro CY

0 (b) es un subconjunto cerrado de Y , ycomo Y es compacto, CY

0 (b) es compacto. Además, si b y c son elementos de U con b 6= c, esCY

0 (b) ∩ CY0 (c) = ∅. Para cada b ∈ U , hagamos Eb = φ−1

(CY

0 (b)). Por su denición y por la

proposición 4.20, cada Eb es un subconjunto compacto no vacío de X, y si b 6= c, Eb ∩ Ec = ∅,pues si x ∈ Eb, es φ(x) ∈ CY

0 (b), luego φ(x) /∈ CY0 (c), y entonces x /∈ Ec. Además, cada x ∈ X

pertenece a un único Eb. Así que la familia Ebb∈U es una familia de conjuntos compactos queconstituye una partición para X. Luego, por el corolario 4.19, existe δ > 0 tal que d(x, y) ≥ δtoda vez que x ∈ Eb e y ∈ Ec con b 6= c. Tomemos N ∈ N sucientemente grande como paraque 2−N < δ. Si x e y son puntos de X tales que x[−N,N ] = y[−N,N ], entonces d(x, y) < 2−N < δ,por lo que x e y deben estar en un mismo Eb. Esto signica que existe b ∈ U tal que φ(x) yφ(y) están ambos en CY

0 (b), o sea, φ(x)0 = b = φ(y)0. Pero esto quiere decir que la coordenada0 del transformado por φ de x ∈ X depende sólo de x[−N,N ], como queríamos probar.

Page 73: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

5. SISTEMAS DINÁMICOS 69

5. Sistemas dinámicos

Los sistemas físicos pueden usualmente describirse a través de una cantidad nita de medi-ciones. Por ejemplo, un péndulo oscilante constituye un sistema que queda totalmente caracteri-zado por el ángulo respecto de la vertical y por la velocidad angular. Un gas se describe a travésde la posición y momentum de cada molécula. A medida que transcurre el tiempo, esos valorescambian. Si denotamos por M al conjunto de todos los valores posibles para un dado sistema,el estado del mismo en un instante dado corresponde a uno de esos estados. Imaginemos quelmamos el sistema y que luego observamos los cuadros que corresponden al instante t = 0,luego a t = 1 seg, t = 2 seg, etc. Cada cuadro depende del anterior, de acuerdo a la maneraen que el sistema evolucione durante cada intervalo de un segundo. Si suponemos que las leyesque gobiernan el sistema no cambian con el tiempo, la dependencia de cada cuadro respectodel anterior se traduce en una función T : M →M que usualmente es continua. Así, si x0 es elestado del sistema en t = 0, T (x0) describe el estado del sistema en t = 1, T T (x0) en t = 2,y así. Por lo tanto, estudiar el comportamiento del sistema en el tiempo se reduce a estudiarlas iteraciones de T , es decir, la composición de T consigo misma. Para n ≥ 0, designaremospor T n a la composición de T consigo misma n veces. Es decir, T 0 es la identidad, y, paran > 0, T n = T T n−1. Notar que T n es continua si T lo es, pues la continuidad se preserva porcomposición.

Definición 4.22. Un sistema dinámico es un par (M,T ), en donde M es un espaciométrico compacto y T es una transformación continua en M . Si T es un homeomorsmo, elsistema dinámico se dice inversible.

Para nosotros, los sistemas dinámicos más interesantes serán aquellos en los que el conjuntoM sea un espacio shift. En particular, si X es un espacio shift, el par (X, σX) es un sistemadinámico que denominamos sistema dinámico shift. Si φ es un CVD de X en X, el par(X,φ) es también un sistema dinámico.

Definición 4.23. Para un sistema dinámico (M,T ), la órbita de un punto x ∈M es lasucesión T nxn∈N. Si el sistema es inversible, la órbita de x es la sucesión T nxn∈Z.

Definición 4.24. Para un sistema dinámico (M,T ), un punto periódico es un puntox ∈M tal que T nx = x para algún n > 0, y tal n se llama un período de x. Si x es un puntoperiódico, el menor de los n > 0 tales que T nx = x se llama período mínimo de x. Unaórbita T nx es periódica si x es un punto periódico.

Un conjunto de problemas que interesan en relación a estos tópicos involucra el estudiodel comportamiento de la órbita de puntos y de conjuntos en un dado sistema dinámico. Porejemplo, si se tiene un sistema dinámico (M,T ) en particular, puede interesar saber cómo sedistribuyen las órbitas de los puntos de un dado subconjunto abierto U de M , o si el conjuntode puntos periódicos del espacio es denso.

Otro conjunto de problemas tiene que ver con problemas de clasicación de sistemas diná-micos: ¾Cuándo dos sistemas dinámicos aparentemente distintos son el mismo sistema?

Definición 4.25. Sean (M,T ) y (N,S) dos sistemas dinámicos. Un homomorsmo θ de(M,T ) a (N,S) es una función continua θ : M → N tal que θ T = S θ. Los homomorsmosde un sistema dinámico a sí mismo se denominan endomorsmos del sistema dinámico.

Una simple inducción muestra que si θ es un homomorsmo de (M,T ) a (N,S), entonces,para cualquier entero positivo n, se tiene que θ T n = Sn θ.

Notemos que, debido al Teorema de Curtis, Lyndon y Hedlund, los homomorsmos entrelos sistemas dinámicos shift son precisamente los códigos de ventana deslizante.

Definición 4.26. Una inmersión es un homomorsmo inyectivo, un factor es un homo-morsmo sobreyectivo, y una conjugación topológica es un homomorsmo biyectivo. Dos

Page 74: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

70 4. ASPECTOS TOPOLÓGICOS Y DINÁMICOS DE LOS ESPACIOS SHIFT

sistemas dinámicos se dicen topológicamente conjugados si existe una conjugación topoló-gica entre ellos.

Las nociones de inmersión, factor y conjugación conducen a problemas de clasicación desistemas dinámicos. Dos sistemas dinámicos conjugados son esencialmente el mismo, pero lacuestión de si dos sistemas dinámicos dados son conjugados, o uno factor del otro, o uno inmersoen el otro, puede ser muy difícil de resolver.

Para detectar si dos sistemas dinámicos no son conjugados, una estrategia es la siguiente:asociemos a cada sistema dinámico con alguna entidad (que puede ser un número, un conjunto,o lo que sea) de manera que dos sistemas conjugados tengan asociados la misma entidad. Luego,dados dos sistemas dinámicos en particular, obtengamos las entidades asociadas respectivas, ysi éstas no coinciden sabremos que los sistemas no son conjugados (aunque puede ocurrir queno podamos deducir nada si vemos que ambas entidades coinciden). Dichas entidades recibenel nombre de invariantes por conjugación.

Una de tales entidades es el conjunto de puntos periódicos de período n, donde n es unnatural jo. Ya hemos visto, en el capítulo primero, la demostración para el caso en que lossistemas involucrados son sistemas dinámicos shift. Veamos el resultado en general.

Proposición 4.27. Sea n un entero positivo. La cantidad de puntos periódicos de períodon es un invariante por conjugación.

Demostración. Sean (M,T ) y (N,S) sistemas dinámicos conjugados, y θ : M → N unaconjugación. Denotemos por pn(T ) al cardinal del conjunto de puntos periódicos de período npara T , y pn(S) al de los puntos periódicos para S. Para x ∈M , se tiene que

T nx = x⇔ θ (T nx) = θ (x)⇔ Sn (θ(x)) = θ (x)

de modo que θ establece una biyección entre los puntos jos de T n y los de Sn. Por lo tanto,pn(T ) = pn(S).

Un argumento similar al anterior muestra que el número de puntos periódicos de períodomínimo n es también invariante por conjugación.

Veamos ahora otro invariante por conjugación.

Definición 4.28. Un sistema dinámico (M,T ) es topológicamente transitivo si paracualquier par de abiertos no vacíos U y V , existe n > 0 tal que (T nU) ∩ V 6= ∅.

Es decir, un sistema topológicamente transitivo mueve a cada conjunto abierto lo sucientecomo para que llegue a tocar a cualquier otro conjunto abierto, en alguna iteración. La deni-ción implica que ese toque se producirá una cantidad innita de veces, según demostraremosa continuación.

Lema 4.29. Sean (M,T ) un sistema topológicamente transitivo, U y V dos conjuntos abier-tos no vacíos y m un natural arbitrario. Existe n > m tal que (T nU) ∩ V 6= ∅.

Demostración. Sea W = (Tm)−1 (V ). Ya que V es abierto y T continua en M , W esabierto, así que, por hipótesis de transitividad topológica, existe k > 0 tal que

(T kU

)∩W 6= ∅.

Eso quiere decir que existe z ∈ T kU tal que z ∈ (Tm)−1 (V ); lo primero signica que existex ∈ U tal que T kx = z, y lo segundo dice que Tmz ∈ V . Poniendo n = m + k, tendremos quen > m y que T nx = Tm

(T kx

)= Tmz ∈ V . Es decir, existe x ∈ U tal que T nx ∈ V , de donde

(T nU) ∩ V 6= ∅.

De manera directa, se desprende de allí el siguiente resultado.

Proposición 4.30. Sean (M,T ) un sistema topológicamente transitivo, y U y V dos con-juntos abiertos no vacíos. Existe una sucesión nkk∈N estrictamente creciente de númerosnaturales tal que para todo k ∈ N, es (T nkU) ∩ V 6= ∅.

Proposición 4.31. La transitividad topológica es invariante por conjugación.

Page 75: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

5. SISTEMAS DINÁMICOS 71

Demostración. Sean (M,T ) y (N,S) sistemas dinámicos conjugados, con (M,T ) topo-lógicamente transitivo, y θ : M → N una conjugación. Sean U y V abiertos en N . DenotemosU ′ = θ−1(U) y V ′ = θ−1(V ). Como θ es continua, U ′ y V ′ son abiertos en M , por lo que existen > 0 tal que (T nU ′)∩V ′ 6= ∅, es decir, (T n (θ−1(U)))∩ θ−1(V ) 6= ∅. Por lo tanto, siendo θ unabiyección, tenemos que

∅ 6= θ((T n(θ−1(U)

))∩ θ−1(V )

)= θ

(T n(θ−1(U)

))∩ θ(θ−1(V )

)= Sn

(θ(θ−1(U)

))∩ V = (SnU) ∩ V

Entonces, (N,S) es también topológicamente transitivo.

En el primer capítulo, hemos denido irreductibilidad: un espacio shift X es irreduciblesi para cualquier par de palabras u y w en el lenguaje, hay una palabra v también en B(X)tal que uvw ∈ B(X). Veremos ahora que en el contexto de los sistemas dinámicos shift, lairreductibilidad de un espacio shiftX equivale a la transitividad topológica del sistema dinámico(X, σX).

Proposición 4.32. Un sistema dinámico shift es topológicamente transitivo si, y sólo si, elespacio shift es irreducible.

Demostración. Supongamos que el sistema dinámico shift (X, σX) es topológicamentetransitivo. Sean u y w en B(X). Hagamos U = CX

0 (u) y V = CX0 (w). Ya que U y V son

abiertos y no vacíos, por el lema 4.29, existe n > |u| tal que (σnXU) ∩ V 6= ∅, es decir, hayun x ∈ X tal que x ∈ σnX

(CX

0 (u))

= CX−n(u) y x ∈ CX

0 (w). Es decir que x[−n,−n+|u|−1] = u yx[0,|w|−1] = w. Como n > |u|, es −n+ |u| − 1 < 0, de modo que podemos tomar v = x[−n+|u|,−1]

para ver que uvw v x, es decir, uvw ∈ B(X).Recíprocamente, supongamos que X es un espacio shift irreducible, y sean U y V dos

abiertos no vacíos en el espacio métrico X. Sean x ∈ U , y ∈ V , y tomemos k, l ∈ N tales queB2−k(x) ⊆ U y B2−l(y) ⊆ V . Hagamos u = x[−k,k] y w = y[−l,l]. Sabemos que B2−k(x) = CX

−k(u)y que B2−l(y) = CX

−l(w). ComoX es irreducible, existe v ∈ B(X) tal que uvw ∈ B(X). Tomemosz ∈ X tal que z[−k,−k+|u|+|v|+|w|−1] = uvw. Tenemos que z ∈ CX

−k(u) ⊆ U , y además, puesto que|u| = 2k + 1 y |w| = 2l + 1, tenemos que

z ∈ CX−k+|u|+|v| (w) = σ

k−|u|−|v|−lX

(CX−l (w)

)= σ

−k−1−|v|−lX

(CX−l (w)

)⊆ σ

−k−1−|v|−lX (V )

Es decir, z ∈ U y σk+l+|v|+1X (z) ∈ V . Por lo tanto, tomando n = k + l + |v| + 1 > 0, tenemos

que (σnXU) ∩ V 6= ∅.

De nuestros resultados anteriores, deducimos que, en el universo de los espacios shift, elcarácter de irreducible es invariante por conjugación.

Teorema 4.33. Sean X e Y espacios shift conjugados. Entonces o ambos son irreducibleso ninguno lo es.

Demostración. X es irreducible si, y sólo si, (X, σX) es topológicamente transitivo (prop.4.32), lo que, por ser X e Y conjugados, equivale a que (Y, σY ) es topológicamente transitivo(prop. 4.31), lo que ocurre si, y sólo si, Y es irreducible.

En el próximo capítulo deniremos e investigaremos un importante invariante por conjuga-ción entre espacios shift: la entropía.

Page 76: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

72 4. ASPECTOS TOPOLÓGICOS Y DINÁMICOS DE LOS ESPACIOS SHIFT

EJERCICIOS

1. En el espacio métrico(AZ, d

)con A = 0, 1 y d la métrica usual de los espacios shift,

considereX = X01 − 0∞

a) Muestre que X no es un subconjunto cerrado de AZ.b) Muestre que X no tiene puntos interiores.c) ¾Es X un espacio shift?d) Determine X, la clausura de X. ¾Es X un espacio shift?e) Para x ∈ X

c, encuentre r > 0 tal que el entorno de radio r con centro en x esté

contenido en Xc. (Sugerencia: x contiene al bloque 01 en alguna posición k ∈ Z.)

2. En el espacio métrico(AZ, d

)con A = 0, 1 y d la métrica usual de los espacios shift,

considere las sucesionesx(n)n∈N y

z(n)n∈N denidas por:

x(n)i =

1 si n es factor de i0 c. o. c.

z(n)i =

0 si n e i son ambos pares1 c. o. c.

Analice la convergencia de cada una de ellas, encontrando sus puntos de acumulación.3. Denamos d : 0, 1Z × 0, 1Z → R mediante

d(x, y) =∞∑

k=−∞

|xk − yk|2|k|

Muestre que d es una métrica para 0, 1Z. Muestre que si una sucesión en 0, 1Z esconvergente para esta métrica, también lo es para la métrica usual, y viceversa (es decir,muestre que ambas métricas son equivalentes).

4. Sean A y B subconjuntos compactos disjuntos no vacíos de un espacio métrico (X, d).Pruebe que existe un real r estrictamente positivo tal que para todos a ∈ A y b ∈ B,d(a, b) ≥ r. Verique que A = X01 y B = X11,000 son subconjuntos compactosdisjuntos no vacíos de la full 0, 1-shift con la métrica usual, y encuentre uno de talesr. A través de un ejemplo en algún espacio métrico, muestre que la compacidad de A yB es esencial para la existencia de r.

5. Sea φ una función continua entre los espacios métricos M y N , y sea E un subconjuntocompacto deM . Muestre que φ(E) es un subconjunto compacto de N (es decir, las fun-ciones continuas transforman compactos en compactos). Con este resultado, demuestreque la imagen de un espacio shift a través de un código de ventana deslizante es unespacio shift.

6. Sea φ una función continua entre los espacios métricosM y N , conM compacto, y sea Fun subconjunto compacto de N . Muestre que φ−1(F ) es un subconjunto compacto deM(es decir, la preimagen de un compacto a través de una función continua cuyo dominioes un compacto, es un compacto). Muestre, a través de un ejemplo, que el requisito dela compacidad de M es esencial en este resultado.

7. Sean E y F subconjuntos compactos de un espacio métrico. Muestre que E∪F y E∩Fson ambos compactos. Use este resultado para concluir que la unión y la intersecciónde espacios shift son también, respectivamente, espacios shift.

8. Muestre que el conjunto de puntos periódicos de un shift de tipo nito irreducible X esdenso en X (es decir, cualquier entorno alrededor de cualquier punto de X contiene unpunto de X que es periódico).

9. Considere A = 0, 1.a) Dé un ejemplo de función de AZ en AZ que conmute con σ pero que no sea un

código de ventana deslizante.b) Dé un ejemplo de función continua de AZ en AZ que no sea un código de ventana

deslizante.

Page 77: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

Capítulo 5

ENTROPÍA

Una manera de medir la complejidad de un espacio shift X es observar la cantidad de losbloques de largo n en el lenguaje de X a medida que n crece; cuanto más grande es el númerode n-bloques en B(X), más complejidad tiene el espacio X. Veremos que, conforme n aumenta,|Bn(X)| crece exponencialmente, es decir, se comporta como λn para algún real no negativo λ.Poniendo c = log λ (recordando nuestra convención de que log signica logaritmo en base 2),tendremos que, para n sucientemente grande, es |Bn(X)| ≈ 2cn, de modo que c ≈ 1

nlog |Bn(X)|.

Esa tasa de crecimiento c, en el límite cuando n→∞, recibe el nombre de entropía del espacioshift X, y es un invariante por conjugación entre espacios shift. El objetivo de este capítulo esestudiar propiedades de esta entidad, y encontrar métodos para saber calcularla para distintasclases de espacios shift.

1. Denición y propiedades básicas

Definición 5.1. Sea X un espacio shift. La entropía de X se dene como

h(X) = lımn→∞

1

nlog |Bn(X)|

con la convención de que log 0 = −∞.

Por ejemplo, si X = AZ, para todo n ∈ N es Bn(X) = An, así que log |Bn(X)| = log |An| =log |A|n = n log |A|. Dividiendo por n y tomando límite cuando n → ∞, vemos que h

(AZ)

=log |A|. Es decir, la entropía de un full shift es el logaritmo de la cantidad de letras de sualfabeto. De la denición, se desprende también directamente que h(∅) = −∞.

Nuestra primera tarea es ver que la entropía es un número bien denido, para lo cualdebemos garantizar que ese límite que la dene efectivamente existe. Primero observemos que,siendo X no vacío, es |Bn(X)| ≥ 1 para todo n ∈ N, así que el límite, de existir, es un real nonegativo.

Sean m,n ∈ N y sea u ∈ Bm+n(X). Tal u debe ser la concatenación de un bloque v ∈ Bm(X)y un bloque w ∈ Bn(X). Por lo tanto, Bm+n(X) ⊆ vw : v ∈ Bm(X), w ∈ Bn(X) (la contenciónpuede ser estricta, ya que la concatenación de dos bloques en el lenguaje de un espacio shift nonecesariamente produce otro bloque en ese lenguaje). Entonces, por el principio fundamentaldel conteo, ocurre que

|Bm+n(X)| ≤ |Bm(X)| · |Bn(X)|En consecuencia,

log |Bm+n(X)| ≤ log |Bm(X)|+ log |Bn(X)|Poniendo an = log |Bn(X)| para cada n ∈ N, resulta que la sucesión ann∈N es una sucesiónsubaditiva de reales no negativos, es decir, am+n ≤ am + an para todos m,n ∈ N. Una simpleinducción muestra que si an es cualquier sucesión subaditiva en R+

0 , entonces, para enterospositivos c y k cualesquiera, ack ≤ cak y, en particular, ar ≤ ra1 para cualquier entero positivor.

Las sucesiones subaditivas en R+0 poseen una interesante propiedad que establecemos en el

siguiente resultado.

Lema 5.2. Sea ann∈N una sucesión subaditiva de reales no negativos. Entonces lımn→∞ann

existe y vale ınfn≥1ann.

73

Page 78: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

74 5. ENTROPÍA

Demostración. Designemos α = ınfn≥1ann, teniéndose entonces que an

n≥ α para todo

n ≥ 1. Debemos ver que

∀ε > 0,∃N : ∀n ≥ N,∣∣∣α− an

n

∣∣∣ < ε

Consideremos entonces ε > 0 jo. Por propiedad de ínmo, existe k ≥ 1 tal que akk≤ α + ε

2.

Por otro lado, sea m cualquier entero positivo mayor que 2a1/ε. Hagamos N = mk. Sea n ≥ N .Por el teorema de la división, existen naturales c y r tales que n = ck + r con 0 ≤ r < k. Yaque (c + 1)k > n ≥ N = mk, tenemos que (c + 1) > m, por lo que c ≥ m ≥ 1. Si fuese r = 0,tendremos

ann

=ackck≤ cak

ck=akk≤ α +

ε

2< α + ε,

mientras que si fuese r > 0, tendremosann

=ack+r

ck + r≤ ack + ar

ck≤ cak + ra1

ck<akk

+a1

c≤ ak

k+a1

m< α +

ε

2+ε

2= α + ε

Es decir, se cumple en cualquier caso que∣∣α− an

n

∣∣ = ann− α < ε.

Aplicando el lema 5.2 al hecho de que log |Bn(X)|n∈N es una sucesión subaditiva de realesno negativos, se deduce inmediatamente que la entropía de cualquier espacio shift es un númeroreal no negativo bien denido.

De la denición, resulta inmediato que si X e Y son espacios shift con X ⊆ Y , tendremosque h(X) ≤ h(Y ), pues, para todo n ∈ N, es Bn(X) ⊆ Bn(Y ), de modo que |Bn(X)| ≤ |Bn(Y )|;aplicando logaritmos, dividiendo por n y tomando límite cuando n→∞ tenemos el resultado.Combinado con lo que ya sabemos de la entropía de los full shifts, esto nos dice que la entropíade un espacio shift X ⊆ AZ no supera a log |A|.

Investigaremos ahora otras propiedades de la entropía.

Proposición 5.3. Sean X, Y espacios shift. Si Y es factor de X, entonces h(Y ) ≤ h(X).

Demostración. Sea φ : X → Y un código de ventana deslizante factor, inducido por Φcon memoriam y anticipación k. Cualquier bloque de tamaño n en el lenguaje de Y es la imagende algún bloque de tamaño m+ n+ k en el lenguaje de X, por lo que |Bn(Y )| ≤ |Bm+n+k(X)|.Por lo tanto,

h(Y ) = lımn→∞

1

nlog |Bn(Y )| ≤ lım

n→∞

1

nlog |Bm+n+k(X)|

= lımn→∞

m+ n+ k

n

1

m+ n+ klog |Bm+n+k(X)|

= lımn→∞

m+ n+ k

nlımn→∞

1

m+ n+ klog |Bm+n+k(X)| = h(X)

Corolario 5.4. La entropía es un invariante por conjugación. Es decir, si X e Y sonespacios shift conjugados, entonces h(X) = h(Y ).

Demostración. Siendo X e Y conjugados, cada uno de ellos es un factor del otro, así queh(X) ≤ h(Y ) y h(Y ) ≤ h(X), de donde se sigue el resultado.

Esto permite ver rápidamente que dos full shifts con distinta cantidad de letras en susalfabetos no pueden ser conjugados, pues sus entropías son diferentes. Debe notarse que, sinembargo, la entropía no es un invariante completo. Por ejemplo, si X = 0∞ e Y = 0∞, 1∞,ambos tienen entropía 0 (pruébelo) pero no son conjugados pues no poseen la misma cantidadde puntos jos para σ.

Corolario 5.5. Si X es un espacio shift inmerso en un espacio shift Y , entonces h(X) ≤h(Y ).

Page 79: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

2. CÁLCULO DE LA ENTROPÍA DE SHIFTS SÓFICOS IRREDUCIBLES 75

Demostración. Sea φ : X → Y una inmersión. Entonces X es conjugado al espacio shiftφ(X), que es un subshift de Y . Luego, h(X) = h(φ(X)) ≤ h(Y ).

Dedicaremos bastante de este capítulo a establecer métodos de cálculo de la entropía deshifts de aristas. Ya que cualquier shift de tipo nito es conjugado a uno de aristas, tendremosentonces un método para calcular la entropía de cualquier shift de tipo nito, y también la decualquier shift sóco, en base al siguiente resultado, y teniendo en cuenta que cualquier shiftsóco admite una presentación resolvente a derecha.

Proposición 5.6. Sea G = (G,L) un grafo rotulado, con L resolvente a derecha. Entonces,h (XG) = h (XG).

Demostración. Como L∞ es código factor de XG a XG, tenemos que h (XG) ≤ h (XG).Supongamos que G tiene k vértices. Cualquier bloque en B (XG) tiene a lo sumo k presenta-

ciones (pues hay a lo sumo una presentación comenzando en cada vértice). Luego, |Bn (XG)| ≤k |Bn (XG)|, así que log |Bn (XG)| ≤ log k + log |Bn (XG)|. Dividiendo por n y tomando límitecuando n→∞, concluimos que h (XG) ≤ h (XG), y el resultado queda establecido.

2. Cálculo de la entropía de shifts sócos irreducibles

Comenzaremos analizando métodos para calcular la entropía de shifts de aristas que seanirreducibles. Convendrá, a tal efecto, realizar algunas convenciones sobre notación matricial.Diremos que una matriz A (no necesariamente cuadrada) es estrictamente positiva (A > 0)si todos sus coecientes son positivos; similarmente, diremos que A es no negativa (A ≥ 0)si todos sus coecientes son reales no negativos. Más generalmente, si A y B son matrices deigual tamaño, escribimos A > B cuando cada coeciente de A es estrictamente mayor que elrespectivo coeciente de B; escribimos A ≥ B cuando cada coeciente de A es mayor o igualque el respectivo coeciente de B. Toda esta notación se aplica también a los vectores (por sercasos particulares de matrices rectangulares).

Recordemos que un grafo G es esencial si desde cualquier vértice sale al menos una arista, y acualquier vértice llega al menos una arista. Esto se traduce en que la matriz de adyacencia de Gno tiene las nulas ni columnas nulas. Por otro lado, un grafo G es irreducible si desde cualquiervértice hay camino en G hasta cualquier otro vértice. Esto equivale a que para cualquier parejade vértices I, J , existe n ≥ 0 tal que (AnG)IJ > 0. Todo esto motiva las siguientes deniciones:

Definición 5.7. Sea A ≥ 0 una matriz cuadrada. A se dice esencial si no contiene lasnulas ni columnas nulas. A se dice irreducible si ∀I, J,∃n ≥ 0 : (An)IJ > 0.

Notar que un grafo es esencial si, y sólo si, su matriz de adyacencia es esencial. Similarmente,un grafo es irreducible si, y sólo si, su matriz de adyacencia es irreducible.

Convendremos que A0 = Id|A|×|A| cualquiera sea la matriz cuadrada A. Como caso particu-lar, [0]0 = [1]; entonces, [0] es irreducible pero no esencial. Cualquier matriz distinta de [0] queno sea esencial no puede ser irreducible, ya que si A tiene alguna la nula, la correspondientela de An (cualquiera sea n ≥ 1) es también nula (y análogamente si A tiene alguna columnanula). Dicho de otro modo, toda matriz irreducible debe necesariamente ser esencial (salvo elcaso excepcional de la matriz [0]).

La matriz de adyacencia es una valiosa herramienta para computar la entropía de shiftsde aristas. Sea G un grafo esencial de r vértices con matriz de adyacencia A. Sabemos que An

contiene la información necesaria para calcular la cantidad de caminos de largo n en G, es decir,la cantidad de bloques de tamaño n en el lenguaje de XG:

|Bn (XG)| =r∑I=1

r∑J=1

(An)IJ

Por lo tanto, para conocer la entropía de XG, debemos averiguar cómo van variando los coe-cientes de An conforme crece n. Veremos a continuación que, para ello, el conocimiento de losautovalores de A es fundamental.

Page 80: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

76 5. ENTROPÍA

Proposición 5.8. Sea A ≥ 0 una matriz r × r no nula que posee un autovector v > 0.Entonces, el correspondiente autovalor λ es positivo, y existen constantes positivas c0 y d0 talesque

c0λn ≤

r∑I=1

r∑J=1

(An)IJ ≤ d0λn

En consecuencia, si G es un grafo cuya matriz de adyacencia es A, entonces h (XG) = log λ.

Demostración. Como v es autovector correspondiente al autovalor λ, se cumple queAv = λv. Ya que A posee al menos un coeciente AKL > 0, es (Av)K > 0, es decir, λvK > 0,de donde se deduce que λ es positivo pues v tiene todos sus coecientes positivos.

Una simple inducción muestra que, ya que Av = λv, se tiene que Anv = λnv para cualquiern ≥ 1. Entonces, para cualquier índice I, es (Anv)I = (λnv)I , de donde

∑rJ=1 (An)IJ vJ = λnvI .

De allí quer∑I=1

r∑J=1

(An)IJ vJ = λnr∑I=1

vI

Designemos c = mınv1, . . . ,vr y d = maxv1, . . . ,vr. Notemos que tanto c como d sonestrictamente positivos.

Por un lado, tendremos quer∑I=1

r∑J=1

(An)IJ vJ ≥r∑I=1

r∑J=1

(An)IJ c = cr∑I=1

r∑J=1

(An)IJ

y que

λnr∑I=1

vI ≤ λnr∑I=1

d = λnrd

Entoncesr∑I=1

r∑J=1

(An)IJ ≤rd

cλn

Llamemos d0 = rd/c, resultando d0 > 0 pues r, d y c son positivos.Por otro lado, tendremos que

r∑I=1

r∑J=1

(An)IJ vJ ≤r∑I=1

r∑J=1

(An)IJ d = dr∑I=1

r∑J=1

(An)IJ

y que

λnr∑I=1

vI ≥ λnr∑I=1

c = λnrc

Entoncesr∑I=1

r∑J=1

(An)IJ ≥rc

dλn

Llamemos c0 = rc/d, , resultando c0 > 0 pues r, d y c son positivos.

Juntando las dos desigualdades de más arriba, tenemos que, para cualquier n ∈ N, es

c0λn ≤

r∑I=1

r∑J=1

(An)IJ ≤ d0λn

Si G es un grafo esencial que tiene matriz de adyacencia A, se cumple que |Bn (XG)| =∑rI=1

∑rJ=1 (An)IJ . Por nuestro resultado anterior, esto signica que

c0λn ≤ |Bn (XG)| ≤ d0λ

n

Page 81: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

2. CÁLCULO DE LA ENTROPÍA DE SHIFTS SÓFICOS IRREDUCIBLES 77

de donde1

nlog c0 +

1

nn log λ ≤ 1

nlog |Bn (XG)| ≤ 1

nlog d0 +

1

nn log λ

Tomando límites cuando n→∞, resulta h (XG)) = log λ.

Corolario 5.9. Si una matriz no nula A a coecientes enteros admite un autovectorpositivo, todos los autovectores positivos de ella corresponden a un mismo autovalor.

Demostración. Sea G el shift de aristas correspondiente a A. Sean v,v′ autovectorespositivos correspondientes a autovalores λ, λ′ respectivamente. Aplicando la proposición 5.8,concluimos que log λ = h (XG) = log λ′, de donde λ = λ′.

Corolario 5.10. Dada una matriz A ≥ 0 que admite un autovector positivo v correspon-diente al autovalor λ > 0, cualquier autovalor µ de A cumple que |µ| ≤ λ.

Demostración. Sea r el tamaño de A. Sean µ un autovalor de A y v′ un autovectorasociado a µ. Como Anv′ = µnv′ y A ≥ 0, es, por un lado,

r∑I=1

|(Anv′)I | =r∑I=1

|(µnv′)I | =r∑I=1

|µnv′I | = |µ|n

r∑I=1

|v′I |

y, por otro lado,r∑I=1

|(Anv′)I | =r∑I=1

∣∣∣∣∣r∑

J=1

(An)IJ v′J

∣∣∣∣∣ ≤r∑I=1

r∑J=1

|(An)IJ v′J | =r∑I=1

r∑J=1

(An)IJ |v′J |

≤ max1≤I≤r

|v′I |r∑I=1

r∑J=1

(An)IJ ≤

(r∑I=1

|v′I |

)d0λ

n

donde d0 > 0 es el garantizado en la proposición 5.8.Juntando todo esto, resulta que, para todo n ≥ 0, es |µ|n ≤ d0λ

n, es decir, |µ| ≤ d1/n0 λ.

Como d0 > 0, es lımn→∞ d1/n0 = 1, y entonces |µ| ≤ λ.

Dado un grafo esencial G, para poder calcular la entropía de XG por aplicación de laproposición 5.8, necesitamos saber si AG posee un autovector positivo. Para ello, contamos conel Teorema de PerronFrobenius, que enunciaremos sin demostración y que es válido para unaclase especial de matrices que comprende a las matrices de adyacencia de los grafos irreducibles.

Teorema 5.11. (PerronFrobenius) Sea A ≥ 0 una matriz irreducible no nula. EntoncesA posee un autovector vA positivo con autovalor correspondiente λA positivo que es geométri-camente y algebraicamente simple. Cualquier autovalor µ de A tiene módulo menor o igual queλA, y cualquier autovector positivo de A es un múltiplo positivo de vA.

El autovalor λA del teorema anterior se denomina autovalor de Perron de A, y vA es unautovector de Perron de A. El teorema muestra que vA es único salvo multiplicación por unescalar.

Por combinación de la proposición 5.8 con el teorema de PerronFrobenius, obtenemos elsiguiente resultado principal.

Teorema 5.12.

1. Si G es un grafo irreducible, entonces h(XG) = log λAG.2. Si X es un shift de tipo nito irreducible de memoria M y G es el grafo esencial tal queX [M+1] = XG, entonces h(X) = log λAG.

Demostración.

Page 82: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

78 5. ENTROPÍA

1. Como G es irreducible, AG es irreducible, por lo que admite un autovector positivo quecorresponde a λAG . Entonces, por la proposición 5.8, h(XG) = log λAG .

2. Ya que X es conjugado a X [M+1], siendo la entropía invariante por conjugación, esh(X) = h

(X [M+1]

)= h(XG). Como X es irreducible, también lo es X [M ] (teor. 4.33),

de donde G es irreducible, lo que implica que AG también lo es. Entonces, por el incisoanterior, h(X) = log λAG .

Corolario 5.13. Sea X un shift sóco irreducible y G = (G,L) una presentación irredu-cible resolvente a derecha de X. Entonces h(X) = log λAG.

Demostración. Por la proposición 5.6, h(X) = h(XG) = h(XG), y, siendo G irreducible,por el teorema 5.12, h(XG) = log λAG .

3. Cálculo de la entropía de shifts sócos

Previamente vimos cómo calcular la entropía de shifts sócos irreducibles: obtener unapresentación resolvente a derecha irreducible, y tomar el logaritmo del autovalor de Perron dela matriz de adyacencia del grafo subyacente. Ahora generalizaremos el método de cálculo parael caso de shifts sócos en general (no necesariamente irreducibles).

Como siempre, arrancaremos considerando los shifts de aristas, en este caso correspondientesa grafos arbitrarios (no necesariamente irreducibles). Veremos cómo, en este caso, el correspon-diente grafo G contiene ciertos subgrafos irreducibles cuya identicación nos permitirá obtenerla entropía de XG.

La idea es reorganizar las las y columnas de la matriz de adyacencia de G de modo dellevarla a una forma triangular por bloques, según veremos enseguida, y usar ciertas submatricescuadradas cercanas a la diagonal para calcular la entropía de XG.

Definición 5.14. Dado un grafo G = (V,Σ, i, t), y estados I, J ∈ V , decimos que I secomunica con J (denotado I J) si existe camino en G desde I hasta J ; equivalentemente,si existe n ≥ 0 tal que (AnG)IJ > 0. Decimos que I se intercomunica con J (denotado I! J)si I J y J I.

Es fácil chequear que la intercomunicación establece una relación de equivalencia entre losvértices del grafo (ejercicio). Sus clases de equivalencia se llaman clases de intercomunica-ción. Una clase de éstas consiste en un conjunto maximal de estados tal que desde cualquiera deellos se puede ir a cualquier otro de la clase por un camino en G. G es irreducible precisamentetiene una sola clase de intercomunicación.

Una arista de G que sale de un estado perteneciente a una clase de intercomunicación C1

y termina en un estado de una clase de intercomunicación C2 diferente se llama arista detransición de C1 a C2. Debe notarse que si hay una arista de transición de C1 a C2, nopuede haber al mismo tiempo arista de transición de C2 a C1, pues, en ese caso, todos losestados en C1 ∪ C2 estarían intercomunicados, contradiciendo la maximalidad de las clases deintercomunicación.

Con las clases de intercomunicación de un grafo G se puede construir otro grafo H cuyosvértices son las clases de intercomunicación de G, y hay una arista (única) desde un vértice Cihacia otro vértice Cj en H si, y sólo si, hay en G una arista de transición de Ci a Cj.

Ejemplo 5.15. Sea G grafo mostrado en la gura 1, con su correspondiente matriz deadyacencia A = AG.

Notar que 5 ! 4 y ningún otro vértice se intercomunica con 5 (ni con 4: por ejemplo,a pesar de haber camino de 1 a 4, es imposible en el grafo ir de 4 a 1). Luego, una clase deintercomunicación es C1 = 5, 4. Análogamente se ve que hay otras cuatro clases: C2 = 8,C3 = 1, 2, 7, C4 = 6 y C5 = 3, según puede observarse en la gura 2, que es básicamente el

Page 83: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

3. CÁLCULO DE LA ENTROPÍA DE SHIFTS SÓFICOS 79

1 2 3 4 5 6 7 81 0 1 0 0 0 0 1 02 1 0 1 1 0 0 0 03 0 0 0 1 0 0 0 04 0 0 0 0 1 0 0 15 0 0 0 2 1 0 0 06 0 0 0 0 0 2 0 17 0 1 0 0 0 0 0 18 0 0 0 0 0 0 0 0

Figura 1. Grafo del ejemplo 5.15

Figura 2. Componentes irreducibles para el grafo del ejemplo 5.15

mismo grafo G excepto que con los vértices de cada clase agrupados según una línea discontinua.

La arista de G que va de 4 a 8 es de transición de C1 a C2. Hay también aristas de transiciónde C3 a C1, de C3 a C5, de C3 a C2, de C3 a C4, de C5 a C1 y de C4 a C2. Por lo tanto, elgrafo H de las clases de intercomunicación tiene cinco vértices (C1, C2, C3, C4, C5) y siete aristas(C1 − C2, C3 − C1, C3 − C5, C3 − C2, C3 − C4, C5 − C1, C4 − C2), según se muestra en la gura3.

Figura 3. Grafo de clases de intercomunicación para el ejemplo 5.15

Notar que el grafo H que se construye de esta manera no puede tener rulos (pues pordenición las aristas de transición vinculan vértices de clases distintas) ni, más generalmente,ciclos, pues, en ese caso, habría nodos de una clase intercomunicados con nodos de otra clasedistinta, lo que no puede ser por la maximalidad de las clases. Esto implica que no todo estado deH puede tener aristas salientes (si fuera ése el caso, se podría generar un ciclo en H). Entonces,debe haber al menos un estado en H sin aristas salientes (en nuestro ejemplo anterior, C2 es

Page 84: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

80 5. ENTROPÍA

el único). Tales nodos se llaman sumideros. Análogamente debe haber al menos un estado enH sin aristas entrantes (C3 es el único del ejemplo anterior) y tales nodos se llaman fuentes.

Si quitamos los sumideros de H (y las aristas conectadas a ellos) de a uno por vez, recursi-vamente, hasta que no quede ninguno, obtendremos una manera de renombrar los vértices deH de acuerdo al orden en que se fueron quitando los vértices; así, el primer nodo quitado seráC ′1, el segundo C

′2, y así sucesivamente. De este modo, las clases de intercomunicación quedarán

ordenadas de manera tal que sólo puede haber camino en H desde C ′i hasta C′j cuando i > j.

En nuestro ejemplo, el procedimiento anteriormente descripto tiene varias alternativas; unade ellas es C ′1 = C2 = 8, C ′2 = C1 = 5, 4, C ′3 = C4 = 6, C ′4 = C5 = 3 y C ′5 = C3 =1, 2, 7.

Este orden nos permite reescribir la matriz de adyacencia G usando el orden en que aparecenlos vértices de G en C ′1, C

′2, etc. Al hacer este reordenamiento, la matriz asume una forma

triangular inferior por bloques que puede esquematizarse de la siguiente manera:

C ′1 C ′2 C ′3 · · · C ′kC ′1 A1 0 0 · · · 0C ′2 ∗ A2 0 · · · 0C ′3 ∗ ∗ A3 · · · 0...

......

.... . .

...C ′k ∗ ∗ ∗ · · · Ak

En ese esquema, 0 representa submatrices rectangulares nulas, y ∗ representa submatrices rec-tangulares posiblemente no nulas. Cada una de las matrices Ai corresponde a la matriz deadyacencia del subgrafo irreducible Gi de G que se obtiene de considerar los vértices pertene-cientes a la clase C ′i con las aristas de G que inician y terminan en dichos vértices. Cada Gi sellama una componente irreducible de G, y las Ai se llaman las componentes irreduciblesde AG. También nos referiremos a los XGi como las componentes irreducibles de XG.

Para el ejemplo 5.15, un posible reordenamiento siguiendo este proceso es el siguiente:

8 5 4 6 3 1 2 78 0 0 0 0 0 0 0 05 0 1 2 0 0 0 0 04 1 1 0 0 0 0 0 06 1 0 0 2 0 0 0 03 0 0 1 0 0 0 0 01 0 0 0 0 0 0 1 12 0 0 1 0 1 1 0 07 1 0 0 0 0 0 1 0

Ya que el polinomio característico de una matriz no cambia por una permutación simultáneade las y columnas, podemos calcular el polinomio característico χA(t) de la matriz A originalmás fácilmente usando la forma triangular por bloques. Al realizar la expansión (de Laplace)para obtener el determinante, cualquier producto que involucre un término ∗ de la porción pordebajo de la diagonal involucrará también un término 0 de la porción por encima de la diagonal.Por ello, sólo los bloques Ai sobre la diagonal importan al calcular el polinomio característicode A, resultando éste ser el producto de los determinantes de las componentes irreducibles deA:

χA(t) = χA1(t)χA2(t) · · ·χAk(t)En consecuencia, los autovalores de A son exactamente los autovalores de las Ai. En particular,el mayor de los λAi (en valor absoluto) será también un autovalor de A. Esto sugiere la siguientedenición.

Definición 5.16. Sea A una matriz no negativa con componentes irreducibles A1, . . . , Ak.El autovalor de Perron de A es λA = maxλAi : 1 ≤ i ≤ k.

Page 85: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

4. LOS PUNTOS PERIÓDICOS Y LA ENTROPÍA 81

Ya que el conjunto de autovalores de A es la unión de los autovalores de las Ai, cualquierautovalor de A tiene módulo acotado por alguno de los λAi . Luego, el autovalor de Perron deA es el más grande (en valor absoluto) de los autovalores de A. Veremos, a continuación, queλA controla la tasa de crecimiento de An (y, en consecuencia, la entropía de XG correspondeal máximo de las entropías de sus componentes irreducibles XGi), lo que es una extensión delteorema 5.12 a grafos en general.

Teorema 5.17. Sea G un grafo. Entonces, h (XG) = log λAG.

Demostración. Supongamos que las componentes irreducibles de AG son A1, . . . , Ak. SeráλAG = λAq para algún q ∈ 1, . . . , k. Como XG ⊇ XGq , es h (XG) ≥ h

(XGq

)= log λAq =

log λAG .Resta probar la desigualdad en el otro sentido. Si λAG = 0, es porque cada λAi es 0, lo que

implica que cada Ai es la matriz [0]. En ese caso, G no tiene caminos bi-innitos, lo que implicaque XG = ∅, quedando en ese caso el resultado establecido.

Supongamos entonces que λAG > 0. Probaremos la desigualdad deseada acotando el númerode caminos de longitud n en G. Cualquiera de tales caminos se puede descomponer en subca-minos dentro de clases de intercomunicación separados por aristas de transición entre clases.Es decir, cualquier π ∈ Bn (XG) es de la forma

π = τ (1)e(1)τ (2)e(2) · · · τ (j−1)e(j−1)τ (j)

donde, para cada i ∈ 1, . . . , j, τ (i) es camino (digamos de largo ni) en alguno de los subgrafosirreducibles de G (digamos Gqi), y, para cada i ∈ 1, . . . , j − 1, e(i) es una arista en G desdealgún estado en Gqi hasta algún estado de Gqi+1

. Observar que q1 > q2 > · · · > qj, y entoncesj ≤ k. Sea M la cantidad total de aristas de transición entre clases que hay en G. Cada e(i)

tiene a lo sumo M posibilidades, y a lo sumo n lugares en los que pueden ocurrir. O sea quela cantidad total de maneras de acomodar aristas de transición es a lo sumo (Mn)k. Por cadauna de tales maneras, el número de opciones para cada τ (i) es

∣∣Bni (XGqi)∣∣.Nótese que, siendo Gi irreducible para cada i entre 1 y k, es |Bm (XGi)| ≤ diλ

mAi

paraalgún di ∈ R+ (prop. 5.8). Denamos entonces d = maxdi : 1 ≤ i ≤ k. Tendremos que|Bm (XGi)| ≤ dλmAG . Por lo tanto, siendo n1 + · · · + nk ≤ n, la cantidad de formas de elegir losτ (i) es, a lo sumo, ∣∣Bn1

(XGq1

)∣∣× · · · × ∣∣Bnj (XGqi)∣∣ ≤ djλn1+···+njAG ≤ dkλnAG

Luego,|Bn (XG)| ≤ (Mn)kdkλnAG = (Md)knkλnAG

Aplicando logaritmos, dividiendo por n y tomando límite cuando n → ∞, resulta h (XG) ≤log λAG .

Con el resultado previo, ya estamos en condiciones de calcular la entropía de cualquierespacio shift sóco (posiblemente reducible).

Corolario 5.18. Sea X un shift sóco, y G = (G,L) una presentación resolvente a derechapara X. Entonces, h(X) = log λAG.

Demostración. Por la proposición 5.6, sabemos que h (XG) = h (XG) = log λAG . ComoX = XG, se concluye el resultado.

4. Los puntos periódicos y la entropía

Queremos ahora investigar cómo crece la cantidad de puntos periódicos de período n quehay en un espacio shift X, a medida que crece n. Veremos que existe una vinculación entre latasa de crecimiento de esa cantidad y la entropía de X.

Definición 5.19. Sea X un espacio shift y n un entero positivo. Designamos por pn(X) ala cantidad de puntos periódicos (para σ) de período n que hay en X.

Page 86: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

82 5. ENTROPÍA

Por ejemplo, si X = 0, 1Z y n es cualquier entero positivo, tomando cualquier bloque u ∈An se tiene que u∞ es un punto periódico de X, y bloques diferentes generan puntos periódicosdiferentes, por lo que pn(X) = 2n. Como vemos, al igual que lo que ocurre con |Bn(X)|, pn(X)puede crecer sin cota, por lo que resulta pertinente considerar la tasa de crecimiento de pn(X),es decir, 1

nlog pn(X), y ver qué ocurre con esta sucesión cuando n→∞. Debe advertirse, desde

un comienzo, que puede no existir el límite de dicha sucesión, ni siquiera restringiendo X a lafamilia de los shifts de tipo nito.

Ejemplo 5.20. Sea X un shift de aristas con conjunto de vértices I, J,K teniendo untotal de 6 aristas, de las cuales una es un rulo en I, 2 van de J a K y 3 de K a J . Su matrizde adyacencia es

A =

1 0 00 0 20 3 0

Por la proposición 2.25, sabemos que pn(X) es la traza de An. Si computamos An y sumamosen cada paso los coecientes de su diagonal, obtenemos que, para n par, es pn(X) = 1 + 2 · 6n/2y, para n impar, es pn(X) = 1, así que la subsucesión de 1

nlog pn(X) correspondiente a los

términos pares tiende a log√

6, y la correspondiente a los impares tiende a 0. Por lo tanto,1n

log pn(X) carece de límite.

Ya que lımn→∞1n

log pn(X) puede no existir, consideraremos lım supn→∞1n

log pn(X), recor-dando que el límite superior de una sucesión es el mayor de sus puntos de acumulación, ysiempre existe (y coincide con el límite de la sucesión si éste existe).

Proposición 5.21. Sea X un espacio shift. Entonces, lım supn→∞1n

log pn(X) ≤ h(X).

Demostración. Cada punto x ∈ X de período n está determinado por x[0,n−1] ∈ Bn(X),por lo que pn(X) ≤ |Bn(X)|. En consecuencia,

lım supn→∞

1

nlog pn(X) ≤ lım sup

n→∞

1

nlog |Bn(X)| = lım

n→∞

1

nlog |Bn(X)| = h(X)

La proposición anterior muestra que la tasa de crecimiento de pn(X) tiene a la entropía deX como cota superior. Sin embargo, para muchos espacios shift esa tasa iguala a h(X).

Proposición 5.22. Si X es un shift de aristas irreducible, entonces lım supn→∞

1n

log pn(X) =

h(X).

Demostración. Sea G = (V,Σ, i, t) un grafo irreducible tal que X = XG. Como haycamino desde I hasta J en G cualesquiera sean los vértices I, J , sea

N = maxI,J∈V

mın |π| : π camino desde I hasta J en G

Por lo tanto, dados vértices I, J arbitrarios en G, hay un camino en G desde I hasta J delongitud menor o igual que N .

Sea π un bloque en Bn(X) (y, por lo tanto, un camino en G), y sea τ un camino en G desdet(π) hasta i(π) con |τ | ≤ N . Entonces, πτ es ciclo en G, por lo que (πτ)∞ determina un puntoperiódico en X, con período n + |τ | ≤ n + N . Así vemos cómo construir, para cada bloque enBn(X), un punto periódico en X cuyo período está entre n y n + N . Notar que dos bloquesdiferentes en Bn(X) generan diferentes puntos periódicos. Por lo tanto,

|Bn(X)| ≤ pn(X) + pn+1(X) + · · ·+ pn+N(X)

Para cada n, elijamos kn en el conjunto 0, 1, . . . , N tal que pn+kn(X) ≥ pn+i(X) para cadai ∈ 0, 1, . . . , N. Tendremos que

|Bn(X)| ≤ (N + 1)pn+kn(X)

Page 87: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

4. LOS PUNTOS PERIÓDICOS Y LA ENTROPÍA 83

por lo que1

nlog |Bn(X)| ≤ 1

nlog(N + 1) +

1

nlog pn+kn(X)

En consecuencia,

h(X) = lımn→∞

1

nlog |Bn(X)| = lım sup

n→∞

1

nlog |Bn(X)|

≤ lım supn→∞

1

nlog(N + 1) + lım sup

n→∞

1

nlog pn+kn(X) = lım sup

n→∞

n+ knn

1

n+ knlog pn+kn(X)

= lım supn→∞

n+ knn

lım supn→∞

1

n+ knlog pn+kn(X) ≤ lım sup

n→∞

1

nlog pn(X)

Es decir, h(X) ≤ lım supn→∞1n

log pn(X). Entonces, aplicando la proposición 5.21, tenemos laigualdad deseada.

Corolario 5.23. Si X es un shift de tipo nito irreducible, entonces lım supn→∞

1n

log pn(X) =

h(X).

Demostración. Supongamos que X tiene memoria M . Entonces existe un grafo irredu-cible G tal que XG = X [M+1]. Siendo X y X [M+1] conjugados, es

h(X) = h(X [M+1]

)= h(XG) = lım sup

n→∞

1

nlog pn(XG) = lım sup

n→∞

1

nlog pn(X)

pues, siendo la cantidad de puntos periódicos invariante por conjugación, es pn(XG) = pn(X)para todo n.

Corolario 5.24. Si X es un shift sóco irreducible, entonces lım supn→∞1n

log pn(X) =h(X).

Demostración. Sea G = (G,L) una presentación resolvente a derecha para X, con Girreducible. Sabemos que h(X) = h(XG) (prop. 5.6). Supongamos que G tiene r vértices. Porser una presentación resolvente a derecha, cada punto en XG tiene a lo sumo r presentacionesen XG. Como L es código de ventana deslizante, transforma puntos de período n de XG enpuntos de período n de XG, por lo que

pn(XG) ≤ r · pn(XG)

Entonces,

lım supn→∞

1

nlog pn(X) = lım sup

n→∞

1

nlog pn(XG)

≥ lım supn→∞

1

nlog

1

r+ lım sup

n→∞

1

nlog pn(XG) = lım sup

n→∞

1

nlog pn(XG)

= h(XG) = h(X)

Es decir, h(X) ≤ lım supn→∞1n

log pn(X). Entonces, aplicando la proposición 5.21, tenemos laigualdad deseada.

Page 88: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

84 5. ENTROPÍA

EJERCICIOS

1. Muestre que el full A-shift es factor del full A′-shift si, y sólo si, |A| ≤ |A′|.2. Aplicando la denición, encuentre la entropía de X111.3. Para cualquier espacio shift X y cualquier entero positivo N , muestre que h

(X [N ]

)=

h(X) y que h(XN)

= Nh(X).4. Pruebe que si X e Y son dos espacios shift, h(X ∪ Y ) = maxh(X), h(Y ).5. Sea G un grafo con matriz de adyacencia A, r la menor de las sumas de sus las, y s la

mayor. Muestre que log r ≤ h (XG) ≤ log s.6. Encuentre dos shifts de tipo nito irreducibles de igual entropía, pero que no sean

conjugados.7. Sean X1 = X11 y X2 = X1 ∪ 1∞. Muestre que h (X1) = h (X2).8. Analice el valor de verdad de la siguiente proposición para matrices a coecientes no

negativos: (a bc d

)es irreducible si, y sólo si, b y c son ambos positivos

9. Muestre que la intercomunicación establece una relación de equivalencia entre los vér-tices de un grafo.

10. Encuentre la entropía de los shifts de aristas cuyas matrices de adyacencia son lassiguientes: (

2 11 1

) (0 11 0

) (0 32 0

)11. Para un grafo irreducible G, muestre que h (XG) = 0 si, y sólo si, G consiste de un único

ciclo.12. Considere los números log

√2, log 3

2, log

(3−√

2)y log π. ¾Cuáles de ellos corresponden

a la entropía de algún shift de tipo nito irreducible?13. Encuentre la entropía de XF , siendo F = aac, aba, acb, baa, bbb, bca, cac, cba, cca.14. Sea X un shift de aristas sobre el alfabeto A, con matriz de adyacencia T indexada

sobre A con entradas sólo 0 y 1.a) Sea a ∈ A jo, y T ′ la matriz que resulta de borrar de T la la y columna que

corresponden a a. Sea X ′ el shift de aristas con matriz de adyacencia T ′. Muestreque si T es irreducible y h(X) > 0, entonces h(X) > h (X ′). (Sugerencia: use unresultado clásico de la teoría espectral de matrices, que enuncia que si E,F sonmatrices a coecientes no negativos con F irreducible, Eij ≤ Fij para todos i, j, yλ es el radio espectral de F , entonces cualquier autovalor µ de E verica |µ| ≤ λ,con igualdad si, y sólo si, E = F .)

b) Para k ≥ 1, sea X [k] la presentación de X en k-bloques con solape. Muestre queX [k] es un shift de aristas con matriz de adyacencia de 0 y 1 con índices en Bk(X),denida por

T (k)[i1···ik],[j1···jk] =

1 si i2 · · · ik = j1 · · · jk−1 y i1 · · · ikjk ∈ Bk+1(X)0 en caso contrario

c) Sea U un alfabeto, L : A → U una función monobloque, e Y = L∞(X). Se dice queL∞ tiene diamante si existe k ≥ 1 tal que hay bloques distintos i1 · · · ik, j1 · · · jk ∈Bk(X) con i1 = j1, ik = jk y L (i1 · · · ik) = L (j1 · · · jk). Pruebe que:1) Si L∞ no tiene diamante, entonces:

i) ∀r1 · · · rk ∈ Bk(Y ), |L−1(r1 · · · rk)| ≤ |A|2.ii) ∀y ∈ Y, |L−1

∞ (y)| ≤ |A|2.iii) |Bk(X)| ≤ |A|2 |Bk(Y )|.iv) h(X) = h(Y ).

Page 89: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

5. ENTROPÍA 85

2) Si X e Y son irreducibles y L∞ tiene diamante, entonces existe y ∈ Y tal que|L−1∞ (y)| =∞. Si además h(X) es estrictamente positiva, entonces h(X) > h(Y ).

(Sugerencia: considere una presentación X [k] que tiene diamante, elimine delalfabeto de ella una de las dos palabras que intervienen en el diamante, y apliqueel ítem (14a).)

Page 90: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

Capítulo 6

CÓDIGOS DE ESTADOS FINITOS

Por diversos motivos, puede interesar codicar sucesiones arbitrarias sobre un alfabeto A ensucesiones de algún shift sóco X, y hacerlo de tal manera que exista algún modo de recuperarla sucesión original conociendo su imagen (recordar la discusión acerca del almacenamientomagnético de datos digitales al nal del capítulo 2). Lo primero que interesa es saber si esposible tal operación. Por ejemplo, si A = 0, 1 y X = 0∞ es evidente que no. En caso deser posible, de los métodos disponibles investigaremos en este capítulo uno que se denominacódigo de estados nitos, en el que los símbolos de la sucesión imagen se obtienen de a uno porvez, a medida que se van leyendo uno por uno los símbolos de la sucesión original, los que soninterpretados como una suerte de instrucciones. El método usa grafos rotulados con dos clasesespeciales de rotulaciones, una resolvente a derecha que además cumple otras condiciones, yuna un poco más débil que resolvente a derecha.

1. Coloreo de rutas y presentaciones cerrantes a derecha

Recordemos que una rotulación L : Σ→ A para un grafo G = (V,Σ, i, t) se dice resolventea derecha si desde un mismo nodo no salen dos aristas con un mismo rótulo; es decir, L|ΣI esinyectiva para cada I ∈ V . Si imponemos la condición más fuerte de que cada L|ΣI sea unabiyección, tendremos un tipo especial de rotulaciones resolventes a derecha.

Definición 6.1. Sea G un grafo con conjunto de aristas Σ. Un coloreo de rutas de G esuna rotulación L : Σ → A que, para cada I ∈ V , establece una biyección entre las aristas quesalen de I y las letras del alfabeto. G se dice coloreable si admite un coloreo de rutas.

La gura 1 muestra un ejemplo de grafo coloreable con A = 0, 1, y un ejemplo de coloreo.

Figura 1. Ejemplo de coloreo de rutas

Vemos entonces que, en un coloreo de rutas, por cada vértice I de G y cada letra a ∈ A,sale exactamente una arista desde I cuyo rótulo es a. Esto obliga a que desde cada vérticedeban salir exactamente |A| aristas. Entonces, G es coloreable si, y sólo si, tiene grado de salidaconstante desde sus vértices, lo que, en términos de la matriz de adyacencia, signica que laslas suman todas lo mismo. Un grafo con r estados y n aristas saliendo desde cada vérticeadmite (n!)r posibles coloreos de rutas (pues para cada uno de los r vértices hay que elegiruna forma de asignar a n aristas las n letras del alfabeto, que es como ordenar las letras delalfabeto).

86

Page 91: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

1. COLOREO DE RUTAS Y PRESENTACIONES CERRANTES A DERECHA 87

Otra consecuencia de la denición es que si L es un coloreo de rutas para G que tiene rvértices, cada palabra sobre A tiene exactamente r presentaciones, una empezando en cadavértice. Es decir, para cada I ∈ V y cada w ∈ A∗, hay un único camino comenzando en Icuyo rótulo es w (y, en consecuencia, un coloreo de rutas resulta una presentación para AZ).Si w = a1a2 . . . am, desde I se toma la única arista e1 ∈ Σ saliente con rótulo a1, desde t(e1) setoma la única arista e2 ∈ Σ saliente con rótulo a2, y así sucesivamente. En este sentido, cadasímbolo de A se interpreta como una instrucción de cuál arista tomar si se está en un dadovértice.

Ahora veamos otro tipo de rotulaciones especiales para grafos, que satisfacen una condiciónmás débil que la de ser resolventes a derecha.

Definición 6.2. Un grafo rotulado se dice cerrante a derecha con demora D si cualquierpareja de caminos de longitud D + 1 arrancando desde un mismo vértice y llevando el mismorótulo usan la misma primera arista. Un grafo rotulado se dice cerrante a derecha si escerrante a derecha con alguna demora D ≥ 0.

Informalmente hablando, un grafo rotulado puede no ser resolvente a derecha (lo cual crearáambigüedad sobre cuál arista rotulada tomar para salir desde algunos estados) pero es cerrantea derecha si esa ambigüedad queda salvada mirando anticipadamente una cierta cantidad Dde símbolos adicionales que vendrán después. Para los grafos resolventes a derecha, no hay quemirar anticipadamente nada, correspondiendo al caso en que la demora es D = 0.

Ejemplo 6.3. Consideremos los grados rotulados (a)(d) mostrados en la gura 2.El grafo (a) tiene demora D = 1. Para verlo, consideremos el estado I. Ya que hay dosaristas rotuladas a comenzando en I, el grafo no es resolvente a derecha. Sin embargo,el bucle en I sólo puede ser seguido por una arista rotulada a, mientras que la arista deI a J sólo puede ser seguida por una arista rotulada b o c. Luego, el rótulo de un caminode longitud 2 empezando en I determina su arista inicial. Un análisis similar permiteconcluir lo mismo para el estado J , y el estado K es más fácil, dado que las aristas quesalen de él llevan rótulos distintos.De manera análoga al inciso anterior, se puede vericar que el grafo rotulado (b) tambiénes cerrante a derecha con demora 1.En el grafo rotulado (c), hay dos caminos con diferentes aristas iniciales rotulados ab,por lo que este grafo no tiene demora 1. Sin embargo, el siguiente símbolo determinacuál de los dos caminos debe tomarse, por lo que el grafo es cerrante a derecha condemora D = 2.En el grafo rotulado (d), para cualquier m, hay dos caminos comenzando en J quepresentan al bloque abm; ya que estos caminos tienen distinta arista inicial, el grafo noes cerrante a derecha.

Una manera equivalente, y a veces cómoda, de visualizar la propiedad de una rotuladora deser cerrante a derecha con demora D es pensar que dos caminos de largo D + 1 arrancando enun mismo vértice pero usando distinta primera arista no pueden llevar el mismo rótulo.

Obviamente, así como el concepto de rotulación resolvente a derecha tiene su dual, que es elde resolvente a izquierda (todas las aristas que llegan a un mismo nodo tienen rótulos diferentes),se puede denir la noción dual de cerrante a derecha que es la de rotulación cerrante a izquierda:todos los caminos de largo D + 1 que terminan en un mismo nodo y llevan el mismo rótulousan la misma última arista. Pero en el presente capítulo usaremos sólo la noción de cerrantea derecha.

La propiedad de ser cerrante a derecha con demora D tiene una consecuencia sobre loscaminos de largo D + 1: todos los caminos de esa longitud que arrancan en un mismo vérticey llevan igual rótulo, tienen la misma primera arista. La gura 3 ilustra ese hecho. Esto puedegeneralizarse a caminos más largos diciendo que todos los caminos de largo mayor que Darrancando de un mismo nodo y teniendo el mismo rótulo usan las mismas aristas, excepto

Page 92: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

88 6. CÓDIGOS DE ESTADOS FINITOS

Figura 2. Ejemplos de rotulaciones con o sin cierre a derecha

Figura 3. Cierre por la arista inicial de caminos con igual rótulo

quizás las últimas D aristas. Es decir, dos caminos e0e1 . . . ek y f0f1 . . . fk con k ≥ D (o sea,de largo mayor que D) que arrancan en el mismo vértice y llevan el mismo rótulo cumplenque ej = fj para cada j ∈ 0, . . . , k − D: aplicando la denición a los dos bloques inicialese0 . . . eD y f0 . . . fD, obtenemos que e0 = f0, con lo cual e1 . . . ek y f1 . . . fk arrancan en unmismo vértice, y, en caso de tener largo al menos D + 1, aplicamos el mismo razonamientopara ver que e1 = f1, y así sucesivamente. Visto así, la propiedad de cierre a derecha actúa ala manera de un cierre de prenda de vestir, juntando todas las aristas de los caminos de largomayor que D que arrancan desde un mismo vértice y llevan un mismo rótulo, salvo las últimasD aristas. Véase la gura 4.

Figura 4. Cierre de todas excepto las últimas D aristas de caminos con igual rótulo

Usando esta idea para caminos cada vez más largos, vemos que la ambigüedad se trasladacada vez más hacia la derecha; en un caso límite de caminos innitamente largos hacia la

Page 93: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

1. COLOREO DE RUTAS Y PRESENTACIONES CERRANTES A DERECHA 89

derecha, esa ambigüedad queda entonces expulsada al innito (o sea, no subsiste la ambigüedad).Es decir, veremos que, en un grafo rotulado cerrante a derecha, cualquier pareja de caminosinnitos a derecha que empiezan en el mismo estado y llevan el mismo rótulo corresponden enrealidad a un único camino en el grafo. Para formalizar esto, dado un espacio shift X cualquieradenimos su shift unilateral X+ como el conjunto de todas las sucesiones innitas a derechaque aparecen en X. Es decir,

X+ = x0x1x2 . . . : (xk)k∈Z ∈ XEn el caso del shift de aristas correspondiente al grafo G = (V,Σ, i, t), X+

G corresponde alconjunto de caminos innitos a derecha que pueden ser recorridos en el grafo:

X+G = e0e1e2 . . . : ∀k ∈ N, ek ∈ Σ ∧ t(ek) = i(ek+1)

Si I es un estado de G, designamos por X+G,I como el conjunto de caminos innitos a derecha

que pueden ser recorridos en el grafo empezando en I:

X+G,I =

e0e1e2 . . . ∈ X+

G : i(e0) = I

Si G = (G,L) es un grafo rotulado, X+G es la familia de los rótulos de todos los caminos innitos

a derecha en G. Si para cada e0e1e2 . . . ∈ X+G designamos

L+(e0e1e2 . . .) = L(e0)L(e1)L(e2) . . . ,

tendremos que X+G = L+(X+

G) =L+(x) : x ∈ X+

G

, resultando que L+ : X+

G → X+G es una

función sobreyectiva.

Proposición 6.4. Un grafo rotulado (G,L) es cerrante a derecha si, y sólo si, para cadavértice I del grafo, L+|X+

G,Ies inyectiva.

Demostración. Supongamos primero que (G,L) es cerrante a derecha, digamos con de-mora D. Sea I un vértice cualquiera del grafo, y sean x = e0e1e2 . . . e y = f0f1f2 . . . caminosinnitos en X+

G,I tales que L+(x) = L+(y). Entonces i(e0) = I = i(f0) y L(e0)L(e1) . . .L(eD) =L(e0)L(e1) . . .L(eD). Por ser el grafo rotulado cerrante a derecha con demoraD, debe ser e0 = f0

y, en consecuencia, e1 y f1 comienzan en el mismo vértice t(e0). Como L(e1)L(e2) . . .L(eD+1) =L(f1)L(f2) . . .L(fD+1) y el grafo es cerrante a derecha, es e1 = f1. Aplicando sucesivamenteel mismo razonamiento, se cumple que para todo k ∈ N es ek = fk, es decir, x = y, y de estemodo L+ es inyectiva si se la restringe a X+

G,I .Ahora probemos la vuelta por contrarreciprocidad. Supongamos entonces que (G,L) no es

cerrante a derecha. Esto signica que para cada D ≥ 0, existe una pareja de caminos de largoD + 1, digamos π y τ , que comienzan en un mismo vértice, tienen distinta primera arista yllevan ambos el mismo rótulo. Elijamos tales caminos para el caso en que D = |V |2. Será

π = e0e1 . . . eD τ = f0f1 . . . fD

con i(e0) = i(f0), e0 6= f0 y L(e0)L(e1) . . .L(eD) = L(f0)L(f1) . . .L(fD). Como D + 1 > |V |2,debe haber índices i < j tales que la pareja ei, fi coincide con ej, fj, por lo que ei . . . ej y fi . . . fjson ambos ciclos en G comenzando en un mismo nodo; llamémosles β y γ respectivamente,siendo |β| = |γ|. Hagamos α = e0 . . . ei−1 y α′ = f0 . . . fi−1, siendo |α| = |α′|. Notar queL(α) = L(α′) por ser ambos subcaminos iniciales de π y τ con igual longitud; y, similarmente,L(β) = L(γ). Entonces αβ∞ y α′γ∞ son dos caminos innitos a derecha arrancando en i(e0),ambos distintos (pues e0 6= f0 ) y con rotulaciones iguales. Luego, L+|X+

G,i(e0)no es inyectiva.

Una situación en la que podemos garantizar que un grafo rotulado es cerrante a derecha esaquella en la que la función rotuladora, como código de ventana deslizante que es, resulta seruna conjugación.

Proposición 6.5. Sea G = (G,L) un grafo rotulado con L∞ : XG → XG conjugación cuyainversa L−1

∞ tiene anticipación n. Entonces el grafo rotulado es cerrante a derecha con demoran.

Page 94: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

90 6. CÓDIGOS DE ESTADOS FINITOS

Demostración. Podemos suponer que G es esencial. Sean e0e1 . . . en y f0f1 . . . fn doscaminos comenzando en el mismo vértice I y llevando el mismo rótulo. Debemos probar quee0 = f0.

Llamando m a la memoria de L−1∞ y Φ a la respectiva función de bloques, elijamos un

camino π en G de largo m que termine en I (tal elección es posible por ser G esencial).Entonces L(πe0e1 . . . en) = L(π)L(e0e1 . . . en) = L(π)L(f0f1 . . . fn) = L(πf0f1 . . . fn). Luego,Φ (L(πe0e1 . . . en)) = Φ (L(πf0f1 . . . fn)), siendo el primer miembro de esta igualdad precisa-mente e0, y el segundo f0 (por ser Φ la función inductora de L−1

∞ ). Es decir, e0 = f0.

Recordemos que el desdoblamiento de salidas de un grafo rotulado corresponde a un des-doblamiento de salidas del grafo subyacente, rotulando todas las aristas ei con el mismo rótuloque en el grafo original tiene la arista e. Recordemos también que esto produce una nuevapresentación del mismo shift sóco. Demostraremos ahora que si se desdobla un grafo rotuladoresolvente a derecha con demora D, el grafo desdoblado es también resolvente a derecha, aunquecon demora D + 1.

Proposición 6.6. Sea G cerrante a derecha con demora D. Cualquier grafo rotulado obte-nido por desdoblamiento de salidas de G es cerrante a derecha con demora D + 1.

Demostración. Sea G = (G,L), y sea (H,L′) un grafo obtenido por desdoblamiento desalidas de G. Recordar que H tiene estados I i y aristas ei, y que el código de amalgama ei → eda una conjugación de XH a XG. Además, la rotuladora L′ en H está dada por L′(ei) = L(e).Veremos que (H,L′) es cerrante a derecha con demora D + 1.

Sean ei00 ei11 . . . e

iD+1

D+1 y fj00 f

j11 . . . f

jD+1

D+1 dos caminos de largo D+2 en H comenzando ambos enI i y teniendo el mismo rótulo (según L′). Aplicando el código amalgama, vemos que e0e1 . . . eD+1

y f0f1 . . . fD+1 son caminos de largo D + 2 en G comenzando en I y con el mismo rótulo(para L). Así que e0e1 = f0f1. Ya que i0 está determinado por el elemento de la partición alque pertenece e1, y similarmente j0 está determinado por el elemento de la partición al quepertenece f1, concluimos que ei00 = f j00 , quedando establecido que L′ es cerrante a derecha condemora D + 1.

Ejemplo 6.7. Consideremos el grafo rotulado (b) de la gura 2, que es cerrante a derechacon demora 1. Hagamos un desdoblamiento elemental de salidas usando Σ1

I , Σ2I y Σ1

J , dondeΣ1I consiste en el rulo en I rotulado a y la única arista de I a J rotulada b, Σ2

I es el resto delas aristas que salen de I, y Σ1

J = ΣJ . El grafo rotulado desdoblado resultante se muestra en lagura 5. En él, hay dos caminos comenzando en I1 rotulados aa que usan distinta arista inicial,por lo que el grafo no tiene demora 1. Sin embargo, la proposición muestra que tiene demora2, como efectivamente puede vericarse.

Figura 5. El desdoblamiento de grafos rotulados incrementa una unidad la demora

Recordemos que, en un grafo rotulado, la entropía del shift de aristas del grafo subyacentey la del sóco coinciden si la rotulación es resolvente a derecha. Lo mismo es cierto para lasrotulaciones cerrantes a derecha.

Page 95: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

2. CÓDIGOS DE ESTADOS FINITOS 91

Proposición 6.8. Sea G = (G,L) un grafo rotulado cerrante a derecha. Entonces, h (XG) =h (XG).

Demostración. Ya que XG es factor de XG, tenemos que h (XG) ≤ h (XG).Para probar la desigualdad en el otro sentido, supongamos que G es cerrante a derecha con

demora D. Entonces, cada estado I de G y cada bloque de largo n + D en el lenguaje de XGdeterminan a lo sumo un camino de largo n en G, y todos los caminos en Bn(XG) surgen deesta forma. Luego, |Bn(XG)| ≤ |V | × |Bn+D(XG)|. Aplicando logaritmos, dividiendo por n ytomando límite cuando n→∞, resulta h (XG) ≤ h (XG).

2. Códigos de estados nitos

Introduciremos ahora una clase de dispositivos para transformar sucesiones arbitrarias (esdecir, sin restricciones) sobre un alfabeto en sucesiones sujetas a determinadas restricciones(posiblemente sobre otro alfabeto). Analizaremos también desde el punto de vista teórico lafactibilidad del método en lo que resta del capítulo.

Definición 6.9. Un código de estados nitos (CEF) es una terna (G, I,O), donde Ges un grafo llamado grafo codicador, I es un coloreo de rutas de G llamado rotulaciónde entradas y O es una rotulación cerrante a derecha de G llamada rotulación de salidas.Si todos los vértices de G tienen grado de salida n y si X es un espacio shift que contiene aO∞(XG), decimos que la terna (G, I,O) es un (X,n)-código de estados nitos.

Representaremos grácamente a los CEF mediante el dibujo del correspondiente grafo yuna leyenda de la forma a/b en cada arista e, en donde a representa I(e) y b representa O(e).

Ejemplo 6.10. El grafo rotulado (b) de la gura 2 tiene grado de salida constante 4, demodo que proporciona una rotulación de salida para un CEF. La gura 6 muestra una posibleelección de rotulación de entradas con alfabeto 0, 1, 2, 3.

Figura 6. Un ejemplo de CEF

Si (G, I,O) es un (X,n)-CEF e I0 es un estado jo de G, podemos transformar cualquiersucesión arbitraria de entradas a0a1a2 . . . ∈

(AZ)+

en otra sucesión de salidas r0r1r2 . . . de X+

del siguiente modo: identicamos la única arista e0 saliendo de I0 tal que I(e0) = a0 y denimosr0 = O(e0). Ahora desde el vértice terminal de e0 sale una única arista e1 tal que I(e1) = a1 ydenimos r1 = O(e1). Continuando de esta manera, denimos rk para cualquier k ∈ N.

Obviamente, queremos ser capaces de recuperar la sucesión original a partir de la sucesiónasí obtenida. Es precisamente para ello que hemos requerido que O sea cerrante a derecha: laproposición 6.4 nos garantiza que O es inyectiva cuando se restringe a los caminos innitos enG que arrancan en I0, lo que signica que hay un único camino innito e0e1e2 . . . en X+

G,I0tal

que O(e0e1e2 . . .) = r0r1r2 . . .; por lo tanto, cada ak se recupera viendo I(ek).Concretamente, si (G,O) tiene demora D, el bloque r0r1 . . . rD determina e0, así que a0 =

I(e0). Luego, r1r2 . . . rD+1 es un camino rotulado (por O) en G que comienza en t(e0), y por lotanto determina e1, de donde a1 = I(e1). Continuando de este modo, obtenemos todos los ak.

Page 96: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

92 6. CÓDIGOS DE ESTADOS FINITOS

En la práctica sólo podemos manejar sucesiones nitas de símbolos. En tal caso, a partirde una sucesión nita arbitraria a0a1 . . . ak podemos generar, por el método arriba descripto,r0r1 . . . rk. Pero el conocimiento de ésta sólo nos permite recuperar a0a1 . . . ak−D (pues O escerrante a derecha con demoraD). Si bien esto parece alarmante, una solución posible es agregarD símbolos arbitrarios a la derecha de a0a1 . . . ak y codicar mediante el CEF esta sucesiónmás grande; obtendremos así una r0r1 . . . rk . . . rk+D que nos permitirá recuperar a0a1 . . . akcompletamente y sin ambigüedades.

Ahora bien, dado un alfabeto de n símbolos para las sucesiones arbitrarias de entrada y unshift sóco X, resta ver bajo qué condiciones existe un (X,n)-CEF. El teorema principal de loscódigos de estados nitos establece cuál es exactamente esa condición: que X tenga sucientecapacidad de almacenamiento de información, o complejidad, la que es medida por la entropía.

Teorema 6.11. (Teorema de los Códigos de Estados Finitos) Sean X un shift sócoy n un entero positivo. Entonces, hay un (X,n)-código de estados nitos si, y sólo si, h(X) ≥log n.

La dirección fácil de la demostración es la directa: si (G, I,O) es un (X,n)-CEF, porla proposición 6.8, que establece que las rotulaciones cerrantes a derecha preservan entropía,tenemos que h (I∞(XG)) = h(XG) = h (O∞(XG)). Como (G, I) es una presentación del fullshift de n símbolos, y además O∞(XG) ⊆ X, tenemos que

log n = h (I∞(XG)) = h (O∞(XG)) ≤ h(X)

La demostración de la implicación recíproca es mucho más delicada, y requiere de nuevas ideasque desarrollaremos en las secciones posteriores del capítulo.

3. Autovectores aproximados

Supongamos que n es un entero positivo y que X es un shift sóco. Sabemos que X admiteuna presentación resolvente a derecha (H,L). Si tenemos la suerte de que, en esa presentación,salen al menos n aristas desde cada vértice, podemos diseñar un (X,n)-CEF simplementeeligiendo exactamente n aristas salientes desde cada estado (borrando las otras) y restringiendoL a esas aristas elegidas (llamemosO a esa restricción). Obtenemos así un subgrafoG coloreable,al que dotamos de cualquier coloreo de rutas I. Tenemos que (G, I,O) constituye un (X,n)-CEF, pues I y O son ambas resolventes a derecha (y entonces O es cerrante a derecha condemora D = 0) y O∞(XG) = L∞(XG) ⊆ L∞(XH) = X.

El problema sería que H no tuviese al menos n aristas saliendo desde cada estado. Veremos,sin embargo, que si X satisface la condición h(X) ≥ log n, una cadena de desdoblamientos deestados convenientemente elegidos, aplicados sucesivamente a partir de (H,L), producirá unapresentación de X en la que hay al menos n aristas saliendo desde cada vértice. A ella le apli-caremos nuestras consideraciones previas, y de esta manera quedará completa la demostracióndel Teorema de los Códigos de Estados Finitos, que se hará en la sección posterior.

Nos dedicaremos ahora a presentar la herramienta precisa que nos servirá de guía para elegirconvenientemente la sucesión de desdoblamientos de estados a realizar, a partir de (H,L), parallegar a la presentación buscada. Esa herramienta recibe el nombre de autovector aproximado,y, para motivar su nombre y su denición, notemos que si un grafo con matriz de adyacenciaA tiene al menos n aristas saliendo desde cada vértice, cada la de A suma al menos n. Esacondición equivale a la desigualdad matricial A1 ≥ n1, en donde 1 es el vector columna dedimensión igual al tamaño de A y que tiene todos sus coecientes valiendo 1. Cualquier vectorcolumna v 6= 0 que, reemplazado en cuenta de 1 en esa desigualdad, la siga satisfaciendo,recibirá un nombre especial.

Definición 6.12. Sea A una matriz cuadrada a coecientes enteros no negativos, y nun entero positivo. Un (A, n)-autovector aproximado ((A, n)-AA) es un vector v 6= 0 concoecientes enteros no negativos que satisface Av ≥ nv.

Page 97: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

3. AUTOVECTORES APROXIMADOS 93

Ejemplo 6.13. Sean A =

[1 36 1

]y n = 5. De la denición de autovector aproximado,

resulta que cualquier (A, 5)-AA u = (u1, u2) debe satisfaceru1 + 3u2 ≥ 5u1

6u1 + u2 ≥ 5u2

o, equivalentemente, −4u1 + 3u2 ≥ 0

6u1 − 4u2 ≥ 0

Este sistema determina un cono en el primer cuadrante; los puntos de ese cono que tienenambas coordenadas enteras son precisamente los (A, 5)-autovectores aproximados. Entre ellos,tenemos [

23

],

[34

],

[46

],

[57

],

[68

],

[69

],

[710

], . . .

El ejemplo anterior es generalizable de manera directa al hecho de que dada una matriz Ade tamaño r y un n > 0, el conjunto de los (A, n)-AA es el conjunto de vectores (u1, . . . , ur)a coordenadas enteras no negativas que se encuentran en el cono poliédrico de dimensión r (omenor) determinado por el sistema de inecuaciones

∑rJ=1AIJuJ ≥ nuI : 1 ≤ I ≤ r.

Observación 6.14. Podemos caracterizar de diversas maneras a los autovectores aproxi-mados.

Sea v un (A, n)-autovector aproximado. Siendo A ≥ 0, es A2v = A(Av) ≥ A(nv) =n(Av) ≥ n(nv) = n2v. Una sencilla inducción muestra que, más generalmente, paratodo k ≥ 0 se cumple que Akv ≥ nkv toda vez que v es un (A, n)-AA.

Por lo tanto, dados n ∈ Z+, A y v 6= 0 a coecientes enteros no negativos,

v es (A, n)-AA ⇐⇒ ∀k ∈ N, Akv ≥ nkv

Sea A la matriz de adyacencia de un grafo G = (V,Σ, i, t), y v 6= 0 un vector a coe-cientes enteros no negativos de dimensión igual al tamaño de A. Consideremos cualquierJ ∈ V . Como ΣJ es la unión disjunta

⋃L∈V ΣL

J , se tiene que∑e∈ΣJ

vt(e) =∑

e∈⋃L∈V ΣLJ

vt(e) =∑L∈V

∑e∈ΣLJ

vt(e) =∑L∈V

∑e∈ΣLJ

vL =∑L∈V

∣∣ΣLJ

∣∣vL =∑L∈V

AJLvL

Por otra parte, de la denición de autovector aproximado, se tiene que v es un (A, n)-AAsi, y sólo si, ∀J ∈ V,

∑L∈V AJLvJ ≥ nvJ . Por lo dicho previamente, resulta que

v es (A, n)-AA ⇐⇒ ∀J ∈ V,∑e∈ΣJ

vt(e) ≥ nvJ

Dado un grafo G tal que existe un (AG, n)-AA, hay un subgrafo irreducible H de G tal queexiste un (AH , n)-autovector aproximado estrictamente positivo.

Lema 6.15. Sean G = (V,Σ, i, t) un grafo con matriz de adyacencia A. Existe un (A, n)-AAsi, y sólo si, G posee un subgrafo irreducible H con matriz de adyacencia B tal que existe un(B, n)-AA estrictamente positivo.

Demostración.

⇒) Sea v un (A, n)-AA. Designemos por K al subgrafo de G que resulta de quitar todos losvértices I (y, obviamente, sus aristas incidentes) para los cuales vI = 0. Sea H una componenteconexa de K que sea un sumidero, es decir, que no contenga aristas que terminen en un estadoque no esté en H. Tal H es un subgrafo de G. Llamando VH al conjunto de vértices de H y Ba su matriz de adyacencia, sea w la restricción de v a VH . Por su denición, es w > 0.

Además, podemos observar que:

Page 98: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

94 6. CÓDIGOS DE ESTADOS FINITOS

Para cualquier J ∈ VH , es wJ = vJ y AIJ = BIJ , por lo que BIJwJ = AIJvJ . De allíque

∑J∈VH BIJwJ =

∑J∈VH AIJvJ .

Para cualquier J ∈ V − VH , puede ocurrir una de dos alternativas:1. O bien J no es un vértice en el subgrafo K, lo que ocurre por ser vJ = 0.2. O bien J es un vértice de K. En tal caso, todas las aristas de G incidentes con I y

con J subsisten en K, y, por denición de H, no hay arista en K desde I hasta J ,de donde se deduce que no hay arista en G desde I hasta J . Entonces, en este caso,AIJ = 0.

Cualquiera sea esa alternativa, resulta entonces que AIJvJ = 0. Siendo J arbitrario enV − VH , tenemos que

∑J∈V−VH AIJvJ = 0.

Entonces, ∑J∈VH

BIJwJ =∑J∈VH

AIJvJ +∑

J∈V−VH

AIJvJ =∑J∈V

AIJvJ ≥ nvI = nwI

quedando así demostrado que w es un (B, n)-AA estrictamente positivo.⇐) Sea w un (B, n)-AA para el subgrafo H = (V ′,Σ′, i′, t′), y sea v el vector denido por

vJ =

wJ si J ∈ V ′0 si J ∈ V − V ′

Sea I un vértice arbitrario de G. Si I /∈ V ′, siendo vI = 0, la desigualdad∑

L∈V AILvL ≥ nvIse cumple trivialmente. Y para cualquier I ∈ V ′, resulta∑

L∈V

AILvL =∑L∈V ′

AILvL +∑

L∈V−V ′AILvL =

∑L∈V ′

AILwL ≥∑L∈V ′

BILwL ≥ nwI = nvI

Ya que v 6= 0 pues w > 0, resulta que v es un (A, n)-AA.

Dada una matriz A y un entro positivo n, ¾cuándo existe un (A, n)-AA?

Teorema 6.16. Sean A ≥ 0 una matriz cuadrada a coecientes enteros, y n un enteropositivo. Entonces, hay un (A, n)-AA si, y sólo si, λA ≥ n. Si además suponemos que A esirreducible, entonces hay un (A, n)-AA estrictamente positivo.

Demostración. Llamemos r al tamaño de A. Sea G un grafo cuya matriz de adyacenciasea A.

Para la implicación directa, por el lema 6.15, podemos suponer que A es irreducible y queadmite un (A, n)-AA v > 0. Sean c = mınvI : 1 ≤ I ≤ r y d = maxvI : 1 ≤ I ≤ r,teniéndose que d ≥ c > 0. Para cualquier k ∈ N, es Akv ≥ nkv (observación 6.14), lo queimplica que para cualquier I ∈ 1, . . . , r es

(Akv

)I≥ nkvI , y entonces

d

r∑I=1

r∑J=1

(Ak)IJ≥

r∑I=1

r∑J=1

(Ak)IJ

vJ ≥r∑I=1

nkvI = nkr∑I=1

vI ≥ nkrc

Es decir,∑r

I=1

∑rJ=1

(Ak)IJ≥ nkrc/d. Pero además, por la proposición 5.8 y el Teorema de

Perron-Frobenius, es∑r

I=1

∑rJ=1

(Ak)IJ≤ d0λ

kA para alguna constante d0 > 0. Juntando todo

esto, y llamando t = rcdd0

, resulta que, para cualquier k ∈ N, es λA ≥ t1/kn. Haciendo tender ka innito, y considerando que t > 0, resulta que λA ≥ n.

Para la implicación recíproca, supongamos que se cumple la condición λA ≥ n. Usando unacomponente irreducible de G de entropía maximal, podemos suponer que A es irreducible. Suautovector de Perron vA es positivo, y satisface AvA = λAvA ≥ nvA. Si vA tuviese todos suscoecientes racionales, haciendo v = MvA (donde M es el producto de los denominadores delos coecientes de vA) obtendríamos que Av = AMvA = M(AvA) ≥ MnvA = nv, mostrandoque v sería el (A, n)-AA que buscamos. Pero no tenemos garantía de que vA vaya a tener todossus coecientes racionales, así que debemos trabajar un poco más para asegurar que hay un(A, n)-AA. Distinguiremos dos casos:

Page 99: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

3. AUTOVECTORES APROXIMADOS 95

1. λA = n. En este caso, resolvemos la ecuación vectorial Av = nv por eliminación gaus-siana (siendo el sistema consistente ya que admite al menos la solución vA), y, ya queA tiene todos sus coecientes enteros, la solución v debe tener todos sus coecientesracionales. Por el teorema de Perron-Frobenius, λA es geométricamente simple, por loque v es múltiplo de vA. Multiplicando a v por el producto de los denominadores desus coecientes (y eventualmente por −1), obtenemos un vector v′ > 0 que cumpleAv′ ≥ nv′. Entonces, v′ es un (A, n)-AA.

2. Si λA > n, de modo que AvA > nvA, elijamos v con coordenadas racionales sucien-temente cercanas a las respectivas coordenadas de vA tal que la desigualdad Av > nvsiga cumpliéndose. Apliquemos a tal v el proceso de multiplicar por el producto delos denominadores (y eventualmente por −1) para obtener un vector v′ que satisfaráAv′ ≥ nv′. Entonces, v′ es un (A, n)-AA.

Veremos más adelante que, a la hora de construir (X,n)-códigos de estados nitos, esnecesario obtener explícitamente un (A, n)-AA, conociendo cierta matriz A (estrechamentevinculada al shift sóco X) y el entero positivo n. El teorema anterior asegura que, bajo lacondición λA ≥ n, existe un (A, n)-AA; sin embargo, no proporciona una manera explícita deencontrar uno. Afortunadamente, existe un algoritmo que permite hacerlo. Antes de presentarlo,denimos una nueva notación: dados dos vectores v,v′ de igual tamaño r, designamos pormın(v,v′) al vector minimal componente a componente, es decir, (mın(v,v′))I = mınvI ,v′Ipara cada I ∈ 1, . . . , r. Además, designamos por bvc al vector que se obtiene de tomar laspartes enteras de las componentes de v, es decir, bvcI = bvIc para cada I ∈ 1, . . . , r.

Teorema 6.17. (Algoritmo del autovector aproximado) Sean A ≥ 0 una matrizcuadrada a coecientes enteros, n un entero positivo y v 6= 0 un vector a coecientes enterosno negativos. Pongamos

v′ = mın

(v,

⌊1

nAv

⌋)Si v′ = v, contestar v y nalizar. Si no, reemplazar v por v′ y repetir. Este proceso nalmenteculmina, y su respuesta es o bien un (A, n)-autovector aproximado o bien el vector nulo.

Demostración. Los sucesivos vectores que se van produciendo tienen coecientes enterosno negativos y monótonamente decrecientes componente a componente. Luego, el proceso debeterminar, pues el vector nulo 0 satisface la condición

0 = mın

(0,

⌊1

nA0

⌋)si es que ésta no se produce antes.

Sea v la respuesta. Se tiene que v es un vector a coecientes enteros no negativos. Si v = 0,se cumple el enunciado. Si no, notemos que

v = mın

(v,

⌊1

nAv

⌋)≤ 1

nAv

por lo que Av ≥ nv con v 6= 0, es decir, v es un (A, n)-AA.

Típicamente, el algoritmo anterior se emplea del siguiente modo: comenzar con v siendo elvector cuyas componentes son todas 1 y aplicar el algoritmo; si la respuesta es un vector nonulo, ya tenemos el autovector aproximado que buscamos. En caso contrario, tomar v siendoel vector cuyas componentes son todas 2, y así sucesivamente. El teorema 6.17 asegura que enalgún momento terminaremos con este procedimiento, pues existe un (A, n)-AA v. Si hacemosp = maxI vI , aplicando el algoritmo comenzando con el vector cuyas componentes son todas p,se obtendrá como respuesta un vector no nulo (ejercicio).

Page 100: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

96 6. CÓDIGOS DE ESTADOS FINITOS

Ejemplo 6.18. Apliquemos el algoritmo anterior a la matriz A =

[1 36 1

]y el n = 5 del

ejemplo 6.13. Comenzando con v =

[11

], obtenemos sucesivamente[

11

]→[

01

]→[

00

]→[

00

]Comenzando con v =

[22

], obtenemos sucesivamente[

22

]→[

12

]→[

11

]→[

01

]→[

00

]→[

00

]Comenzando con v =

[33

], obtenemos sucesivamente[

33

]→[

23

]→[

23

]y hemos obtenido el más pequeño de los (A, 5)-autovectores aproximados.

4. Construcción de códigos de estados nitos

En esta sección completaremos la demostración del Teorema de los Códigos de EstadosFinitos. Lo haremos de manera constructiva, es decir, proporcionando también un método paraconstruir el CEF, conocidos n y el shift sóco X con h(X) ≥ log n.

El primer paso es obtener una presentación resolvente a derecha (G′,L′) para X. Luego,basados en el corolario 5.18, elegimos una componente irreducible G = (G′′,L) con h (XG) =h (XG′) = h(X) ≥ log n. A partir de G, y siguiendo una adecuada secuencia de desdoblamientosde estados de grafos rotulados, construimos una presentación de X en la que desde cada vérticesalen al menos n aristas, y en esa presentación eliminamos algunas aristas para obtener un grafoG en el que, desde cada vértice, queden saliendo exactamente n aristas. La función rotuladorarestringida a esas aristas será nuestra rotuladora de salidas O, y como rotuladora de entradasI elegimos cualquier coloreo de rutas del grafo que resulta. Así obtenemos el CEF (G, I,O)que buscamos.

Para ello, necesitamos demostrar una proposición que constituye el corazón de la demos-tración de que efectivamente existe aquella secuencia de desdoblamientos de estados de grafosrotulados de la que hablamos más arriba. Y dicha proposición usa un sencillo hecho de teoríade números que enunciamos a continuación.

Lema 6.19. Sea mini=1 una sucesión de n enteros positivos. Entonces, existe S ⊆ 1, . . . , ntal que n es factor de

∑i∈Smi.

Demostración. Para cada N ∈ 1, . . . , n, sea pN =(∑N

i=1mi

)mod n.

Si los pN son todos distintos, debe haber algún N∗ tal que pN∗ = 0 (pues los posibles restosde una división por n son 0, 1, . . . , n − 1) y, en ese caso n es factor de

∑N∗

i=1mi; luego, bastatomar S = 1, . . . , N∗ para ver que el enunciado es cierto.

Si no son todos distintos, debe haber N1 < N2 tales que pN1 = pN2 . Eso signica que∑N1

i=1 mi =(∑N2

i=1mi

)mod n, es decir,

∑N2

i=N1+1 mi = 0 mod n. De aquí que∑N2

i=N1+1mi es

múltiplo de n; luego, basta tomar S = N1 +1, . . . , N2 para ver que el enunciado es cierto.

Proposición 6.20. Sean n un entero positivo, G = (V,Σ, i, t) un grafo irreducible, y v > 0un (AG, n)-autovector aproximado. Supongamos que algún estado K∗ ∈ V tiene menos de naristas saliendo de él. Entonces, existe I ∈ V y una partición de ΣI en subconjuntos no vacíos

Page 101: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

4. CONSTRUCCIÓN DE CÓDIGOS DE ESTADOS FINITOS 97

Σ1I y Σ2

I tal que si G′ es el grafo que resulta de desdoblar I en I1, I2 usando esa partición, hay un

(AG′ , n)-autovector aproximado v′ > 0 con v′I1 +v′I2 = vI y v′J = vJ para todo J ∈ V −I1, I2.

Demostración. Denotemos A = AG y p = maxJ∈V vJ .Primero vamos a demostrar que debe haber una arista e∗ ∈ Σ tal que vi(e∗) = p y vt(e∗) < p.

Para ello, notemos que debe haber algún estado K tal que vK < p, pues, de lo contrario,tendríamos que ∀K ∈ V,vK = p y entonces

∑LAK∗LvL = p

∑LAK∗L = p |ΣK∗|; como v

es (A, n)-AA, tendríamos que p |ΣK∗ | ≥ nvK∗ = np, es decir, |ΣK∗| ≥ n, contradiciendo lahipótesis de que desde K∗ salen menos de n aristas. Elijamos entonces I ′, K ∈ V tales quevK < p y vI′ = p. Como G es irreducible, hay camino en G desde I ′ hasta K. Sea I el últimoestado en el recorrido de ese camino tal que vI = p, y e∗ la arista de ese camino que sale delestado I. Ésa es la arista buscada, pues vi(e∗) = vI = p y vt(e∗) < p.

Habiendo entonces elegido una arista e∗ con la característica arriba descripta, y llamandoI = i(e∗), veamos que desde I deben salir más de n aristas. En efecto, designemos m = |ΣI |.Como v es (A, n)-AA, es

∑e∈ΣI

vt(e) ≥ nvI = np (observación 6.14). Además, ∀e ∈ ΣI ,vt(e) ≤ py ∃e∗ ∈ ΣI : vt(e∗) < p. Luego,

∑e∈ΣI

vt(e) < p |ΣI | = pm. De lo anterior, concluimos quem > n,es decir, hay más de n aristas saliendo de I.

Ahora, enumeremos las aristas de G que salen de I como e1, . . . , en, . . . , em con e1 = e∗.Aplicando el lema 6.19 a la sucesión

vt(e1), . . . ,vt(en)

, vemos que existe S ⊆ 1, . . . , n tal que∑

i∈S vt(ei) = qn para algún q ∈ Z+. Designemos Σ1I = ei : i ∈ S y Σ2

I = ΣI −Σ1I . Tendremos

que Σ1I 6= ∅ 6= Σ2

I (pues |ΣI | > |Σ1I |). Sea G′ = (V ′,Σ′, i′, t′) el grafo que resulta de hacer un

desdoblamiento elemental de G por el estado I usando la partición ΣI = Σ1I ,Σ

2I, y llamemos

A′ a su matriz de adyacencia. Denamos v′ mediante:

v′J =

q si J = I1

vI − q si J = I2

vJ si J ∈ V − I1, I2

Veamos que v′ así denido es positivo. Para J 6= I2, v′J > 0 pues q > 0 y vJ > 0. Y paraver que v′I2 > 0, notemos que nq =

∑e∈Σ1

Ivt(e) ≤

∑ni=1 vt(ei) < np, pues vt(e1) = vt(e∗) < p y

vt(ei) ≤ p para i ∈ 2, . . . , n (así que∑n

i=1 vt(ei) < np); de allí que q < p y, en consecuencia,v′I2 = vI − q = p− q > 0.

Tengamos presente que cada arista e de G que no termina en I es también arista en G′ ycumple que v′t′(e) = vt(e); en tanto, cada arista e de G que termina en I (incluidos los rulos enI) aparece desdoblada en G′ como e1 y e2, siendo v′t′(e1) + v′t′(e2) = v′I1 + v′I2 = vI = vt(e).

Resta ver que v′ es (A′, n)-AA. Lo haremos por la segunda caracterización dada en laobservación 6.14.

Si J = I1: Designemos ∆1 a los rulos en I1, ∆2 a las aristas que van de I1 a I2 y ∆ alas que salen de I1 y no terminan ni en I1 ni en I2 (siendo ∆ ⊂ Σ1

I). Se tiene que Σ′I1es la unión disjunta ∆ ∪∆1 ∪∆2, y además Σ1

I es la unión disjunta de ∆ con los rulosen I que están en Σ1

I . Por lo dicho más arriba, por cada arista e1 ∈ ∆1 hay una aristae2 ∈ ∆2 y viceversa; y cada pareja e1, e2 proviene de un rulo e ∈ ΣI

I ∩ Σ1I . Entonces,

∑e∈Σ′

I1

v′t′(e) =∑e∈∆

v′t′(e) +∑e∈∆1

v′t′(e) +∑e∈∆2

v′t′(e) =∑e∈∆

vt(e) +∑

e∈ΣII∩Σ1I

(v′t′(e) + v′t′(e)

)=

∑e∈∆

vt(e) +∑

e∈ΣII∩Σ1I

vt(e) =∑e∈Σ1

I

vt(e) = nq = nv′I1

Page 102: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

98 6. CÓDIGOS DE ESTADOS FINITOS

Si J = I2: Por análisis similar al realizado en el caso anterior, resulta∑

e∈Σ′I2

v′t′(e) =∑e∈Σ2

Ivt(e), y, como Σ2

I = ΣI − Σ1I , se tiene que∑

e∈Σ′I2

v′t(e) =∑

e∈ΣI−Σ1I

vt(e) =

(∑e∈ΣI

vt(e)

)− nq ≥ nvI − nq = n(vI − q) = nv′I2

Si J /∈ I1, I2: Designemos ∆1 a las aristas que van de J a I1, ∆2 a las que van deJ a I2 y ∆ a las que van de J hasta un vértice distinto de I1 y de I2. Se tiene queΣ′J es la unión disjunta ∆ ∪ ∆1 ∪ ∆2. Como antes, por cada arista e1 ∈ ∆1 hay unaarista e2 ∈ ∆2 y viceversa; y cada pareja e1, e2 proviene de una arista e en G desde Jhasta I. Procediendo de manera análoga a lo anterior, se llega a ver que

∑e∈Σ′J

v′t′(e) =∑e∈ΣJ

vt(e) ≥ nvJ = nv′J .

Es decir, para todos los vértices de G′ se cumple la desigualdad requerida en la observación6.14 en cuanto a v′, A′ y n, resultando entonces que v′ es un (A′, n)-AA.

Teorema 6.21. Sean n ∈ Z+ y G un grafo irreducible. Si λAG ≥ n, entonces existe unasucesión de grafos G0, G1, . . . , Gm tales que G0 = G, Gm tiene al menos n aristas saliendodesde cada vértice, y para cada i ∈ 1, . . . ,m, Gi resulta de un desdoblamiento elemental deGi−1.

Demostración. Sea v > 0 un (AG, n)-AA, cuya existencia está garantizada por el teorema6.16. Hagamos G0 = G. Si desde cada estado de G salen al menos de n aristas, tomamos m = 0y el enunciado se cumple. En caso contrario, sea G1 el grafo que resulta de aplicar a G0 laproposición 6.20, cuya matriz de adyacencia tendrá un autovector aproximado v(1) > 0 cuyadimensión es una unidad mayor que la de v pero cuya suma de componentes es igual a lasuma de las componentes de v. Si G1 tampoco tiene al menos n aristas saliendo desde cadavértice, le aplicamos nuevamente la proposición 6.20 para obtener un grafo G2 cuya matriz deadyacencia tiene autovector aproximado v(2) > 0 con dimensión una unidad mayor que la dev(1) y suma de coecientes igual a la suma de los coecientes de v(1), y así sucesivamente. Elproceso debe terminar, pues cada v(i) que se obtiene en cada paso es estrictamente positivo ytiene una coordenada más que v(i−1), pero sus respectivas sumas de coecientes son iguales.Entonces, el último Gm obtenido es el buscado.

Ahora podemos completar la demostración del Teorema de los Códigos de Estados Finitos,cuya vuelta nos estaba faltando.

Demostración. (Suciencia de la condición de entropía para existencia de un(X,n)-CEF) Supongamos que X es un shift sóco con h(X) ≥ log n, y sea (H,L) una pre-sentación resolvente a derecha para X. Sea G0 una componente irreducible de H tal queh (XG0) = h (XG). Designemos L0 a la restricción de L a las aristas de G0. Como h(X) =log λAG0

≥ log n, es λAG0≥ n. Aplicando entonces a G0 el teorema 6.21, obtenemos la sucesión

de grafos rotulados G0 = (G0,L0), . . . ,Gm = (Gm,Lm) donde G1, . . . , Gm son los que resul-tan del teorema, y cada grafo rotulado Gi es el correspondiente desdoblamiento (como graforotulado) de Gi−1. Sabemos que X ⊇ XG0 = XGm , y, por la proposición 6.6, Gm es cerrante aderecha con demora m. Como Gm tiene al menos n aristas saliendo desde cada vértice, ele-gimos exactamente n aristas saliendo desde cada vértice (eliminando las otras) para obtenerasí un subgrafo G coloreable al que dotamos de un coloreo de rutas I. Designando por O ala restricción de Lm a las aristas de G, resulta que la terna (G, I,O) es un (X,n)-CEF, puesO∞ (XG) = (Lm)∞ (XG) ⊆ (Lm)∞ (XGm) = XGm ⊆ X.

Ejemplo 6.22. Sea X el shift sóco mostrado en la gura 7. Analizaremos si es posibleconstruir un (X, 3)-CEF, y, en caso armativo, veremos la aplicación del procedimiento queestá implícito en las demostraciones anteriores para obtener tal código de estados nitos.

Page 103: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

4. CONSTRUCCIÓN DE CÓDIGOS DE ESTADOS FINITOS 99

Figura 7. Shift sóco X para construir un (X, 3)-CEF

El grafo subyacente es irreducible y su matriz de adyacencia es

A =

2 1 10 1 12 1 0

Su autovalor de Perron es λA = 3, 1149 . . ., y como la presentación es resolvente a derecha, esh(X) = log λA ≥ log 3. Entonces, de acuerdo al Teorema de los Códigos de Estados Finitos,existe un (X, 3)-CEF. Seguidamente construiremos uno, basados en el algoritmo implícito enla demostración del mencionado teorema.

Como el grafo subyacente ya es irreducible y la presentación es resolvente a derecha, el graforotulado de la gura 7 será nuestro G0 de arranque. Como hay estados con menos de tres aristassalientes, deberemos seguir el procedimiento dado en la demostración de la proposición 6.20.

Por aplicación del algoritmo de búsqueda de autovector aproximado, llegamos a que v =[3, 1, 2] es un (A, 3)-AA. De acuerdo a la demostración de la proposición 6.20, buscamos unaarista e∗ que arranque en un estado I con vI maximal, y termine en un estado J con vJ nomaximal. Hay varias opciones; elegiremos I = 1 y e∗ la arista de 1 a 3 que tiene rótulo a.De acuerdo a la demostración, elegimos Σ1

I conteniendo e∗ y la arista de 1 a 2 con rótulo d,y Σ2

I son todas las otras aristas que salen de I (los dos rulos en 1, en este caso). Notar que∑e∈Σ1

Ivt(e) = 3, así que el q de la demostración vale, en esta etapa, 1. Luego, el autovector

aproximado correspondiente al grafo desdoblado G1 tendrá coecientes 1 y 2, respectivamente,para los dos estados en que se desdoblará I; los otros estados conservarán el valor que tienenasociado en G0.

En la gura 8, mostramos una posible sucesión de desdoblamientos de grafos rotulados quese produce. En cada paso, mostramos dentro de un hexágono al lado de cada estado el valordel coeciente del autovector aproximado que le corresponde en esa etapa, e indicamos con Iel estado que elegimos para producir el desdoblamiento, con (∗) la arista e∗ seleccionada, y conlínea discontinua las aristas de Σ1

I .El proceso se detiene en G3, pues hemos llegado a una presentación en la que desde cada

vértice salen al menos tres aristas.Elegimos entonces exactamente tres aristas saliendo de cada vértice, eliminando las otras,

y coloreamos el grafo rotulado resultante con el alfabeto de entradas A = 0, 1, 2. La mismagura 8 muestra, en la parte inferior, uno de los posibles (X, 3)-CEF.

Usando el hecho de que h(XN)

= Nh(X) (donde XN es la presentación de X en bloquesde tamaño N sin solape), en los ejercicios se verá cómo se puede adaptar el Teorema de losCódigos de Estados Finitos para construir códigos aún sin cumplirse de manera directa lacondición h(X) ≥ log n.

Page 104: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

100 6. CÓDIGOS DE ESTADOS FINITOS

G0 G1

G2 G3

Figura 8. Ejemplo 6.22: Una cadena de desdoblamientos, y un (X, 3)-CEF resultante

Page 105: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

6. CÓDIGOS DE ESTADOS FINITOS 101

EJERCICIOS

1. Una palabra sincronizante para un grafo rotulado G = (G,L) es un camino rotuladotal que todas sus presentaciones en G terminan en un mismo vértice. Es decir, w espalabra sincronizante para G si existe un estado I tal que, para cualquier camino π enG, L(π) = w ⇒ t(π) = I.

Considere el grafo G subyacente al grafo rotulado de la gura 1.a) Decida si el grafo, con la rotulación mostrada en la misma gura, tiene una palabra

sincronizante.b) Encuentre una rotulación de G tal que el grafo rotulado tiene alguna palabra sin-

cronizante.c) ¾Cuantos coloreos de rutas admite G? ¾Cuántos de ellos tienen alguna palabra

sincronizante?d) ¾Hay algún coloreo de rutas para G tal que toda palabra sucientemente larga es

sincronizante?2. Muestre que si G = (G,L) es una presentación irreducible resolvente a derecha de un

full shift, entonces L debe ser un coloreo de rutas. (Sugerencia: muestre que el grafofusionado a partir de G tiene un solo estado.)

3. En la tabla que sigue, se dan las funciones inicial y terminal de un grafo con vérticesA,B,C,D,E y aristas a, b, c, d, e, f, g, h, i, j; también se especican tres funcionesrotuladoras sobre 0, 1:

arista a b c d e f g h i jinicial A A D C B C D D E Eterminal A B B A C D D A B EL1 0 1 0 0 0 1 0 1 1 0L2 0 1 0 0 1 1 0 1 1 0L3 1 1 0 1 0 0 1 1 1 0

Para cada caso, determine si el correspondiente grafo rotulado es cerrante a derecha ono. Para los que sean, indique la demora y calcule la entropía del correspondiente shiftsóco.

4. Diseñe un grafo con rótulos en 0, 1 que tenga demora mínima 3.5. Tomando I0 = I, utilice el CEF de la gura 6 para codicar la sucesión 322010331123.

Decodique hasta donde pueda la sucesión obtenida y verique que obtiene casi toda lasucesión original.

6. Sea A =

[1 31 0

], y sea X un shift de aristas cuyo grafo tenga matriz de adyacencia

A. Muestre que h(X) > log 2, pero no hay un (X, 2)-CEF cuyas rotuladoras de entraday de salida sean ambas resolventes a derecha.

7. Sean A ≥ 0 una matriz cuadrada a coecientes enteros y n un entero positivo.a) Muestre que el conjunto de los (A, n)-AA es cerrado bajo suma, multiplicación por

un escalar entero positivo, y máximo componente a componente.b) Muestre que, dados dos (A, n)-AA, el mínimo componente a componente entre am-

bos vectores no es necesariamente un (A, n)-AA.8. Proporcione una cota superior explícita, en términos del vector inicial v, para el número

de iteraciones necesarias para que el Algoritmo del Autovector Aproximado termine.9. Implemente el Algoritmo del Autovector Aproximado en cualquier lenguaje de progra-

mación. El programa debe recibir como argumentos la matriz A, el entero positivo n yel vector inicial v. Pruebe su implementación con varias matrices A y varios valores den. (Sugerencia: use un software que permita manipulación fácil de matrices y vectores,como por ejemplo el excelente, libre y gratuito SageMath.)

Page 106: DINÁMICA SIMBÓLICA - Universidad Nacional de Salta · uno de duración semestral con una carga horaria de 60 horas reloj para las clases teóricas, se llega a cubrir un porcentaje

102 6. CÓDIGOS DE ESTADOS FINITOS

10. Sean n un entero positivo, A ≥ 0 una matriz cuadrada a coecientes enteros con λA ≥ n,y 1 el vector de dimensión igual al tamaño de A cuyas componentes valen todas 1.

Suponga que w es un (A, n)-AA. Sea p = maxI

wI . Muestre que el Algoritmo del

Autovector Aproximado contesta un (A, n)-AA cuando el vector inicial para aplicarel algoritmo es p1. (Sugerencia: muestre que si v ≥ w, entonces

⌊1nAv⌋≥ w.)

Sea p∗ = mın

maxI

wI : w es (A, n)-AA. Muestre que el Algoritmo del Autovector

Aproximado contesta el vector nulo cuando el vector inicial para aplicar el algoritmoes k1 con k < p∗.Diseñe una estrategia para encontrar rápidamente el p∗ del ítem anterior. (Sugeren-cia: use el algoritmo del ejercicio 9 con v = 2i1 para i = 0, 1, 2, . . . hasta que elalgoritmo conteste un (A, n)-AA; el correspondiente 2i será una cota superior parap∗. Si i > 1, realice una búsqueda binaria de p∗ en el rango 2i−1 + 1, . . . , 2i).Use la estrategia del ítem anterior y el algoritmo del ejercicio 9 para implementar encomputadora otro algoritmo que recibe como argumentos A y n, chequea si λA ≥ n,y, en tal caso, contesta un (A, n)-AA pequeño.

11. Encuentre un (X, 5)-CEF, donde X es el shift sóco presentado por un grafo rotuladocuya matriz de adyacencia simbólica es la siguiente:[

a b+ c+ de+ f + g + h+ i+ j a

]12. Sean A = 0, 1, . . . , n− 1 y X un shift sóco con h(X) < log n.

Muestre que si p y q son enteros positivos tales que h(X) ≥ p lognq

, entonces existe un(Xq, np)-CEF. En consecuencia, si bien no existe un (X,n)-CEF, se puede codicarbloques de tamaño p sobreA en bloques de tamaño q del lenguaje deX. (Sugerencia:h (Xq) = qh(X).)El código de estados nitos de la gura 9 usa la idea del ítem anterior para codicar2-bloques binarios en 3-bloques del shift de paso limitado (0, 1). Úselo para codicarel bloque 011100100010 (no olvide agregar algunos símbolos de acuerdo a la demora,para que la decodicación sea completa). Decodique el bloque así obtenido, yverique que corresponde al bloque original.

Figura 9. CEF basado en el shift de paso limitado (0, 1)

Sea X el shift de paso limitado (1, 2). Construya una presentación resolvente a dere-cha de X y calcule así su entropía. Verique que existe un (X5, 22)-CEF, y construyauno. Úselo para codicar el bloque 011100100010101. Decodique el bloque así ob-tenido y verique que recupera casi todo el bloque original.