comunicaciones inal ambricas - iie.fing.edu.uy · comunicaciones inal ambricas notas del curso...

311
Comunicaciones Inal´ ambricas Notas del Curso Facultad de Ingenier´ ıa Universidad de la Rep´ ublica Pablo Belzarena y Federico Larroca 2 de octubre de 2017

Upload: trinhduong

Post on 29-Sep-2018

248 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Comunicaciones InalambricasNotas del Curso

Facultad de IngenierıaUniversidad de la Republica

Pablo Belzarena y Federico Larroca

2 de octubre de 2017

Page 2: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

c©2017 Pablo Belzarena (belza [at] fing [dot] com [dot] uy) y Federico ‘Larroca’La Rocca (flarroca [at] fing [dot] com [dot] uy).

Esta obra es publicada bajo una licencia Creative Commons Atribucion-CompartirIgual4.0 Internacional. Para leer una copia de esta licencia, visite http://creativecommons.org/licenses/by-sa/4.0/o envıe una carta a Creative Commons, PO Box 1866,Mountain View, CA 94042, USA.

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 In-ternational License. To view a copy of this license, visit http://creativecommons.

org/licenses/by-sa/4.0/ or send a letter to Creative Commons, PO Box 1866,Mountain View, CA 94042, USA.

Page 3: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Indice general

1. Sistemas de Comunicacion y Modulacion Lineal Digital 91.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.2. Sistemas de tiempo continuo y tiempo discreto . . . . . . . . . . . . . 91.3. Introduccion a la Modulacion . . . . . . . . . . . . . . . . . . . . . . . 111.4. Espacios de funciones de energıa finita . . . . . . . . . . . . . . . . . . 13

1.4.1. Proyeccion unidimensional . . . . . . . . . . . . . . . . . . . . . 161.4.2. Bases ortonormales y proyeccion sobre subespacios . . . . . . . 17

1.5. Producto interno para funciones L2 . . . . . . . . . . . . . . . . . . . . 181.6. Sistema de transmision “completo” . . . . . . . . . . . . . . . . . . . . 20

1.6.1. Transmisor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.6.2. Receptor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221.6.3. Consideraciones practicas . . . . . . . . . . . . . . . . . . . . . 23

1.7. Coeficiente de correlacion, correlacion cruzada y convolucion . . . . . . 25

A. Espacios vectoriales y espacios de funciones 29A.1. Espacios Vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

A.1.1. Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29A.1.2. Cuerpos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30A.1.3. Espacio de vectores . . . . . . . . . . . . . . . . . . . . . . . . . 31A.1.4. Dimension y base de un espacio vectorial . . . . . . . . . . . . 33

A.2. Espacio vectorial con producto interno . . . . . . . . . . . . . . . . . . 35A.2.1. Proyeccion unidimensional . . . . . . . . . . . . . . . . . . . . . 37A.2.2. Bases ortonormales y proyeccion sobre subespacios . . . . . . . 37A.2.3. Dimension del espacio vectorial de funciones L2 . . . . . . . . . 38

2. Introduccion al Analisis en Frecuencia 412.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412.2. Series de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

2.2.1. Aproximacion en un espacio de dimension finita . . . . . . . . . 422.2.2. Espacios de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . 442.2.3. ¿Una base para las funciones L2? . . . . . . . . . . . . . . . . . 462.2.4. Transformada de Fourier en Tiempo Discreto . . . . . . . . . . 49

2.3. Senales con soporte no acotado: la Transformada de Fourier . . . . . . 502.4. El teorema de muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . 55

2.4.1. Senales bandabase . . . . . . . . . . . . . . . . . . . . . . . . . 552.4.2. Senales pasabanda . . . . . . . . . . . . . . . . . . . . . . . . . 56

3

Page 4: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

2.4.3. Aliasing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 582.4.4. Transformada de Fourier Discreta . . . . . . . . . . . . . . . . 60

3. Filtros y Procesamiento Multitasa 633.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 633.2. Transformada de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . 63

3.2.1. Motivacion y Definicion . . . . . . . . . . . . . . . . . . . . . . 633.2.2. Calculo y propiedades de la Transformada de Laplace . . . . . 663.2.3. Transformada de Laplace y solucion de ecuaciones diferenciales 693.2.4. Transformada inversa de Laplace . . . . . . . . . . . . . . . . 70

3.3. Transformada Z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 723.3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 723.3.2. Motivacion y definicion . . . . . . . . . . . . . . . . . . . . . . 723.3.3. Convergencia de la transformada Z . . . . . . . . . . . . . . . . 733.3.4. Propiedades de la transformada Z . . . . . . . . . . . . . . . . 753.3.5. Sistemas Lineales invariantes en el tiempo y ecuaciones en di-

ferencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 763.3.6. Transformada Z inversa de un cociente de polinomios . . . . . 773.3.7. Polos, estabilidad, causalidad y ROC . . . . . . . . . . . . . . . 783.3.8. Sistemas de fase mınima . . . . . . . . . . . . . . . . . . . . . . 80

3.4. Filtros Digitales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 803.4.1. Clasificacion de los Filtros digitales . . . . . . . . . . . . . . . . 803.4.2. Diseno de Filtros Digitales . . . . . . . . . . . . . . . . . . . . . 813.4.3. Diseno de Filtros IIR en el dominio del tiempo . . . . . . . . . 823.4.4. Diseno de Filtros IIR en el dominio de la frecuencia: transfor-

macion bilineal . . . . . . . . . . . . . . . . . . . . . . . . . . . 843.4.5. Diseno de Filtros FIR . . . . . . . . . . . . . . . . . . . . . . . 88

3.5. Procesamiento de senales multitasa . . . . . . . . . . . . . . . . . . . . 903.5.1. Sobremuestreo de la senal . . . . . . . . . . . . . . . . . . . . . 913.5.2. Submuestreo de la senal . . . . . . . . . . . . . . . . . . . . . . 923.5.3. Interpolacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 953.5.4. Identidades de Noble . . . . . . . . . . . . . . . . . . . . . . . . 953.5.5. Filtros polifase . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

4. El canal inalambrico 1034.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

4.1.1. Ecuaciones de Maxwell . . . . . . . . . . . . . . . . . . . . . . . 1034.1.2. Ecuacion de onda electromagnetica . . . . . . . . . . . . . . . . 1074.1.3. Ecuacion de onda del potencial magnetico . . . . . . . . . . . . 1094.1.4. Radiacion de una antena dipolo hertziano . . . . . . . . . . . . 1104.1.5. Caracterizacion de una Antena . . . . . . . . . . . . . . . . . . 1114.1.6. Antena receptora . . . . . . . . . . . . . . . . . . . . . . . . . . 1144.1.7. Ecuacion de transmision de Friis . . . . . . . . . . . . . . . . . 1144.1.8. Un primer modelo de un canal inalambrico . . . . . . . . . . . 1154.1.9. Modelo del canal si una antena se mueve . . . . . . . . . . . . 1164.1.10. Modelo del canal si una antena se mueve y hay reflexion en una

pared . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

4

Page 5: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

4.1.11. Modelo de dos rayos con reflexion en el piso . . . . . . . . . . . 1194.1.12. Modelo general entrada salida de un canal inalambrico . . . . . 1204.1.13. Desvanecimiento (Fading) frecuencia y tiempo de coherencia . 1224.1.14. Modelo bandabase del canal en tiempo continuo y discreto . . 1244.1.15. Modelos de perdidas de camino empıricos . . . . . . . . . . . . 126

5. Procesos estocasticos, procesos Gaussianos, ruido y deteccion 1315.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1315.2. Procesos estocasticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

5.2.1. Definicion y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . 1315.2.2. Estadısiticos de segundo orden de un proceso . . . . . . . . . . 1335.2.3. Analisis espectral . . . . . . . . . . . . . . . . . . . . . . . . . . 1365.2.4. Sistemas lineales con entradas estocasticas . . . . . . . . . . . . 1375.2.5. Procesos ergodicos . . . . . . . . . . . . . . . . . . . . . . . . . 139

5.3. Procesos Gaussianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1405.4. Ruido Blanco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1425.5. Ruido aditivo y relacion senal a ruido . . . . . . . . . . . . . . . . . . 1435.6. Modulacion y deteccion en un canal AWGN . . . . . . . . . . . . . . . 145

B. Procesos eficazmente estacionarios y eficazmente estacionarios ensentido amplio 147

6. Modulacion y Demodulacion Digital 1516.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1516.2. Modulacion PAM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

6.2.1. Espectro PAM . . . . . . . . . . . . . . . . . . . . . . . . . . . 1556.3. Modulacion QAM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

6.3.1. Implementaciones de moduladores / demoduladores MQAM . . 1596.4. Forma del pulso conformador y pulsos de Nyquist . . . . . . . . . . . . 1636.5. Decision de maxima verosimilitud . . . . . . . . . . . . . . . . . . . . . 166

6.5.1. Probabilidades de error y estimadores MAP o ML . . . . . . . 1676.5.2. ML en el caso de ruido gaussiano blanco . . . . . . . . . . . . . 168

7. Sincronizacion en fase y frecuencia 1717.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1717.2. PLL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

7.2.1. Analisis del modelo lineal y en tiempo continuo del PLL . . . . 1737.2.2. Analisis del modelo lineal y en tiempo discreto del PLL . . . . 179

7.3. Correccion del error de fase . . . . . . . . . . . . . . . . . . . . . . . . 1817.4. Estimador de maxima verosimilitud . . . . . . . . . . . . . . . . . . . 182

8. Sincronizacion temporal 1898.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1898.2. Diagrama general de un sincronizador temporal en tiempo discreto . . 1958.3. Estimacion del error . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196

8.3.1. Introduccion, tiempo continuo . . . . . . . . . . . . . . . . . . 1968.3.2. Tiempo Discreto . . . . . . . . . . . . . . . . . . . . . . . . . . 1978.3.3. Deteccion de error: Estimador de maxima verosimilitud . . . . 198

5

Page 6: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

8.3.4. Deteccion de errores: otros estimadores . . . . . . . . . . . . . 1998.3.5. Calculo del estimador del error de maxima verosimilitud . . . . 201

8.4. Interpolacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2038.4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2038.4.2. Interpolador polinomico . . . . . . . . . . . . . . . . . . . . . . 2048.4.3. Interpolador polifasico . . . . . . . . . . . . . . . . . . . . . . . 205

8.5. Control del interpolador . . . . . . . . . . . . . . . . . . . . . . . . . . 2068.5.1. Contador modulo-1 . . . . . . . . . . . . . . . . . . . . . . . . . 2068.5.2. Algoritmo recursivo . . . . . . . . . . . . . . . . . . . . . . . . 209

9. Codificacion 2159.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2159.2. Introduccion a los codigos de correccion de errores . . . . . . . . . . . 2169.3. Modelo de canal, tasa de informacion, probabilidad de decodificacion

erronea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2169.3.1. Canal BSC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2169.3.2. Una primera aproximacion: codigos de repeticion . . . . . . . . 2169.3.3. Distancia de Hamming, capacidad de detectar y corregir errores

de un codigo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2189.4. Codigos lineales y codigos lineales de bloques . . . . . . . . . . . . . . 221

9.4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2219.4.2. Una vision desde el algebra del problema de codificacion . . . . 2229.4.3. Base de un codigo lineal binario y matriz generadora . . . . . 2239.4.4. Matriz de chequeo de paridad . . . . . . . . . . . . . . . . . . . 2259.4.5. El sındrome y la decodificacion . . . . . . . . . . . . . . . . . . 2279.4.6. OPCIONAL: El problema de decodificacion y la proyeccion or-

togonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2299.4.7. Codigos de Hamming . . . . . . . . . . . . . . . . . . . . . . . 2309.4.8. Codigos cıclicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 231

9.5. Codigos Convolucionales . . . . . . . . . . . . . . . . . . . . . . . . . . 2339.5.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2339.5.2. Formas de representacion de un codigo convolucional . . . . . . 2349.5.3. OPCIONAL: El codigo convolucional como un sistema lineal

invariante en el tiempo . . . . . . . . . . . . . . . . . . . . . . . 2369.5.4. Decodificacion de un codigo convolucional . . . . . . . . . . . . 2379.5.5. Algunas consideraciones de implementacion de Viterbi . . . . . 2409.5.6. Decodificadores hard y soft . . . . . . . . . . . . . . . . . . . . 241

9.6. Correccion de errores en Gnuradio . . . . . . . . . . . . . . . . . . . . 241

10.Ecualizacion 24710.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24710.2. Filtro de recepcion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250

10.2.1. Canal ideal con ruido . . . . . . . . . . . . . . . . . . . . . . . 25010.2.2. Canal no ideal . . . . . . . . . . . . . . . . . . . . . . . . . . . 252

10.3. Estimacion optima de secuencias de sımbolos . . . . . . . . . . . . . . 25410.3.1. Probabilidades de error y estimadores MAP o ML . . . . . . . 25510.3.2. ML en el caso de ruido gaussiano blanco . . . . . . . . . . . . . 256

6

Page 7: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

10.3.3. El algoritmo de Viterbi y el diagrama de Trellis . . . . . . . . 25610.4. Ecualizacion Lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260

10.4.1. SNR =∞, criterio de distorsion de pico, ecualizador ZF . . . . 26210.4.2. SNR finito, Ecualizador error cuadratico medio, MSE . . . . . 267

10.5. Ecualizacion de espaciado fraccional . . . . . . . . . . . . . . . . . . . 27010.5.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270

10.6. Ecualizadores adaptivos . . . . . . . . . . . . . . . . . . . . . . . . . . 27210.6.1. Algoritmo adpativo LMS . . . . . . . . . . . . . . . . . . . . . 27210.6.2. Ecualizacion a ciegas: Algortimo CMA . . . . . . . . . . . . . . 273

C. Material complementario 277C.1. Prueba de Teoremas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277

C.1.1. Teorema 10.2. . . . . . . . . . . . . . . . . . . . . . . . . . . . 277C.1.2. Teorema 10.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278

C.2. Bases ortonormales y filtro blanqueador . . . . . . . . . . . . . . . . . 279C.3. Ecualizadores fraccionales y Teorema de Euclıdes . . . . . . . . . . . . 281

C.3.1. El Teorema de Euclıdes . . . . . . . . . . . . . . . . . . . . . . 281C.3.2. Diseno de ecualizadores FSE con filtros FIR . . . . . . . . . . . 284

11.Sistemas multiportadora y OFDM 28911.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28911.2. Efecto del canal e imperfecciones del receptor en OFDM . . . . . . . . 293

11.2.1. El prefijo cıclico . . . . . . . . . . . . . . . . . . . . . . . . . . 29311.2.2. El espectro de OFDM y la relacion pico a promedio (PAR) . . 295

11.3. Sincronizacion en OFDM . . . . . . . . . . . . . . . . . . . . . . . . . 29811.3.1. Efecto en OFDM del error en frecuencia . . . . . . . . . . . . 29811.3.2. Efecto en OFDM del error en la fase . . . . . . . . . . . . . . 30011.3.3. Efecto en OFDM del error en el tiempo de muestreo en el receptor30011.3.4. Efecto en OFDM del error en la sincronizacion de la trama . . 301

11.4. Sincronizacion y correccion de errores de sincronismo en OFDM . . . . 30111.4.1. Tecnicas de sincronizacion en el dominio del tiempo . . . . . . 302

7

Page 8: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

8

Page 9: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Capıtulo 1

Sistemas de Comunicacion yModulacion Lineal Digital

1.1. Introduccion

En este capıtulo se realizara una revision de algunos conceptos fundamentalesde los sistemas de comunicaciones y la modulacion digital. Si bien en el libro setrabajara principalmente con sistemas de comunicacion que procesan senales digitalesy de tiempo discreto no hay que olvidar que en todas las comunicaciones inalambricasel medio de transmision es analogico y se transmiten senales de tiempo continuo.Por tanto, en alguna etapa del transmisor y receptor se procesaran senales analogicasde tiempo continuo y se deberan convertir a senales digitales de tiempo discreto yviceversa. Por otra parte, desde un punto de vista didactico en algunos casos se veraque es mas simple explicar algunos temas con un enfoque de tiempo continuo antesde verlo en tiempo discreto. Por esta razon se analizara brevemente los sistemas detiempo discreto y de tiempo continuo con los que se trabajara en el libro.

1.2. Sistemas de tiempo continuo y tiempo discreto

Los sistemas de tiempo continuo tienen como entradas y salidas senales de laforma x(t), donde t es un numero real y x(t) para cada t es en general un numerocomplejo (o un numero real en algunos casos particulares). Por otro lado, los sistemasde tiempo discreto tienen como entradas y salidas senales de la forma x[n], donde n esun numero entero y x[n] para cada n es en general un numero complejo (o un numeroreal en algunos casos particulares).

Se debe hacer una precision. Cuando se trabaja en un sistema de comunicaciondigital las senales con las que se trabaja son senales de tiempo discreto. Ademas, parapoder procesar la senal en cualquier sistema digital (e.g. una PC), esta debe ser cuan-tificada. Es decir, x[n] pasa a tener un valor de una cantidad finita de posibilidades.Sin embargo, en la mayorıa de los sistemas de procesamiento digital en la actualidadse trabaja con arquitecturas de punto flotante, cuyos posibles valores para la senaldigital son muchısimos. Por lo tanto asumiremos que x[n] es un complejo (o un real),

9

Page 10: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

aunque hay que ser conscientes que la senal es digital y con una precision que, si bienasumimos es muy grande, es finita. En los casos que el error introducido por estacuantizacion no sea despreciable, se modela con el denominado ruido de cuantizacion.

Los sistemas tanto de tiempo continuo como discreto con los que se trabajara seranen general sistemas lineales y mayoritariamente invariantes en el tiempo (sistemas LTIpor sus siglas en ingles). Cuando se estudien los modelos para un canal inalambricose trabajara con sistemas lineales pero variables en el tiempo (sistemas LTV), cuyascaracterısticas se estudiaran en ese momento.

Los sistemas se dicen lineales si cumplen la siguiente propiedad. Supongamos queel sistema ante dos entradas cualesquiera x1(·) y x2(·) tiene salidas y1(·) e y2(·) respec-tivamente (con el sımbolo · indicando que nos referimos tanto senales de tiempo conti-nuo como de tiempo discreto). Entonces, ante una entrada de la forma ax1(·) + bx2(·)tendra salida ay1(·) + by2(·) con a y b dos complejos (o reales) cualesquiera.

Los sistemas invariantes en el tiempo son tales que su comportamiento no cambiacon el tiempo. Esta definicion se puede formalizar de la siguiente forma. Supongamosnuevamente que si al sistema ingresa una entrada x1(·) se obtiene una salida y1(·).Entonces el sistema sera invariante en el tiempo si cuando al sistema ingresa la senalx1(·) retardada un tiempo T , entonces la salida sera y1(·) retardada un tiempo T (conT un real cualquiera si el sistema es a tiempo continuo, o un entero cualquiera si esa tiempo discreto).

Los sistemas de tiempo discreto y tiempo continuo estan caracterizados por larespuesta al impulso h(t) y h[n] respectivamente. En los sistemas lineales invariantesen el tiempo la salida esta relacionada con la entrada al sistema a traves de la respuestaal impulso:

y(· · · ) = x(· · · ) ∗ h(· · · ),

donde ∗ es el producto de convolucion, definido para tiempo continuo de la siguienteforma:

y(t) = x(t) ∗ h(t) =

∫ ∞−∞

x(τ)h(t− τ)dτ,

y en tiempo discreto:

y[n] = x[n] ∗ h[n] =

∞∑k=−∞

x[k]h[n− k].

Una subclase importante de los sistemas LTI de tiempo continuo se pueden mo-delar mediante una ecuacion diferencial lineal a coeficientes constantes de la forma:

N∑k=0

akdky(t)

dtk=

M∑k=0

bkdkx(t)

dtk,

y mediante una ecuacion en diferencias lineal y a coeficientes constantes en el caso detiempo discreto:

N∑k=0

aky[n− k] =

M∑k=0

bkx[n− k]

10

Page 11: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Mas adelante en el capıtulo sobre filtros digitales, se volvera sobre estas represen-taciones de los sistemas. Para terminar con esta repaso de los conceptos basicos serecuerda que los sistemas de tiempo discreto se pueden clasificar en dos tipos. Lossistemas de respuesta al impulso finita (FIR por sus sigla en ingles). En este casoN = 0 y la ecuacion en diferencias queda de la siguiente forma:

y[n] =

M∑k=0

bka0x[n− k],

y los sistemas de respuesta al impulso infinita (IIR) cuando N > 0.

1.3. Introduccion a la Modulacion

En la transmision digital de datos, por cada bit (o conjunto de bits) se envıa unasenal analogica. Es decir, aunque el mensaje sea digital (por ejemplo, el contenidode un archivo o la cancion en un CD), esta debe ser enviada por un medio que pornaturaleza es analogico. En este caso, cada bit es convertido a voltaje, que viaja por uncable hacia una antena, que a su vez genera un campo electromagnetico, que es luegorecibido por la antena receptora, que genera un cierto voltaje en el equipo receptorque trata de recuperar el mensaje original lo mas correctamente posible.

Es importante de todas formas remarcar que de todas las infinitas posibles senalesanalogicas (en el ejemplo anterior, los voltajes en que son convertidos los bits) que sepueden enviar a traves de este canal, se elige un sub-conjunto finito para representarlos bits. Estas las denominaremos formas de onda.

Ejemplo 1.1. Si Ts es la duracion de la forma de onda, un posible mapeo es elsiguiente:

1→ sin (2πt/Ts) rect(t/Ts),

0→ cos (2πt/Ts) rect(t/Ts),

donde

rect(t) =

1, si |t| ≤ 1/2

0, sino.

Ejemplo 1.2. Si Ts es la duracion de la forma de onda y A es un valor cualquierapositivo, otro posible mapeo es el siguiente:

00→− 3A rect(t/Ts),

01→−A rect(t/Ts),

10→A rect(t/Ts),

11→ 3A rect(t/Ts).

Es importante notar que en este segundo ejemplo cada forma de onda representados bits, y por tanto necesitamos cuatro formas de onda distintas. Por ejemplo, el

11

Page 12: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

0 Δx 2Δx 3Δx 4Δx 5Δx 6Δx 7Δx 8Δx 9Δx

(a) La integral de Riemann.

0

Δy

2Δy

3Δy

4Δy

(b) La integral de Lebesgue.

Figura 1.1: Los dos tipos de integrales.

par bits ’00’ se representa como un voltaje −3A fijo durante Ts segundos. Esto encontraposicion con el primer mapeo en que la forma de onda no es un voltaje fijo,sino que cambia durante el tiempo de sımbolo Ts.

En recepcion sera entonces necesario distinguir entre estas senales, incluso antela presencia de ruido u otras distorsiones o incertidumbres introducidas por el canal.La primer pregunta que nos surgira entonces es ¿que senales elegir como formas deonda para representar los bits?. Ya en los ejemplos vimos dos posibilidades, y a simplevista no es facil saber cual es mas conveniente. Mas en general, cabe la pregunta deque tipo de funciones podemos considerar como formas de onda. En este texto noslimitaremos a las denominadas de energıa finita, siendo estas las funciones s(t) talesque: ∫ ∞

−∞|s(t)|2dt <∞. (1.1)

Las formas de onda s(t) seran, en la implementacion fısica concreta y como dis-cutimos antes, por ejemplo un voltaje o una intensidad de corriente. Por lo tanto, laenergıa que transportan sera proporcional a la integral que aparece en la ecuacion(1.1), y de ahı que digamos que son de energıa finita. En este sentido, la integral en(1.1) define lo que se entiende por energıa de la forma de onda. Notar que se utilizo elmodulo de la funcion, pues esta podra ser tanto real como compleja (i.e. s(t) : R→ Ro s(t) : R → C). La utilidad de considerar funciones complejas quedara claro masadelante en este texto.

Es importante destacar que la energıa de la forma de onda se calculara consi-derando la integral de Lebesgue (y por lo tanto, las funciones que cumplen (1.1) sedenominan L2). La figura 1.1 ilustra la diferencia entre esta y la mas “tradicional”integral de Riemann. En ambos casos la integral se calcula como la suma del area delos rectangulos dibujados cuando el numero de estos va al infinito. La diferencia resideen que la de Riemann divide el dominio en segmentos de igual ancho, mientras quela de Lebesgue hace lo mismo pero con el codominio.1 Esto hace que la de Lebesgueeste bien definida para muchas mas funciones que la de Riemann, lo cual nos serade particular interes cuando consideremos el ruido superpuesto a nuestra senal deinteres. La discusion teorica la llevaremos por ahora hasta este punto, y ahondaremosen ella mas adelante cuando sea de mayor utilidad. Para todos los ejemplos que vamosa considerar en este capıtulo ambos tipos de integral son equivalentes.

1Esto permite por ejemplo considerar funciones que vayan de cualquier conjunto a los reales,siempre que sobre el dominio se pueda definir alguna nocion de medida (y no de orden como en elcaso de Riemann).

12

Page 13: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Volviendo a la eleccion de las formas de onda, cabe preguntarse porque elegimosconcretamente este tipo de funciones. Por ejemplo, una simple sinusoide de soporteno acotado no tiene energıa finita. Sin embargo, si para transmitir un conjunto finitode bits (a traves de la forma de onda correspondiente) es necesario un tiempo infinito,nuestro sistema no sera de gran utilidad. Por lo tanto, toda forma de onda con utilidadpractica tendra soporte temporal finito, lo cual significa que por restricciones fısicasy reglamentarias la energıa que se envıa en ese intervalo no puede ser infinita. Estoes una primera justificacion a restringir nuestra atencion a las funciones L2.

De todas formas, mas adelante nos interesara estudiar funciones con soporte tem-poral no acotado. A estas les seguiremos pidiendo que cumplan (1.1), pues mas allade la discusion practica anterior, existe una razon teorica de casi igual importancia.Como sera discutido en las secciones que siguen, las funciones L2 pueden ser estu-diadas en el marco de los espacios vectoriales con producto interno (i.e. basicamenteuna funcion L2 podra ser tratada como un vector), una teorıa que se estudia en todocurso elemental de algebra y que simplifica enormemente el analisis. En base a esteanalisis desarrollaremos ademas, y en capıtulos sucesivos, la serie y transformada deFourier, junto con el teorema de muestreo.

1.4. Espacios de funciones de energıa finita

Referido a nuestro receptor digital, la siguiente pregunta serıa: una vez sensadoel canal, de donde en principio se obtendran senales totalmente arbitrarias, ¿comoelijo cual de las posibles formas de onda fue enviada?. Claramente esta pregunta y laeleccion del conjunto de formas de onda estan relacionadas, y en este capıtulo daremosuna posible respuesta a traves de la teorıa de espacios lineales, que comenzamos aestudiar en esta seccion. Hay que tener claro que esta sera una posible respuesta yque existen otras alternativas. De todas formas, tambien hay que tener claro que elmetodo que desarrollaremos es en el que se basan la amplia mayorıa de los sistemas decomunicacion digitales modernos, por lo que se puede considerar una buena respuesta.

Por lo tanto, en esta seccion presentaremos los conceptos basicos necesarios paradesarrollar la teorıa que nos permitira idear un sistema de comunicacion digital. Enla proximas secciones utilizaremos diversas herramientas de espacios vectoriales. Ellector que no recuerde o no este familiarizado con los conceptos de espacio vectorial,subespacio, base de un subespacio, producto interno y proyeccion sobre un subespacio,puede leer previo a continuar con esta seccion y las siguientes el Apendice A dondeestos son brevemente presentados.

Como comentamos antes, el conjunto de las funciones complejas o reales de energıafinita pueden verse como un espacio vectorial. Notaremos como v al vector corres-pondiente a la funcion v(t). Aunque estrictamente hablando son la misma cosa, asıexplicitaremos que v corresponde a la funcion v(t) vista como un vector, y no al valorparticular que toma v(t) evaluado en t.

Ademas del conjunto de vectores, para verificar si es un espacio vectorial debemosdefinir la operacion suma entre ellos, al conjunto de escalares, al producto escalar,y verificar que sean cerrados en el conjunto. La suma entre elementos del espaciovectorial v+u la definiremos como el vector correspondiente a la funcion que mapeacada t a u(t) + v(t). Una propiedad importante es que, la suma de dos funciones de

13

Page 14: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

energıa finita sigue teniendo energıa finita:∫ ∞−∞|u(t) + v(t)|2dt ≤

∫ ∞−∞

2|u(t)|2dt+

∫ ∞−∞

2|v(t)|dt ≤ ∞,

por lo que u + v ∈ V ; ∀u,v ∈ V y por lo tanto el conjunto de vectores es cerradobajo esta suma.

Ademas, en este caso los escalares seran los complejos o lo reales respectivamente.Analogamente a la suma, el producto escalar a.v lo definiremos como el vector co-rrespondiente a la funcion que mapea cada t a a.v(t). Por lo tanto, a.v tiene |a|2 masveces de energıa que v, que sigue siendo finita, por lo que a.v ∈ V ; ∀a ∈ C,v ∈ V ypor lo tanto el conjunto tambien es cerrado bajo este producto escalar. Por lo tanto,el conjunto de funciones L2 con estas operaciones es un espacio vectorial.

Si un subconjunto S ⊂ V del espacio vectorial V es a su vez un espacio vectorial,se denomina subespacio de V .

Ejemplo 1.3. Se puede verificar que las funciones de la forma v(t) = a rect(t/T ) cona ∈ R forman un subespacio del espacio de las funciones de energıa finita. Esto esmuy simple de ver ya que la suma de dos vectores correspondientes a las funcionesa1 rect(t/T ) y a2 rect(t/T ) (con a1, a2 ∈ R) resulta en un vector que sigue estando enel conjunto, y ademas su multiplicacion por un escalar (i.e. b× a rect(t/T )) tambienlo esta. Ademas, es facil observar que todas las funciones de este espacio se puedengenerar a partir de la funcion φ(t) = rect(t/T ) y como este conjunto es linealmenteindependiente, es una base del subespacio y este subespacio tiene dimension uno.

Ahora bien, imaginemos que tenemos un espacio vectorial finito-dimensional Vcon una base φ1, . . . ,φn. Entonces, cualquier elemento v ∈ V puede ser escrito dela forma

v =

n∑i=1

aiφi,

con a1, . . . , an un conjunto de escalares a determinar. Ademas, dado que la base esun conjunto linealmente independiente, entonces el conjunto de escalares es unico.Por lo tanto, dada la base, cualquier vector v ∈ V puede ser representado de maneraunica por la n-tupla (a1, . . . , an) ∈ Cn (o Rn si trabajamos con reales). Por lo tanto,cualquier espacio vectorial finito-dimensional se puede “equiparar” con Cn o Rn.

Ejercicio 1.1. Tome la base calculada en el ejemplo 1.3 y exprese las funciones delespacio (i.e. a rect(t/T )) como una n-tupla en Rn.

Para ser mas precisos, por equiparar nos referimos a que cualquier (conjunto de)operacion(es) en el espacio vectorial original V la podemos realizar en tres pasos.Primero haciendo la traslacion a Cn o Rn, luego realizando la(s) operacion(es) eneste espacio alternativo, y por ultimo llevando el resultado al espacio V original.Dependiendo de la complejidad de V , esta forma indirecta de operar puede ser signi-ficativamente mas sencilla que realizar las operaciones en el espacio original.

Por ultimo, antes de continuar, haremos un intermedio a nuestro problema origi-nal de modulacion digital. En este momento estamos en condiciones de ver que lasformas de onda escogidas para enviar los bits (s1(t), . . . , sM (t)) estan contenidas en

14

Page 15: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

t1

𝜙1(t)

t10.5

11

-1

𝜙2(t)

Figura 1.2: El conjunto de funciones del ejercicio 1.2

-A +A

(0,A)

(A,0)

𝜙2

𝜙1 𝜙1

𝜙2

𝜙1

𝜙2

𝜙1

𝜙2

𝜙1

𝜙2

𝜙1

radio=A√2

radio=A

2π/3

radio=A

(A,A)

2A

2A

Figura 1.3: Las constelaciones del ejercicio 1.2.

algun subespacio finito-dimensional de las funciones L2, en particular en el subespaciogenerado por el propio conjunto. Existe a su vez una base de este subespacio (quepuede ser o no un subconjunto de s1(t), . . . , sM (t)). Por lo tanto, y dada la base,podemos interpretar cada forma de onda como un vector de Cn o Rn. El conjuntode estos vectores se denomina constelacion de la modulacion, y generalmente (si esposible) se brinda en forma grafica, marcando los puntos en el plano complejo o enR2 e indicando a que bit(s) corresponde cada uno.

Ejercicio 1.2. Considere las dos funciones dibujadas en la figura 1.2.

1. Verifique que son la base de algun subespacio.

2. Dibuje las formas de onda correspondientes a los puntos de las constelacionesque se muestran en la figura 1.3.

En nuestro problema de modulacion digital, nos concentraremos ahora en el re-ceptor. Como dijimos al comienzo, este sensa el canal y recibe senales que en principioson totalmente arbitrarias. ¿Que forma de onda le fue enviada? Un criterio razonablepara tomar esta decision es definir algun tipo de distancia entre senales, y elegir laforma de onda mas “cercana” (i.e. la que se encuentra a menor distancia de entre lasque pertenecen a la constelacion).

Dado que ya hicimos el paralelismo entre las formas onda elegidas y Rn o Cn, esnatural pensar que la nocion de distancia entre funciones sera igualmente equipara-ble. Sin embargo, la teorıa que manejamos hasta ahora sobre espacios vectoriales nocontiene ninguna nocion de medidas. Para introducir esta nocion de distancia entrevectores es necesario definir el producto interno entre vectores del espacio. Si el lec-tor quiere repasar la definicion de producto interno y sus propiedades basicas puedereferirse al Apendice A, definicion A.5.

15

Page 16: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

El ejemplo mas clasico de espacio vectorial con producto interno es el de Rn. Eneste caso, el producto interno habitual se define como 〈u,v〉 =

∑ni=1 uivi, donde na-

turalmente u = (u1, . . . , un) y v = (v1, . . . , vn). Considerando el caso particular den = 2, es facil verificar que este producto interno induce la norma mas “tradicio-nal” (‖v‖ =

√v2

1 + v22). De manera similar para el espacio vectorial Cn, un posible

producto interno es 〈u,v〉 =∑ni=1 uiv

∗i .

Sera de utilidad, y mas adelante nos quedara claro porque, definir ademas unanocion de angulos entre vectores. Para esto, la idea sera generalizar lo que sucede enR2 a un espacio vectorial cualquiera.

Definicion 1.1. El angulo entre dos vectores en un espacio vectorial cualquiera, loque notaremos como ∠(u,v) sera, en caso que los escalares sean los reales, el anguloentre −π y π que cumple:

cos (∠(u,v)) =〈u,v〉‖u‖‖v‖

. (1.2)

El caso imaginario es analogo, pero se toma el modulo del producto interno. Es impor-tante notar que la existencia de ∠(u,v) solucion de la ecuacion anterior esta aseguradapor la desigualdad de Cauchy-Schwarz.

Con esta nocion de angulo es natural definir la condicion de ortogonalidad entrevectores (i.e. ∠(u,v) = ±π/2) cuando el coseno del angulo que forman sea 0. Lasiguiente definicion considera la condicion mınima necesaria para que se cumpla loanterior.

Definicion 1.2. Se dice que dos vectores u y v son ortogonales si y solo si se cumplela siguiente condicion:

〈u,v〉 = 0,

y lo notaremos como u ⊥ v.

1.4.1. Proyeccion unidimensional

Recordemos brevemente que nuestro objetivo ultimo en recepcion sigue siendoencontrar la forma de onda (del conjunto definido por la constelacion) mas “cercana” ala que sensamos en el canal. Para ello, aun nos faltan tomar algunos pasos importantes,y la definicion de proyeccion es uno de ellos.

Dados dos vectores v y u 6= 0, el problema de proyeccion unidimensional se puedeplantear como expresar v en la suma de dos vectores, tal que uno de ellos sea ortogonala u (y que notaremos v⊥u) y el otro sea colineal con u (y que notaremos v|u). Porlo tanto, v⊥u ⊥ v|u.

Ejemplo 1.4. El caso mas ilustrativo es R2. La figura 1.4 ayuda a entender el proble-ma. De la misma es facil concluir que ‖v|u‖ = ‖v‖ cos θ. Ademas, como la “direccion”de v|u esta dada por u/‖u‖, se cumple la siguiente igualdad:

v|u = ‖v|u‖u

‖u‖= ‖v‖ cos θ

u

‖u‖.

16

Page 17: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

θ u

vv⟂u

v|u

Figura 1.4: Proyeccion unidimensional en el espacio R2.

Por ultimo, aplicando la definicion general del angulo entre vectores llegamos al re-sultado final:

v|u =〈v,u〉‖u‖2

u. (1.3)

El resultado de la ecuacion (1.3) vale en general para cualquier espacio vectorialcon producto interno, independientemente de su dimension. Ver el Apendice A

1.4.2. Bases ortonormales y proyeccion sobre subespacios

Repasaremos ahora un teorema importante respecto a las bases ortonormales deun espacio vectorial.

Teorema 1.1. Sea S un subespacio de dimension n del espacio con producto internoV , siendo φ1, . . . ,φn una base de S que ademas es ortonormal. Entonces, para todov ∈ V , existe un unico v|S ∈ S tal que 〈v − v|S , s〉 = 0∀s ∈ S. Ademas,

v|S =

n∑i=1

〈v,φi〉φi

Demostracion. Ver Apendice A

Analogamente a lo que sucedıa en el caso unidimensional, v−v|S es perpendicularal subespacio S. Por lo tanto, v se puede separar en dos vectores unicos y perpendi-culares entre sı:

v = v − v|S︸ ︷︷ ︸⊥S

+ v|S︸︷︷︸∈S

Es importante tambien notar que el teorema, en su expresion de v|S , nos dabastante informacion que nos sera de gran utilidad. Primeramente, las coordenadasde la proyeccion de v sobre S, expresadas en la base ortonormal φ1, . . . ,φn, seencuentran de realizar el producto interno de v con los distintos elementos de la base.

La segunda observacion tiene que ver con la norma de un vector en S. Sea v unvector cualquiera en S, y que por tanto puede escribirse como una combinacion linealde la base, entonces:

‖v‖2 = 〈v,v〉 = 〈v,n∑i=1

aiφi〉 =

n∑i=1

a∗i 〈v,φi〉 =

n∑i=1

a∗i ai =

n∑i=1

|ai|2.

17

Page 18: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

En el caso particular de una proyeccion sobre S, esto quiere decir que ‖v|S‖2 =∑i |〈v,φi〉|2.

La tercer y ultima observacion tiene que ver con uno de nuestros objetivos masinmediatos, y es que la proyeccion v|S de v sobre S es el vector mas cercano a v enS. El siguiente teorema lo presenta de manera mas formal.

Corolario 1.1. Sea v un vector cualquiera en V y S un subespacio finito-dimensionalcuya base es φ1, . . . ,φn. Se define v|S =

∑ni=1〈v,φi〉φi. Entonces ‖v − v|S‖ ≤

‖v − s‖ ∀s ∈ S, con igualdad unicamente cuando s = v|S.

Demostracion. Ver Apendice A

1.5. Producto interno para funciones L2

Finalmente estamos llegando a nuestro objetivo ultimo. Ya sabemos que en recep-cion estamos esperando una deM posibles funciones (i.e. una del conjunto si(t)i=1,...,M ),y que estas necesariamente pertenecen a un subespacio finito-dimensional S de dimen-sion n ≤M de todas las funciones de energıa finita (y cuya base sera φii=1,...,n). Sipudieramos aplicar la teorıa que presentamos hasta ahora a nuestro problema parti-cular, encontrar la forma de onda mas cercana a la senal que se recibio (r(t)) serıa enprincipio relativamente sencillo, y podrıa hacerse en dos pasos. Primero, proyectamosr al subespacio S, obteniendo r|S . Una vez calculadas las coordenadas de r|S (i.e.〈r,φi〉i=1,...,n), se puede trabajar como si fueran vectores en Cn o Rn. Por lo tanto,encontrar la forma de onda correspondiente significa hallar el punto de la constelacionmas cercano a r|S en el sentido Euclidiano habitual.

Sin embargo, para aplicar estas ideas hace falta un paso de cierta complejidad:definir un producto interno para el espacio vectorial de las funciones L2. Naturalmente,existen varias maneras de hacer esto. Una posibilidad es la siguiente:

〈u,v〉 =

∫ ∞−∞

u(t)v∗(t)dt.

En este caso, la norma de un vector resulta ‖u‖2 =∫|u(t)|2dt, que es una medida

bastante intuitiva de que tan lejos esta u(t) de la funcion identicamente nula.

Resta ver si esta operacion cumple las condiciones de la definicion de productointerno (cf. definicion A.5). En cualquier curso de calculo se verifica que la integralde la definicion esta acotada para cualquier u(t) y v(t) en L2, por lo que 〈·, ·〉 siempredevuelve un valor dentro del conjunto de los escalares (recordar que el infinito no seincluye en los escalares).

Restarıa verificar los tres axiomas de la definicion (i.e. conjugada simetrica, linealen el primer argumento y definida positiva). Los dos primeros se cumplen y la pruebaes bastante sencilla. El problema surge al considerar el ultimo axioma. Recordemosque en este caso el mismo equivale a

〈u,u〉 =

∫ ∞−∞|u(t)|2dt ≥ 0,

18

Page 19: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

con la igualdad unicamente cuando u = 0 (i.e. u(t) = 0 ∀t). Sin embargo, consideremosla siguiente funcion:

u(t) =

1, t = 0

0, t 6= 0.

Claramente u 6= 0, pero lamentablemente 〈u,u〉 = 0, por lo que esta definicion deproducto interno no cumple el tercer axioma. En general, cualquier funcion que sea 0para todo t salvo en una cantidad numerable de puntos tendra norma nula y sera uncontra-ejemplo.

La solucion mas sencilla para aliviar este problema serıa considerar un espaciode funciones mas restringido donde estos contra-ejemplos no existan. Por ejemplo, elespacio de las funciones de energıa finita y continuas. Sin embargo, esto nos eliminarıafunciones que seran de interes estudiar (e.g. u(t) = rect(t)).

La alternativa que usaremos es modificar el espacio vectorial y que representa cadavector u. En vez de representar a una funcion en particular u(t), u representara a to-das las funciones que son iguales a u(t) en casi todo punto. De hecho, se puede probarfacilmente que ser iguales en casi todo punto define una relacion de equivalencia2entrelas funciones L2. Por lo tanto, esta relacion genera una particion del espacio de lasfunciones L2, donde cada funcion u(t) pertenece unicamente a una clase de equivalen-cia (i.e. en este caso, un subconjunto de L2 tal que todo par de elementos son igualesentre sı salvo en un conjunto numberable de puntos). Por lo tanto, y precisando loque se dijo al comienzo de este parrafo, cada vector u representara a una clase deequivalencia en particular. Por ejemplo, el vector 0 representa a todas las funcionesde energıa nula.

Ejercicio 1.3. La definicion de cada vector como una clase de equivalencia genera loque podrıamos llamar complicaciones. Por ejemplo, ¿como sumar dos clases de equi-valencia?. Antes habıamos definido u+v como el vector correspondiente a la funcionu(t) + v(t). Pruebe que imitando las definiciones que hicimos antes, pero tomando unelemento cualquiera dentro de la clase de equivalencia que representa u (denominadogeneralmente representante), se cumple la definicion de espacio vectorial con productointerno.

Quiza esta alternativa impresione como excesivamente complicada o lisa y llana-mente tramposa. Sin embargo, tiene otra ventaja ademas de permitirnos trabajar contodas las funciones L2, y de corte muy practico. ¿Que sentido tiene considerar comodiferentes dos funciones que son identicas en todos los puntos salvo en un conjunto demedida nula? Absolutamente ninguno. Estas herramientas matematicas, quiza algosofisticadas, nos permiten entonces tener en cuenta este aspecto ingenieril.

Por lo tanto, y hay que tenerlo sumamente claro, cuando nos refiramos a igualdadentre elementos del espacio vectorial de las funciones L2

3, querra decir que representanla misma clase de equivalencia. Perfectamente u = v, y al mismo tiempo cuando

2Sea → una relacion binaria entre dos elementos de un conjunto V . Se dice que esta es una relacionde equivalencia si y solo cumple las propiedades de reflexividad (x → x), simetrıa (x → y ⇒ y → x)y transitividad (si x → y e y → z ⇒ x → z).

3Seguramente es mas correcto referirse al espacio vectorial con producto interno V de las clases deequivalencia de las funciones L2. Sin embargo, en este caso y en lo que resta del texto, sacrificaremoscompletitud en pos de facilidad de lectura.

19

Page 20: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

salgamos de nuestro espacio vectorial y volvamos a las funciones, u(t) y v(t) no seaniguales en todo punto. Eso sı, el numero de puntos en que difieren debe ser numerable.

1.6. Sistema de transmision “completo”

En esta seccion terminaremos de armar una primera version de un sistema de trans-mision basado en la teorıa que hemos desarrollado hasta ahora. Sea s1(t), s2(t), . . . , sM (t)un conjunto de M formas de onda que se utilizaran para enviar log2M bits cada una.Como lo hemos hecho hasta ahora, notaremos s1, . . . , sM al conjunto de los corres-pondientes vectores del espacio vectorial V de las funciones L2. Sea S el subespaciogenerado por este conjunto.

Como probamos en el teorema A.2, S es un subespacio finito-dimensional condimension n ≤ M . Por lo tanto, existe una base ortonormal de S que notaremosφ1, . . . ,φn. Por ende, para todas las formas de onda se cumple que existe un conjun-to de escalares (reales o complejos dependiendo del caso) tales que si =

∑nj=1 αi,jφj .

Es decir, αi,j es la coordenada j-esima de la forma de onda i-esima en la base escogida.De vuelta en el dominio de las funciones, esto significa que si(t) =

∑nj=1 αi,jφj(t) (al

menos en el sentido L2 que ya hemos discutido). Por lo tanto, haremos la siguienteequivalencia con Rn o Cn:

s1(t)↔ (α1,1, α1,2, . . . , α1,n),

s2(t)↔ (α2,1, α2,2, . . . , α2,n),

. . .

sM (t)↔ (αM,1, αM,2, . . . , αM,n).

A su vez, cada forma de onda se utilizara para enviar una de las posibles log2M -tuplas de bits. Por lo tanto, hay un segundo nivel de correspondencia entre las coor-denadas en Rn o Cn y las tuplas de bits:

(α1,1, α1,2, . . . , α1,n)↔ (b1,1, b1,2, . . . , b1,logM 2),

(α2,1, α2,2, . . . , α2,n)↔ (b2,1, b2,2, . . . , b2,logM 2),

. . .

(αM,1, αM,2, . . . , αM,n)↔ (bM,1, bM,2, . . . , bM,logM 2).

(1.4)

Como ya lo mencionamos antes, las coordenadas de las funciones si(t) en Rn (o Cn)se denomina constelacion, y cuando es posible se brinda graficamente. Por ejemplo,la figura 1.5 da un ejemplo donde M = 4 (y por tanto cada forma de onda transmitedos bits), los escalares son los reales y el espacio generado es de dimension n = 2. Porlo general tambien se indica a que bit(s) corresponde cada punto de la constelacion,tal como se muestra en la figura.

1.6.1. Transmisor

Imaginemos entonces que deseamos transmitir unicamente log2M bits (en el ejem-plo de la figura 1.5 serıan un par de bits). La figura 1.6 muestra un diagrama del

20

Page 21: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

00

01

10

11

1

1

Figura 1.5: Un ejemplo de constelacion.

LUT 1

LUT 2

LUT n

𝜙1(t)

𝜙2(t)

𝜙n(t)

S/Ps(t)

bits

log2M bits

a1

a2

an

Figura 1.6: El diagrama del transmisor. Las flechas dobles indican que esa conexiontransmite mas de un valor.

sistema de transmision que iremos discutiendo paso a paso. Generalmente, los bitsson alimentados al transmisor en forma serial, por lo que el primer paso es ponerlosen grupos de a log2M bits mediante el dispositivo que denominaremos serie/paralelo(o simplemente S/P). El objetivo sera generar la forma de onda si(t) correspondienteal conjunto de bits (a priori arbitrario) que haya que transmitir. Es decir,

s(t) =

n∑i=1

aiφi(t), (1.5)

donde ai es el αj,i correspondiente al grupo de bits que haya que transmitir, talcomo aparece en (1.4). Siguiendo con el ejemplo, si la pareja a transmitir fuera 01,entonces a1 = 1 y a2 = −1. Notar que en la expresion anterior para s(t) desaparecioel subındice, en el entendido que esta puede ser cualquiera de las M posibles si(t).

Una posible implementacion es tener n caminos paralelos que generen cada unoel ai correspondiente y luego se multiplique por φi(t). Para hallar este ai se puedeutilizar una simple tabla (o look-up table, LUT) que tome como entrada el grupo debits correspondiente. En nuestro ejemplo en particular, habrıa dos tablas, cada unacon el siguiente contenido:

LUT 100 101 110 -111 -1

LUT 200 101 -110 111 -1

(1.6)

21

Page 22: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

𝜙1*(t)

𝜙2*(t)

𝜙n*(t)

r(t)

∫(.)dt

∫(.)dt

∫(.)dt

decisión

a1

a2

an

proyección a S

log2M bits

Figura 1.7: El diagrama del receptor.

01

1

(a1,a2)

-1

Figura 1.8: Un ejemplo de como funciona el bloque Decision.

1.6.2. Receptor

En recepcion, y tal como lo vinimos adelantando, el proceso se hara en dos partes.Si r(t) es la senal sensada en el canal, el primer paso sera proyectar r en S y encontrarsus coordenadas en la base φ1, . . . ,φn. Tal como lo muestra la figura 1.7, lo queharemos sera tener n caminos en recepcion, uno por coordenada. Para hallar el valorde esta coordenada, y tal como se discutio al comienzo de la seccion 1.5, en cada unode estos caminos multiplicaremos r(t) por φi(t)

∗ e integraremos la senal entre −∞ y+∞ (i.e. hallaremos ai = 〈r,φi〉).

Es importante notar la presencia de una llave a la salida de los integradores.Esto representa el hecho que la salida de los mismos nos interesaran unicamentecuando la integracion haya finalizado y no sus valores intermedios. Si no hubo mayoresproblemas, el valor resultante ai, deberıa ser muy similar al ai originalmente enviado(cf. ecuacion (1.5)).

Una vez hallado r|S(t) =∑i aiφi(t), la mejor aproximacion de r(t) en S (en

el sentido de distancia que vinimos considerando hasta ahora), el siguiente paso eshallar a cual de las formas de onda s1(t), . . . , sM (t) (y por tanto de pareja de bits) secorresponde. Dado que estamos dentro de un subespacio finito-dimensional, podemosusar la correspondencia con Rn (en nuestro ejemplo R2) que discutimos en la seccion1.4 y trabajar con la geometrıa habitual. Por tanto, el par de bits correspondientessera aquel cuyas coordenadas en la constelacion sean las mas cercanas a (a1, a2).Generar esta pareja sera la responsabilidad del bloque Decision que aparece en eldiagrama. En la figura 1.8 se muestra un ejemplo donde la decision fue la pareja debits 01.

Ejercicio 1.4. Sea sr(t) la forma de onda elegida por el algoritmo en dos pasos

22

Page 23: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

t1

r(t)1

0.5

r(t)

r(t)

r(t) r(t)

t1

1

0.5

t1

1

0.5

-1

t1

1

0.5

-1

t1

4

0.5

Figura 1.9: Las funciones del ejercicio 1.5.

t1

𝜙1(t)

√2

0.5t1

𝜙2(t)

√2

0.5

Figura 1.10: Base alternativa del ejercicio 1.6.

descrito antes cuando la entrada es r(t). Pruebe que se cumple la siguiente igualdad:

sr(t) = mıni=1,...,M

∫ ∞−∞|r(t)− si(t)|2dt.

Es decir, se escoge la forma de onda tal que la energıa de la diferencia con la senalrecibida es mınima.

Ejercicio 1.5. Encuentre la mejor aproximacion de las funciones que se muestranen la figura 1.9 dentro del sub-espacio generado por las funciones de la figura 1.2.En cada caso indique a que punto de las constelaciones que aparecen en la figura 1.3harıa corresponder un demodulador si recibiera cada uno de los r(t). Asuma A = 1.

Ejercicio 1.6. Repita el ejercicio anterior pero considerando la base de la figura 1.10.

1.6.3. Consideraciones practicas

El par receptor-transmisor que disenamos funcionarıa bajo ciertas idealidades. Enparticular, r(t) deberıa ser muy similar a s(t). Esto significa por ejemplo que el tiempoque le toma a la senal llegar hasta el receptor debe ser insignificante. A su vez, enese recorrido, la senal debe sufrir cambios en su forma que deben ser insignificantestambien.

Pero hay otros problemas en lo que se refiere a la utilidad del sistema en sı, inclusobajo estas idealidades. Por lo pronto, para transmitir un unico par de bits es necesarioun tiempo infinito, correspondiente al subsistema de proyeccion (esto sin mencionarel hecho que integrar desde −∞ no tiene mayor significado fısico). Sin embargo, este

23

Page 24: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

r(t) 𝜙2*(-t)

𝜙1*(-t)

𝜙n*(-t)

decisión

a1

a2

an

proyección a S

t=0

t=0

t=0

log2M bits

Figura 1.11: El receptor implementado con un filtro apareado.

aspecto tiene una “sencilla” solucion4 que ya adelantamos al comienzo del capıtulo:utilizar funciones de soporte temporal acotado. De este modo el tiempo para obtenerun par de bits es finito.

Imaginemos entonces que cada funcion φi(t) tiene soporte en t = (0, Ts). Entonces,vale la siguiente igualdad:

ai =

∫ Ts

0

r(τ)φ∗i (τ)dτ =

∫ Ts

0

r(τ)φ∗i (τ − t)dτ

∣∣∣∣∣t=0

= [r(τ) ∗ φ∗i (−τ)](t)|t=0 , (1.7)

donde la operacion ∗ es la convolucion entre funciones. Es decir, f(t)∗g(t) =∫f(s)g(t−

s)ds =∫f(t−s)g(s)ds. En la ecuacion (1.7) forzamos un tanto la notacion para hacer

notar que se convoluciona r(t) con φ∗i (−t). Aunque dedicaremos un capıtulo comple-to a repasar este tema, adelantamos aquı que la ecuacion anterior significa que sepuede obtener ai de pasar r(t) por un filtro cuya respuesta al impulso sea φ∗i (−t) ymuestreando en t = 0.

La variacion discutida en el parrafo anterior es lo que se denomina filtro apareado(generalmente notado como MF, de matched filter), y se puede apreciar en la figura1.11. Hay que tener claro que si φi(t) tiene soporte para los t positivos, este filtroapareado no sera causal (i.e. responde a entradas que todavıa no han entrado al filtro)y por tanto sera irrealizable. Sin embargo, esto se corrige sencillamente considerandouna version atrasada Ts de la respuesta φ∗i (−t) (i.e. φ∗i (−(t− Ts)) = φ∗i (−t+ Ts)), ymuestreando en t = Ts (ver figura 1.12), lo cual ademas tiene el sentido fısico de poderrecuperar los bits despues que la forma de onda fue enviada totalmente (en t = Ts)y no antes. De todas formas, esta correccion relativamente menor generalmente seasume implıcitamente, cosa que nosotros tambien haremos.

Quiza el problema mas grave, que requerira una discusion relativamente larga yque dejaremos para capıtulos posteriores, es el hecho de poder enviar mas que unpar de bits. Es decir, por lo general los bits se generan en el transmisor a una ciertacadencia fija R bits/s. El objetivo es lograr un sistema de transmision que puedatransmitirlos y recibirlos a esa misma tasa.

De todas formas, en esta seccion presentamos el principio basico de funcionamientodel sistema de comunicacion que usaremos a lo largo del texto. Lo que sigue seranmodificaciones sobre esta base, que necesariamente el lector tiene que tener clara.

4En capıtulos sucesivos quedara claro porque se incluyeron las comillas.

24

Page 25: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

t1

1

0.5

-1

𝜙(t)

t-1

1

-0.5

-1

𝜙(-t) 𝜙(-t+1)

t1

1

0.5

-1

Figura 1.12: Un ejemplo de la funcion φ(t) original, su version apareada, y la respuestaa impulso del filtro que se utilizara en el receptor. En este caso Ts = 1 y la funcion esreal.

1.7. Coeficiente de correlacion, correlacion cruzaday convolucion

Supongamos que las formas de onda escogidas para representar cada conjunto debits (i.e. si(t)i=1,...,M ) corresponden a vectores con la misma energıa (i.e. ‖si‖ =‖sj‖ ∀ i, j = 1, . . . ,M con ‖si‖2 =

∫|si(t)|2dt). En este caso, existe una simplificacion

a veces utilizada en la practica para el bloque de decision de la figura 1.7: en estecaso es facil ver que el vector de la senal recibida r estara mas cercana a aquel si conquien forme el menor angulo (ver figura 1.13 para el caso en que las formas de ondase pueden asimilar a R2).

Recordemos que el coseno del angulo entre dos funciones para este caso vale (cf.(1.2))

cos (∠(r, si)) =〈r, si〉‖r‖‖si‖

=

∫∞−∞ r(t)si(t)dt√

ErEsi

, (1.8)

y en caso que las senales sean complejas, habra que usar el conjugado de si(t) en laintegral y tomar el valor absoluto de esta ultima. Ademas Er y Esi son la energıa delas senales r y si respectivamente, es decir:

Er =

∫ ∞−∞|r(t)|2dt,

Esi =

∫ ∞−∞|si(t)|2dt.

En este caso particular entonces, el bloque de decision debera calcular el valorindicado en (1.8) para cada si(t) y tomar el maximo, pues correspondera al menorangulo. Esta decision no dependera de la energıa de r(t) (ni de la de si(t) al sertodas iguales), por lo que llegamos a lo que se denomina muchas veces Receptor deCorrelacion, que se ilustra en la figura 1.14.

Ejercicio 1.7. El analisis anterior se puede generalizar a formas de onda con dis-tintas energıas. Partiendo de que el receptor decidira por el sımbolo i-esimo tal que

i = arg mınj=1,...,M

‖r − sj‖2 = arg mınj=1,...,M

〈r − sj , r − sj〉,

25

Page 26: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

s1

s2

s3

s4

Figura 1.13: Un ejemplo donde las formas de onda si pertenecen a R2 y no estanalineadas. La region de decision de cada sımbolo (es decir, los puntos del plano dondese decidira por el sımbolo correspondiente) se marca con un color distinto.

s1(t)

r(t)

∫(.)dt

∫(.)dt

∫(.)dt

máxi

mo

log2M bits

s2(t)

sM(t)

Figura 1.14: El diagrama del receptor de correlacion. Recordar que en este caso lasformas de onda si(t)i=1,...,M deben tener todos la misma energıa.

realice los cambios necesarios al receptor de la figura 1.14 para que funcione inclusoen este caso.

La funcion definida en (1.8), aunque aquı la obtuvimos de interpretarlo como unangulo, aparece frecuentemente en la literatura bajo distintos nombres. Por ejemploen la literatura de probabilidad se lo conoce como coeficiente de correlacion (y deahı el nombre del receptor de la figura 1.14) y generalmente se la nota cn. Comovimos recien, esta brinda una cierta medida de cercanıa entre ellas, o mas precisa-mente de alineacion. De todas formas, se la utiliza muchas veces en la literatura conel primer significado, ası que la pregunta que surge es ¿que significado tiene esta rela-cion de cercanıa o similitud entre funciones? Veamos un ejemplo para interpretar susignificado.

Ejemplo 1.5. Se considera como funcion u(t) = A rect(t/T ) con T entero y A > 0.Calcular el coeficiente de correlacion de u(t) con v1(t) = B rect(t/T ) y B > 0, conv2(t) = −B rect(t/T ), con v3(t) = Ae−t/T rect(t/T ), con v4(t) = A sin(2πt) rect(t/T )

Dejamos al lector el calculo de las integrales correspondientes y verificar que parav1(t) se obtiene cn = 1, con v2(t) se obtiene cn = −1, con v3(t) se obtiene cn = 0,96,con v4(t) se obtiene cn = 0 .

Con los resultados se puede analizar el tipo de similitud entre funciones que es-tablece el coeficiente definido. En primer lugar el maximo coeficiente correlacion loobtenemos con v1(t) y es independiente del valor B. Esto nos indica que esta relacion

26

Page 27: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

de cercanıa o similitud no tiene en cuenta la amplitud de la funcion sino la formade la onda. Esto es evidente si se observa la expresion del coeficiente de correlacion,ya que en la formula de cn se esta dividiendo entre la energıa de las senales. En elcaso de v2(t), cn = −1. Este valor indica que las formas de onda son similares perode signo opuesto. Con v3(t) observamos que si bien no son la misma forma de onda,hay similitud entre ambas formas de onda. De v4(t) podemos ver que cn = 0 y por lotanto las formas de onda son ortogonales, no hay cercanıa alguna entre ambas formasde onda.

En muchos casos en sistemas de comunicacion se desea detectar en el receptor unasenal que se envıa desde el transmisor y por lo tanto en el receptor se debe “encon-trar” la senal transmitida. El problema es que aun asumiendo que el receptor y eltransmisor estan perfectamente sincronizados, si simplemente se calcula el coeficientede correlacion de la senal recibida en el instante en que se transmite con el pulsoenviado, cn tendra muy probablemente un valor cercano a cero. Esto se debe a queel medio de transmision nos impone un retardo variable entre transmisor y receptor.Por lo tanto, no se conoce el momento preciso en que el pulso sera recibido. En lossistemas de radar por ejemplo es de interes ademas, conocer ese tiempo variable. Laidea basica de estos sistemas es que se envıa un pulso, este “rebota” contra un objetoy conociendo el retardo que se tiene en recibir el pulso enviado es posible conocer laposicion del objeto.

Por los motivos expuestos en el parrafo anterior habitualmente se define y secalcula la correlacion cruzada entre funciones:

ruv(τ) =

∫ ∞−∞

u(t)v∗(t− τ)dt.

Es decir que ruv(τ) mide la correlacion entre una senal y la senal retrasada τ (y sumagnitud sera proporcional al coseno del angulo entre ellas). En muchos receptoresdonde como se menciono es necesario “encontrar” el pulso transmitido en la senalrecibida se realiza la correlacion cruzada de la senal recibida con el pulso enviadoy se busca el maximo de la correlacion cruzada variando τ (salvo que la senal tengaalgun tipo de periodicidad, el valor τmax donde se de el maximo indicara este retardo).Ademas del ejemplo del radar hay muchas otras aplicaciones que utilizan la correlacioncruzada con el pulso enviado. Por ejemplo en el capıtulo de OFDM veremos porejemplo que en 802.11 se envıan senales de sincronizacion que sirven para detectar yalinear la trama OFDM recibida. La forma de detectar y alinear la trama recibida esmediante la correlacion cruzada entre la senal recibida y la senal de sincronizacion quese envio. Habitualmente en estos casos, al igual que con el coeficiente de correlacion,se divide ruv entre la norma (energıa) de los vectores para tener un valor entre -1 y 1.Ası mismo se define la autocorrelacion de una senal u(t) como ruu(τ). Mas adelantevolveremos sobre la autocorrelacion y se comprendera mejor su utilidad.

Para terminar esta seccion se debe mencionar que el producto de convolucion quese definio al comienzo de este capıtulo se puede escribir como una correlacion. De ladefinicion de la correlacion cruzada y el producto de convolucion se deduce facilmenteque:

ruv(t) = u(t) ∗ v∗(−t) =

∫ ∞−∞

u(τ)v∗(τ − t)dτ,

27

Page 28: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

de lo que se concluye que el receptor de correlacion y el filtro apareado son extrema-damente similares.

28

Page 29: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Apendice A

Espacios vectoriales yespacios de funciones

A.1. Espacios Vectoriales

En esta seccion presentaremos los conceptos basicos necesarios para desarrollar lateorıa que nos permitira idear un sistema de comunicacion digital. Se hara una pre-sentacion relativamente general, pues estos conceptos seran re-visitados en capıtulosposteriores, en particular en aquel dedicado a la teorıa de codigos.

A.1.1. Grupos

Comenzamos con la definicion de grupo. Informalmente, este es un conjunto de ele-mentos entre los que se define una operacion binaria (que notaremos de forma genericaen esta seccion con el sımbolo ∗) que debe cumplir ciertas reglas. Por operacion bi-naria nos referimos a una operacion que involucra a dos elementos del grupo, del quese obtiene un resultado unico. Una definicion mas formal de grupo es la siguiente:

Definicion A.1. Un conjunto G en el que se define una operacion binaria ∗ sedenomina grupo (y se lo notara (G, ∗) o simplemente G) si se cumplen las siguientescondiciones o axiomas:

i. El conjunto G es cerrado bajo ∗. Es decir, ∀a, b ∈ G el resultado de la operaciona ∗ b debe estar en G.

ii. La operacion debe ser asociativa: (a ∗ b) ∗ c = a ∗ (b ∗ c), ∀a, b, c ∈ G.

iii. Existe un elemento e ∈ G tal que se cumple la ecuacion a∗ e = e∗a = a, ∀a ∈ G.A e se lo denomina elemento identidad del grupo.

iv. Para todo a ∈ G existe otro elemento b ∈ G tal que se cumple la ecuaciona ∗ b = b ∗ a = e (con e el elemento identidad). En este caso, b se denomina elinverso de a (y por tanto a es el inverso de b).

Ejemplo A.1. El ejemplo mas evidente de grupo es el conjunto de los enteros conla operacion suma habitual. Verificar los axiomas para este caso es muy sencillo.

29

Page 30: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ejemplo A.2. Los numeros naturales bajo la suma habitual no son un grupo, puesno cumplen el cuarto axioma.

Ejercicio A.1. Pruebe que el elemento identidad de cualquier grupo es unico. Tam-bien pruebe que el inverso de cualquier elemento del grupo es unico.

A.1.2. Cuerpos

La aparente simplicidad de los axiomas que definen un grupo esconde la comple-jidad de lo que hoy en dıa es una disciplina muy activa dentro de la matematica: lateorıa de grupos. En este texto no iremos mas alla de esta breve mencion, y utilizare-mos los grupos para construir entidades algo mas complejas, en particular un cuerpo.Un cuerpo (o a veces denominado campo) es relativamente similar a un grupo, perose definen dos operaciones binarias cerradas en el conjunto y algunas propiedades quedeben cumplir entre ellas. Una definicion formal es la siguiente.

Definicion A.2. Sea F un conjunto de elementos entre los que se definen las ope-raciones binarias suma (“+”) y multiplicacion (“×”). El conjunto F junto con lasoperaciones + y × son un cuerpo si y solo si:

i. F es un grupo conmutativo bajo +. Es decir, que ademas de (G,+) ser un grupo,se cumple que a+ b = b+ a, ∀a, b ∈ F . El elemento identidad de + se denominaelemento nulo o simplemente 0.

ii. El subconjunto de elementos distintos del nulo en F es un grupo conmutativobajo ×. El elemento identidad de × se denomina elemento unitario o simplemente1.

iii. La operacion × es distributiva sobre +. Es decir que a× (b+ c) = a× b+ a× c∀a, b, c ∈ F .

Por lo tanto, un cuerpo se podrıa entender como un conjunto en donde se puedenrealizar las operaciones de suma, resta, multiplicacion y division sin salir del conjunto(cumpliendo la multiplicacion y suma las propiedades de asociativa, conmutativa ydistributiva). Aunque los axiomas solo se refieren a la suma y la multiplicacion, ladivision y la resta se definen implıcitamente a traves de la existencia de los inversosde la multiplicacion y la suma respectivamente.

Ejercicio A.2. ¿Los numeros enteros son un cuerpo? ¿Y los numeros racionales?¿Y los reales? ¿Y los complejos? En todos los casos considere las operaciones suma yproducto habituales.

Esta claro que un cuerpo tiene al menos dos elementos: el nulo y el unitario. Esmas, el siguiente ejemplo muestra que se puede construir un cuerpo con unicamenteestos dos elementos.

Ejemplo A.3. Considere el conjunto F = 0, 1 junto con la suma y multiplicacionmodulo-2. Es decir:

0 + 0 = 0; 0 + 1 = 1; 1 + 0 = 1; 1 + 1 = 0;

0× 0 = 0; 0× 1 = 0; 1× 0 = 0; 1× 1 = 1.

30

Page 31: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Es facil ver que F es un grupo conmutativo bajo +: los resultados de las sumason siempre 0 o 1 (por lo que es cerrado bajo +), se pueden realizar las ocho posiblescombinaciones de tres valores para probar la asociatividad de +, la identidad es el 0,y el inverso de 0 es el 0 y el del 1 es el 1.

Es igualmente facil ver que el conjunto 1 es un grupo bajo ×: 1× 1 = 1 por loque es cerrado bajo ×, es verdad que 1× (1× 1) = 1× 1 = (1× 1)× 1, la identidades el 1, y el inverso del 1 es el propio 1. Faltarıa verificar que se cumple la propiedaddistributiva, lo que se puede verificar simplemente listando las ocho combinacionesposibles para a× (b+ c) y a× b+ a× c.

El ejemplo anterior es muy importante, y sera utilizado en otros capıtulos del libro.Forma parte de la familia de cuerpos finitos (pues es un cuerpo con una cantidadfinita de elementos) o cuerpos de Galois (en honor a Evariste Galois1), y se notageneralmente como GF (2) (Galois Field de orden 2), donde el numero entre parentesisindica la cantidad de elementos del cuerpo.

Ejercicio A.3. Imitando la construccion realizada para el GF (2), pruebe que F =0, 1, 2 es un cuerpo bajo la suma y el producto modulo-3.

A.1.3. Espacio de vectores

Finalmente estamos en condiciones de definir lo que es un espacio de vectores.

Definicion A.3. Sea V un conjunto de elementos entre los que se define una opera-cion binaria +. Sea F un cuerpo. Se define una operacion binaria × entre un elementode F y otro de V . El conjunto V se denomina espacio de vectores sobre el cuerpo Fsi se cumplen las siguientes condiciones o axiomas:

i. V es un grupo conmutativo bajo +.

ii. Para todo a ∈ F y v ∈ V , a× v ∈ V .

iii. Se cumplen las propiedades distributivas entre V y F :

a× (u+ v) = a× u+ a× v; ∀a ∈ F ; ∀u,v ∈ V(a+ b)× v = a× v + b× v; ∀a, b ∈ F ; ∀v ∈ V.

iv. Se cumple tambien la propiedad asociativa entre V y F :

(a× b)× v = a× (b× v)

v. Sea 1 el elemento unitario de F . Entonces 1× v = v; ∀v ∈ V .

Es importante notar que aquı se forzo un poco la notacion, en el sentido que seutilizo el mismo sımbolo (+) para la operacion suma entre los elementos del cuerpoF (los que se denominan escalares) y los elementos del espacio de vectores V (deno-minados vectores). Esta claro que no es lo mismo u+v que a+ b, y que el contexto es

1Matematico frances, nacido en 1811, y muerto a los veinte anos de edad en un duelo. En su cortapero intensa vida, sento las bases lo que luego serıa la Teorıa de Galois, mientras luchaba activamenteen la revolucion francesa.

31

Page 32: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

suficiente para indicar a que operacion nos referimos en cada caso. Lo mismo sucedecon v × a (denominado generalmente producto escalar) y a× b (que ademas muchasveces notaremos v.a y a.b o simplemente va y ab).

Ejemplo A.4. El ejemplo mas sencillo de espacio vectorial, es el muchas veces deno-minado espacio trivial. Este consiste unicamente en el nulo del grupo, i.e. V = 0 yse define a×0 = 0∀a ∈ F . Este espacio no lo consideraremos pues carece de utilidad.

Ejemplo A.5. El ejemplo clasico de espacio vectorial es V = Rn sobre los escalaresF = R con las operaciones entre vectores y escalares habituales. En el ejercicio A.2probamos que los reales forman un cuerpo con estas operaciones. Como las operacio-nes suma entre los elementos de Rn y el producto escalar son ambas coordenada acoordenada, es facil probar que el resto de las propiedades tambien se cumplen. Porejemplo, el elemento identidad del grupo (Rn,+) es 0 = (0, 0, . . . , 0).

Lo importante del ejemplo anterior es destacar que lo que se entiende generalmentepor vector es un elemento de Rn (o Cn), pero que justamente no es mas que unejemplo. La teorıa que hemos presentado permite manejar entidades matematicasmuy distintas, pero con aspectos estructurales comunes, como lo muestran el siguienteejemplo y ejercicio. Aprovechar esta estructura nos permitio disenar un sistema detransmision y recepcion de bits, como se ve en el cuerpo de este capıtulo.

Ejemplo A.6. Las funciones complejas o reales de energıa finita tambien puedenverse como un espacio vectorial. En este caso los escalares seran los complejos o loreales respectivamente, que ya vimos en el ejercicio A.2 que eran un cuerpo. Notaremoscomo v al vector correspondiente a la funcion v(t). Aunque estrictamente hablandoson la misma cosa, ası explicitaremos que v corresponde a la funcion v(t) vista comoun vector, y no al valor particular que toma v(t) evaluado en t.

La suma entre elementos del espacio vectorial v+u la definiremos como el vectorcorrespondiente a la funcion que mapea cada t a u(t)+v(t). Verificar que ası se defineun grupo conmutativo es relativamente sencillo. Por ejemplo, el elemento unidad dela suma (0) resulta la funcion identicamente nula. El inverso de u es el vector −ucorrespondiente a la funcion que mapea cada t a −u(t). Las propiedades asociativay conmutativa se cumplen por como definimos la suma. Por ultimo, la suma de dosfunciones de energıa finita sigue teniendo energıa finita:∫ ∞

−∞|u(t) + v(t)|2dt ≤

∫ ∞−∞

2|u(t)|2dt+

∫ ∞−∞

2|v(t)|dt ≤ ∞,

por lo que u + v ∈ V ; ∀u,v ∈ V . Por tanto probamos que las funciones de energıafinita forman un grupo conmutativo y que se cumple el axioma i de la definicion A.3.

Analogamente, a.v lo definiremos como el vector correspondiente a la funcion quemapea cada t a a.v(t). Por lo tanto, a.v tiene a2 mas veces de energıa que v, quesigue siendo finita, por lo que a.v ∈ V ; ∀a ∈ C,v ∈ V . Entonces tambien se cumpleel axioma ii. El resto de los axiomas se verifican por como definimos las operaciones.

Ejercicio A.4. Considere las n-tuplas formadas por n elementos de GF (2) de la for-ma v = (a1, a2, . . . , an). Pruebe que, bajo la suma modulo-2 coordenada a coordenada,el conjunto V formado por las 2n posibles n-tuplas forman un grupo conmutativo. Lue-go pruebe que, utilizando F = GF (2) como el conjunto de los escalares y utilizandoel producto escalar habitual, V es un espacio vectorial.

32

Page 33: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Es posible que un subconjunto S ⊂ V del espacio vectorial V sea a su vez unespacio. Esto se denomina subespacio de V . Existe una condicion relativamente sencillade verificar si un sub-conjunto de V es a su vez un espacio.

Teorema A.1. Sea S un subconjunto no vacıo de un espacio vectorial V sobre elcuerpo F . Entonces, S es un subespacio de V si y solo si:

1. u+ v ∈ S; ∀u,v ∈ S,

2. a.v ∈ S; ∀a ∈ F,v ∈ V .

Ejercicio A.5. Probar el teorema A.1.

Ejercicio A.6. Probar que las funciones de la forma v(t) = a rect(t/T ) con a ∈ Rforman un subespacio del espacio de las funciones de energıa finita con las operacionesdefinidas en el ejemplo A.6.

Ejemplo A.7. Considere el espacio vectorial de todas las 5-tuplas sobre GF (2) (cf.ejercicio A.4). Es facil verificar que el conjunto (00000), (00111), (11010), (11101)cumple las condiciones del teorema A.1, por lo que es un sub-espacio.

A.1.4. Dimension y base de un espacio vectorial

Definicion A.4. Un conjunto finito de n vectores φ1,φ2, . . . ,φn ∈ V se dice quegenera el espacio vectorial V (y por tanto se denomina conjunto generador) si y solosi para todo v ∈ V existe un conjunto de n escalares a1, a2, . . . , an tal que

v =

n∑i=1

aiφi.

La suma en la derecha de la ecuacion anterior se denomina combinacion linealde los vectores φ1, . . . ,φn. Dado que el espacio vectorial cumple las propiedades deasociativa y conmutativa, no hay ambiguedades en la definicion de la combinacionlineal (e.g. no hacen falta parentesis).

Esta claro que no todos los espacios cuentan con un conjunto generador entre suselementos. Aquellos que sı lo tengan son denominados espacios finito-dimensionales.A su vez, si este conjunto generador es linealmente independiente (i.e. no existe unconjunto de escalares a1, . . . , an tal que

∑ni=1 aiφi = 0 salvo si ai = 0 ∀i), se

denomina base del espacio vectorial, y el espacio tiene dimension n.

Hay algunas cosas que son importantes notar respecto a la base de un espaciofinito-dimensional. La primera es que no es unica. Es facil verificar que si el conjuntoφ1, . . . ,φn es una base de V , entonces aφ, . . . , aφn con a un escalar distintodel nulo tambien es una base. La segunda es que la definicion de dimension asumela existencia de una base para cualquier espacio finito-dimensional, lo que prueba elsiguiente teorema.

Teorema A.2. Sea V un espacio vectorial finito-dimensional y v1, . . . ,vm un con-junto generador de V . Entonces, existe un subconjunto de v1, . . . ,vm base de V .

33

Page 34: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Demostracion. Primeramente, si el conjunto generador es linealmente independiente,entonces es base y queda probado el teorema.

Sino, uno de los elementos del conjunto puede ser escrito como combinacion linealde los otros. Supongamos, sin perdida de generalidad, que ese vector es v1. Entonces,es facil ver que el conjunto v2, . . . ,vm sigue generando V . Si este nuevo conjunto eslinealmente independiente, entonces es base y queda probado el teorema. Sino, repitoel procedimiento hasta hallar una base.

La unica posibilidad que generarıa problemas es que V sea el espacio trivial, peroya aclaramos que no lo estamos considerando.

Por ultimo, la definicion de dimension tambien asume que todos los espacios finito-dimensionales tienen la misma cantidad de elementos en cualquier base. Esto lo proba-remos basandonos en el siguiente teorema, el cual tambien utilizaremos para calcularla dimension del espacio vectorial de las funciones L2 en la seccion A.2.3.

Teorema A.3. Sea V un espacio vectorial finito-dimensional, v1, . . . ,vm ⊂ Vun conjunto linealmente independiente y u1, . . . ,un un conjunto generador de V .Entonces n ≥ m. Es decir, cualquier conjunto linealmente independiente tiene menos(o igual) cantidad de elementos que cualquier conjunto generador.

Demostracion. Si el conjunto ujj=1,...,n genera V , entonces existe un conjunto deescalares tal que

vi = ai,1u1 + . . .+ ai,nun ∀i = 1, . . . ,m.

Ademas, al ser un conjunto linealmente independiente, se cumple que

b1v1 + . . .+ bmvm = 0⇔ bi = 0∀i = 1, . . . ,m.

La ecuacion anterior la puedo re-escribir en funcion de los vectores del conjunto ge-nerador:

b1v1 + . . .+ bmvm = (b1a1,1 + . . .+ bmam,1)u1 + . . .+ (b1a1,n + . . .+ bmam,n)un = 0.

Ahora supongamos que n < m y tratemos de llegar a una solucion para la ecuacionanterior donde los bi sean no nulos. Para ello, nos plantemos el sistema de ecuacionesen forma matricial: a1,1 . . . am,1

...a1,n . . . am,n

b1

...bm

=

0...0

Si n < m, este sistema tiene menos ecuaciones que incognitas, por lo que existe unasolucion no nula para los escalares b1, . . . , bm, por lo que llegamos a un absurdo yprobamos el teorema.

Ejercicio A.7. A partir del teorema anterior, pruebe que no puede haber dos basescon distinta cantidad de elementos.

Ejercicio A.8. En el ejercicio A.6 probamos que las funciones de la forma v(t) =a rect(t/T ) con a ∈ R forman un espacio. ¿Que dimension tiene este espacio? De unabase para el mismo.

34

Page 35: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ejercicio A.9. Idem para el subespacio considerado en el ejemplo A.7.

Ahora bien, imaginemos que tenemos un espacio vectorial finito-dimensional Vcon una base φ1, . . . ,φn. Entonces, cualquier elemento v ∈ V puede ser escrito dela forma

v =

n∑i=1

aiφi,

con a1, . . . , an un conjunto de escalares a determinar. Ademas, dado que la base esun conjunto linealmente independiente, entonces el conjunto de escalares es unico.Por lo tanto, dada la base, cualquier vector v ∈ V puede ser representado de maneraunica por la n-tupla (a1, . . . , an) ∈ Fn (donde F es el conjunto de los escalares sobreel que esta definido V ). Tomando el caso concreto de F = C o F = R, que seranlas dos posibilidades que mas manejaremos en este texto, cualquier espacio vectorialfinito-dimensional se puede “equiparar” con Cn o Rn.

A.2. Espacio vectorial con producto interno

Para evitar innecesarias complejidades matematicas, de aquı en mas supondremosque los escalares (i.e. el cuerpo sobre el que se definio nuestro espacio vectorial) sonlos complejos o los reales (i.e. F = C o F = R).

Definicion A.5. Producto interno se denomina a una operacion binaria entre ele-mentos de V que devuelve un complejo, que notaremos como 〈u,v〉 (por tanto, ennotacion formal, 〈·, ·〉 : V × V → C), y que cumple las siguientes propiedades:

i. 〈u,v〉 = 〈v,u〉∗,

ii. 〈au+ bv,w〉 = a〈u,w〉+ b〈v,w〉,

iii. 〈v,v〉 > 0 ∀v 6= 0 y 〈0,0〉 = 0.

En este caso, la notacion a∗ corresponde al conjugado del numero complejo a. Ladefinicion correspondiente a F = R es analoga.

Definicion A.6. La norma de un vector v de un espacio con producto interno sedefine como ‖v‖ =

√〈v,v〉.

Ejemplo A.8. El ejemplo mas clasico de espacio vectorial con producto internoes el de Rn. En este caso, el producto interno habitual se define como 〈u,v〉 =∑ni=1 uivi, donde naturalmente u = (u1, . . . , un) y v = (v1, . . . , vn). Considerando

el caso particular de n = 2, es facil verificar que este producto interno induce lanorma mas “tradicional” (‖v‖ =

√v2

1 + v22).

Ejercicio A.10. Considere el espacio vectorial Cn. Pruebe que un posible productointerno es 〈u,v〉 =

∑ni=1 uiv

∗i . Ahora considere la definicion alternativa 〈u,v〉 =∑n

i=1 ciuiv∗i con c1, . . . , cn numeros complejos fijos. Indique bajo que condiciones esta

definicion tambien corresponde con un producto interno:

1. Los cj son todos iguales a un numero real positivo.

35

Page 36: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

2. Los cj son todos numeros reales positivos.

3. Los cj son todos numeros reales no-negativos.

4. Los cj son todos iguales al mismo complejo no nulo.

5. Los cj son todos complejos no nulos.

A continuacion se definira la nocion de angulos entre vectores. Para esto, la ideasera generalizar lo que sucede en R2 a un espacio vectorial cualquiera. Como primerpaso, probaremos la denominada desigualdad de Cauchy-Schwarz.

Teorema A.4. Sean u y v dos vectores cualesquiera en un espacio vectorial V conproducto interno 〈·, ·〉. Entonces se cumple la siguiente desigualdad:

|〈u,v〉| ≤ ‖u‖‖v‖.

Demostracion. La desigualdad se cumple de forma casi trivial cuando v = 0, por loque continuemos la prueba suponiendo que v 6= 0. Definamos un escalar a tal que

a‖v‖2 = 〈u,v〉.

Entonces, desarrollando la norma del vector u − av y aplicando la definicion de aresulta:

0 ≤ ‖u− av‖2 = 〈u− av,u− av〉 = ‖u‖2 − |〈u,v〉|2

‖v‖2⇔ ‖u‖2‖v‖2 ≥ |〈u,v〉|2,

y tomando la raız de la desigualdad anterior resulta en lo queremos probar.

Definicion A.7. Estamos por lo tanto en condiciones de definir la nocion de anguloentre dos vectores en un espacio vectorial cualquiera, lo que notaremos como ∠(u,v).En caso que los escalares sean los reales, lo definiremos como el angulo entre −π y πque cumple:

cos (∠(u,v)) =〈u,v〉‖u‖‖v‖

.

El caso imaginario es analogo. Es importante notar que la existencia de ∠(u,v) solu-cion de la ecuacion anterior esta asegurada por la desigualdad de Cauchy-Schwarz. Esrelativamente facil verificar que el producto interno habitual para el caso R2 inducela definicion geometrica del coseno.

Ejercicio A.11. Pruebe que el producto interno habitual en R2 induce un anguloentre vectores igual al habitual.

Ejercicio A.12. Pruebe la denominada desigualdad triangular:

‖u+ v‖ ≤ ‖u‖+ ‖v‖

Ayuda: desarrolle ‖v + u‖2 en cuatro terminos y luego aplique la desigualdad deCauchy-Schwarz.

36

Page 37: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Con esta nocion de angulo es natural definir la condicion de ortogonalidad entrevectores (i.e. ∠(u,v) = ±π/2) cuando el coseno del angulo que forman sea 0. Lasiguiente definicion considera la condicion mınima necesaria para que se cumpla loanterior.

Definicion A.8. Se dice que dos vectores u y v son ortogonales si y solo si se cumplela siguiente condicion:

〈u,v〉 = 0,

y lo notaremos como u ⊥ v.

Ejercicio A.13. Sean u y v dos vectores de un espacio vectorial con producto interno.Pruebe que si u y v son ortogonales se cumple la siguiente igualdad (Teorema dePitagoras):

‖u+ v‖2 = ‖u‖2 + ‖v‖2

A.2.1. Proyeccion unidimensional

Dados dos vectores v y u 6= 0, el problema de proyeccion unidimensional se puedeplantear como expresar v en la suma de dos vectores, tal que uno de ellos sea ortogonala u (y que notaremos v⊥u) y el otro sea colineal con u (y que notaremos v|u). Porlo tanto, v⊥u ⊥ v|u.

Teorema A.5. Sean u 6= 0 y v dos vectores de un espacio vectorial con pro-ducto interno, entonces existe un unico escalar a tal que 〈v − au,u〉 = 0 y valea = 〈v,u〉/‖u‖2. Por lo tanto, expresado en la nomenclatura utilizada hasta ahora,v⊥u = v − au y v|u = av, con v⊥u ⊥ v|u y v = v|u + v⊥u.

Ejercicio A.14. Pruebe el teorema anterior.

A.2.2. Bases ortonormales y proyeccion sobre subespacios

Definicion A.9. En un espacio vectorial V con producto interno 〈·, ·〉, un conjuntode vectores v1, . . . ,vn se denomina ortonormal si y solo si

〈vi,vj〉 =

1, i = j

0, i 6= j.

Es decir, un conjunto es ortonormal si todos sus elementos son vectores de nor-ma igual a 1 y ortogonales entre si. Esta claro que cualquier conjunto ortogonal (i.e.que cumple unicamente la segunda condicion, y que no contiene al vector nulo) esfacilmente “normalizable”. En base a estos conjunto ortonormales veremos como pro-yectar un vector sobre un sub-espacio, generalizando ası el resultado obtenido en laseccion anterior.

Teorema A.6. Sea S un subespacio de dimension n del espacio con producto internoV , siendo φ1, . . . ,φn una base de S que ademas es ortonormal. Entonces, para todov ∈ V , existe un unico v|S ∈ S tal que 〈v − v|S , s〉 = 0∀s ∈ S. Ademas,

v|S =

n∑i=1

〈v,φi〉φi

37

Page 38: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Demostracion. Tomaremos v|S como un vector cualquiera en S (y que por tanto puedeescribirse como v|S =

∑i aiφi) y trataremos de establecer las condiciones bajo las

cuales v− v|S es ortogonal a todo s ∈ S. Por lo pronto, en terminos de los elementosde la base es facil ver que esta condicion se cumple si y solo si

〈v − v|S ,φi〉 = 0, ∀i = 1, . . . , n.

Aplicando la regla distributiva para el producto interno, lo anterior es equivalentea:

〈v,φi〉 = 〈v|S ,φi〉 =

n∑j=1

aj〈φj ,φi〉 = ai, ∀i = 1, . . . , n.

Lo anterior quiere decir que v − v|S es perpendicular a todo s ∈ S si y solo si elconjunto de escalares aii=1,...,n que define a v|S en la base φii=1,...,n es igual a〈v,φi〉i=1,...,n. Esto ademas significa que este v|S es unico.

Ejercicio A.15. El teorema anterior requiere la existencia de una base ortonormal.Brinde un metodo para, a partir de una base cualquiera, construir una ortonormal.

Corolario A.1. Sea v un vector cualquiera en V y S un subespacio finito-dimensionalcuya base es φ1, . . . ,φn. Se define v|S =

∑ni=1〈v,φi〉φi. Entonces ‖v − v|S‖ ≤

‖v − s‖ ∀s ∈ S, con igualdad unicamente cuando s = v|S.

Demostracion. Tomemos un vector s ∈ S cualquiera.

v = v|S + v⊥S ⇒ v − s = (v|S − s) + v⊥S

Ahora bien, como v|S y s estan en S, entonces tambien lo esta v|S − s. Por lo tanto,el vector (v|S − s) es perpendicular a v⊥S . Entonces, por el teorema de Pitagoras,

‖v − s‖2 = ‖v|S − s‖2 + ‖v⊥S‖2 ≥ ‖v⊥S‖2 = ‖v − v|S‖2.

La igualdad se cumple unicamente cuando ‖v|S − s‖ = 0, y por tanto v|S = s.

A.2.3. Dimension del espacio vectorial de funciones L2

Antes de finalizar esta seccion, verificaremos que el espacio vectorial de las funcio-nes L2 no es finito-dimensional. Para ello, primero plantearemos el siguiente lema.

Lema A.1. Sea v1, . . . ,vn un conjunto ortonormal. Entonces el conjunto tambienes linealmente independiente.

Ejercicio A.16. Pruebe el lema anterior.

Considere la siguiente funcion L2 parametrica en k ∈ Z:

φk(t) = ej2πkt rect(t).

Es facil ver que 〈φk,φk〉 = ‖φk‖2 = 1. Ademas,

〈φk,φk′〉 =

∫ 1

0

ej2π(k−k′)tdt = 0∀k 6= k′ ∈ Z.

38

Page 39: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Por lo tanto, el conjunto φ−k, . . . ,φ0, . . . ,φk es ortonormal para todo valor dek, y por lo tanto es linealmente independiente por el lema anterior. Entonces, por elteorema A.3, la dimension del espacio vectorial de funciones L2 es al menos 2k + 1.Pero como k puede ser cualquier natural, entonces el espacio no es de dimension finita.

39

Page 40: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

40

Page 41: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Capıtulo 2

Introduccion al Analisis enFrecuencia

2.1. Introduccion

Para todo sistema de comunicaciones inalambrico la limitante mas importante es elespectro que puede ocupar la senal transmitida. Es decir, cuantos Hertz puede ocupardicha senal y centrada en que frecuencia. Para los lectores que tengan cierta formacionen ingenierıa electrica, estos conceptos le deberıan ser bastante familiares. Atendiendoa aquellos lectores no versados en esta area, y tambien con el fin de hacer este textolo mas auto-contenido posible, dedicaremos este capıtulo a repasar la Representacionen Frecuencia de una senal. Este analisis nos permitira introducir otro concepto queresultara crucial en las implementaciones que realizaremos: el denominado Teorema deMuestreo (o sobre cuando es posible que toda la senal se pueda representar unicamentepor sus muestras y como).

La representacion en frecuencia mas “tradicional” surge de tratar de descomponeruna funcion u(t) periodica de perıodo T en las funciones periodicas por excelenciaej2πkt/T = cos(2πkt/T ) + j sin(2πkt/T ), con k ∈ N, de la forma

u(t) =

∞∑k=−∞

Ukej2πkt/T . (2.1)

Visto en el plano complejo, la funcion ej2πkt/T es un punto que gira alrededor delorigen en un cırculo de radio 1 y que completa k vueltas por perıodo T (y por lo tantocon una frecuencia de giro igual a k/T vueltas por unidad de tiempo, con el signode k indicando el sentido del giro). Es por este motivo que decimos que esta es lafuncion de perıodo T por excelencia. El termino en la derecha de la ecuacion (2.1) sedenomina Serie de Fourier. En caso de poder realizar una descomposicion como esta,se podrıa decir que la energıa de la senal u(t) en la frecuencia k/T es proporcional a|Uk|2.

En nuestro caso en particular las senales periodicas tendran una utilidad muylimitada. Esta claro que una vez que el receptor recibio el primer periodo, poco leagregara recibir los que siguen. Por tanto, y tal como discutimos en el capıtulo anterior,

41

Page 42: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

nuestro interes se centrara en formas de onda de duracion finita, y sera sobre esasfunciones que aplicaremos la teorıa de las series de Fourier. En particular, adaptaremosla teorıa desarrollada en el capıtulo anterior sobre el espacio de las funciones L2 paraver cuando y que sentido tiene una descomposicion del tipo de la ecuacion (2.1).

2.2. Series de Fourier

2.2.1. Aproximacion en un espacio de dimension finita

Nuestro objetivo ultimo para esta seccion sera encontrar que bajo que condicionestiene sentido una ecuacion de la forma:

u(t) =

∞∑k=−∞

Ukej2πkt/T rect(t/T ), (2.2)

donde u(t) es una funcion L2 de soporte en el intervalo [−T/2, T/2]. Consideremoscomo primer paso el conjunto finito de vectores ortonormales φkk=−K,...,K , corres-pondientes a las funciones (cf. la seccion A.2.3 donde se discute el conjunto)

φk(t) =

√1

Tej2πt/T rect(t/T ),

las cuales generan un subespacio S(K) de dimension 2K+1.1 Se puede usar el teorema1.1 para encontrar la mejor aproximacion de u (el vector correspondiente a u(t))dentro de S(K) como:

u|S(K) =

K∑k=−K

〈u,φk〉φk.

En el dominio de las funciones, y para esta base en particular, la ecuacion anterior esequivalente a

u|S(K)(t) =

K∑k=−K

a(K)k

√1

Tej2πkt/T rect(t/T )

con a(K)k =

√1

T

∫ T/2

−T/2u(t)e−j2πkt/T .

Por tanto, si definimos U(K)k = a

(K)k

√1/T (denominados coeficientes de Fourier)

llegamos a una igualdad muy similar a la de la ecuacion (2.2):

u|S(K)(t) =

K∑k=−K

U(K)k ej2πkt/T rect(t/T ) (2.3)

Vale la pena recordar que cuando pasamos del espacio vectorial con productointerno de las funciones L2 al dominio de las funciones propiamente dichas, igualdades

1Preferimos usar la notacion S(K) y no la quiza mas natural S(2K+1) para simplificar la lecturay la presentacion.

42

Page 43: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

como la de la ecuacion anterior no deben tomarse como ciertas para todo t. Estas sonen el sentido de que la energıa de la diferencia entre ambas funciones es nula, que paraser mas concretos significa que pueden diferir a lo sumo en un conjunto numerable depuntos.

Comparando las ecuaciones (2.2) y (2.3), la pregunta que resta entonces es verque sucede con u|S(K)(t) a medida que K aumenta. Por lo pronto es facil verificar que

U(K)k no depende de K, por lo que de aquı en adelante omitiremos el supra-ındice que

explicita la base. Este hecho, que parece relativamente menor, es importante cuandose realicen aproximaciones de la funcion u(t) por una truncacion de la serie de Fourier(i.e. por u|S(K)(t)): el valor de los coeficientes Uk no depende de cuantos elementos sevayan a tomar en dicha truncacion.

La siguiente observacion relativamente inmediata es notar que u− u|S(K) es per-pendicular a u|S(K) (cf. teorema 1.1) y que por el teorema de Pitagoras (cf. ejercicioA.13) vale la siguiente igualdad:

‖u‖2 = ‖u|S(K)‖2 + ‖u− u|S(K)‖2. (2.4)

La primer consecuencia de la igualdad anterior tiene que ver con la norma delerror de aproximar u por u|S(K) , pues

‖u− u|S(K)‖2 = ‖u‖2 − ‖u|S(K)‖2 ≥ 0.

Como ‖u|S(K)‖2 = T∑Kk=−K |Uk|2 y |Uk|2 es un numero no negativo, aumentar K

nunca significara un aumento en la norma del error. Es decir, la norma del error es nocreciente en K. Esto significa que cada termino que agreguemos a la serie truncada(2.3) siempre mejora (o mejor dicho, no empeora) la precision de la aproximacion.

La segunda consecuencia importante de la ecuacion (2.4) es que

‖u|S(K)‖2 = T

K∑k=−K

|Uk|2 ≤ ‖u‖2.

Como la igualdad anterior es valida para cualquier K y solo suma numeros no ne-gativos, no hay problema en tomar el lımite en K. Por lo tanto, quedo probado elsiguiente teorema, denominado Desigualdad de Bessel.

Teorema 2.1. Sea u(t) una funcion L2 de soporte en el intervalo [−T/2, T/2] yUk =

∫u(t)ej2πkt/T dt. Entonces vale la siguiente desigualdad:

T

∞∑k=−∞

|Uk|2 ≤ ‖u‖2 =

∫ ∞−∞|u(t)|2dt <∞. (2.5)

Ejercicio 2.1. Naturalmente, el teorema anterior se puede expresar para cualquierconjunto ortonormal de vectores, y no solo para φk(t) = ej2πkt/T rect(t/T ). Escriba ypruebe esta version mas general.

La desigualdad de Bessel tiene como consecuencia que la serie a la izquierda de(2.5) converge, por lo que los |Uk| son acotados para todo k, y ademas |Uk| −→

|k|→∞0.

Ejercicio 2.2. Mostrar que ninguna funcion L2 con soporte en [−T/2, T/2] tienecomo coeficientes de Fourier a Uk = 1/ log(|k|).

43

Page 44: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

2.2.2. Espacios de Hilbert

Por ahora hemos probado que, para funciones L2 de soporte finito, los coeficientesde Fourier Uk estan bien definidos para cualquier k y que cumplen algunas propie-dades de convergencia. Nos faltarıa ver si la funcion u|S(K)(t) converge (o el vectorcorrespondiente), y en que sentido, a u(t) a medida que K va al infinito. Lo prime-ro que haremos entonces sera definir convergencia en nuestro contexto de espaciosvectoriales.

Definicion 2.1. Una secuencia de vectores (un)n∈N en un espacio vectorial V (i.e.un ∈ V ∀n) con norma ‖ · ‖ se dice que converge a u ∈ V (en norma) si y solo si paratodo ε > 0 existe un entero positivo N tal que ‖u − un‖ < ε para todo n > N . Enese caso usaremos las notaciones habituales:

lımn→∞

un = u,

un → u.

Notar que esta definicion significa que un → u si y solo si ‖un − u‖ → 0.

Ejercicio 2.3. Usando la desigualdad triangular inversa, probar que si un → uentonces se cumple que

‖u‖ = lımn→∞

‖un‖.

Por tanto, la convergencia se refiere a secuencias de vectores tales que los elementosde la misma se vuelven arbitrariamente cercanos al lımite. Es facil probar que esto asu vez significa que los elementos de la secuencia tambien se vuelven arbitrariamentecercanos entre sı. Esto define lo que se denomina una secuencia de Cauchy.

Definicion 2.2. Una secuencia de vectores (un)n∈N en un espacio vectorial V connorma ‖ · ‖ se dice de Cauchy si para todo ε > 0 existe un entero positivo N tal que‖un − um‖ < ε para todo n,m > N .

Ejemplo 2.1. Consideremos la secuencia de vectores (uK)K∈N definida por

uK =

K∑k=−K

akφk, (2.6)

donde asumiremos que los numeros ak cumplen que∑k |ak|2 < ∞ y que φkk∈Z

forman un conjunto ortonormal en el espacio vectorial V . Por lo tanto, cada uK es unacombinacion lineal del conjunto ortonormal, y por tanto un elemento de V . Ademas,considerando n > m

‖un − um‖2 =∑

m<|k|≤n

|ak|2 ≤∑|k|>m

|ak|2.

La serie de la derecha debe ir a cero cuando m→∞ pues supusimos que∑|ak|2 <

∞. Por lo tanto, la sucesion (2.6) es de Cauchy.

44

Page 45: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Una caracterıstica deseable para cualquier espacio es que todas las secuencias deCauchy tengan lımite dentro del espacio. Esto significara que el mismo no tiene “agu-jeros” a los que se llega a partir de elementos del propio espacio. Es esta interpretacionla razon por la que se denominan completos a los espacios que cumplen esta propie-dad. Es mas, los espacios vectoriales con producto interno (como las funciones L2)que tambien son completos se denominan de Hilbert. Lamentablemente, no todos losespacios cumplen esta propiedad tal y como lo muestra el siguiente ejemplo.

Ejemplo 2.2. Considere el espacio vectorial de los numeros racionales, y la secuenciadefinida por la siguiente recurrencia:

xn+1 =xn2

+1

xn.

La secuencia es claramente de Cauchy, y si x0 es racional entonces lo seran todoslos elementos de la misma. Sin embargo, el lımite x de esta secuencia debe cumplirx2 = 2 (a lo que se llega fijando xn = xn+1 = x en la ecuacion anterior) lo que ningunracional cumple. Por lo tanto los racionales son un espacio vectorial incompleto.

Esto deberıa dejar claro que los espacios de Hilbert son aquellos en los que laintuicion adquirida de trabajar repetidamente sobre Rn sigue funcionando. Es decir,son espacios que tienen distancia, angulos y lımites siempre bien definidos. ¿El espaciovectorial de las funciones L2 es de Hilbert? Afortunadamente sı. No incluiremos laprueba de esto, pero es importante remarcar que en ella se hace necesario trabajarcon integrales de Lebesgue. Es mas, las funciones que son integrables por Riemannno forman un espacio completo.

Por lo tanto, el hecho que el espacio vectorial de funciones L2 sea completo, juntocon el ejemplo 2.1 y recordando la desigualdad del teorema 2.1, nos permiten probarque existe el lımite

u|(t) = lımK→∞

u|S(K)(t) =∑k∈Z

Ukej2πkt/T rect(t/T ),

Uk =1

T

∫ T/2

−T/2u(t)e−j2πkt/T ,

y que el mismo se encuentra dentro de las funciones L2. Ademas, por lo probado enel ejercicio 2.3, la norma del vector proyectado vale ‖u|‖2 = T

∑k∈Z |Uk|2. Tambien

nos permite probar el recıproco, en el sentido que para cualquier sucesion de valorescomplejos (Uk)k∈Z que cumplan que

∑k∈Z |Uk|2 <∞ existe una funcion u|(t) en L2

tal que

u|(t) =∑k∈Z

Ukej2πkt/T rect(t/T ),

‖u|‖2 = T∑k∈Z|Uk|2.

Ejercicio 2.4. Imite el razonamiento realizado hasta ahora para probar la siguienteversion mas general de lo que acabamos de discutir. Este teorema se podrıa entendercomo una generalizacion del teorema de proyeccion visto en el capıtulo anterior, pero

45

Page 46: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

a subespacios de dimension infinita. Sea φkk∈Z un conjunto ortonormal de vectoresen un espacio de Hilbert H (e.g. las funciones L2). Sea u un vector cualquiera en H.Entonces existe un unico vector u| ∈ H tal que u| − u = u⊥ es ortogonal a todos losφk y

lımK→∞

K∑k=−K

〈u,φk〉φk =∑k∈Z〈u,φk〉φk = u|,

‖u|‖2 =∑k∈Z|〈u,φk〉|2 <∞.

El recıproco tambien es cierto, en el sentido que dada una secuencia de complejos(ak)k∈Z con

∑k∈Z |ak|2 <∞, entonces existe un vector u ∈ H tal que u =

∑k∈Z akφk

y ‖u‖2 =∑k∈Z |ak|2.

2.2.3. ¿Una base para las funciones L2?

Nos estamos acercando a nuestro objetivo de probar una igualdad como la de laecuacion (2.2). En particular, y siguiendo la nomenclatura de la seccion anterior, nosfaltarıa probar que u| (el lımite de u|S(K) cuando K va a infinito) es igual a u, queequivale a probar que ‖u − u|‖ = 0. Por ahora sabemos que la energıa del error‖u− u|S(K)‖2 es no creciente en K. ¿Pero tiende a cero?

Ahora bien, como vimos en el ejercicio 2.4, u| puede ser interpretado como la pro-yeccion de u al subespacio generado por el conjunto ortonormal φkk∈Z correspon-diente a las funciones φk(t) = ej2πkt/T rect(t/T )/

√T . Entonces, el vector diferencia

(i.e. u⊥ = u−u|) es perpendicular al espacio generado por el conjunto φkk∈Z. Estevector debe ser entonces perpendicular a todos los φk. Si lograramos mostrar que elunico vector que cumple esto ultimo es el vector nulo, quedarıa finalmente probadoque u = u|. El teorema que sigue es un primer paso considerando un subconjunto delas funciones L2.

Teorema 2.2. Sea V el espacio vectorial de las funciones L2 con soporte en el inter-valo [−T/2, T/2]. Sea S el conjunto de elementos de V correspondientes a las funcio-nes u(t) tales que la extension periodica de u(t) es continua (la extension periodicaes una funcion, valga la redundancia, periodica e igual a u(t) en [−T/2, T/2]).

Sea φkk∈Z el conjunto de vectores de V correspondiente a las funciones

φk(t) =1√Tej2πkt/T rect(t/T ).

Sea u ∈ S un vector que cumple 〈u,φk〉 = 0 ∀k ∈ Z. Entonces u = 0.

Demostracion. Sabemos que

〈u,φk〉 =1√T

∫ T/2

−T/2u(t)e−j2πkt/T dt = 0∀k ∈ Z.

Podemos ignorar el factor normalizador 1/√T y multiplicar ej2πs/T , donde s es una

constante, que la ecuacion anterior se sigue cumpliendo de la forma:∫ T/2

−T/2u(t)e−j2πk(t−s)/T dt =

∫ T/2−s

−T/2−su(t+ s)ej2πkt/T dt = 0∀k ∈ Z.

46

Page 47: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

−1.5 −1 −0.5 0 0.5 1 1.50

0.2

0.4

0.6

0.8

1

t

Q1(t)

−0.5−s 0.5−s−δ δ−s

α

Figura 2.1: Qn(t) para n = 1 y T = 1.

De aquı en mas supondremos que −T/2 < s < T/2. La prueba para s arbitrariamentecerca a T/2 o −T/2 es analoga a lo que sigue (teniendo en cuenta la definicion decontinuidad que manejamos antes) y queda como ejercicio.

Ahora bien, cos(πt/T )2n =[

1+cos(2πt/T )2

]n=[

1+(ej2πt/T+e−j2πt/T )/22

]n, por lo que

es una combinacion lineal de varias exponenciales de la forma ej2πkt/T . Por lo tantose debe cumplir la igualdad

∫ T/2−s

−T/2−su(t+ s) cos(πt/T )2ndt = 0∀n ∈ N,

por lo que tambien es verdad que

∫ T/2−s

−T/2−s(u(s)− u(t+ s)) cos(πt/T )2ndt =

= u(s)

∫ T/2−s

−T/2−scos(πt/T )2ndt = u(s)Cn,

donde Cn es el resultado de la integral. En lo que sigue de la demostracion quedaraclaro porque la eleccion de Qn(t) = cos(πt/T )2n, a priori tan arbitraria. La figura 2.1muestra su grafica, que remarca el hecho que esta es siempre positiva y menor a 1.Ademas, el maximo se alcanza en los multiplos de T .

Tomando la ultima igualdad y aplicando el valor absoluto llegamos a la siguientedesigualdad:

|u(s)| ≤ 1

Cn

∫ T/2−s

−T/2−s|u(s)− u(s+ t)| cos(πt/T )2ndt.

Dado que u(t) es continua, para todo ε > 0 existe un δ > 0 tal que |u(s)−u(s+t)| <ε si |t| < δ. Por tanto, partiremos la integral anterior en dos partes: con t en el intervalo[−δ, δ] y fuera de este intervalo (cf. figura 2.1). Por ultimo, otra consecuencia de queu(t) sea continua y L2 es que tiene un supremo finito, que denominaremos U . Esto

47

Page 48: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

resulta en:

|u(s)| ≤ 1

Cn

∫ δ

−δ|u(s)− u(t+ s)|︸ ︷︷ ︸

cos(πt/T )2ndt+

+1

Cn

∫[−T/2−s,−δ]∪[δ,T/2−s]

<2U︷ ︸︸ ︷|u(s)− u(t+ s)|

[cos(πt/T )2︸ ︷︷ ︸<cos(πδ/T )2=α

]n.

Por lo tanto, vale la desigualdad

|u(s)| ≤ ε

CnCn + 2UT

αn

Cn. (2.7)

Ahora bien, como 0 < α < 1 y ε es arbitrariamente pequeno, parecerıa quepodrıamos hacer |u(s)| arbitrariamente pequeno para un n suficientemente grande.En realidad el factor que importa es αn/Cn, y faltarıa verificar que este cociente seva a cero con n. Para ello hay que resolver la integral de Qn(t) en un perıodo, queresulta en Cn =

(2nn

)T/22n (utilizar la formula estandar para la potencia par de un

coseno), que para n grande se puede aproximar (desigualdad de Stirling mediante)por Cn ≈ T/

√πn. Por lo tanto, Cn se va a cero, pero mas lentamente que αn, por lo

que terminamos la prueba.

Quiza el lector se haya percatado del hecho de que asumimos propiedades sobreu(t) para valores particulares de t. Esto es, aunque hayamos definido u como el vectordel espacio L2 correspondiente a una funcion continua, este vector se refiere a unaclase de equivalencia, que incluye funciones no continuas (como mucho en un conjuntonumerable de puntos). Esto a priori puede representar un problema, pero lo esencialen la prueba es la desigualdad (2.7). Esta sera verdad para todo punto s tal que lafuncion u(s) es continua, lo que es cierto en casi todo punto, por lo que el problemano es tal.

Acabamos de probar entonces que cualquier vector del espacio L2 correspondientea una funcion con soporte en [−T/2, T/2], y tal que su extension periodica es conti-nua, se puede aproximar arbitrariamente por una combinacion lineal de los vectorescorrespondientes a las funciones φk(t) = ej2πkt/T rect(t/T ). ¿Que falta para obtenerel resultado general, incluyendo cualquier funcion L2 con soporte acotado? No mucho.Se puede probar que, analogamente a lo que sucede entre racionales y reales, toda fun-cion L2 tiene una funcion continua (en su extension periodica) arbitrariamente cerca,por lo que queda demostrado el caso general, que dejaremos planteado a continuacion.

Teorema 2.3. Sea u(t) : [−T/2, T/2] → C una funcion L2. Entonces, para todok ∈ Z, se definen los coeficientes de Fourier Uk por la integral de Lebesgue

Uk =1

T

∫ T/2

−T/2u(t)e−j2πkt/T dt.

48

Page 49: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Estos existen, son finitos y cumplen las siguientes propiedades:

‖u‖2 =

∫ T/2

−T/2|u(t)|2dt = T

∑k∈Z|Uk|2,

u(t) =∑k∈Z

Ukej2πkt/T rect(t/T ).

La ultima igualdad debe entenderse en el sentido L2, o para ser mas explıcitos:

lımK→∞

∫ T/2

−T/2

∣∣∣∣∣u(t)−K∑

k=−K

Ukej2πkt/T

∣∣∣∣∣2

dt = 0

El siguiente ejercicio pone en evidencia lo que sucede en los eventuales puntos dediscontinuidad de la funcion u(t). Ademas, la funcion tiene un soporte no centrado encero, lo cual no cambia en nada la teorıa desarrollada hasta ahora, siendo parte delejercicio realizar los (mınimos y casi obvios) ajustes corrrespondientes.

Ejercicio 2.5. Considere la funcion u(t) = (π − t)/2 con soporte entre 0 y 2π.

1. Encuentre una expresion para los coeficientes de Fourier Uk de u(t) y pruebeque

π − t2

rect

(t− π2π

)=∑k>0

1

ksin(kt) rect

(t− π2π

).

En una nota historica, esta expresion ya era conocida por Euler mas de veinteanos antes que naciera Fourier.

2. Utilizando su programa de calculo favorito, grafique uK(t) =∑Kk=−K Uke

jkt rect(t−π2π

)para distintos valores de K, y verifique que a medida que este aumenta el vectorun converge a u en el sentido L2. Preste especial atencion a t = 0 y t = 2π, ynote que por mas grande que sea K, uK(t) siempre sera cero en esos puntos, yno π/2 y −π/2 como u(t).

2.2.4. Transformada de Fourier en Tiempo Discreto

Consideremos ahora lo que podrıamos denominar el recıproco del teorema 2.3.Partimos de una sucesion de complejos (u[k])k∈Z, tales que

∑k |u[k]|2 <∞, en cuyo

caso la funcion

U(f) =∑k

u[k]ej2πkf/2W rect(f/2W )

es L2 al ser el lımite de una sucesion de Cauchy. Notar que esta funcion no es masque la serie de Fourier estandar, donde simplemente sustituimos Uk por u[k], t por fy T por 2W .

Sin embargo, esta perspectiva nos brinda la definicion de la Transformada de Fou-rier en Tiempo Discreto (DTFT por sus siglas en ingles) de la secuencia a tiempo

49

Page 50: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

discreto (u[k])k. Es importante remarcar que el valor de W puede ser fijado arbitra-riamente, por lo que muchas veces se encontrara una definicion de la DTFT de laforma:

UDTFT (Ω) = U(ejΩ) =∑k

u[k]e−jΩk, (2.8)

donde Ω = −2πf/2W , y se omite la funcion rect(Ω/2π) (resultando por tanto en

una funcion periodica de perıodo 2π). La notacion U(ejΩ

) seguramente impresione allector como extrana. Por razones que quedaran claras en otro capıtulo, es la notacionhabitual en la literatura. Ademas, nos servira para distinguir entre transformada deFourier a tiempo continuo y discreto.

En todo caso, y dado los resultados que hemos obtenido hasta ahora, ya estaprobado el siguiente resultado.

Teorema 2.4. Sea (u[k])k∈Z una secuencia de complejos tal que∑k |u[k]|2 < ∞.

Entonces existe U(ejΩ) tal como se define en (2.8) (denominada DTFT), si se laconsidera en un unico perıodo es L2 y cumple las siguientes propiedades:

u[k] =1

∫ π

−πU(ejΩ)ejkΩdΩ

∞∑k=−∞

|u[k]|2 =1

∫ π

−π

∣∣U(ejω)∣∣2 dΩ.

En esta formulacion∑k |u[k]|2 se puede interpretar como la energıa de la sucesion,

por lo que U(ejΩ) expresa la densidad de potencia en cada Ω. Respecto a este ultimo,si u[k] se obtiene de muestrear una funcion en tiempo continuo, tendra unidades deradianes por muestra.

2.3. Senales con soporte no acotado: la Transforma-da de Fourier

¿Que sucede cuando el soporte de u(t) no es acotado? Una primera respuesta essimplemente partir la recta real en una sucesion de intervalos de ancho T y considerarla serie de Fourier de la funcion definida unicamente en ese intervalo, para luegosuperponer todas esas series.

Para ser mas explıcitos, definamos um(t) como

um(t) =

u(t); mT − T/2 ≤ t < mT + T/2

0; sino= u(t) rect

(t−mTT

),

para la que vale la siguiente igualdad:

u(t) =∑m∈Z

um(t) =∑m∈Z

∑k∈Z

Uk,mej2πkt/T rect

(t

T−m

), (2.9)

Uk,m =1

T

∫ mT+T/2

mT−T/2u(t)e−j2πkt/T dt (2.10)

50

Page 51: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Es basicamente de esta forma se calculan los denominados espectrogramas, muyusados en procesamiento de audio. Estos son una imagen en alguna escala de coloresmostrando en cada par (mT, k/T ) el nivel de energıa presente (i.e. el valor de T |Uk,m|2,o alguna funcion de la misma).

Es importante remarcar que lo anterior puede verse como la descomposicion decualquier funcion L2 (de soporte temporal arbitrario) en la base ortonormal dada porφk,m, correspondiente a las funciones:

φk,m(t) =1√Tej2πkt/T rect(t/T −m).

Por lo tanto podemos aplicar el teorema probado en el ejercicio 2.4, para probarla siguiente igualdad:

‖u‖2 =

∫ ∞−∞|u(t)|2dt = T

∑k,m∈Z

|Uk,m|2 <∞

La desventaja que tiene este analisis es la dificultad en fijar el valor de T , quesiempre sera arbitrario, y que es quien limita la resolucion espectral. Es decir, ¿comosabemos cuanta energıa hay en la componente frecuencial entre k/T y (k + 1)/T?La respuesta se obtiene re-calculando los coeficientes Uk,m con un ancho de ventanaduplicado. De llevar este razonamiento a componentes frecuenciales arbitrarias (i.e.T →∞) es que surge la Transformada de Fourier.

Es decir, en la serie de Fourier nuestra intencion era re-escribir la funcion u(t) de so-porte en [−T/2, T/2] como una combinacion lineal de las funciones ej2πkt/T rect(t/T )(a frecuencia k/T , con k ∈ Z). Ahora nuestro objetivo es poder encontrar la com-ponente de u(t) a frecuencias arbitraria y por tanto poder re-escribirla como unacombinacion de las funciones ej2πft (a frecuencia f , con f ∈ R). Naturalmente, enlugar de una sumatoria, tendremos una integral, de la forma:

u(t) =

∫ ∞−∞

U(f)ej2πftdt. (2.11)

Sobre el final de esta seccion habremos probado que U(f) se puede encontrar atraves de la siguiente integral, que define la Transformada de Fourier:

U(f) =

∫ ∞−∞

u(t)e−j2πftdt, (2.12)

y ademas que ambas igualdades son en el sentido de la norma L2, como sucedio enla Serie de Fourier. Nuestro primer paso sera probar que U(f) existe y es L2, para loque necesitaremos dos resultados preliminares. Lo primero sera probar que U(f) existepara un sub-conjunto de las funciones L2, y lo segundo seran algunas propiedades dela transformada (en caso que exista) que nos seran utiles mas adelante.

Teorema 2.5. Sea u(t) una funcion L2 tal que ademas∫|u(t)|dt < ∞ (la no-

tacion habitual para este tipo de funciones es simplemente L1), entonces U(f) =∫u(t)e−j2πftdt existe y satisface |U(f)| ≤

∫|u(t)|dt para todo f ∈ R. Ademas, U(f)

es continua.

51

Page 52: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Demostracion.

|U(f)| ≤∫ ∞−∞

∣∣u(t)e−j2πft∣∣ dt =

∫ ∞−∞|u(t)| dt <∞,

lo que prueba la existencia y la cota para todo t, f ∈ R. Ademas,

|U(f + h)− U(f)| =∣∣∣∣∫ ∞−∞

u(t)e−j2πft(e−j2πfh − 1

)dt

∣∣∣∣ ≤≤∫ ∞−∞|u(t)|

∣∣e−j2πfh − 1∣∣ dt →

|h|→00,

por lo que la diferencia |U(f +h)−U(f)| puede hacerse arbitrariamente pequena conun h suficientemente pequeno, lo que prueba la continuidad.

Ejemplo 2.3. Un ejemplo clasico que usaremos a continuacion es u(t) = rect(t).Esta funcion es claramente L1, y ademas se puede probar que su transformada deFourier es igual a

U(f) = sinc(f) =

sin(πf)πf ; f 6= 0

1; f = 0,

la cual es continua tal cual prueba el teorema.

Ejercicio 2.6. Pruebe que si la transformada de Fourier de u(t) es U(f) y la de v(t)es V (f), entonces se cumplen las siguientes propiedades:

1. La transformada de u(t− τ) es igual a U(f)e−j2πfτ .

2. La transformada de u(t)ej2πf0t es U(f − f0).

3. La transformada de∫∞−∞ u(τ)v(t− τ)dτ es U(f)V (f). Verifique primero que si

u(t) y v(t) son L1, entonces tambien lo sera la integral. Esto garantiza la exis-tencia de la transformada con lo que tenemos hasta ahora (ademas de permitirleintercambiar los ordenes de integracion en la prueba).

4. u(0) =∫∞−∞ U(f)df .

5.∫∞−∞ u(t)v∗(t)dt =

∫∞−∞ U(f)V ∗(f)df . Ayuda: combine la propiedad anterior con

una variacion menor de la propiedad 3.

Ahora que verificamos la existencia de U(f) para funciones L1, vamos a utilizarla descomposicion de la ecuacion (2.9) para verificarla en el caso de funciones L2,para lo que nos apoyaremos en varias de las propiedades probadas en el ejercicio 2.6.Partamos de una suma parcial de la serie que, siguiendo la nomenclatura que usamosen las secciones anteriores, para T = 1 esta dada por

u|S(K,M)(t) =

M∑m=−M

K∑k=−K

Uk,mej2πkt rect(t−m).

52

Page 53: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Esta funcion es L1 (al ser L2 y de soporte acotado), y por tanto tiene su transformadade Fourier bien definida. Es mas, combinando el ultimo ejemplo y las primeras dospropiedades del ejercicio anterior se prueba que la transformada en este caso vale

U|S(K,M)(f) =

M∑m=−M

K∑k=−K

Uk,me−j2πfm sinc(f − k).

Ejercicio 2.7. Pruebe que el conjunto de vectores ψk,mk,m∈Z del espacio L2 dado

por las funciones ψk,m(t) = e−j2πfm sinc(f − k) es un conjunto ortonormal. Ayuda:utilice la ultima propiedad del ejercicio 2.6.

Con el ejercicio anterior, y tomando en cuenta que∑k,m |Uk,m|2 = ‖u‖2 < ∞

(T = 1), estamos nuevamente en condiciones de aplicar el teorema probado en elejercicio 2.4, por lo que verificamos que el lımite en K y M de U|S(K,M)(f) existe,

es una funcion L2 y su energıa es∑k,m |Uk,m|2. Ahora bien, definamos la funcion

auxiliar de soporte acotado dada por:

uM (t) = u(t) rect

(t

1 + 2M

)=

M∑m=−M

∑k∈Z

Uk,mej2πkt rect(t−m).

Esta claro que esta funcion tambien es L1, por lo que tambien tiene su transformadade Fourier bien definida, la que llamaremos UM (f), y que se puede escribir como:

UM (f) =

∫ M+ 12

−M− 12

u(t)e−j2πftdt.

Comparando la ecuacion anterior y (2.12), es facil verificar que la definicion deU(f) es el lımite en M de UM (f), que es precisamente el lımite en K y M deU|S(K,M)(f), que ya probamos que estaba bien definida y era L2. La discusion an-terior prueba por tanto el siguiente teorema.

Teorema 2.6. Sean u(t) una funcion L2, uA(t) = u(t) rect(t/2A), y U(f), UA(f) susrespectivas transformadas de Fourier, tal como se define en (2.12). Entonces U(f)existe, es L2 y valen las siguientes igualdades:

lımA→∞

∫ ∞−∞|U(f)− UA(f)|2df = 0,∫ ∞

−∞|u(t)|2dt =

∫ ∞−∞|U(f)|2df.

De manera similar a como se procedio con la transformada, podemos probar elsiguiente teorema.

Teorema 2.7. Sea u(t) una funcion L2 y U(f) su transformada de Fourier. Sea asu vez uB(t) la anti-transformadas de Fourier, tal como se define en (2.11), de lafuncion UB(f) = U(f) rect(f/2B). Entonces

lımB→∞

∫ ∞−∞|u(t)− uB(t)|2dt = 0,∫ ∞

−∞|U(f)|2df =

∫ ∞−∞|u(t)|2dt.

53

Page 54: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ejercicio 2.8. Pruebe el teorema anterior. Para ello, verifique que la transformada yla anti-transformada son en realidad operaciones muy similares, por lo que la pruebade la existencia de la anti-transformada es casi trivial con lo que ya probamos. Ladificultad principal reside en probar que uB(t) es L2 equivalente a u(t) en el lımite,para lo que debera lograr escribir lımB uB(t) como el lımite en K y M de u|S(K,M)(t).

Remarquemos brevemente la ultima igualdad en los teoremas 2.6 y 2.7. Tal y comodiscutimos tanto para la serie de Fourier como en la DTFT, si la integral temporalde |u(t)|2 simboliza la energıa de la senal, entonces el valor puntual en t (i.e. |u(t)|2)es la potencia en ese instante. En este sentido entonces, se entiende |U(f)|2 como lapotencia de la senal a la frecuencia f . Es por este motivo que el rango de frecuencias(o valores de f) para las cuales |U(f)| es mayor a cero (o al menos de un valorsignificativo) se denomina ancho de banda de la senal. Existe un concepto asociado aesto, y son las senales denominadas bandabase. Estas generalmente se definen comoaquellas que tienen una transformada de Fourier de soporte acotado (tıpicamenteincluyendo a f = 0). Mas adelante precisaremos esta definicion, relacionandolo con elteorema de muestreo.

Ejemplo 2.4. Ya vimos en el ejemplo 2.3 que la transformada de Fourier de u(t) =rect(t) es U(f) = sinc(f). Es posible calcular la anti-transformada de U(f) tomandoel lımite en B como se discutio en el teorema anterior, teniendo como resultado lasiguiente funcion:

lımB→∞

uB(t) =

1; |t| < 1/2

1/2; |t| = 1/2

0; |t| > 1/2.

Notar que la expresion anterior no coincide con rect(t) en t = ±1/2. Es mas,la definicion de rect(t) en esos dos puntos difiere entre autores, pudiendo ser 0, 1/2o 1. A esta altura del texto, deberıa quedar claro que en el marco de las funcionesL2 esa discusion nos es totalmente superflua, y podremos fijar el valor en ese puntoarbitrariamente sin cambiar los resultados que obtendremos.

Ejercicio 2.9. Para terminar con esta seccion, analizaremos que significa la seriede Fourier en el marco de lo que acabamos de ver. Considere una funcion u(t) desoporte acotado en [−T/2;T/2] y que ademas es L2. Por lo tanto estan bien definidossus coeficientes de Fourier Uk, ası como su transformada de Fourier U(f). Pruebeque se cumple la siguiente relacion:

U(f) =∑k∈Z

UkT sinc(fT − k),

y que por lo tanto Uk = U(k/T )/T ∀k ∈ Z. Es decir que para las funciones de soporteacotado y L2, la transformada de Fourier se puede recuperar a partir de los coeficientesde Fourier, quienes a su vez corresponden, salvo por un escalado, con sus muestrastomadas a tasa T .

54

Page 55: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

2.4. El teorema de muestreo

2.4.1. Senales bandabase

En esta seccion nos basaremos en lo desarrollado anteriormente para presentar eldenominado teorema de muestreo. Es decir, cuando y como es posible representar unafuncion continua u(t) unicamente por sus muestras u(kT ) cada tiempo T .

Para ello, partamos de una funcion en frecuencia U(f) de soporte en [−W,W ] yL2 (y por lo tanto tambien L1), y procedamos como en la seccion 2.2.4. Es decir, dadoque tiene soporte finito, podemos escribir su serie de Fourier de la forma:

U(f) =∑k∈Z

u[k]ej2πkf/2W rect(f/2W ).

Tal como se discutio en la seccion anterior, la anti-transformada u(t) existe y esL2. El calculo es similar al realizado en el ejercicio 2.9, lo que resulta en

u(t) =∑k∈Z

2Wu[k] sinc(2Wt+ k). (2.13)

Es mas, de manera muy similar al teorema 2.5, podemos probar que dado que U(f)es L1, u(t) debe ser continua. Ahora bien, conviene recordar que por su definicionsinc(t) es cero para todos los valores de t enteros, salvo para el 0, donde vale 1. Porlo tanto deducimos la siguiente igualdad:

u

(l

2W

)=∑k∈Z

2Wu[k] sinc(l + k) = 2Wu[−l].

Definamos entonces T = 1/2W , y sustituyamos lo anterior en (2.13) para hallarla siguiente igualdad, que cumple con nuestro objetivo inicial:

u(t) =∑k∈Z

u(−kT ) sinc(t/T + k) =∑k∈Z

u(kT ) sinc(t/T − k). (2.14)

Es decir, cualquier funcion que resulte de anti-transformar por Fourier una funcionL2 de soporte acotado en [−W,W ] se puede recuperar a partir de sus muestras toma-das a una tasa de 1/T = 2W muestras por segundo (es decir, como el soporte total desu representacion en frecuencia). Aquellas funciones que se pueden reconstruir de estaforma se denominan bandabase. Tal como remarcamos a continuacion y en el ejemploque sigue, no basta con que su transformada de Fourier tenga soporte acotado:

Definicion 2.3. Una funcion u(t) se dice bandabase de ancho de bandaW si es la anti-transformada de Fourier de una funcion U(f) que sea L2 y tal que U(f) = 0 ∀|f | >W . Esto es equivalente a definirla como una funcion continua cuya transformada deFourier tenga su soporte en [−W,W ]. Notar que el soporte en f es 2W , pero porrazones historicas se toman en cuenta unicamente las frecuencias positivas.

Ejemplo 2.5. Consideremos una funcion bandabase u(t) de ancho de banda 2/T .Definamos ahora v(t) = u(t) para todo t, salvo para t = kT ∀k ∈ Z, donde valdracero. Esta claro que la interpolacion por las muestras de v(t) resultante de aplicar(2.14) nos dara la funcion identicamente nula, arbitrariamente distinta de v(t). Esteejemplo sirve para ilustrar la importancia de la definicion 2.3 de bandabase, que noes simplemente que la transformada de Fourier de v(t) tenga soporte acotado.

55

Page 56: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ejercicio 2.10. Haciendo la dualidad entre f y t, re-haga el ejercicio 2.9 a la luz delresultado (2.14).

Es importante remarcar que la igualdad (2.14), a diferencia de lo que venıamostrabajando hasta ahora, es valida para todo t. Esto es debido a que ahora u(t) esnecesariamente continua, y ademas la definimos a partir de la anti-transformada deU(f).

Notese tambien que un analisis alternativo, pero totalmente equivalente, era con-siderar el conjunto de vectores ortogonales φk correspondientes a las funcionesφk(t) = sinc(t/T − k), y proceder como se hizo con la serie de Fourier. La comple-jidad en ese caso era probar que este conjunto tambien correspondıa a una base delas funciones bandabase, lo que nos evitamos en este caso basandonos en lo desarro-llado hasta ahora. De todas formas, esta observacion remarca le hecho que u(t) esuna combinacion lineal de vectores ortogonales del espacio de las funciones L2, lo quenos permitirıa aplicar lo probado en el ejercicio 2.4 para obtener la siguiente igualdadrespecto a la energıa de las funciones bandabase:∫ ∞

−∞|u(t)|2dt = T

∑k∈Z|u(kT )|2.

Por lo tanto, para este tipo de senales, el valor T |u(kT )|2 representa la potenciapor muestra.

Ejercicio 2.11. Para poder aplicar el teorema del ejercicio 2.4 hace falta verificarprimero que

∑k∈Z |u(kT )|2 <∞ para toda senal bandabase. Pruebelo.

2.4.2. Senales pasabanda

Nos interesaremos ahora al caso de senales cuyo ancho de banda no esta centradoalrededor del cero, sino en una frecuencia f0 arbitraria. De todas formas, tal como elestudiante hizo en el ejercicio 2.5, el hecho que la senal no tenga su soporte centradoen cero no impide encontrar su serie de Fourier, por lo que el procedimiento sera muysimilar a lo que se hizo antes. Sin embargo, el analisis vale la pena para remarcaralgunas propiedades importantes.

Comencemos entonces por tomar una funcion U(f) en frecuencia, tal que sea L2

y U(f) = 0∀|f − f0| > W , y calculemos su serie de Fourier:

V (f) =∑k∈Z

v[k]ej2πkf/2W rect

(f − f0

2W

).

Ahora nuevamente calculemos la anti-transformada de Fourier de esta funcion,que resulta en:

v(t) =∑k∈Z

2Wv[k] sinc(2Wt+ k)ej2πjf0(t+k/2W )

⇒ v(l/2W ) = 2Wv[−l].

56

Page 57: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

e-j2πf0t

𝑣(𝑡)

𝑡=𝑘𝑇

DAC

ej2πf0t

𝑣(𝑡)

𝑓0

𝑉(𝑓) 𝑉'(𝑓) 𝑉'(𝑓)

𝑓0

𝑉(𝑓)

𝑣'(𝑡)

Figura 2.2: La igualdad (2.15) ilustrada mediante un diagrama de bloques. El bloqueDAC (digital-to-analog conversor) es quien se encarga de realizar la interpolacionmediante las funciones sinc. El espectro de la senal en cada etapa se ilustra en laparte superior.

Por lo tanto, y definiendo T = 1/2W , obtenemos la siguiente igualdad:

v(t) =∑k∈Z

v(kT ) sinc(t/T − k)ej2πf0(t−kT )

⇒ v(t) = ej2πf0t∑k∈Z

v(kT )e−j2πf0kT sinc(t/T − k). (2.15)

Definicion 2.4. De forma analoga a las senales bandabase, definimos una senal comopasabanda si es la anti-transformada de Fourier de una funcion U(f) que sea L2 y desoporte acotado en algun intervalo [f0−W ; f0 +W ]. Una definicion alternativa es quesea continua y su transformada de Fourier existe y tiene soporte en algun intervalo[f0−W ; f0 +W ]. En este caso, nuevamente por razones historicas, se dice que la senaltiene un ancho de banda 2W .

La igualdad anterior pone en relieve que una senal pasabanda centrada en unafrecuencia arbitraria f0 se puede recuperar a traves de sus muestras tomadas a tasa2W , pero con un metodo un poco mas indirecto:

1. Primero se multiplica por e−j2πf0t, lo que por la propiedad 2 del ejercicio 2.6 laconvierte en bandabase. El proceso de convertir una senal pasabanda a banda-base se conoce generalmente como demodulacion.

2. Luego se muestrea la senal resultante a tasa 2W .

3. Para recuperar la senal a tiempo continuo se interpola mediante sinc(t/T −W ),lo que recuperarıa la senal bandabase antes mencionada. Por ello, y por lapropiedad ya citada, se la multiplica por ej2πf0t, lo que resulta en la senalpasabanda original. Al proceso de convertir una senal bandabase en pasabandase lo denomina generalmente modulacion.

La figura 2.2 ilustra lo que acabamos de discutir. Es importante remarcar que esteanalisis nos brinda un metodo para procesar de manera digital (i.e. a tiempo discreto)una senal pasabanda centrada a una frecuencia f0 arbitraria trabajando a una tasamucho menor a 2(f0 +W ) (como hubiesemos procedido de haber aplicado el teoremade muestreo de la seccion anterior directamente).

57

Page 58: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

2.4.3. Aliasing

Haciendo el paralelismo con lo realizado en la transformada de Fourier, nos pre-guntamos ahora que sucede cuando el soporte en frecuencia de u(t) es no acotado, yU(f) es una funcion L2 cualquiera. Naturalmente, procederemos como al comienzode la seccion 2.3, descomponiendo U(f) en un conjunto numerable de funciones desoporte acotado de largo 1/T , de la forma:

U(f) =∑m∈Z

Um(f) =∑m∈Z

U(f) rect (fT −m) . (2.16)

Ahora podemos aplicar el mismo metodo que en la seccion anterior para cadaUm(f). Si um(t) es la correspondiente anti-transformada, se llega a la siguiente ex-presion:

u(t) =∑k,m

um(kT ) sinc(t/T − k)ej2πm(t−kT )/T ⇒

u(t) =∑k,m

um(kT ) sinc(t/T − k)ej2πmt/T , (2.17)

donde um(t) es la anti-transformada de Fourier de Um(t). Notar que acabamos deescribir una funcion L2 arbitraria como la combinacion lineal de un nuevo conjuntoortogonal de funciones φk,m(t) dadas por:

φk,m(t) = sinc(t/T − k)ej2πmt/T

Ahora volvemos al esquema de la figura 2.2 (donde supondremos f0 = 0). Ala entrada tenemos la senal u(t) bandabase de ancho de banda W , y a la salidaobtendremos s(t) igual a:

s(t) =∑k

u(kT ) sinc(t/T − k).

Si W < 1/2T , entonces s(t) = u(t). Lo que estudiamos ahora es que obtenemos ens(t) si esto no es verdad, y el ancho de banda de u(t) es W > 1/2T .

Es importante remarcar que la ecuacion (2.17) es valida para cualquiera seanT y W , por lo que la podemos utilizar para hallar que las muestras u(kT ) valenu(kT ) =

∑m um(kT ), y por lo tanto:

s(t) =∑k,m∈Z

um(kT ) sinc(t/T − k) =∑m∈Z

sm(t). (2.18)

Comparando esta ultima ecuacion con (2.17) es facil verificar que s(t) y u(t) no soniguales, y que el error se haya en las muestras que se toman. El sistema “correcto”toma muestras cada T , pero de cada una de las um(t) por separado, pues luegolas multiplica por ej2πmt/T . El sistema “incorrecto” toma muestras de todo u(t),mezclandose entonces los distintos um(kT ) cuando se hace la interpolacion.

Todavıa mas ilustrativo resulta tomar la transformada de Fourier de s(t). Estasera simplemente la superposicion de las transformadas de cada sm(t). Ahora bien,

58

Page 59: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

𝑈(𝑓)

-𝟣/2𝑇 𝟣/2𝑇

𝑈𝑚(𝑓+𝑚𝑇)

-𝟣/2𝑇 𝟣/2𝑇

𝑆(𝑓)

𝑓𝑓-3/2𝑇 3/2𝑇

Figura 2.3: El aliasing ilustrado en frecuencia (cf. ecuacion (2.19)). A la izquierda elU(f) original, y a la derecha el espectro de la senal recuperada mediante la interpo-lacion con aliasing. La grafica de S(f) es meramente ilustrativa.

comparando las ecuaciones (2.17) y (2.18), es facil verificar que se cumple la siguienterelacion:

um(t) = sm(t)ej2πmt/T .

Una vez mas podemos utilizar las propiedades de la transformada de Fourier paraverificar que la transformada de sm(t) es igual a:

Um(f) = Sm(f −m/T )⇒ Sm(f) = Um(f +m/T ).

Para hallar S(f) faltarıa hallar la relacion entre Um(f + m/T ) y U(f). Esto loharemos simplemente evaluando la definicion de Um(f) que aparece en (2.16) parallegar a la siguiente igualdad:

S(f) =∑m∈Z

Um(f +m/T ) =∑m∈Z

U(f +m/T ) rect(fT ). (2.19)

La ecuacion anterior tiene una interpretacion muy interesante. El resultado deinterpolar una funcion u(t) a partir de sus muestras tomadas cada T resulta en unafuncion bandabase de ancho de banda 1/2T , tal que en frecuencia se superponen todoslos segmentos de ancho 1/T del U(f) original (i.e. los Um(f) definidos antes). Cuandoestos Um(f) no son despreciables para m 6= 0 se dice que existe aliasing. La figura 2.3presenta un ejemplo que ilustra lo que acabamos de discutir.

Ejercicio 2.12. El lector que haya leıdo con mucha atencion lo que acabamos dehacer en las dos secciones anteriores notara una diferencia importante entre (2.17)y (2.15): la ausencia del termino e−j2πf0kt. Revise las cuentas para verificar que enrealidad si f0 = m/T para algun m ∈ Z, entonces este termino se convierte en 1 paratodo t.

Esta observacion, a priori menor, tiene una consecuencia practica importante: laetapa de demodulacion no requiere obligatoriamente de una oscilador local a frecuencia−f0. Disene un sistema que utilice unicamente un muestreador y un DAC para obteneruna senal bandabase de una pasabanda centrada a f0 y con un ancho de banda 2W .Pruebe que su sistema funciona utilizando la igualdad (2.19) e incluya las condicionesque deben cumplir T (la tasa a la que funciona el muestreador y el DAC), f0 y W .

59

Page 60: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

2.4.4. Transformada de Fourier Discreta

Ahora nos interesaremos brevemente en la relacion entre la transformadas de Fou-rier a tiempo discreto y a tiempo continuo. Con lo que hemos desarrollado hasta ahoradeberıa ser bastante sencillo realizar el siguiente ejercicio:

Ejercicio 2.13. Sea u(t) una senal bandabase de ancho de banda W . Sea (u[k])k∈Zuna secuencia definida como u[k] = u(kT )∀k ∈ Z, donde T = 1/2W . Sea U(ejΩ) laDTFT de (u[k]) tal como se define en (2.8). Sea U(f) la transformada de Fourierde u(t) como se define en (2.12). Pruebe que se cumple la siguiente igualdad para−π ≤ Ω ≤ π:

U(ejΩ) =1

TU

2πT

).

Por lo tanto, tenemos un metodo para calcular la transformada de Fourier de lasenal a tiempo continuo original u(t), y por lo tanto su espectro, unicamente a partirde sus muestras u(kT ) (siempre que la tasa cumpla 1/T > 2W ). De todas formas, yal igual que sucede con la transformada a tiempo continuo, necesitamos de un tiempoinfinito para obtener el resultado de U(ejΩ).

¿Que sucede si contamos unicamente con un numero finito de muestras de (u[k])?Supongamos que tenemos N muestras, indexadas desde 0 hasta N − 1, y definamosentonces la sucesion auxiliar:

uN [k] =

u[k]; k = 0, . . . , N − 1;

0; sino.

Tenemos entonces una sucesion de soporte acotado. En este caso, y haciendo elanalogo con la serie de Fourier, se puede definir la denominada Transformada Discretade Fourier (DFT). La idea es nuevamente tratar de escribir la secuencia como unacombinacion lineal de exponenciales, de la forma:

uN [k] =1

N

N−1∑n=0

U [n]ej2πnk/N rect(n/N − 1/2). (2.20)

Es importante notar que todo el marco teorico de espacios vectoriales que desa-rrollamos en el capıtulo 6 es aplicable tambien a este caso: estamos ante el espaciovectorial con producto interno CN . En particular, si uN y vN son dos vectores de CNde la forma (u[0], . . . , u[N − 1]) y (v[0], . . . , u[N − 1]), definiremos el producto internocomo:

〈uN ,vN 〉 =

N−1∑i=0

u[i]v∗[i].

Ejercicio 2.14. Sea φkk=0,...,N−1 el conjunto de vectores correspondientes a la

secuencia φk[n] = ej2πnk/N/√N . Verifique que este es un conjunto ortonormal. A

su vez, verifique que tambien es una base del espacio RN , y exprese cualquier vectoruN como una combinacion lineal de los φk, dando una expresion explıcita para loscoeficientes en funcion de los uN [k].

60

Page 61: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

A partir del ejercicio anterior es facil concluir entonces que una descomposicion deltipo (2.20) es posible, y los coeficientes U [n] se pueden hallar de la siguiente expresion:

U [n] =

N−1∑k=0

uN [k]e−j2πnk/N ∀n = 0, . . . , N − 1. (2.21)

La ecuacion anterior define lo que se entiende como DFT.El interes de este analisis surge de comparar la definicion de la DTFT (cf. ecuacion

(2.8)) y la de la DFT. Es facil verificar que si UN (ejΩ) es la DTFT de la secuencia(uN [k]), entonces se cumple la siguiente igualdad:

U [n] = UN (ejΩ)|ω=2πn/N ∀n = 0, . . . , N − 1.

Es decir, la DFT X[n] son N muestras equiespaciadas de la transformada de Fouriera tiempo discreto. Atencion, porque estamos hablando de la DTFT de la secuenciade soporte acotado, y no de la sucesion original dada por las muestras de u(t). Sinembargo, si N es suficientemente largo es de esperar que el error por truncar lasucesion sea despreciable a propositos practicos.

Por ultimo, remarquemos ademas que existen metodos computacionalmente muyeficientes para calcular la DFT y su inversa (generalmente denominados Fast Fou-rier Transform, FFT), lo que la ha hecho extremadamente popular como tecnica deanalisis espectral. Sin embargo, hay que tener claras las relaciones entre las distintastransformadas (ver figura 2.4), y que en caso de utilizar la DFT para estimar el espec-tro de una senal continua a partir de sus muestras, el resultado es una aproximaciony que habra un error debido al truncamiento de la sucesion. Existen metodos paraminimizar este error, como el enventanado, que seran discutidas mas adelante en estetexto.

61

Page 62: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

𝑢(𝑡)

𝑡

𝑇

𝑢[𝑘]

𝑘

𝑈(𝑓)

𝑓𝟣/𝑇-𝟣/𝑇

𝟣CTFT

DTFT

DTFT

DFT

𝑈(𝑒𝑗Ω)

π-π

𝟣/𝑇

Ω

𝑈𝑁(𝑒𝑗Ω)

π-π Ω𝑁

𝑢𝑁[𝑘]

𝑘

𝑈[𝑛]

𝑛𝑁

Figura 2.4: Las distintas transformadas de Fourier en un ejemplo para una senal u(t)bandabase. Las graficas son meramente ilustrativas, aunque es importante notar queexisten diferencias entre U(ejΩ) y UN (ejΩ).

62

Page 63: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Capıtulo 3

Filtros y ProcesamientoMultitasa

3.1. Introduccion

En este capıtulo se hara un repaso de los conceptos principales de los filtros analogi-cos y digitales que se utilizaran en el resto del texto. Posteriormente se introducirantecnicas para el procesamiento digital de senales multitasa (o multirate en ingles) queseran ampliamente utilizadas en el texto. El procesamiento multitasa sera utilizadoen la mayorıa de los sistemas de comunicaciones que se analizaran en este texto. Engeneral, habra partes del procesamiento de la senal donde sera conveniente o necesariotrabajar a una cierta tasa de muestreo y otras partes donde sera necesario hacerlo auna tasa diferente. Se debera entonces, en algunos casos aumentar la tasa de muestreoy en otros disminuirla. Se analizara en este capıtulo como proceder en estos casos.

3.2. Transformada de Laplace

3.2.1. Motivacion y Definicion

Comencemos entonces por considerar un Sistema Lineal e Invariante en el Tiempo(SLIT) en tiempo continuo. Como se comento en el capıtulo 6, estos corresponden aun sistema donde se deben cumplir dos propiedades:

1. Lineal. Si ante una entrada xi(t) la salida es yi(t) para el conjunto de funcionesindexadas por i ∈ Z, entonces cualquiera combinacion lineal de estas entradas∑i aixi(t) generara la correspondiente salida

∑i aiyi(t) para todo ai ∈ C. Tam-

bien sera verdad que si las funciones de entrada se pueden parametrizar por uncierto s ∈ C resultando en la funcion xs(t) y su correspondiente salida ys(t), en-tonces ante una “combinacion lineal” de estas entradas dado por

∫a(s)xs(t)ds

la salida resulta∫a(s)ys(t).

2. Invariante en el tiempo. Si ante una entrada x(t) la salida es y(t), entoncesla salida correspondiente a x(t− τ) para todo τ ∈ R debe ser y(t− τ).

63

Page 64: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Consideremos ahora el caso especial que la entrada es una exponencial parametricaen s ∈ C de la forma xs(t) = est, y notemos la correspondiente salida como ys(t).Sabemos que si ahora a la entrada ponemos xs(t − τ), la salida sera ys(t − τ) porinvarianza temporal. Pero a su vez, como xs(t− τ) = es(t−τ) = este−τs = xs(t)e

−τs,sabemos por linealidad que la salida tambien debera ser igual a ys(t)e

−τs. Por lotanto, acabamos de probar que para esta entrada en particular, la salida cumple lasiguiente igualdad:

ys(t− τ) = ys(t)e−τs ⇒ ys(−τ) = ys(0)e−τs ⇒ ys(t) = ys(0)est = ys(0)xs(t).

Por lo tanto, toda exponencial es lo que se denomina funcion propia de un SLIT (enel sentido de que obtenemos la misma funcion pero multiplicada por una constante).Ahora bien, en el capıtulo anterior vimos que toda funcion L2 puede ser expresadacomo “combinacion lineal” de exponenciales a traves de su transformada de Fourier(i.e. x(t) =

∫X(f)ej2πftdf). Por lo tanto, cambiando la notacion ys(0) por H(f)

(dado que en este caso el parametro importante es f) y usando la linealidad delsistema tenemos el siguiente resultado:

x(t) =

∫X(f)ej2πftdf ⇒ y(t) =

∫X(f) H(f)ej2πft︸ ︷︷ ︸

salida de ej2πft

df. (3.1)

El resultado anterior es valido siempre que la segunda integral este bien definida.Si ademas H(f) tiene anti-transformada de Fourier h(t), y por la tercera propiedadprobada en el ejercicio 2.6, llegamos al siguiente resultado:

y(t) =

∫ ∞−∞

x(τ)y(t− τ)dτ = x(t) ∗ h(t).

Por lo que la salida en un SLIT para x(t), bajo ciertas condiciones, es la convolucionde este con la funcion h(t), la cual se denomina la respuesta a impulso del sistema. Esimportante notar que la ecuacion mas general es (3.1) pues requiere que el productoX(f)H(f) tenga anti-transformada de Fourier, y no H(f). Por ejemplo, un simplepasa-todos (i.e. H(f) = 1 ∀f ∈ R) no tiene respuesta a impulso bien definida.1

Ahora bien, de todas formas el analisis anterior deja afuera muchas senales quepueden ser de interes y no son L2 (o mas precisamente, que no tienen transformadade Fourier). Por ejemplo senales como el escalon unitario (u(t) = 1 si t ≥ 0 y u(t) = 0sino, a la que nos referiremos por χ(t) de ahora en adelante), la rampa (u(t) = atχ(t))o senales de crecimiento exponencial (u(t) = eatχ(t) con a > 0).

Comenzaremos analizando que se podrıa hacer si se quisiera obtener un resultadocomo el de (3.1) para el escalon u(t) = aχ(t) con a ∈ R. Naturalmente, la transformadade Fourier de esta funcion no esta bien definida pues la integral (2.12) en este casoparticular (i.e.

∫∞0aej2πftdt) no converge. Una forma de resolver este problema, pero

tomando en cuenta lo discutido en los parrafos anteriores, es multiplicar u(t) por e−σt.De esta forma para σ > 0 g(t) = u(t)e−σt sı es L2, por lo tanto tiene transformada

1Al menos no tiene respuesta a impulso en el conjunto de las funciones.

64

Page 65: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 3.1: Plano s

de Fourier G(f) y se cumple que:

G(f) =

∫g(t)e−j2πftdt =

∫u(t)e−σte−j2πftdt,

u(t)e−σt = g(t) =

∫G(f)ej2πftdf ⇒

u(t) =

∫G(f)e(σ+j2πf)tdf.

Por lo tanto, sı podemos representar u(t) = aχ(t) como combinacion lineal defunciones de la forma e(σ+j2πf)t, que es un conjunto de senales de tipo sinusoidal quecrecen exponencialmente con t. Esta generalizacion de la Transformada de Fourierse denomina Transformada de Laplace. En lugar de representar la senal por expo-nenciales complejas que recorren el eje imaginario (y por lo tanto correspondientesa cosenos y senos), se representa la senal mediante exponenciales con exponente querecorren un eje vertical en el plano complejo (σ+j2πf) con f variando entre (−∞,∞)y σ un valor mayor que 0 en este caso (ver figura 3.1). A la region donde la integralconverge (en este caso σ > 0) se la denomina region de convergencia (o ROC) de latransformada de Laplace de u(t).

Definamos entonces la variable compleja s = σ + j2πf . Por lo tanto, y en funcionde lo discutido antes, llegamos a la definicion mas clasica de la Transformada deLaplace, donde se realiza un cambio de variable y se expresan las ecuaciones anterioresen funcion de s:

U(s) =

∫ ∞−∞

u(t)e−stdt, (3.2)

u(t) =1

2πj

∮U(s)estds, (3.3)

donde la segunda integral se hace en una recta paralela al eje imaginario que perte-nezca a la ROC de u(t) (es decir, con σ tal que u(t)e−σt sea L2).

Estas ecuaciones definen la transformada de Laplace y la anti-transformada de La-place. Calcular la transformada de Laplace es muy similar a calcular la transformada

65

Page 66: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

de Fourier y muchas de las propiedades son similares. Incluso es facil verificar a partirde la definicion que la transformada de Fourier es la transformada de Laplace eva-luada en el eje imaginario (i.e. s = j2πf). Sin embargo, calcular la anti-transformadade Laplace implica calcular una integral compleja. Para hacer esto correctamente hayque usar herramientas del analisis complejo como las funciones analıticas, la integralde Cauchy, etc.. En la practica, rara vez es necesario hacer este calculo y se utilizantablas de pares de funciones simples y sus transformadas. Mas adelante se analizaracomo anti-transformar funciones escritas como cociente de polinomios a partir deanti-transformadas elementales.

Ejercicio 3.1. En base a lo anterior, demuestre que si la entrada a un SLIT esx(t) tal que su transformada de Laplace existe y es X(s) para algun σ, entonces latransformada de Laplace de la salida y(t) sera Y (s) = X(s)H(s) donde H(s) nodepende de x(t), sino que unicamente del sistema.

Por lo tanto, H(s) caracteriza totalmente el sistema. En este sentido es que sedenomina funcion de transferencia del sistema. Como probaremos mas adelante, y aligual que para el caso de la transformada de Fourier, si existe la anti-transformada deLaplace de H(s), h(t), entonces y(t) = x(t) ∗ h(t) y se denomina respuesta a impulso.Sin embargo, nuevamente es mas general relacionar la entrada y la salida mediante laecuacion Y (s) = X(s)H(s).

Un ultimo comentario. En general salvo que se diga expresamente se trabajaracon la denominada transformada de Laplace unilateral:

U(s) =

∫ ∞0

u(t)e−stdt. (3.4)

Esta claro que integrar a partir de t = 0 es equivalente a (3.2) cuando la senal escausal (es decir senales que son 0 para todo t < 0, como en el ejemplo del escalon).Si no es ası, entonces cuando transformemos por Laplace usando (3.4) y volvamosal dominio temporal (usando (3.3)) recuperaremos una senal causal e igual a u(t)unicamente para t mayor a cero2 (por ejemplo, sera discontinua en t = 0, salvo siu(0) = 0). Este detalle sera importante mas adelante, cuando querramos resolverecuaciones diferenciales mediante la transformada de Laplace.

3.2.2. Calculo y propiedades de la Transformada de Laplace

Comenzaremos viendo algunos ejemplos del calculo de la transformada de Laplacey luego se veran algunas propiedades importantes.

Ejemplo 3.1. Calcular la transformada de Laplace unilateral (de aquı en mas no lodiremos y se asumira que siempre es unilateral) de u(t) = eat con a real o complejo.

U(s) = lımT→∞

∫ T

0

eate−stdt = lımT→∞

e(a−s)t

a− s

∣∣∣∣∣T

0

,

U(s) = lımT→∞

e(a−s)T

a− s− 1

a− s= lımT→∞

1

s− a− e(a−s)T

s− a.

Por lo tanto al tomar el lımite T →∞ vemos que si:

2Con la igualdad entendida en el sentido L2 como hasta ahora.

66

Page 67: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Re(s) < Re(a): la exponencial compleja en el segundo termino tiende a infinitoy no existe la transformada de Laplace.

Re(s) = Re(a): la exponencial compleja oscila y su modulo es constante, por loque no tiene lımite y no existe la transformada de Laplace.

Re(s) > Re(a): la exponencial compleja tiende a cero, por lo que existe latransformada de Laplace y vale:

U(s) =1

s− a.

Es importante volver a remarcar que si anti-transformamos la expresion anteriormediante (3.3) (usando por ejemplo el teorema de los residuos) obtendremos u(t) =eatχ(t) y no la funcion original.

Ejercicio 3.2. Utilizando el resultado del ejemplo 3.1 se pueden deducir varias trans-formadas de Laplace:

1. Sea u(t) = cos(ωt) = ejωt+e−jωt

2 con ω ∈ R, probar que tiene transformada deLaplace U(s) = s

s2+ω2 y su region de convergencia es Re(s) > 0.

2. Sea u(t) = sin(ωt), probar que U(s) = ωs2+ω2 .

3. Sea u(t) = χ(t), funcion escalon, probar que tiene transformada de LaplaceU(s) = 1

s y su region de convergencia es Re(s) > 0.

Veremos a continuacion varias propiedades importantes de la transformada deLaplace.

Propiedad 3.1 (Linealidad). Sea g(t) = au(t)+bv(t) entonces G(s) = aU(s)+bV (s).Se prueba simplemente sustituyendo g(t) en la definicion de transformada de Laplace.

Propiedad 3.2 (Desplazamiento en el tiempo). Sea v(t) = χ(t − t0)u(t − t0) cont0 > 0 (i.e. trasladamos u(t) en el tiempo pero teniendo en cuenta que u(t) = 0 parat < 0 por ser causal). Entonces V (s) = e−st0U(s). Esta propiedad se puede demostrarsustituyendo v(t) en la definicion de transformada

V (s) =

∫ ∞t0

u(t− t0)e−stdt

y haciendo un cambio de variable t′ = t− t0.

V (s) =

∫ ∞0

u(t′)e−s(t′+t0)dt′ = e−st0

∫ ∞0

u(t′)e−st′dt′.

Propiedad 3.3 (Desplazamiento en s). Si V (s) = U(s−s0) entonces v(t) = es0tu(t).Se prueba de forma similar al caso anterior:

V (s) = U(s− s0) =

∫ ∞0

u(t)e−(s−s0)tdt =

∫ ∞0

(u(t)es0t)e−stdt.

De la ultima ecuacion se puede ver que v(t) = u(t)es0t. Si la region de convergenciade la transformada de Laplace de u(t) es Re(s) > a ¿cual es la region de convergenciade V (s)? La respuesta queda como ejercicio para el lector.

67

Page 68: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ejemplo 3.2. La trasformada de u(t) = cos(wt) se vio que era U(s) = ss2+w2 por lo

tanto la transformada de v(t) = eatcos(wt) es V (s) = U(s− a) = s−a(s−a)2+w2

Propiedad 3.4 (Transformada de la derivada en el tiempo). Sea u(t) una senalderivable en el tiempo y v(t) = u′(t) su derivada. Entonces para todo s donde existanlas transformadas de Laplace U(s) y V (s) se cumple que V (s) = sU(s) − u(0). Laprueba es tomando partes en la integral:

V (s) = lımT→∞

∫ T

0

u′(t)e−stdt = lımT→∞

s∫ T

0

u(t)e−stdt+ u(t)e−st

∣∣∣∣∣T

0

⇒ V (s) = sU(s)− u(0) + lım

T→∞u(T )e−sT .

Como la transformada U(s) existe, el lımite en T debe ser cero. Este resultadose puede generalizar para la derivada m-esima de una funcion v(t) = u(m), y sutransformada de Laplace sera:

V (s) = smU(s)−m−1∑i=0

sm−1−iu(i)(0).

Este resultado permitira como se vera mas adelante resolver ecuaciones diferenciales.

Propiedad 3.5 (Derivada en s de la Transformada de Laplace). Sea U(s) la trans-formada de Laplace de u(t). Si existe U ′(s) y las integrales que definen U(s) y U ′(s)convergen absolutamente, entonces U ′(s) es la transformada de Laplace de la funcion−tu(t). Se prueba de manera simple derivando la integral que define F (s) y se puedederivar el integrando por la hipotesis de convergencia absoluta.

Ejemplo 3.3. A continuacion se calcula la transformada de varias senales a partirde lo anterior.

u(t) = teat. Se vio que si v(t) = eat entonces V (s) = 1s−a por lo tanto U(s) =

−V ′(s) = 1(s−a)2 .

u(t) = t cos at. Analogamente al ejemplo anterior a partir de la transformada

del coseno y derivando en s, se obtiene U(s) = s2−a2

(s2+a2)2 .

u(t) = t sin at. A partir de la transformada del seno y derivando en s, se obtieneU(s) = −2as

(s2+a2)2 .

Propiedad 3.6 (Transformada de Laplace de la integral en el tiempo). Si u(t) es

seccionalmente continua y v(t) =∫ t

0u(τ)dτ , entonces V (s) = U(s)

s . Se demuestraobservando que v′(t) = u(t), aplicando el resultado anterior para la transformada dela derivada y teniendo en cuenta que al ser seccionalmente continua u(t) entonces g(t)es continua y por lo tanto g(0) = 0. Esta propiedad permite calcular la transformadade Laplace de integrales de funciones cuya transformada conocemos.

Ejemplo 3.4. Se vio en esta seccion que la transformada de Laplace de la funcionescalon y(t) era Y (s) = 1

s . Por lo tanto si v(t) = t utilizando el resultado de latransformada de Laplace de la integral V (s) = 1

s2

68

Page 69: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Propiedad 3.7 (Convolucion). Sea g(t) = u(t) ∗ v(t). Entonces si el producto deconvolucion existe y existen las transformadas de Laplace de g(t), u(t) y v(t) en s0,entonces para todo Re(s) > Re(s0) se cumple que G(s) = U(s)V (s). Se prueba apartir de la definicion del producto de convolucion:

G(s) =

∫ ∞0

∫ t

0

u(τ)v(t− τ)dτe−stdt.

Cambiamos el orden de integracion ajustando los lımites de integracion:

G(s) =

∫ ∞0

∫ ∞τ

e−stu(τ)v(t− τ)dtdτ,

y haciendo un cambio de variable t′ = t− τ

G(s) =

∫ ∞0

∫ ∞0

e−s(t′+τ)u(τ)v(t′)dt′dτ =

∫ ∞0

u(τ)e−sτdτ

∫ ∞0

v(t′)e−st′dt,

lo que prueba el resultado.

3.2.3. Transformada de Laplace y solucion de ecuaciones dife-renciales

En el primer capıtulo se vio que una clase importante de sistemas lineales inva-riantes en el tiempo son descritos a traves de una ecuacion diferencial a coeficientesconstantes que relaciona la entrada y la salida de la forma:

N∑k=0

akdky(t)

dtk=

M∑k=0

bkdkx(t)

dtk,

con las condiciones iniciales correspondientes. Utilizando el resultado visto para latransformada de Laplace de la funcion derivada es posible escribir esta ecuacion di-ferencial como una ecuacion algebraica. Veremos con un ejemplo como se aplica estemetodo.

Ejemplo 3.5. Un sistema lineal invariante en el tiempo esta definido por la siguienterelacion entre sus senales de entrada y salida:

y′′(t)− 2y′(t) + 2y(t) = x(t).

Supongamos que queremos hallar la salida cuando x(t) = e−t y que asumimosque y(0) = 0 y y′(0) = 1. Utilizando los teoremas de derivacion la transformada deLaplace para u(t) = y′(t) y v(t) = y′′(t) resulta (cf. propiedad 3.4)

U(s) = sY (s)− y(0) = sY (s),

V (s) = s2Y (s)− y′(0)− sy(0) = s2Y (s)− 1.

69

Page 70: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Por lo tanto, pasando al dominio de Laplace la ecuacion diferencial resulta

s2Y (s)− 1− 2sY (s) + 2Y (s) =1

s+ 1

⇒ Y (s)(s2 − 2s+ 2) = 1 +1

s+ 1

⇒ Y (s)(s2 − 2s+ 2) =s+ 2

s+ 1

⇒ Y (s) =s+ 2

(s2 − 2s+ 2)(s+ 1)=

s+ 2

((s− 1)2 + 1)(s+ 1).

En la siguiente seccion se vera como anti-transformar esta expresion y encontrar y(t).De todas formas, los resultados trabajados hasta aquı corresponden a la transformadaunilateral. Por lo tanto, como dijimos al final de la seccion 3.2.1, el resultado queobtendremos de anti-transformar Y (s) (y tambien X(s)) sera cero para todo t < 0.Quiza sorprenda que terminemos hallando una solucion no continua para una ecuaciondiferencial, pero la discontinuidad en cero es producto del tipo de transformacion.De todas formas nuestro interes siempre estara en la solucion a partir de t = 0, yen ese caso la solucion de la ecuacion diferencial y el resultado de anti-transformarcoincidiran.

3.2.4. Transformada inversa de Laplace

Como ya se dijo antes anti-transformar implica calcular una integral complejaimpropia que requiere ser calculada utilizando analisis complejo y funciones analıticas.Sin embargo, en la practica rara vez se hace esto. Para la mayorıa de las funcionessimples se encuentran tablas de pares u(t) ↔ U(s). En los ejemplos vistos en estaseccion, ya se han calculado varios de estos pares para funciones simples. A partirde estas tablas de pares de transformadas de Laplace es posible calcular otras mascomplejas.

En particular es de interes anti-transformar cocientes de polinomios en s. Comose vio en la introduccion, la mayorıa de los sistemas que seran de interes en este textose modelan mediante ecuaciones diferenciales a coeficientes constantes, y utilizandola transformada de Laplace se pueden llevar a un cociente de polinomios en s que esnecesario anti-transformar para encontrar la solucion.

Veremos a continuacion como anti-transformar un cociente de polinomios P (s) =N(s)D(s) . Consideraremos diferentes casos. Se asumira que el numerador es de menor

orden que el denominador.

1. Raıces reales simples en el denominador. En ese caso descomponemos el cocientede polinomios de la siguiente forma:

P (s) =N(s)

D(s)=

N(s)

Πn−1i=0 (s− si)

=

n−1∑i=0

Ais− si

.

Para calcular cada Ai simplemente se multiplica P (s) por s−si y se hace s = si.

Ejemplo 3.6. Consideremos el siguiente cociente de polinomios:

P (s) =s+ 1

s(s+ 2)=A0

s+

A1

s+ 2.

70

Page 71: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Multiplicando por s y haciendo s = 0 obtenemos A0 = 1/2, y multiplicando pors+ 2 y haciendo s = −2 obtenemos A1 = 1/2.

2. Raıces complejas simples en el denominador. Se pueden calcular los Aj igual queen el caso anterior, aunque muchas veces si la ecuacion es de coeficientes realeslas raıces son pares conjugados. En ese caso se pueden buscar otras formasque permiten anti-transformar de forma mas sencilla. A continuacion se veraun ejemplo que muestra el tipo de procedimiento con el cual se puede anti-transformar en estos casos.

Ejemplo 3.7. Se considera la ecuacion diferencial a la que se aplico la trans-formada de Laplace en el ejemplo 3.5. En ese caso la funcion a anti-transformarque se obtuvo era:

Y (s) =s+ 2

(s2 − 2s+ 2)(s+ 1)=

s+ 2

((s− 1)2 + 1)(s+ 1)=

A

s+ 1+B(s− 1) + C

(s− 1)2 + 1.

En primer lugar, A se calcula como antes y se obtiene A = 1/5. Luego, sacandodenominador comun e igualando numeradores en cada potencia de s se puedever que B = −1/5 y C = 9/5. Entonces:

Y (s) =1/5

s+ 1− 1/5(s− 1)

(s− 1)2 + 1+

9/5

(s− 1)2 + 1.

Recordando los resultados de los ejemplos vistos, se puede anti-transformar cadatermino:

y(t) =1

5e−t − 1

5et cos(t) +

9

5et sin(t).

Nuevamente, es importante remarcar que la solucion de la ecuacion diferen-cial (que en este caso se puede hallar con otras tecnicas estandar) y la anti-transformada de Laplace coincidiran unicamente para t > 0 (en caso contrario,esta ultima sera 0).

3. Raıces multiples en el denominador. Si en el denominador se tiene una raız s0

multiple de orden n entonces

P (s) =N(s)

D(s)=

N(s)

(s− s0)nD1(s)=

n−1∑i=0

Ai(s− s0)i

+N1(s)

D1(s).

Definamos entonces:

P1(s) = (s− s0)nP (s) =

n−1∑i=0

Ai(s− s0)i +R(s)(s− s0)n.

Por lo tanto P1(s0) = A0. Luego derivamos P1(s) respecto a s y se obtiene:

dP1(s)

ds=

n−1∑i=1

iAi(s− s0)i−1 +R(s)n(s− s0)n−1

⇒ dP1(s)

ds

∣∣∣∣s=s0

= A1.

71

Page 72: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Si se continua derivando respecto de s se llega a:

Ai =1

i!

diP1(s)

dsi

∣∣∣∣s=s0

.

3.3. Transformada Z

3.3.1. Introduccion

Ası como la transformada de Laplace extiende la Transformada de Fourier, latransformada Z extendera a la Transformada de Fourier en tiempo discreto (DTFT).La DTFT permite estudiar la respuesta en frecuencia de senales en tiempo discreto yexpresarlas como una combinacion (en principio infinita) de exponenciales complejas,pero vimos que la DTFT esta bien definida para senales u[k] donde

∑k |u[k]|2 <∞.

Aunque existen senales que no cumplen lo anterior y sı tienen DTFT, muchas senalesdiscretas que son de interes no. Ejemplos claros son nuevamente, el escalon discretoχ[k] o exponenciales de la forma eakχ[k].

3.3.2. Motivacion y definicion

Comenzaremos analizando que se podrıa hacer si se quisiera expresar el escalonunitario (i.e. u[k] = χ[k]) como combinacion lineal de exponenciales. De forma similara lo visto en la transformada de Laplace, la idea en este caso es multiplicar u[k] pore−σk (con σ > 0) de forma que v[k] = u[k]e−σk sı tenga DTFT. De esta forma tenemosentonces que:

V (ejΩ) =

∞∑k=−∞

u[k]e−σke−jΩk =

∞∑k=−∞

u[k]e−(σ+jΩ)k

⇒ u[k] = eσk1

∫ π

−πV (ejΩ)ejΩkdΩ︸ ︷︷ ︸

v[k]=u[k]e−σk

=1

∫ π

−πV (ejΩ)e(σ+jΩ)kdΩ

Definiendo z = e(σ+jΩ), U(z) = V (ejΩ) y observando que dzz = jdΩ obtenemos la

expresion habitual del par de transformada y anti-transformada Z:

U(z) =

∞∑−∞

u[k]z−k,

u[k] =1

2πj

∮U(z)zk−1dz.

De la forma que hemos definido la transformada Z y la transformada de Fourieren tiempo discreto (DTFT) es facil ver que la DTFT es la transformada Z evaluadaen el cırculo unitario.

La integral en la anti-transformada es una integral en el plano complejo en la quez recorre un cırculo de radio eσ y con Ω variando entre −π y π en el sentido contrarioa las agujas de reloj. Al igual que en el caso de Laplace no se abordaran en estetexto los metodos de calculo de esta integral ya que a partir de los pares de funciones

72

Page 73: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

simples y sus transformadas se podran calcular la mayorıa de las anti-transformadasque son de interes practico como se vera mas adelante.

Es importante notar que la transformada converge para ciertos valores de σ (enel caso del escalon para σ > 0). Esto define la denominada region de convergencia(o ROC por su sigla en ingles), la que veremos con detalle mas adelante. De todasformas, adelantemos aquı que dado que z se puede expresar como z = rejΩ, si la serieconverge para ciertos valores de σ es equivalente a decir que converge para ciertosvalores de r (e.g. para el escalon r > 1).

Antes de seguir, probemos porque el interes en esta transformada para sistemasdiscretos lineales e invariantes en el tiempo.

Ejercicio 3.3. Pruebe que si la entrada a un SLIT discreto es x[k] tal que su trans-formada Z existe y es X(z) para algun σ, entonces la transformada Z de la salida y[k]sera Y (z) = X(z)H(z) donde H(z) no depende de x[k], sino unicamente del sistema.Para esto, pruebe primero que una exponencial discreta es una funcion propia de unSLIT. Luego re-escriba x[k] como una combinacion lineal de exponenciales mediantela transformada Z y termine la demostracion combinando las correspondientes salidaspor linealidad.

Ejemplo 3.8. Calculemos la transformada Z de u[k] = akχ[k] con a real o complejo:

U(z) =

∞∑0

akz−k =

∞∑0

(az

)k.

Esta es una serie geometrica de razon az por lo que si |az | < 1 (o lo que es lo mismo si

r = |z| > a) converge a:

U(z) =1

1− az

=z

z − a.

Ejercicio 3.4. Pruebe los siguientes pares de transformadas u[k]↔ U(z):

δ[k]↔ 1 ∀z.

χ[k]↔ zz−1 , para |z| > 1.

cos(wk)χ[k]↔ z(z−cos(w))z2−2z cos(w)+1 , para |z| > 1.

3.3.3. Convergencia de la transformada Z

Dada una funcion u[k], se dira que z pertenece a la region de convergencia (ROC)si |U(z)| < ∞. Naturalmente, si la senal tiene duracion finita, entonces su region deconvergencia sera todo z. Sin embargo, si la senal no es de soporte acotado, entonces:

|U(z)| = |∞∑−∞

u[k]z−k| ≤∞∑−∞|u[k]z−k|.

73

Page 74: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Img

Re

Plano z

región deconvergenciacausal

r0

r1

región deconvergenciano causal

Figura 3.2: Plano z

Como z = rejΩ entonces,

|U(z)| ≤∞∑−∞|u[k]r−k| =

−1∑−∞|u[k]r−k|+

∞∑0

|u[k]r−k|

⇒ |U(z)| ≤∞∑1

|u[−k]rk|+∞∑0

∣∣∣∣u[k]

rk

∣∣∣∣ .Por lo tanto,

Si existe r0 tal que la primera serie converge, entonces la primera serie convergerapara todo r < r0.

Si existe r1 tal que la segunda serie converge, entonces la segunda serie conver-gera para todo r > r1.

De las dos observaciones anteriores observamos que la ROC tendra forma anular,es decir convergera para un disco r1 < r < r0.

De las ecuaciones anteriores observamos que si la senal es causal entonces solo setendra la segunda serie y por lo tanto para senales causales la ROC sera el exterior deun cırculo de radio r1. Si la senal es anti-causal, entonces la ROC sera el interior deun cırculo de radio r0. Por ultimo, si el sistema es bilateral la ROC sera una regionanular entre los radios de convergencia de las dos series. Esto se puede observar en lafigura 3.2.

Una observacion muy importante es que dos funciones en el tiempo con diferenteROC pueden tener la misma transformada Z y por lo tanto solo la transformada Z noidentifica unıvocamente la senal en el tiempo. Para tener una representacion unıvocaes necesario dar la transformada Z y la ROC. Veamos un ejemplo.

Ejemplo 3.9. En el ejemplo anterior se calculo la transformada Z de u[k] = akχ[k]con a real o complejo, y se obtuvo que su transformada Z era U(z) = z

z−a y su ROC|z| > a.

74

Page 75: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Calcularemos ahora la transformada Z de v[k] = −akχ[−k − 1].

V (z) =

∞∑k=−∞

−akχ[−k − 1]z−k =

∞∑l=−∞

−a−l−1χ[l]zl+1

⇒ V (z) =

∞∑l=0

−a−l−1zl+1 = 1 +

∞∑l=0

−(za

)l.

Esta es una serie geometrica de razon za y por lo tanto converge a:

V (z) = 1− 1

1− za

=z

z − a

y converge si |z| < a. Es decir que tienen la misma transformada Z pero con diferentesROC.

3.3.4. Propiedades de la transformada Z

A continuacion repasaremos las principales propiedades de la transformada Z.

Propiedad 3.8 (Linealidad). Se prueba simplemente sustituyendo en la definicionde la transformada Z. El planteo de la propiedad y su demostracion quedan comoejercicio para el lector.

Propiedad 3.9 (Desplazamiento temporal). Sea v[k] = u[k − n] entonces V (z) =U(z)z−n con la misma ROC (salvo z =∞ si n < 0 y z = 0 si n > 0). La prueba salede simplemente plantear la definicion de la transformada:

V (z) =

∞∑k=−∞

u[k − n]z−k =

∞∑h=−∞

u[h]z−(n+h) = z−n∞∑

h=−∞

u[h]z−h.

Ejemplo 3.10. La transformada Z de u[k] = ak−nχ[k − n] con a real o complejo sepuede hallar mediante la propiedad del desplazamiento temporal:

U(z) =z

z − az−n =

zn−1

z − a.

Ejemplo 3.11. De forma analoga, la transformada Z de u[k] = δ[k − n] resulta:

U(z) = z−n.

Propiedad 3.10 (Escalado del dominio z). Sea v[k] = aku[k] entonces V (z) = U( za ).La demostracion es sencilla (el calculo de la ROC queda como ejercicio):

V (z) =

∞∑−∞

u[k]akz−k =

∞∑−∞

u[k](za

)−k.

75

Page 76: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Propiedad 3.11 (Multiplicacion por k). Sea v[k] = ku[k], entonces:

−z dUdz

= −z ddz

∞∑−∞

u[k]z−k = −z∞∑−∞

u[k](−kz−k−1)

⇒ −z dUdz

=

∞∑−∞

u[k]kz−k = V (z).

En este caso se puede probar que la ROC es igual a la original, salvo quiza en elborde (si U(z) es una funcion racional en z−1, entonces la ROC no incluye los bordesy queda igual a la original).

Ejemplo 3.12. Calcular la transformada Z de u[k] = kakχ[k]. Por la propiedad demultiplicacion por k y recordando que la transformada de v[k] = akχ[k] es V (z) = z

z−aentonces

U(z) =az

(z − a)2.

Ejercicio 3.5. Calcular las transformadas Z de u[k] = k2akχ[k] y de kχ[k].

Propiedad 3.12 (Convolucion). Sea v[k] = u[k] ∗ h[k] entonces:

V (z) =∑k

(u[k] ∗ h[k])z−k =∑k

∑n

u[n]h[k − n]z−k

=∑n

u[n]∑k

h[k − n]z−k =∑n

u[n]

∞∑−∞

h[m]z−(n+m)

=∑n

u[n]∑m

h[m]z−(n+m) =∑n

u[n]z−n∑m

h[m]z−m

= U(z)H(z).

3.3.5. Sistemas Lineales invariantes en el tiempo y ecuacionesen diferencias

En el ejercicio 3.3 probamos que para todo SLIT discreto existe una cierta H(z)que depende unicamente del sistema tal que

Y (z) = X(z)H(z),

donde X(z) y Y (z) son las transformadas Z de la entrada al sistema x[k] y su co-rrespondiente salida y[k]. Como sucedıa en tiempo continuo, a la funcion H(z) se ladenomina funcion de transferencia. A su vez, a su anti-transformada h[k] se la deno-mina respuesta a impulso. Esto es debido a que por la propiedad de convolucion secumple que:

y[k] = x[k] ∗ h[k],

y por lo tanto h[k] corresponde a la salida cuando a la entrada del sistema ponemosx[k] = δ[k].

76

Page 77: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

En el primer capıtulo se vio que la mayorıa de los sistemas LTI de tiempo discretoque interesaran en este texto son tales que se puede describir la relacion entre laentrada y la salida como una ecuacion en diferencias a coeficientes constantes de laforma:

N∑n=0

any[k − n] =

M∑m=0

bmx[k −m].

Tomando la transformada Z de la ecuacion anterior y aplicando la propiedad delinealidad y la del retardo en el tiempo, se obtiene:

Y (z)

N∑n=0

anz−n = X(z)

M∑m=0

bmz−m,

y por lo tanto

Y (z) = X(z)

∑Mm=0 bmz

−m∑Nn=0 anz

−n= X(z)H(z).

Es decir que tanto la transferencia como la salida se podran expresar como uncociente de polinomios en z. Si se sabe anti-transformar estos cocientes de polinomiosse puede obtener la respuesta al impulso y la forma de onda de la salida.

3.3.6. Transformada Z inversa de un cociente de polinomios

Para obtener la anti-transformada se puede calcular la integral en el plano complejoque se vio en la definicion de la transformada Z. Sin embargo, al igual que en el caso deLaplace, esto en la practica rara vez se hace de este modo. Lo habitual es descomponerel cociente de polinomios correspondiente a la transferencia o a la salida del sistema, yluego usando los pares de transformada Z de funciones elementales obtener la funcionen el tiempo. En todos los casos para obtener la anti-transformada es necesario conocerla region de convergencia porque como se vio antes diferentes senales en el tiempopueden tener la misma transformada Z al tener diferente ROC.

Se veran a continuacion dos metodos para anti-transformar un cociente de poli-nomios. El primero consiste en expandir dicho cociente como una serie de potencias.La idea en este caso es dividir el numerador entre el denominador obteniendo unaserie infinita. Como comentamos recien, hay que tener en cuenta la ROC. Si la senales causal se debe hacer la division de forma de obtener una serie de potencias enz−k, pero si la senal tiene una ROC anti-causal entonces se debe obtener una serie depotencias con terminos en zk. Con este metodo se obtienen los valores de u[k] hastael valor de k al que se expanda la serie de potencias pero no se obtiene una expresioncerrada. Se explicara este metodo con algunos ejemplos.

Ejemplo 3.13. Obtener la anti-transformada de V (z) = 11−az−1 con ROC |z| > a.

1 1− az−1

1− az−1 1 + az−1 + a2z−2 + a3z−3 + ..

az−1 − a2z−2

a2z−2 − a3z−3

77

Page 78: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

En este caso como el sistema es causal por la region ROC en que esta definidase escribio el cociente como una serie de potencias en z−k. En este caso por simpleobservacion podemos obtener la formula cerrada de la anti-transformada v[k] = aky[k]pero en general no es tan simple y lo que obtenemos son los v[k] hasta el k queexpandamos la serie.

Ejemplo 3.14. Obtener la anti-transformada de V (z) = 11−az−1 con ROC |z| < a

En este caso por la ROC definida el sistema es anti-causal por lo tanto se expandiracomo serie de potencias de z. Para eso reescribimos V (z) = 1

1−az−1 = zz−a . Por lo

tanto al hacer la division:

z −a+ zz − a−1z2 −a−1z − a−2z2 − ..

a−1z2

a−1z2 − a−2z3

En este caso tambien por simple inspeccion podemos obtener la formula cerradade u[k] = −a−ky[−k − 1].

El otro metodo utilizado para anti-transformar cocientes de polinomios en z essimilar al explicado al anti-transformar en Laplace. La idea es descomponer en frac-ciones simples el cociente. Asumiendo que N > M , se obtiene:

V (z) =ΠMm=1(1− dmz−1)

ΠNn=1(1− enz−1)

=

=A1

1− e1z−1+

A2

1− e2z−1+ ...+

Ai +Ai+1z−1 + ...+Ai+rz

−r

(1− e1z−1)r,

donde los primeros dos terminos corresponden a raıces simples y el ultimo a una raızmultiple de orden r. Para calcular los Aj se procede de la misma forma que en el casode Laplace, es decir por ejemplo para la primer raız simple multiplicando a amboslados 1 − e1z

−1 y haciendo z−1 = e1. Luego se anti-transforma utilizando los paresde transformada Z de funciones simples.

3.3.7. Polos, estabilidad, causalidad y ROC

La posicion de los polos de la transformada Z (es decir, los ceros del denominador)determinan la frontera de la ROC ya que la ROC no puede contener polos por servalores de z donde su transformada se va a infinito y por lo tanto la serie no converge.Por lo tanto si el sistema es causal la ROC excluye el cırculo de centro en el origeny de radio igual al valor del modulo del polo mas externo. La ROC se extiende desdeeste cırculo (excluyendo esta circunferencia que contiene al polo) hacia el infinito.

Consideremos un sistema lineal invariante en el tiempo de respuesta al impulsoh[k] y H(z) su transformada Z. Definiremos un sistema como BIBO estable (o establede aquı en mas) si a toda entrada acotada le corresponde una salida acotada (boundedinput bounded output). La condicion necesaria y suficiente de estabilidad de un sistema

78

Page 79: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 3.3: En un sistema causal y estable todos los polos deben estar dentro delcırculo unitario

de respuesta al impulso h[k] es que

∞∑−∞|h[k]| <∞.

Esto se puede probar a partir de la relacion de convolucion de la respuesta alimpulso y la entrada al sistema para obtener la salida. Si asumimos que la entrada alsistema es u[k] y que |u[k]| < A por hipotesis, entonces la salida v[k], que para que elsistema sea estable debera estar acotada, sera:

|v[k]| = |∞∑−∞

h[n]u[k − n]| ≤∞∑−∞|h[n]||u[k − n]| ≤ A

∞∑−∞|h[n]| ≤ ∞.

y por lo tanto para que sea estable∑∞−∞ |h[n]| ≤ ∞. De la misma forma se deduce

que si se cumple esta condicion entonces el sistema es estable.

A partir de esta condicion deduciremos las caracterısticas de la ROC de un sistemaestable. Para eso se calculara |H(z)| en |z| = 1, es decir en el cırculo unitario.

|H(z)||z|=1 = |∞∑−∞

h[n]z−n||z|=1 ≤∞∑−∞|h[n]||z|−n|z|=1

⇒ |H(z)||z|=1 ≤∞∑−∞|h[n]| <∞.

Es decir que si el sistema es estable entonces |H(z)||z|=1 < ∞. Por lo tanto elcırculo unitario en un sistema estable pertenece a la ROC.

Si ademas de estable, el sistema es causal todos los polos debe estar dentro delcırculo unitario como se muestra en la figura 3.3. Por el contrario, si el sistema esestable y anti-causal todos los polos deben estar en el exterior del cırculo unitario.

79

Page 80: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

3.3.8. Sistemas de fase mınima

Un sistema lineal invariante en el tiempo de respuesta al impulso h1[n] se diceinverso de otro h2[n] si se cumple que

h1[n] ∗ h2[n] = δ[n],

o lo que es lo mismo,

H1(z) =1

H2(z).

Por lo tanto, si H1(z) = A(z)B(z) entonces H2(z) = B(z)

A(z) . Se denomina sistema de fase

mınima a un sistema estable y causal cuyo inverso es tambien estable y causal. Porlo tanto, y en funcion de lo discutido antes respecto a la posicion de los polos de unsistema causal y estable, un sistema invariante en el tiempo sera de fase mınima sitodos sus polos y ceros estan dentro del cırculo unitario. Esto sera de interes cuandotengamos que ecualizar, donde basicamente habra que invertir un filtro.

3.4. Filtros Digitales

3.4.1. Clasificacion de los Filtros digitales

Un filtro digital, en el presente contexto, sera un sistema lineal e invariante enel tiempo tal que su comportamiento se puede modelar mediante una ecuacion endiferencias lineal y a coeficientes constantes. En esta seccion nos enfocaremos en losaspectos principales de los filtros digitales que se utilizaran en el resto del texto, comoalgunos elementos de su diseno y realizacion. Esto es debido a que la mayorıa delprocesamiento la realizaremos en el mundo digital (y por lo tanto la presentacion dediseno de filtros analogicos se omitio).

Por lo tanto, la relacion entre la senal de entrada x[k] y la senal de salida y[k] delfiltro sera:

N∑n=0

any[k − n] =

M∑m=0

bmx[k −m].

Sin perder generalidad se trabajara asumiendo que a0 = 1. Ademas, estamos supo-niendo sistemas causales, en el sentido que la salida depende unicamente de entradaso salidas pasadas (o presentes), pero nunca futuras.

Los filtros digitales se clasificaran en:

1. Filtros de respuesta al impulso finita (FIR, Finite Impulse Response) cuandoN = 0. En este caso la ecuacion en diferencias resulta:

y[k] =

M∑m=0

bmx[k −m].

En la figura 3.4 se muestra una posible implementacion de un filtro FIR generico.El bloque z−1 representa un retraso de una muestra. Es importante notar queen este caso no hay realimentacion.

80

Page 81: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

z-1

z-1

X +

X

Xb1

b0

bM

x[k] y[k]+

+

Figura 3.4: Posible implementacion de un filtro FIR.

2. Filtros de respuesta al impulso infinita (IIR) cuando N > 0. En este caso laecuacion en diferencias tiene la forma general:

y[k] =

M∑n=0

bmx[k −m]−N∑n=1

any[k − n].

En la Figura 3.5 se muestra una posible implementacion de un filtro IIR generico.En este caso sı hay realimentacion, lo que puede generar sobre la estabilidad delsistema. Sin embargo, como vimos antes, la salida sera acotada ante cualquierentrada acotada siempre que los polos de la funcion de transferencia esten dentrodel cırculo unitario (cf. seccion 3.3.7).

Observar que en el caso de un filtro FIR si se aplica como entrada x[k] = δ[k],luego de transcurridos M intervalos de tiempo la salida sera cero (en particular, larespuesta a impulso sera h[k] = bk ∀0 ≤ k ≤ M y cero en caso contrario). Por eso sellaman de respuesta al impulso finita. En cambio, la respuesta de un filtro IIR anteesta misma entrada, y como la salida se vuelve a aplicar recursivamente, la respuestaal impulso no se extinguira y por eso se llaman de respuesta al impulso infinita.

3.4.2. Diseno de Filtros Digitales

Un metodo que se utiliza habitualmente para disenar filtros es partir de una trans-ferencia deseada en tiempo continuo Ha(s). Se utiliza el sub-ındice a para explicitarque es la transferencia o la respuesta al impulso en tiempo continuo (a de analogico).Luego, a partir de esta transferencia en tiempo continuo se disenara la trasferencia entiempo discreto H(z) o su respuesta al impulso h[k]. Es decir, se razona el filtro enel dominio continuo, que muchas veces es mas intuitivo (por ejemplo, para hablar defrecuencias en Hz), y luego se convierte a digital. Si la tasa de muestreo es suficiente,seran equivalentes (se discute mas adelante que sucede si esto no es verdad). Peroeste encare del problema es util pues el procesamiento de las senales, aunque seananalogicas, se realiza cada vez mas frecuentemente en digital (el caso del audio esbastante ilustrativo). Por ello se busca emular un filtro analogico.

81

Page 82: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

z-1

z-1

z-1

+

X

Xb1

b0

bM

x[k] y[k]+

+

X

Xa1

XaM

+ XaN

Figura 3.5: Posible implementacion de un filtro IIR.

Filtro DigitalH(z)

x(t) y(kT)ConversorAnalógicoDigital

tasa de muestras: T

x(kT) ConversorDigitalAnalógico

y(t)

Filtro entiempocontinuoHa(s)

y(t)x(t)

Figura 3.6: Diseno de filtros digitales

Como se muestra en la figura 3.6 el esquema es el siguiente. La senal analogicaque ingresarıa al filtro analogico Ha(s), se pasa por un conversor Analogico/Digital(D/A), se muestrea y se pasa por el filtro H(z). Luego se convierte nuevamente atiempo continuo con un conversor D/A. Existen dos procedimientos basicos para estediseno: el diseno en el dominio en el tiempo y el diseno en el dominio de la frecuencia.Distinguiremos ademas entre el diseno de filtros IIR y de filtros FIR.

3.4.3. Diseno de Filtros IIR en el dominio del tiempo

En tiempo continuo el filtro deseado tiene respuesta al impulso ha(t), por lo tantola salida del filtro sera:

y(t) =

∫ ∞−∞

x(τ)ha(t− τ)dτ.

82

Page 83: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

La integral anterior la podemos escribir como el lımite de la siguiente sumatoria:

y(t) = lım∆τ→0

∞∑i=−∞

x(i∆τ)ha(t− i∆τ)∆τ.

Si notamos por conveniencia T = ∆τ , al muestrear la sena cada T se observa lamuestra en kT es:

y(kT ) = lımT→0

T

∞∑i=−∞

x(iT )ha((k − i)T ).

La ecuacion anterior se corresponde con la de una entrada de tiempo discreto x[k](resultante de muestrear la senal de tiempo continuo x(t) cada T ) convolucionada conun filtro de transferencia al impulso

h[k] = Tha(kT ). (3.5)

Esta ecuacion sera utilizada para sintetizar el filtro digital a partir de la respuestaal impulso en tiempo continuo deseada. Obviamente cuanto mas se acerque a cero Tmas proximo se estara a la transferencia deseada pero evidentemente en el sistemadigital las muestras no se pueden hacer tender a cero. Mas adelante discutiremos unvalor de T razonable a los efectos practicos.

A partir de la ecuacion 3.5 si se toma la transformada Z se obtiene:

H(z) = TZ(ha(kT )). (3.6)

Ejemplo 3.15. Se quiere sintetizar en tiempo discreto un filtro pasabajo de transfe-rencia

Ha(s) =a

s+ w0.

Como vimos antes, la anti-transformada de Laplace de la expresion anterior (i.e. larespuesta al impulso de este filtro) sera

ha(t) = ae−tw0χ(t).

Por lo tanto, el filtro digital correspondiente tendra respuesta al impulso:

h[k] = aTe−kTw0χ[k],

y la transferencia del filtro digital disenado sera:

H(z) =aTz

z − e−Tw0.

Observar que el procedimiento seguido en el ejemplo anterior se puede generali-zar para una transferencia en tiempo continuo como cocientes de polinomios en s: sedescompone la transferencia en fracciones simples, se obtiene la respuesta al impulsocorrespondiente a cada polo, se utiliza la ecuacion 3.5 para obtener la respuesta al im-pulso del filtro digital y luego se encuentra la transferencia calculando su transformadaZ.

83

Page 84: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

En este punto se debe hacer alguna consideracion respecto del tiempo de muestreoT y a las limitaciones de este metodo. Si analizamos la relacion en el espectro enfrecuencia del filtro analogico y el filtro digital, como se vio en el Capıtulo 2, el espectrodel filtro digital sera la del filtro analogico pero periodizado cada 1/T y re-escalado(cf. ecuacion (2.19), ejercicio 2.13 y sobre todo figura 2.3). Mas precisamente:

H(ejΩ) =1

T

∑m∈Z

H(f +m/T ) rect(fT )

∣∣∣∣∣f= Ω

2πT

.

El problema que se presenta es que los filtros analogicos como el utilizado en el ejemploanterior tienen ancho de banda que no esta verdaderamente limitado. Esto trae comoconsecuencia que el filtro digital disenado tenga solapamiento en frecuencia (aliasing).Lo que se hace es elegir T lo suficientemente pequeno para que este solapamiento seadespreciable. Sin embargo, esto tiene una limitacion. Con este metodo se puedensintetizar filtros con respuesta tipo pasa-bajo o pasa-banda pero no es adecuado parasintetizar filtros pasa-alto.

Como se puede ver en el ejemplo anterior, en este metodo se mapean polos dela transferencia analogica s = −w0 en polos de la transferencia del filtro en tiempodiscreto de la forma z = e−Tw0 . Por lo tanto, un sistema estable y causal en tiempocontinuo (que solo tiene polos en el semiplano izquierdo), produce un sistema establey causal en tiempo discreto. Esto es facil de observar ya que los polos del semiplanoizquierdo se mapean en polos ubicados dentro del cırculo unitario. Este mapeo llevael eje imaginario en s a la circunferencia de radio 1 en el plano z, cuya consecuenciaes el aliasing que ya se comento antes.

3.4.4. Diseno de Filtros IIR en el dominio de la frecuencia:transformacion bilineal

Si un filtro de tiempo continuo de transferencia Ha(s) tiene como entrada unaexponencial compleja xa(t) = est, la salida del filtro sera ya(t) = Ha(s)est. Por otraparte, si un filtro de tiempo discreto de transferencia H(z) tiene como entrada unasenal exponencial x[k] = zk, la salida sera y[k] = H(z)zk.

Ahora bien, si la entrada al filtro de tiempo continuo se muestrea con perıodo Tse obtiene x[kT ] = eskT . Si se elige z = esT y se ingresa esta entrada al filtro digitalobtenemos:

y[k] = H(z)zk∣∣z=esT

= H(esT )eksT . (3.7)

Por otra parte, si la salida del filtro analogico se muestrea con perıodo T se obtiene:

ya(kT ) = Ha(s)eskT . (3.8)

Comparando las ecuaciones 3.7 y 3.8, y en el entendido que para que los dossistemas sean equivalentes la salida producida debe ser la misma se obtiene:

Ha(s) = lımT→0

H(esT ). (3.9)

Esta ecuacion sera la base de diferentes transformaciones que es posible hacer enel dominio de la frecuencia. Se vera a continuacion la transformacion bilineal.

84

Page 85: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

La tangente hiperbolica se define de la siguiente forma:

tanh

(sT

2

)=esT/2 − e−sT/2

esT/2 + e−sT/2≈ sT/2,

donde la ultima aproximacion se obtiene del primer termino del desarrollo en seriede potencias asumiendo que T → 0. Por lo tanto cuando T → 0 operando con lasexponenciales se obtiene que:

s =2

Ttanh

(sT

2

)=

2

T

esT − 1

esT + 1.

Utilizando ahora la ecuacion 3.9 se obtiene para T → 0 que:

Ha

(2

T

esT − 1

esT + 1

)= H(esT ),

de donde:

H(z) = Ha

(2

T

z − 1

z + 1

)= Ha(s)|s= 2

Tz−1z+1

.

Esta transformacion que mapea s → 2Tz−1z+1 , se denomina transformacion bilineal

y se utilizara para disenar filtros digitales. A continuacion se vera un ejemplo paraaclarar este procedimiento.

Ejemplo 3.16. Re-visitemos el ejemplo 3.15 usando esta tecnica. Es decir, tratemosde sintetizar en tiempo discreto el filtro pasabajo de transferencia:

Ha(s) =a

s+ w0.

Utilizando la transformacion bilineal y operando se obtiene:

H(z) =aT (z + 1)

(2 + w0T )z − (2− w0T ).

En la figura 3.7 se muestra el modulo de la transformada Ha(jw) y de las trans-ferencias de los filtros digitales disenados en los ejemplos 3.15 y 3.16. En el primercaso con el metodo del dominio en el tiempo y en el segundo en el dominio de lafrecuencia con la transformacion bilineal. Se muestra ademas como varıan de acuerdocon el valor de T en la figura 3.8.

Notar que el metodo de la transformacion bilineal es mas preciso en bajas fre-cuencias que en altas frecuencias. Esta ultima observacion se debe al tipo de mapeode s a z. A continuacion se analiza que tipo de mapeo realiza esta transformacionen el dominio de la frecuencia. Para eso se estudiara que sucede con el mapeo de lacircunferencia de radio 1 en el plano z.

H(ejwT ) = Ha

(2

T

ejwT − 1

ejwT + 1

)= Ha

(2

T

ejwT/2 − e−jwT/2

ejwT/2 + e−jwT/2

)= Ha

(2j

Ttan(wT/2)

)

85

Page 86: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 3.7: Filtro IIR disenado en el dominio del tiempo y de la frecuencia

Figura 3.8: Variacion con T de los filtros digitales

86

Page 87: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 3.9: Aliasing de filtros digitales

Por lo tanto la respuesta del filtro digital a una cierta frecuencia wd sera:H(ejwdT ) =Ha

(2jT tan(wdT/2)

)= Ha(jwa). Es decir que la frecuencia del filtro analogico wa se

corresponde a traves de la siguiente funcion con la frecuencia del filtro digital wd:

wa =2

Ttan(wdT/2),

wd =2

Tarctan(waT/2).

En primer lugar se observa que en esta transformacion todo el eje imaginariodel filtro analogico (cuando wa va de −∞ a ∞) se mapea una sola vuelta en lacircunferencia de radio 1. Se realiza una compresion del eje imaginario en el plano sa la circunferencia de radio 1 en el plano z. En segundo lugar de la ecuacion anteriorse observa que wd ≈ wa en bajas frecuencias pero cuando la frecuencia crece hay unadistorsion importante. Por este motivo la aproximacion es mejor en bajas frecuenciasque en altas frecuencias.

En la figura 3.9 se puede ver este comportamiento. En la figura se grafica el filtroen tiempo continuo y los filtros digitales disenados por ambos metodos graficadosentre 0 y 2π. Se observa claramente el aliasing en el diseno en el dominio del tiempoy la compresion del eje imaginario a (−π, π) para el caso del diseno en el dominio dela frecuencia.

Para mejorar el error en altas frecuencias se puede disminuir T como se observaen la figura 3.8 con lo cual se logra aumentar el rango en el cual wd ≈ wa peroal costo de trabajar con tasas de muestras mayores. Para mejorar esta distorsionproducida por el mapeo en frecuencias altas, tambien se puede deformar el filtroanalogico deseado antes de aplicar la transformacion bilineal, de forma tal que alutilizar la transformacion bilineal se compense esta deformacion y se obtenga unfiltro mas cercano al deseado.

87

Page 88: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

3.4.5. Diseno de Filtros FIR

El filtro FIR tiene respuesta al impulso finita y esta es la mayor limitante paradisenar estos filtros. Los procedimientos vistos antes generan filtros de respuesta alimpulso infinita, por lo que una primera idea serıa simplemente hacer cero los co-eficientes de un filtro IIR disenado con los metodos anteriores a partir de un ciertoN0.

Lo anterior es como multiplicar h[k] punto a punto con w[k] = rect(k/N0) (aexcepcion de un retardo) con lo cual a partir de N0 los valores de la respuesta alimpulso del filtro se anularan. Pero esto tiene una contrapartida no deseada en fre-cuencia. Multiplicar por una ventana rectangular en el tiempo equivale a convolvercon un sinc() en frecuencia lo que genera ondulaciones que pueden ser importantesrespecto del filtro original deseado y ademas tiene poca atenuacion en altas frecuenciaslo que tambien genera distorsion.

Para solucionar estos inconvenientes, lo que se hace es:

Calcular la respuesta al impulso deseada, ya sea a partir de un filtro ideal entiempo discreto (i.e. anti-transformando algun H(z) o H(ejΩ) de interes) o conel procedimiento explicado para disenar un filtro IIR a partir de sintentizar unoen el dominio del tiempo.

Una vez obtenida la respuesta al impulso deseada, que en general sera infinita,se multiplica por una ventana que no genere los problemas que genera la ven-tana rectangular. En particular se busca que la ventana tenga un decaimientorapido en frecuencia. Comunmente se utilizan ventanas como la de Hamming,Blackman o Blackman-Harris.

Veremos a continuacion dos ejemplos importantes:

Ejemplo 3.17 (Filtro derivador). Se quiere sintetizar en tiempo discreto un filtroderivador. La transferencia en tiempo continuo sera:

Ha(f) = j2πf para |f | < f0.

Se asume que se procurara aproximar el derivador hasta una cierta frecuencia f0

para evitar los problemas de aliasing que discutimos antes. La respuesta al impulsosera entonces:

ha(t) =

∫ f0

−f0

j2πfej2πftdf =2f0

tcos(2πf0t)−

1

πt2sin(2πf0t),

y utilizando la ecuacion 3.5 obtenemos:

h[k] = Tha(kT ) =2Tf0

kTcos(2πf0kT )− T

π(kT )2sin(2πf0kT ).

Si 1/2T = f0 (es decir que el filtro digital derivara el maximo de ancho de bandaposible para la tasa de muestreo dada) la respuesta al impulso queda de la siguienteforma:

h[k] =

1T

(−1)k

k si k 6= 0,

0 si k = 0.

(3.10)

88

Page 89: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ahora se debe llevar esta transferencia a una respuesta de impulso finita multiplicandopor una ventana. Por ejemplo si se utiliza una ventana rectangular con dos muestrasdistintas de cero (w[−1] = 1/2 y w[1] = 1/2), la salida del derivador ante una entradax[kT ] sera:

y[kT ] =

1∑i=−1

h[i]x[(k − i)T ] =x[(k + 1)T ]− x[(k − 1)T ]]

2T, (3.11)

que es una aproximacion de la derivada tomando los puntos anterior y posterior ydividiendo entre la separacion de estos puntos. Es importante notar que el filtro idealresulto IIR y no causal. Ademas, los componentes de mayor energıa se encuentranalrededor de k = 0, por lo que el filtro aproximado tambien es no causal (la aproxi-macion serıa muy burda si se tomaran unicamente los valores de h[k] para k positivos).La implementacion de esta primera aproximacion tendra entonces un retardo de unamuestra antes de comenzar a generar salidas utiles.

Ademas, es claro que esta derivada sera una mejor aproximacion cuanto mas pe-queno sea T . En la figura 3.10 se muestra la magnitud de la funcion de transferenciadel derivador ideal y 3 implementaciones en tiempo discreto (el eje de frecuencias eneste caso varıa entre 0 y π). Por un lado, la aproximacion usada habitualmente de laecuacion 3.11 con solo 3 taps, donde se ve claramente en la figura que la aproximaciones buena solo en bajas frecuencias (se podrıa decir que para que funcione razonable-mente, la senal de entrada deberıa estar muestreada a una tasa mayor a diez vecessu ancho de banda). Por otro lado, se muestran dos aproximaciones de 24 taps. Unade ellas utilizando 24 taps de la ecuacion 3.10 y la otra aplicando una ventana deHamming de ecuacion

w[k] = 0,56 + 0,46 cos

(kπ

ntaps

), (3.12)

siendo ntaps el numero de taps a utilizar. Se puede observar en la figura el ripplegenerado por la ventana rectangular y como mejora la aproximacion utilizando laventana de Hamming.

Ejemplo 3.18 (Filtro integrador). Se quiere sintetizar en tiempo discreto un filtrointegrador. La salida del integrador sera:

y(t) =

∫ t

−∞x(u)du.

Si se muestrea la salida cada T se obtiene:

y(kT ) =

∫ kT

−∞x(u)du =

∫ (k−1)T

−∞x(u)du+

∫ kT

(k−1)T

x(u)du

⇒ y(kT ) = y((k − 1)T ) +

∫ kT

(k−1)T

x(u)du.

Por lo tanto, para obtener la ecuacion en diferencias del filtro debemos aproximar laultima integral. Esto lo podemos hacer mediante un rectangulo de base T y altura

89

Page 90: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 3.10: Derivador ideal en tiempo continuo e implementaciones en tiempo dis-creto

(i) x((k− 1)T ), (ii) x(kT ), o (iii) el promedio de ambas (x((k− 1)T ) + x(kT ))/2. Enestos tres casos las ecuaciones seran:

y[k] = y[k − 1] + Tx[k − 1],

y[k] = y[k − 1] + Tx[k],

y[k] = y[k − 1] +T

2(x([k − 1] + x[k])),

y las correspondientes transformadas Z de la transferencias seran:

H(z) = Tz−1

1− z−1,

H(z) = T1

1− z−1,

H(z) = T1 + z−1

1− z−1.

Observar que esta ultima aproximacion corresponde a la transformacion bilinealvista antes.

3.5. Procesamiento de senales multitasa

Como se menciono en la introduccion de este capıtulo, muchas veces es necesarioen un receptor o en un transmisor trabajar a mas de una tasa de muestreo. Diferentesbloques de procesamiento requieren trabajar a diferentes tasas. Por ejemplo, se puede

90

Page 91: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

tener una fuente de audio (un microfono o un archivo grabado) que trabaje a 48.000muestras por segundo, y ese audio se deba procesar y alimentar una tarjeta de audiocuya frecuencia de muestreo por ejemplo es de 44.100 muestras por segundo. Tambiensuele suceder que los equipos SDR soporten un cierto conjunto de tasas de muestreo.

Ademas, hay filtros o bloques utilizados en la modulacion/demodulacion que estanpensados para trabajar a una cierta tasa de muestras por sımbolo por ejemplo, o quebajar la tasa de muestreo sea conveniente por temas de desempeno. De alguna formaestas tasas se deben adaptar.

Los bloques basicos para el procesamiento multitasa son: un bloque que realiza elsubmuestreo (downsampling) de la senal y el que realiza el sobremuestreo (upsam-pling) de la senal. Se analizaran en primer lugar estos bloques.

3.5.1. Sobremuestreo de la senal

Un sobremuestro de tasa L introduce L ceros entre cada par de muestras de lasenal de entrada. Se comenzara estudiando un ejemplo para L=2 para entender elfuncionamiento del bloque y luego se generalizara.

Ejemplo 3.19. La relacion entrada/salida de un sobremuestreador de tasa 2 vienedada por la siguiente ecuacion:

y[k] =

x[k/2] si k es par,

0 si k es impar.

Es habitual utilizar la siguiente notacion para representar la operacion de sobremues-treo (en este caso por 2): y[k] = [↑ 2]x[k]. Si por ejemplo x[k] es la siguiente secuencia:

..., 4, 2, 7, 9, 14, ... ,

donde la muestra en k = 0 corresponde al valor 7, en este caso la secuencia de saliday[k] tendra la siguiente forma:

..., 0, 4, 0, 2, 0, 7, 0, 9, 0, 14, 0, ... .

En este ejemplo se puede ver que la entrada y la salida tendran transformada Z:

X(z) = ...+ 4z2 + 2z + 7 + 9z−1 + 14z−2 + . . . ,

Y (z) = ...+ 4z4 + 2z2 + 7 + 9z−2 + 14z−4 + . . . .

De este ejemplo se puede ver que Y (z) = X(z2). A continuacion generalizaremos estapropiedad.

Se calculara a continuacion la relacion en la transformadas Z de dos secuenciasrelacionadas por un sobremuestreo de tasa L, es decir y[k] = [↑ L]x[k], o lo que es lomismo

y[k] =

x[k/L] si k/L ∈ Z,

0 en otro caso.

91

Page 92: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

(a) Senal antes del sobremuestreo (b) Senal despues del sobremuestreo

Figura 3.11: Espectro antes y despues de sobremuestrear

Filtro DigitalH(z)

x(kT/L)x(kT) x↑(kT)Sobremuestreador

↑L

Figura 3.12: Diagrama de un interpolador

Por lo tanto

Y (z) =∑k∈Z

y[k]z−k =∑

k:k/L∈Z

x[k/L]z−k =∑n∈Z

x[n]z−nL = X(zL),

y evaluando en z = ejΩ llegamos a que la relacion entre las transformadas de Fourier(DTFT) sera:

Y (ejΩ) = X(ejΩL). (3.13)

En la figura 3.11a se muestra el espectro de una senal antes de realizar el sobre-muestreo. En la figura 3.11b se muestra el espectro luego de sobremuestrear por 3.Observar que la escala del eje x en esta segunda figura esta entre −π y −π y nocoincide con la escala del eje de la primera. Como se observa al sobremuestrear elespectro cambia segun la ecuacion 3.13 y por lo tanto se introducen entre −π y −πlas componentes del espectro que antes estaban fuera de este rango.

Por lo tanto, si x[k] = x(kT ) con 1/2T mayor al ancho de banda de x(t), ob-tendremos y[k] = x(kT/L) (es decir, muestras tomadas L veces mas rapido) si luegode sobremuestrear aplicamos un filtro pasabajos de frecuencia de corte π/L como semuestra en la figura 3.12. Por este motivo, al sobremuestreo seguido del filtro se loconoce con el nombre de interpolador. Esto se discutira con mas detalle en la seccion3.5.3.

3.5.2. Submuestreo de la senal

Un submuestro de tasa M se queda con una de cada M muestras de la senal deentrada. Se comenzara analizando un ejemplo para M = 2 a los efectos de comprender

92

Page 93: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

el funcionamiento del bloque y luego se generalizara.

Ejemplo 3.20. La relacion entrada/salida de un sobremuestreador de tasa 2 vienedada por la siguiente ecuacion:

y[k] = x[2k].

Es habitual utilizar la siguiente notacion para representar la operacion de sobremues-treo (en este caso por 2): y[k] = [↓ 2]x[k]. Si por ejemplo x[k] es la siguiente secuencia:

..., 4, 2, 7, 9, 14, ... ,

donde la muestra en k = 0 corresponde al valor 7, la secuencia de salida y[k] tendrala siguiente forma:

..., 4, 7, 14, ... .

En este ejemplo se puede ver como son las transformadas Z de la entrada y la salidarespectivamente:

X(z) = ...+ 4z2 + 2z + 7 + 9z−1 + 14z−2 + . . . ,

Y (z) = ...+ 4z + 7 + 14z−1 + . . . .

Para encontrar la relacion entre la transformada Z de la entrada y la salida vemosque Y (z2) se puede obtener como la suma entre X(z) y X(−z) dividido 2. Como lasecuencia X(−z) es igual a X(z) en los terminos de potencias pares, y opuesta en losterminos de potencias impares de z, la suma solo preserva los terminos pares como sebuscaba. Es decir:

Y (z2) =X(z) +X(−z)

2

⇒ Y (z) =X(z1/2) +X(−z1/2)

2.

Por lo tanto la transformada de Fourier en tiempo discreto es:

Y (ejΩ) =1

2

(X(ejΩ/2) +X(−ejΩ/2)

)⇒ Y (ejΩ) =

1

2

(X(ejΩ/2) +X(e−jπejΩ/2)

)⇒ Y (ejΩ) =

1

2

(X(ejΩ/2) +X(ej

Ω−2π2 )

).

Generalicemos el resultado anterior a una tasa de submuestreo M cualquiera, esdecir y[k] = [↓M ]x[k], o lo que es lo mismo

y[k] = x[Mk].

Por lo tanto

Y (z) =∑k

y[k]z−k =∑k

x[kM ]z−k =∑n

x[n]

(1

M

M−1∑m=0

ej2πM mn

)z−n/M .

93

Page 94: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

(a) Senal antes del submuestreo (b) Senal despues del submuestreo

Figura 3.13: Espectro antes y despues de submuestrear (M = 3)

Filtro DigitalH(z)

x(kT) y(kTM)Submuestreador

↓M

y(kT)

Figura 3.14: Diagrama de un decimador.

Observar que al cambiar de variable kM = n, se debe sumar solo en los n que sonmultiplos de M . Como se suma en todos los n hay que hacer cero aquellos que no son

multiplos de M . Esto se logra al introducir la expresion(

1M

∑M−1m=0 e

j 2πM mn

)que vale

1 si n es multiplo de M y cero en otro caso. Por lo tanto,

Y (z) =1

M

M−1∑m=0

∑n

x[n](e−j

2πM mz1/M

)−n=

1

M

M−1∑m=0

X(e−j

2πM mz1/M

).

Por lo tanto, la relacion entre las transformadas de Fourier (DTFT) sera:

Y (ejΩ) =1

M

M−1∑m=0

X(ejΩ−2πmM ).

En este caso lo que sucede es que al dividir por M la frecuencia el espectro se“ensancha” y se superpone con el de las componentes periodicas ubicadas cada 2π locual provoca aliasing como se muestra en la figura 3.13. El resultado anterior quizasea mas intuitivo si pensamos que x[k] es el resultado de tomar muestras cada T deuna cierta senal x(t) con ancho de banda menor a 1/2T : el submuestreo es equivalentea haber tomado muestras cada MT .

Se debe observar que si el espectro es 0 para π/M < |Ω| < π/M entonces noexistira aliasing. Si no fuera el caso, habra que filtrar la senal previamente. Por lotanto, un decimador estara compuesto de un filtro de frecuencia de corte π/M seguidode un submuestreador de tasa M como se muestra en la figura 3.14.

94

Page 95: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Filtro DigitalH(z)

Submuestreador

↓MSobremuestreador

↑L

Figura 3.15: Diagrama de un interpolador fraccional

3.5.3. Interpolacion

Como mencionamos antes, interpolacion es el proceso de sobremuestrear la senaly luego filtrarla para obtener la senal con una tasa de muestreo mayor. Supongamosentonces que una senal xa(t) es muestreada a una cierta tasa 1/T para obtener x[n].Posteriormente, la senal x[n] es sobremuestreada con tasa L y se obtiene una senalu[n]. Esta senal luego es pasada por un filtro ideal pasabajo de frecuencia de corteπ/L y ganancia en continua L. Del teorema de muestreo sabemos que:

X(ejΩ) =1

T

∑k

Xa

(j

Ω− 2πk

T

).

Por lo tanto, luego del sobremuestreador de tasa L, y aplicando la ecuacion (3.13):

U(ejΩ) =1

T

∑k

Xa

(j

ΩL− 2πk

T

)=

1

T

∑k

Xa

(j

Ω− 2kπL

T/L

).

Luego del filtro de frecuencia de corte π/L y ganancia L se obtiene:

Y (ejΩ) =L

T

∑k:k/L∈Z

Xa

(j

Ω− 2kπL

T/L

)=L

T

∑m

Xa

(j

Ω− 2mπ

T/L

).

Esta ultima expresion muestra que se obtiene la senal original xa(t) muestreada auna tasa T/L.

Para terminar esta seccion se analizara que se puede hacer si se quiere adaptarentre dos tasas tales que no son multiplo entero una de otra, sino que su cociente esun numero racional. Por ejemplo, si queremos pasar de 24000 a 32000 muestras porsegundo. Esto corresponde a remuestrear a una tasa 3/2, en el entendido que se logracombinando un interpolador de orden 3, seguido de un decimador de orden 5. En estecaso no es necesario poner dos filtros (uno para el decimador y otro para el interpo-lador): con un filtro entre el sobremuestreador y el submuestreador es suficiente. Estefiltro debe tener una frecuencia de corte mın(π/L, π/M). En la figura 3.15 se muestrael diagrama de bloques de un interpolador fraccional.

3.5.4. Identidades de Noble

Consideremos ahora el ejemplo del comienzo de esta seccion, y supongamos quequeremos adaptar dos flujos, de 48000 a 44100 muestras por segundo. Esto se puedelograr, de manera burda, remuestreando con una tasa igual a 441/480 = 147/160.Ahora bien, es importante notar que luego de sobremuestrear estaremos trabajando auna tasa igual a 147× 48000 = 7056000 muestras por segundo, de las cuales solo una

95

Page 96: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

y[k]x[k] u[k]↑L H( z L)

y[k]x[k] v[k]↑LH( z )

Figura 3.16: Sistemas equivalentes de Noble para el sobremuestreo

de 147 sera distinta de cero. Esto sera procesado por un filtro, que debera trabajara esta tasa, a pesar de que luego el submuestreo dejara pasar unicamente una de160 salidas generadas del filtro. Claramente se tiene que poder ser menos ineficientecon los computos, para lo que usaremos las identidades de Noble que presentamos acontinuacion.

Noble establecio dos identidades, una para la interpolacion y otra para la de-cimacion que seran de utilidad en el resto del texto, mas alla del remuestreo quediscutiremos en esta seccion. Para la interpolacion, Noble establecio que los dos sis-temas de la figura 3.16 son equivalentes. Con referencia en esta figura, si se considerael sistema que tiene el filtro antes del sobremuestreo se tiene:

V (z) = H(z)X(z)

Y (z) = V (zL)

⇒ Y (z) = H(zL)X(zL).

Si se considera ahora el otro sistema de la figura 3.16, que tiene el sobremuestreoantes que el filtro entonces:

U(z) = X(zL)

Y (z) = H(zL)U(z)

⇒ Y (z) = H(zL)X(zL).

Por lo tanto la salida de ambos sistemas coincide y son equivalentes.Para el submuestreo, Noble establecio que los dos sistemas de la figura 3.17 son

equivalentes. La demostracion en este caso es similar al caso del sobremuestreo. Sedeben utilizar la transformada Z a la salida de un submuestreador que se obtuvoantes. Los detalles quedan como ejercicio para el lector.

3.5.5. Filtros polifase

Un decimador, como se vio, se construye con un filtro pasabajo seguido de unsubmuestreador de tasa M . Un interpolador se construye con un sobremuestreadorseguido de un filtro pasabajo. Estos dos sistemas son desde el punto de vista compu-tacional muy ineficientes. Como se comento antes, en el caso del interpolador debidoa que el filtro trabaja a la tasa de muestreo alta y opera sobre muchos ceros que tiene

96

Page 97: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

y[k]x[k] u[k]↓MH( zM )

y[k]x[k] v[k]H( z )↓M

Figura 3.17: Sistemas equivalentes de Noble para el submuestreo

la senal sobremuestreada. En el caso de decimador porque luego de filtrar a una tasaalta, muchas de las muestras luego se eliminaran al pasar por el submuestreador. Parahacer mas eficiente este proceso se utilizara una arquitectura denominada polifasica,basada en las identidades de Noble. Se analizara en primer lugar el decimador.

Consideremos el filtro pasabajo H(z) que se coloca antes del submuestreo. Sutransferencia sera de la siguiente forma:

H(z) = h[0] + h[1]z−1 + h[2]z−2 + ...+ h[M ]z−M+

h[M + 1]z−(M+1) + .....+ h[2M ]z−2M + ....

Ahora separemos el filtro original en M sub-filtros, tal que cada uno se queda conuno de cada M taps y el resto se completa con ceros. Es decir, para el primer sub-filtro nos quedamos con h[0], 0, ..., 0, h[M ], 0, ..., 0, h[2M ], ..., para el segundo conh[1], 0, ..., 0, h[M + 1], 0, ..., 0, h[2M + 1], ... y ası sucesivamente.

Si denominamos Hi(zM ) a la transferencia del sub-filtro i-esimo tenemos entonces

que por ejemplo:

H0(zM ) = h[0] + h[M ]z−M + h[2M ]z−2M + ...,

H1(zM ) = h[1] + h[M + 1]z−M + h[2M + 1]z−2M + ....

y ası sucesivamente para los demas filtros. Notar que en todos los casos las transfe-rencias seran un polinomio en zM .

Ademas, el filtro original H(z) se puede escribir de la siguiente forma:

H(z) = H0(zM ) +H1(zM )z−1 +H2(zM )z−2 + ...+HM (zM )z−M.

En la figura 3.18 se muestra la arquitectura con esta descomposicion del filtro.Hasta ahora no se ha ganado mucho, pero utilicemos la identidad de Noble para eldecimador e intercambiemos los filtros con el decimador. En la figura 3.19 se muestraesta nueva arquitectura. Observar que ahora cada filtro opera a la tasa de muestreoreducida. Incluso se puede ir un paso mas alla y pasar una muestra a cada rama delfiltro polifase, evitando la necesidad del submuestreador y retardo, como se muestraen la figura 3.20.

Con un procedimiento similar es posible construir una arquitectura de filtro poli-fase para un interpolador.

97

Page 98: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

y[k]x[k] z[k]↓M

H0(zM)

H1(zM)

HM-1(zM)

z-1

z-(M-1)

+

Figura 3.18: Filtro Polifase para decimar - primer paso

y[k]x[k]

H0(z)

H1(z)

HM-1(z)

z-1

z-(M-1)

+↓M

↓M

↓M

Figura 3.19: Filtro Polifase para decimar - paso intermedio

y[k]x[k]

H0(z)

H1(z)

HM-1(z)

+S/P

Figura 3.20: Filtro Polifase para decimar - paso final. El bloque S/P corresponde aun Serial a Paralelo.

98

Page 99: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

y[k]x[k]

H0(z)

H1(z)

HM-1(z)

S/P

Figura 3.21: Filtro Polifase para interpolar.

Ejercicio 3.6. Muestre mediante las identidades de Noble que la arquitectura delfiltro polifase para interpolar es el que se muestra en la figura 3.21. Si H(z) es el filtropasabajos de la figura 3.16, especifique quienes son los Hi(z). Para terminar, ¿comose implementa un interpolador fraccional basado en esta arquitectura?

99

Page 100: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

100

Page 101: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Bibliografıa

[1] Discrete-Time Signal Processing, Alan V. Oppenheim, Ronald W. Schafer, Pear-son, 3 edition,2009.

[2] Digital Communications: A Discrete-Time Approach, Michael Rice, Pearson,2009.

[3] Signal Processing and Linear Systems, B.P. Lathi, Oxford University Press, 2009.

[4] Multirate Signal Processing for Communication Systems, Harris, Fredric J., Pren-tice Hall PTR, USA, 2004.

101

Page 102: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

102

Page 103: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Capıtulo 4

El canal inalambrico

4.1. Introduccion

Hasta ahora el canal considerado ha sido un canal AWGN, esto implica que elefecto que el canal tiene sobre la senal transmitida es que se le agrega ruido blancoGaussiano y aditivo. Este puede ser un modelo razonable para canales en mediosfısicos que varıan poco en el tiempo ni tienen fuertes interferencias. En un canalinalambrico hay diversos fenomenos fısicos que afectan la senal transmitida ademasdel ruido. Estas distorsiones son muy importantes porque el diseno del receptor debetener en cuenta los efectos que tiene el canal sobre la senal transmitida a los efectos decorregirlos en la medida de lo posible. Para poder analizar los efectos del canal sobrelas senales transmitidas se realizara un modelo del canal inalambrico. Como todomodelo sera una abstraccion y una simplificacion de los fenomenos fısicos y tendraen cuenta solo los principales fenomenos de interes que impactan sobre las senalestransmitidas. Se analizaran los efectos que tienen diversos parametros como ser: lafrecuencia portadora, el ancho de banda, el entorno de propagacion, el retardo depropagacion, el efecto Doppler y la velocidad de movimiento. Luego de analizar lapropagacion en un canal inalambrico se construiran diferentes modelos a los cuales seles ira agregando complejidad paulatinamente.

Los fenomenos que afectan a las senales en un canal inalambrico estan relaciona-dos con las antenas emisoras y receptoras y el entorno en que se propagan las ondaselectromagneticas enviadas y recibidas por ellas. Se comenzara repasando los funda-mentos de las antenas y la propagacion en un canal inalambrico. Este estudio pretendesolamente que el lector comprenda los fenomenos fısicos involucrados y pueda luegoentender las abstracciones que se realizan en los modelos del canal. Para el lectorinteresado en profundizar en estos temas le recomendamos la lectura de los diferenteslibros sobre antenas y propagacion que se citan en la bibliografıa al final del capıtulo.

4.1.1. Ecuaciones de Maxwell

En primer lugar, se realizara un rapido repaso de las ecuaciones de Maxwell queson la base para comprender la teorıa de ondas electromagneticas. Si bien los modelosque se utilizaran luego para modelar un canal inalambrico seran mucho mas simples

103

Page 104: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

∇ ·D = ρlibre∮S

D · n da = qlibre,enc Ley de Gauss∇ ·B = 0

∮S

B · n da = 0 Ley de Gauss∇×E = −∂B∂t

∮C

E · dl = −∮S∂B∂t · n da Ley de Faraday

∇×H = (Jlibre + ∂D∂t )

∮C

H · dl = (Ilibre,enc +∮S∂D∂t · n da) Ley de Ampere

Cuadro 4.1: Ecuaciones de Maxwell en forma diferencial e integral

es importante entender de donde provienen y cuales son su lımites. En este texto seasumira que los campos electromagneticos generados por una antena se propagaranen el aire circundante y se asumira que este entorno se corresponde a la propagacionen el vacıo.

Este consideracion es importante porque si se tiene un medio que no sea el vacıo,en respuesta a un campo electrico el material se polarizara y generara otro campoelectrico debido a la distribucion de las cargas propias del material polarizado. Lomismo sucede al aplicar un campo magnetico generado por una corriente. Este campogenera una polarizacion magnetica del material y este induce una nueva corriente enun conductor que se encuentre en el campo magnetico. Estos fenomenos se obviaranal trabajar en espacios no polarizables como el vacıo.

Las ecuaciones de Maxwell se pueden escribir como se muestra en el cuadro 4.1.En estas ecuaciones E y H son la intensidad de campo electrico y magnetico respec-tivamente, y D y B son la intensidad de flujo electrico y magnetico respectivamente.

Estas ecuaciones ası formuladas son validas no solo en el vacıo sino tambien en lamateria. Escribimos las ecuaciones en su forma diferencial e integral porque si bienpara operar se utiliza en general la forma diferencial, muchas veces la comprensionintuitiva de lo que significan se ve mejor desde su forma integral.

En las ecuaciones de Maxwell ρlibre es la densidad de carga libre. Es decir, so-lamente es la densidad carga libre que provoca el campo y no incluye a la densidadde carga provocada por la polarizacion del material dielectrico. Es importante quela ecuacion dependa solo de la carga libre ya que es lo que se conoce porque es engeneral un dato del problema.

Lo mismo sucede con Jlibre que es la densidad de corriente libre que es por ejemplo,la densidad de corriente que se impondra en una antena para generar un campo. Esdecir en las ecuaciones escritas de esta forma la corriente a considerar es solo la librey no incluye a la corriente inducida por la polarizacion del medio.

De todas formas como se ha dicho antes, en este texto se considerara la radiacionen el vacıo lo que hace que las unicas densidades de carga y corriente existentes seanlas libres ya que no existen las generadas por polarizacion en el vacıo. Sin embargo,se hicieron los comentarios anteriores porque estas ecuaciones son tambien validas enla materia.

Ademas, en el vacıo se cumple que H = µ0B y D = ε0E. Siendo µ0 y ε0 lapermeabilidad y la permitividad en el vacıo y valen:

ε0 = 8,854× 10−12 Faradios/m

µ0 = 4π × 10−7 Henrios/m

104

Page 105: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ademas estas dos constantes se relacionan con otras dos constantes importantes:

c =1

√µ0ε0

= 3× 108 m/s velocidad de la luz

η0 =

õ0

ε0= 377 ohms impedancia del vacıo

Estas ecuaciones definen el comportamiento del campo electrico y magnetico. Acontinuacion se dara una explicacion fısica de lo que implica cada una de las Leyesde Maxwell y que tomara como base las ecuaciones integrales de las mismas. Luegose vera su significado en la ecuacion diferencial correspondiente.

La Ley de Gauss del campo electrico dice que el flujo electrico neto que atraviesauna superficie cerrada es igual a la carga encerrada en dicha superficie (qenc). Por lotanto, si no hay cargas, el lado derecho de la igualdad sera cero. Este sera un casoimportante de estudio porque fuera de la antena asumiremos que no hay cargas (nicorrientes como se vera mas adelante) y por tanto esta ecuacion se simplifica.

La Ley de Gauss del campo magnetico dice que el flujo magnetico neto que atra-viesa una superficie cerrada es igual a cero. Es decir, que si se considera cualquiersuperficie cerrada en un campo magnetico el flujo neto que la atraviesa siempre seracero. Esto puede interpretarse como que no hay polos magneticos aislados (en realidadel concepto de carga electrica no tiene su correspondiente en el magnetismo) y por lotanto sea cual sea la superficie cerrada que tomemos en un campo magnetico el flujoneto es cero.

La Ley de Faraday dice que la variacion de un campo magnetico a traves de unasuperficie induce un campo electrico en la curva que define el borde de dicha superficie.

La Ley de Ampere dice que un campo electrico variable a traves de una superficieo una corriente inducen un campo magnetico circulante en la curva que define lafrontera dicha superficie. La corriente en la ecuacion dice Ienc ya que es la corrienteencerrada por la curva.

Estas ecuaciones integrales tienen su sımil diferencial. En realidad se pasa de una aotra utilizando o el Teorema de Stokes o el de la Divergencia segun el caso. Se recuerdaa continuacion la definicion del rotor y la divergencia ya que es necesario entender susignificado para comprender las ecuaciones de Maxwell en forma diferencial y paraluego operar con ellas.

La divergencia se aplica a un campo vectorial v = vxx + vyy + vzz y su resultadoes un escalar que se define:

∇ · v =∂vx∂x

+∂vy∂y

+∂vz∂z

(4.1)

La divergencia es una medida de cuanto se expande o diverge un campo vectorialen un punto dado. Puede ayudar a entender la divergencia su definicion como lımitedel cociente entre flujo de un campo vectorial a traves de una superficie sobre elvolumen que encierra esa superficie cuando dicho volumen tiende a cero. Es decir,

∇ · v = lım∆V→0

1

∆V

∮S

v · n da (4.2)

105

Page 106: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Esta definicion muestra tambien de forma mas clara la relacion entre la Ley de Gaussen su forma diferencial e integral.

El rotor se aplica a un campo vectorial v = vxx + vyy + vzz y se define de lasiguiente manera:

∇× v =

(∂vz∂y− ∂vy

∂z

)x +

(∂vx∂z− ∂vx

∂z

)y +

(∂vy∂x− ∂vx

∂y

)z (4.3)

El rotor de un campo vectorial es una medida de cuanto tiende a circular uncampo alrededor de un punto. Puede ayudar a entender el rotor su definicion comolımite de la circulacion por unidad de area de un campo vectorial a traves de unacurva infinitesimal y la superficie encerrada por esta curva cuando la superficie tiendea cero. Es decir,

∇× v = lım∆S→0

1

∆S

∮C

v · dl (4.4)

Por ultimo vamos a definir dos funciones que se utilizaran mas adelante y son elgradiente y el Laplaciano. El gradiente se aplica sobre u campo escalar f y se define:

∇f =∂f

∂xx +

∂f

∂yy +

∂f

∂zz (4.5)

Antes de definir el laplaciano se veran algunas propiedades del rotor, la divergencia,y el gradiente que se utilizaran en las siguientes secciones y que se pueden probarfacilmente a partir de sus definiciones:

1.

∇× (∇f) = 0 (4.6)

Es decir que el rotor del gradiente de cualquier campo escalar es siempre cero.

2.

∇ · (∇× v) = 0 (4.7)

Es decir que la divergencia del rotor de cualquier campo vectorial es siemprecero.

3.

∇× (∇× v) = ∇(∇ · v)−∇2v (4.8)

En esta ultima ecuacion aparece ∇2v que es el lapalaciano del campo vectorial.En primer lugar se define el laplaciano de un campo escalar f como

∇2f =∂2f

∂x2+∂2f

∂y2+∂2f

∂z2(4.9)

y a partir de el se define el laplaciano de un campo vectorial v = vxx + vyy + vzzcomo:

∇2v =∂2vx∂x2

x +∂2vy∂y2

y +∂2vz∂z2

z (4.10)

106

Page 107: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

4.1.2. Ecuacion de onda electromagnetica

Si se asume que se esta fuera de la antena y por tanto no hay cargas, ni corrientes,y se toma el rotor a ambos terminos de la Ley de Faraday se obtiene:

∇× (∇×E) = −∇×(∂B

∂t

)∇× (∇×E) = −∂∇×B

∂t

donde en la ultima ecuacion se intercambio el orden del rotor y la derivada res-pecto al tiempo. Para que lo anterior sea valido, se debe asumir que el campo es losuficientemente suave, la cual es una hipotesis habitual.

Utilizando la ecuacion 4.8, la Ley de Ampere: ∇ × H = ∂D∂t (como se dijo se

asume que J = 0 porque el punto se encuentra en el vacıo fuera de la antena), y queH = µ0B y D = ε0E, se obtiene:

∇× (∇×E) = ∇(∇ ·E)−∇2E = −µ0ε0∂(∂E∂t

)∂t

Por otra parte, como la densidad de carga es cero al estar en el espacio libre∇·E = 0 y por lo tanto se llega a la ecuacion de onda del campo electrico en el vacıo:

∇2E = µ0ε0∂2E

∂t2(4.11)

De la misma forma operando con las ecuaciones de Maxwell se puede llegar a laecuacion de onda para el campo magnetico (los detalles quedan como ejercicio parael lector):

∇2B = µ0ε0∂2B

∂t2(4.12)

¿Por que las ecuaciones 4.11 y 4.12 se denominan ecuaciones de onda? Se harauna breve explicacion sobre este punto a continuacion.

Una onda es una perturbacion que se propaga sin variar su forma y a velocidad fija.Se analizara primero el caso unidimencional (por ejemplo una cuerda a que le hacemosuna perturbacion ). En una onda, dada su forma inicial que se notara f(z, 0), la formaen un tiempo t, f(z, t), debe ser la misma que la que tenıa un punto a distancia vt enel instante 0. Es decir que

f(z, t) = f(z − vt, 0) = g(z − vt)

donde v es la velocidad de propagacion de la onda.

ISe llama ecuacion de onda unidimencional a una ecuacion de la forma ∂2f∂z2 =

1v2∂2f∂t2 . Se denomina ecuacion de onda ya que admite como soluciones todas las fun-

ciones de la forma f(z − vt, 0) = g(z − vt). En el caso de una cuerda se puede llegar

107

Page 108: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

a esta ecuacion a partir de las Leyes de Newton, ası como se llego a una ecuacionequivalente (aunque en tres dimensiones) a partir de las ecuaciones de Maxwell.

Las funciones de la forma g(z − vt) no son las unicas que verifican la ecuacion deonda. Tambien se puede ver que la verifica h(z + vt) que es una onda viajando ensentido contrario. Por lo tanto, la solucion mas general para la ecuacion de onda esde la forma f(z, t) = g(z − vt) + h(z + vt).

Se puede observar que la ecuacion de onda para el campo electrico y magneticoson una generalizacion a tres dimensiones de este caso unidimencional. Tambien esimportante observar de las ecuaciones 4.11 y 4.12 que la velocidad de propagacion delas ondas electromagneticas en el vacıo sera v = 1√

µ0ε0que es justamente la constante

c definida antes, la velocidad de la luz.Existen muchas formas de onda que pueden verificar la ecuacion de onda. En el

caso del campo electrico y magnetico interesara un tipo particular de solucion. Comolas corrientes con que excitaremos la antena sera sinusoides o combinaciones linealesde ella, se buscaran soluciones sinusoidales a las ecuaciones de onda de campo electricoy magnetico. Es decir, las soluciones que interesan seran de la forma:

E = E0ej(ku−wt)

B = B0ej(ku−wt)

Donde u es la direccion de propagacion. Escribiremos las ecuaciones habitualmenteen coordenadas polares y modificaremos la notacion para simplificar las operacionesen las siguientes ecuaciones.

E(r, θ, φ, t) = E(r, θ, φ)ejwt

B(r, θ, φ, t) = B(r, θ, φ)ejwt

Antes de continuar con la resolucion de la ecuacion de onda se definira un conceptoque sera importante luego en las antenas. Las ondas que viajan en una cuerda cuandose realiza una perturbacion en ella se denominan transversales porque el desplaza-miento es perpendicular a la direccion de propagacion. Si la cuerda fuera elastica sepodrıa generar una perturbacion estirandola y se podrıan observar ondas longitudi-nales ya que el desplazamiento sobre el equilibrio es en la direccion de propagacion.Las ondas electromagneticas son transversales mientras que las ondas sonoras conlongitudinales.

Existen dos dimensiones perpendiculares a la direccion de propagacion. Por lotanto, las ondas transversales pueden tener dos estados de polarizacion. Si la cuerdase perturba verticalmente se tiene una onda de polarizacion vertical. Si se perturbahorizontalmente se tiene una onda de polarizacion horizontal. Si se la perturba enotra direccion se dice que tiene una direccion de polarizacion dada por la direccionde la perturbacion. Observar que en este caso las oscilaciones se dan en un plano quecontiene al eje de propagacion. En este caso si se descompone la onda en sus com-ponentes vertical y horizontal estas dos componentes estan en fase. En estos casos sedice que se tiene polarizacion lineal. Si la descomposicion en los ejes vertical y hori-zontal, ambas componentes tienen la misma amplitud pero se encuentran desfasados90 grados, entonces se dice que se tiene polarizacion circular, ya que el vector en lugarde moverse en un plano se mueve en una circunferencia.

108

Page 109: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

4.1.3. Ecuacion de onda del potencial magnetico

Caundo se tiene un elemento de corriente que irradia un campo electrico y magneti-co, en general, calcular directamente E y H de las ecuaciones de Maxwell, no es elcamino mas simple. Es mas simple hacerlo a partir de calcular primero el potencialmagnetico A. El potencial magnetico se define segun la ecuacion:

H =1

µ0∇×A (4.13)

y de la Ley de Faraday para el caso de ondas sinusoidales se obtiene:

E =1

jwε0∇×H (4.14)

Por lo tanto conocido A, se pueden obtener operando E y H. Para obtener A seutiliza una ecuacion de onda para el potencial magnetico que se deriva de las ecua-ciones de Maxwell igual que se hizo para las ecuaciones de onda del campo magneticoy electrico. Sustituyendo A en las ecuaciones de Maxwell y operando se obtiene lasiguiente ecuacion de onda para A:

∇2A− µ0ε0∂2A

∂t2= −µ0J

Esta tipo de ecuacion se conoce como ecuacion de D’Alembert no homogenea.Observar que es precisamente no homogenea porque en este caso a diferencia de lasecuaciones de onda que se obtuvieron antes para los campos electricos y magneticos,se asume que hay un elemento radiante de densidad de corriente J.

Si se tiene un elemento con densidad de corriente por unidad de volumen J, sepuede verificar para el caso de ondas sinusoidales que la ecuacion de onda de A tienela siguiente solucion:

A(r, θ, φ) =µ0

∫∫∫J(x′, y′, z′)e−jkR

Rdv′ (4.15)

R es la distancia del elemento de corriente al punto donde se mide el potencialmagnetico. k se denomina constante de propagacion y se define como k = 2π

λ , siendo λla longitud de onda. Si se tiene una densidad de corriente superficial o lineal la integralde volumen se debe sustituir por la correspondiente integral de superficie o en la curvaque corresponda. Esta ecuacion es la clave para calcular el campo generado por unaantena. De esta ecuacion, si se conoce la distribucion de corriente en una antenase puede determinar el potencial A y luego de conocido el potencial magnetico, seobtienen de las ecuaciones 4.13 y 4.14 los campos H y E. Observar tambien que seesta trabajando con una excitacion sinusoidal ası que todos los terminos de la formaejwt estan implıcitos en las ecuaciones.

109

Page 110: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

4.1.4. Radiacion de una antena dipolo hertziano

En esta seccion se aplicaran las ecuaciones anteriores para calcular el campo radia-do por la antena mas simple: un dipolo hertziano. Un dipolo hertziano es un elementode corriente infinitesimal y sinusoidal. Se considera un dipolo hertziano de la forma:I = zI0dl, es decir ubicado en el origen en la direccion del eje z, con I0 la corrienteque circula y dl es la longitud del elemento de corriente. Para aplicar la ecuacion 4.15,en este caso (x′, y′, z′) = (0, 0, 0) y R = r, es decir la distancia de la posicion dondese mide el potencial al origen. Por lo tanto, la ecuacion 4.15 dice que:

A(r, θ, φ) = zµ0

4πI0dl

e−jkr

r= zA0

Es decir que el campo A tiene la misma direccion que el elemento de corriente,en este caso la direccion del eje z. Como la corriente es sinusoidal este campo estamultiplicado implıcitamente por ejwt. Pasado a coordenadas polares se tiene que:

Ar = A0 cos(θ)

Aθ = −A0 sin(θ)

Aφ = 0

Con estas ecuaciones se puede calcular el campo H = 1µ0∇ × A. Operando se

obtiene:

Hr = 0

Hθ = 0

Hφ =jk

4πI0dl sin(θ)

e−jkr

r

(1 +

1

jkr

)A partir de estas ecuaciones se puede calcular E = 1

jwε0∇×H :

Er =k

wε02πI0dl cos(θ)

e−jkr

r2

(1 +

1

jkr

)Eθ =

jk2

wε04πI0dl sin(θ)

e−jkr

r

(1 +

1

jkr− 1

k2r2

)Eφ = 0

Es interesante observar que un elemento de corriente en el origen y en direcciondel eje z, solo causa componentes del campo magnetico en Hφ y de campo electricoEr y Eθ. Por otra estas componentes tienen terminos que decaen con la distanciacomo 1/r, 1/r2 y 1/r3. En particular, para valores de r grandes (kr >> 1) o lo quees lo mismo r >> λ prevalece el termino en 1/r y por tanto los unicos componentesno nulos son:

110

Page 111: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Hφ =jk

4πI0dl sin(θ)

e−jkr

r

Eθ =jk2

wε04πI0dl sin(θ)

e−jkr

r

Esta aproximacion para r >> λ se llama region de campo distante o de Franhoufer.En el campo distante los vectores E y H son ortogonales entre sı y transversales alsentido de propagacion de la onda. Por otra parte, Eθ

Hφen el campo distante es una

constante igual a η0 = kwε0

= 2πλ2πfε0

= 1cε0

=√

µ0

ε0, que ya se vio que es la impedancia

del vacıo e igual a 377 ohms.Por ultimo, se analizara la potencia transmitida en el campo lejano. La densidad

de potencia viene dada por:

S(r, θ, φ) =1

2<(E×H∗) = r

η

2

∣∣∣∣kI0dl4π

∣∣∣∣2 sin2(θ)

r2

Esto muestra que en el campo lejano generado por un dipolo hertziano, la potenciafluye radialmente desde la antena pero la densidad de potencia no es la misma entodas las direcciones.En particular, en la direccion del elemento de corriente (el ejez), sin(θ) = 0 y no hay potencia que fluya en esa direccion.

Antes de pasar a estudiar algunas propiedades de las antenas, se debe hacer uncomentario sobre el campo cercano (r << λ). En este texto el foco estara en el campolejano porque en general el transmisor y el receptor se encuentran a una distanciamucho mayor que la longitud de onda de la portadora. Por otra parte, se puedeobservar que en el campo cercano prevalecen en Hφ el termino que corresponde a r−2

en tanto que en Er y Eθ el que corresponde a r−3. Pero ademas, Er y Eθ estan enfase entre ellos pero a contrafase (90 grados) con Hφ. Por lo tanto la potencia delcampo es reactiva. Las antenas que trabajan con campos cercanos por este motivosson de tipo inductivo.

4.1.5. Caracterizacion de una Antena

En esta seccion se analizaran varias caracterısticas de las antenas que serviranpara caracterizar las antenas y para obtener ecuaciones de la potencia transmitidaentre antenas y la potencia que se pierde en el canal inalambrico.

Si se considera una esfera de radio r con centro en el origen y un elemento dife-rencial de area en esa esfera dA. Este elemento dA tiene asociado un angulo solidocon centro en el origen dΩ y dA = r2dΩ. La potencia que atraviesa el elemento desuperficie dA sera S(r, θ, φ)dA. Por lo tanto, la potencia por unidad de angulo solidosera

U(θ, φ) =S(r, θ, φ)dA

dΩ= r2S(r, θ, φ)

Observar que U(θ, φ) no depende de r ya que S depende de r como r−2 ya que en elcampo lejano el termino que prevalece en los campos electrico y magnetico son el deorden r−1.

111

Page 112: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 4.1: Patron de radiacion dipolo hertziano

Esta potencia por unidad de radiacion se denomina intensidad de radiacion y esun parametro importante en una antena.

El patron de potencia normalizado Pn(θ, φ) se define como el cociente entre ladensidad de potencia y su maximo o como el cociente entre la intensidad de radiaciony su maximo.

Pn(θ, φ) =S(r, θ, φ)

Smax=

U(θ, φ)

Umax

Tambien se definen los patrones de campo normalizados, como el cociente entrelas componentes del campo y sus maximos. Ası por ejemplo para la antena formadapor el dipolo hertziano, el patron de campo normalizado serıa:

Eθn(θ, φ) =Eθ(r, θ, φ)

Eθmax(r)= sin(θ) = Hφn(θ, φ)

El patron de radiacion o el patron de la antena se define como la distribucionespacial de una magnitud que caracteriza el campo electromagnetico generado porla antena. Habitualmente se utiliza el patron de campo o el patron de intensidadde radiacion. En general el patron de radiacion se presenta en un dibujo en dosdimensiones. Este se genera cortando el patron en tres dimensiones por el plano delpatron maximo.

Un patron que se toma cortando con un plano que contiene al eje z es llamadoplano-E ya que este plano contiene al vector de campo electrico. Un patron que setoma con un plano perpendicular al plano-E y que corta la antena de test es llamadoplano-H ya que contiene al vector de campo magnetico. Por ejemplo, para la antenaformada por el dipolo hertziano el plano-E corresponde a un corte por el plano x-z yel plano-H el corte es por el plano x-y. En la figura 4.1 se muestran los patrones decampo normalizados Eθ y Hφ en el plano-E y en el plano-H. Los graficos coincidenya que ambos patrones corresponden a sin(θ). La potencia total radiada por la antenase puede escribir como la integral de la potencia radiada por angulo solido integradaen todo el angulo solido de la esfera:

112

Page 113: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Pr =

∮Ω

U(θ, φ)dΩ

y utilizando la potencia normalizada Pn quedarıa:

Pr = Umax

∮Ω

Pn(θ, φ)dΩ

Si la potencia es radiada uniformemente en todas las direcciones entonces la po-tencia radiada tiene intensidad Umax. Como la esfera tiene 4π estereoradianes laintensidad de potencia radiada promedio sera

Uavg =Pr4π

Se define la directividad de una antena en una cierta direccion D(θ, φ) como

D(θ, φ) =U(θ, φ)

Uavg= 4π

U(θ, φ)

Pr

Si la directividad de una antena se especifica sin direccion, entonces se asume quees la maxima:

D =UmaxUavg

= 4πUmaxPr

Para una antena isotropica que radia una intensidad U0 constante en todas lasdirecciones la directividad es la unidad.

Para un dipolo hertziano ubicado en el origen se puede calcular la potencia radiada:

Pr =

∮Ω

U(θ, φ)dΩ =

∮Ω

U(θ, φ) sin(θ)dθdφ =

∮Ω

r2S(r, θ, φ) sin(θ)dθdφ

Pr =

∮Ω

r2 η

2

∣∣∣∣kI0dl4π

∣∣∣∣2 sin2(θ)

r2sin(θ)dθdφ =

ηπ

3

∣∣∣∣I0dlλ∣∣∣∣2

de donde se concluye que la directividad del dipolo hertziano en el origen es:

D(θ, φ) = 1,5 sin2(θ)

En toda antena, de la potencia que incide a la antena Pi, hay una parte que seirradia Pr y una parte que se pierde (perdidas ohmicas o dielectricas ). Por lo tanto,se define una eficiencia de la antena como β = Pr/Pi. La ganancia de la antena tieneen cuenta esta eficiencia y la directividad de la de la antena

G(θ, φ) = D(θ, φ)β

Si no se especifican (θ, φ) y se da un valor para la ganancia de la antena se asume quees la ganancia en la direccion que es maxima.

113

Page 114: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

4.1.6. Antena receptora

Hasta ahora este capıtulo se ha concentrado en una antena transmisora. Sin em-bargo, las antenas tambien son usadas para recibir energıa. Cuando recibe la energıala antena induce una distribucion de corriente de forma similar a la que se estableceen la antena cuando se va a transmitir. Esta distribucion de corriente lleva ciertapotencia a la carga conectada a los terminales de la antena. Al igual que en transmi-sion, en la recepcion tambien hay perdidas ohmicas y tambien perdidas debido a queuna parte de la potencia es re-irradiada hacia el espacio por la antena. Esta potenciadispersada por la antena receptora tiene un patron de distribucion angular similar alpatron de radiacion de la antena transmisora.

Es decir, que en una antena receptora la potencia entregada a una carga conectadaa sus terminales depende de la distribucion angular con que se recibe el frente de ondaelectromagnetica. Al igual que en el caso de transmision, este patron de recepcion senormaliza sobre el maximo de la potencia recibida. El Teorema de Reciprocidad queno probaremos establece que el patron de radiacion y de recepcion de una antenacoinciden.

El area o la apertura efectiva de una antena es el area en la cual la antena colectaenergıa de la onda incidente y la suministra a la carga conectada a ella. Si la densidadde potencia recibida por la antena es S y la potencia entregada a la carga conectadaa ella es Pr entonces la apertura efectiva sera:

Ae(θ, φ) =S(θ, φ)

Pr

Se prueba que para toda antena la relacion entre la Apertura Efectiva y la Ga-nancia de la antena es:

Ae(θ, φ) =G(θ, φ)λ2

Esta expresion es valida tambien para la apertura y la ganancia maximas.

4.1.7. Ecuacion de transmision de Friis

Se considera una antena transmisora que irradia una potencia Pt y que tiene unaganancia Gt y una antena receptora de ganancia Gr que se encuentra a una distanciaR de la receptora. La longitud de onda utilizada es λ. La densidad de potencia radiadaa una distancia R de la antena transmisora es:

S =PtGt4πR2

Si Ar es el area efectiva de la antena receptora, la potencia recibida sera:

Pr = SAr =PtGtAr4πR2

Como se cumple que

Ar =Grλ

2

114

Page 115: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

entonces,

Pr = PtGtGr

4πR

)2

Esta ecuacion se conoce como ecuacion de Friis y tambien se la utiliza frecuentementeen dB

PrdBm = PtdBm +GtdB +GrdB + 20 log

4πR

)dBm

El termino PL = 10 log(

4πRλ

)2dB representa las perdidas de potencia en el ca-

mino (o en el canal inalambrico)y muestra su dependencia con la distancia y con lafrecuencia. Habitualmente se le denomina perdidas del camino PL.

La transferencia de energıa electromagnetica en el espacio libre que hemos analiza-do desde la antena transmisora a la antena receptora tiene lugar en una lınea directaentre las dos antenas y por lo tanto ese enlace de comunicacion se llama de linea devista (LOS por su sigla en ingles).

Ejemplo 4.1. Un transmisor de 25 W a 900 MHz irradia en el espacio libre utilizandouna antena omnidireccional de 12 dBi. Calcular

1. Calcular la densidad de potencia a una distancia de 10 km de la antena.

2. Si se utiliza un elemento de corriente como antena receptora que se encuentraen la lınea de vista de la antena transmisora ¿cual es la potencia suministradaa los terminales a los que se encuentra conectada la antena receptora?

3. Calcular las perdidas del camino.

La ganancia de la antena transmisora sera Gt = 10GtdB

10 = 101,2 = 15,85. La densidadde potencia a una distancia R de la antena es S = PtGt

4πR2 . Sustituyendo Pt = 25W ,Gt = 15,85, y R = 10000m se obtiene S = 3,15 10−7W/m2.

De la ecuacion de Friis sustituyendo Pt = 25W Gt = 15,85 Gr = 1,5 (ganancia deun elemento de corriente), y λ = c

f = 13m se obtiene que la potencia recibida en la

carga de la antena receptora es: Pr = PtGtGr(

λ4πR

)2= 4,18 10−9W .

Las perdidas del camino son: PL = 10 log(

4πRλ

)2= 20 log

(4π10000

0,3

)= 112,44 dB.

4.1.8. Un primer modelo de un canal inalambrico

En las secciones anteriores se ha analizado como funcionan las antenas y como sepropagan las ondas electromagneticas que ellas generan. Se generalizara ahora lo quese analizo para el campo generado por dipolo hertziano. Con esta generalizacion sedesarrollara un primer modelo simple del canal.

La forma de onda recibida en los bornes de una antena de recepcion ante el campoproducido por una antena de transmision que emite a frecuencia f tendra la forma

g(θ, φ, f)ej2πf(t−r/c)

r(4.16)

115

Page 116: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

donde en la funcion g(θ, φ, f) resume los patrones de radiacion del transmisor yreceptor, perdidas, etc. que dependeran de la posicion relativa de las dos antenas (θ, φ)y de la frecuencia.

Para una posicion fija de las antenas, se define la funcion

H(f) = g(θ, φ, f)ej2πfr/c

r

La ecuacion 4.16 dice que ante una senal de la forma ej2πft emitida en los bornesde la antena transmisora, tendra en bornes de la antena receptora una respuesta :H(f)ej2πft.

La radiacion electromagnetica es un sistema lineal y por lo tanto la respuesta auna entrada combinacion lineal de sinusoides de la forma x(t) =

∫X(f)ej2πftdf sera

una combinacion lineal de sinusoides, es decir

y(t) =

∫H(f)X(f)ej2πftdf

Es decir que la transformada de Fourier de la salida sera Y (f) = H(f)X(f) y porlo tanto la senal en el tiempo es la convolucion:

y(t) =

∫x(τ)h(t− τ)dτ

Por lo tanto, cuando las antenas transmisoras y receptoras se encuentran en posi-ciones fijas, el canal se comporta como un sistema lineal invariante en el tiempo. Latransferencia de este sistema es:

H(f) = g(θ, φ, f)ej2πfr/c

r

Si g(θ, φ, f) no dependiera de f , o al menos si en la banda de interes su variacioncon f fuera pequena, entonces la transferencia serıa de la forma: Kej2πfr/c) y por lotanto h(t) = Kδ(t − r/c), es decir un impulso centrado en r/c. Esto significa que sila senal de entrada es x(t) entonces la salida sera y(t) = Kx(t − r/c). El canal eneste caso causa un modificacion en la amplitud y un retardo en la senal de entrada.Recordemos que esto es valido si g(θ, φ, f) no depende o varıa muy poco con f . Si estono fuera cierto, el canal ya no serıa una exponencial compleja y la senal de entrada semodificarıa en frecuencia y su consecuencia no serıa solo una modificacion en retardoy amplitud. Dependera del ancho de banda de interes si el canal se puede asumir comode modulo constante en frecuencia o no. Si se trabaja con senales de poco ancho debanda entonces sera valido en cambio si la senal tiene un ancho de banda amplio estahipotesis en general no sera valida.

4.1.9. Modelo del canal si una antena se mueve

Si la antena de transmision esta fija y la de recepcion se mueve a velocidad cons-tante v, entonces podemos utilizar el modelo anterior pero ahora la distancia r entre

116

Page 117: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

las antenas no es fija. Se puede escribir que r = r0 +vt. Al igual que en el caso anteriorante una senal sinusoidal enviada en la antena de transmision en recepcion se tendrauna senal de la forma:

g(θ, φ, f)ej2π(ft(1−v/c)−fr0/c)

r0 + vt(4.17)

Por lo tanto, la respuesta a una senal ej2πft sera una senal cuya frecuencia no serala misma sino que sera: f − v/c. Este fenomeno se denomina efecto Doppler y se diceque la frecuencia tiene un desplazamiento Doppler de −v/c.

Este canal si bien sigue siendo lineal ya no es invariante en el tiempo. Es decir queel modelo del canal en este caso sera el de un sistema lineal que varıa en el tiempo.

4.1.10. Modelo del canal si una antena se mueve y hay refle-xion en una pared

Hasta ahora hemos estudiado los modelos utilizando siempre enlaces con lınea devista. En estos casos a partir de las ecuaciones de la distribucion de corriente en laantena se puede calcular el campo electromagnetico en una cierta posicion del espacioasumiendo que las ondas se propagan sin obstaculos en el espacio libre. Con estecampo se puede analizar la senal recibida en la antena de recepcion y como se vioobtener un modelo de canal.

El problema que se plantea ahora es que en general las ondas electromagneticas nose reciben a traves de la lınea de vista porque hay obstaculos o si se reciben a travesde la lınea de vista, esta no es la unica fuente ya que puede haber reflexiones delfrente de onda en diferentes lugares del terreno. Este problema en las comunicacionesinalambricas se denomina habitualmente como multicamino. Este problema se puedeabordar de diferentes formas.

Por un lado, se puede plantear las ecuaciones de reflexion y refraccion del frentede ondas electromagneticas y de acuerdo a las leyes de Maxwell y a los materiales delos obstaculos, se pueden imponer las condiciones de borde adecuadas de los camposy calcular el campo reflejado o refractado. Esto si bien es posible hacerlo en algunoscasos simples analıticamente, en casos mas complicados se debe hacer un calculonumerico con algun software especıfico. Muchas veces la complejidad de estos calculosse puede sustituir por aproximaciones adecuadas para el problema a estudiar.

Por ejemplo, si los obstaculos estan alejados de forma que el campo pueda con-siderarse un campo lejano y se sume que son los suficientemente grandes respectode la longitud de onda se puede estudiar la reflexion y la refraccion del campo elec-tromagnetico, como se estudia en optica asumiendo un modelo de ”partıculas”quechocan contra la superficie y siguen sus leyes fısicas. Este analisis se denomina unaaproximacion ”de rayos”. Esta aproximacion es razonable si los campos son lejanos ysi los obstaculos son suficientemente grandes y estan quietos. En los casos que siguense vera el analisis utilizando un modelo de dos rayos y sobre el final se comentarasobre otros modelos de rayos que se utilizan en algunos contextos de propagacion.Tambien existe software, que permite en casos mas complejos resolver numericamentelas ecuaciones de propagacion utilizando un modelo de rayos y teniendo en cuenta latopologıa del terreno y la ubicacion de las antenas.

117

Page 118: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 4.2: Movil con reflexion en pared

Cuando los obstaculos no estan quietos y tienen movimientos no conocidos o cuan-do las antenas se mueven sin un recorrido conocido entonces lo multicaminos varıanen el tiempo y es necesario utilizar modelos estadısticos para las analizar estas varia-ciones. Sobre el final del capıtulo se analizaran algunos modelos de este tipo.

En el caso de la figura 4.2 se tiene una antena transmisora y una pared a unadistancia r0 de esta. Un movil con una antena receptora parte en t = 0 de la pared yse mueve hacia la antena transmisora a velocidad constante v. Se asume que la paredesta a una distancia tal que el campo electromagnetico de la antena transmisora puedaconsiderarse lejano y que la pared es lo suficientemente grande como para reflejarcompletamente este campo electromagnetico lejano. En esas condiciones el camporeflejado es igual al campo que habrıa detras de la pared si la pared no existiera.Es decir que el campo reflejado en un punto r0 − vt es igual al campo original de laantena en un punto r0 + vt. La senal total recibida en la antena receptora sera de laforma:

g(θ, φ, f)

(ej2π(ft(1+v/c)−fr0/c)

r0 − vt− ej2π(ft(1−v/c)−fr0/c)

r0 + vt

)(4.18)

Si asumimos que al inicio del movimiento con t pequeno los denominadores sepueden aproximar en los dos terminos por r0, entonces se puede escribir la senalrecibida como:

g(θ, φ, f)ej2πf(t−r0/c)

r0

(ej2πftv/c − ej2π−ftv/c

)= 2g(θ, φ, f)

ej2πf(t−r0/c)

r0sin(2πftv/c)

(4.19)

Esto es el batido de dos sinusoides una de frecuencia f como la senal enviada yotra de frecuencia mucho mas baja fv/c. Si por ejemplo un automovil se desplazaa 100 km/h y la frecuencia de la transmision es en la banda celular de 900 MHz, lafrecuencia del batido sera fv/c = 900(MHz)∗100(km/h)/300000(km/s) ≈ 83Hz. Elresultado se muestra en la la figura 4.3. Como se puede apreciar en algunos milisegun-dos la amplitud de la senal pasa de un maximo a cero. Este fenomeno se denominadesvanecimiento multicamino (multipath fading).

118

Page 119: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 4.3: Desvanecimiento multicamino

Figura 4.4: Modelo de dos rayos con reflexion en el piso

4.1.11. Modelo de dos rayos con reflexion en el piso

Si se asume que se tiene un sistema como el de la figura 4.4. Donde hs y hr sonlas alturas de las antenas transmisora y receptora, r es la distancia entre antenas, r1

es la longitud del rayo de linea de vista y r2 es la longitud del rayo reflejado.Se puede probar que si (hs+hr)/r << 1, es decir que la distancia entre las antenas

es mucho mayor que las alturas de las mismas, entonces r2− r1 se puede aproximarpor su desarrollo de Taylor de primer orden: 2hshr/r. La senal reflejada en el pisoidealmente sera igual a la original pero con un cambio de signo. Por lo tanto, la senalrecibida por la antena tendra la siguiente forma:

g(θ, φ, f)

(ej2πft(1−r1/c)

r1− ej2πft(1−r2/c)

r2

)(4.20)

Con la aproximacion mencionada, se puede escribir r2 = r1 + 2hshr/r = r1 +β/r,entonces la senal recibida sera

g(θ, φ, f)ej2πft(1−r1/c)(

1

r1− e−j2πftβ/rc

r2

)(4.21)

Para r suficientemente grande es decir que β/r << f/c = λ la segunda exponencialse puede aproximar por el termino de primer orden de su desarrollo en serie, es decir

119

Page 120: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

que la senal recibida se puede aproximar por

g(θ, φ, f)ej2πft(1−r1/c)(

1

r1− 1− j2πftβ/rc

r2

)(4.22)

Para r suficientemente grande 1/r1 − 1/r2 es del orden de 1/r3 y r2 ≈ r. Por lotanto lo podemos aproximar por cero y la senal recibida queda de la forma:

g(θ, φ, f)ej2πft(1−r1/c)j2πftβ

cr2(4.23)

Lo interesante de ver en este caso es que si r es suficientemente grande el campoya no disminuye como inversamente proporcional a la distancia entre las antenas sinocomo inversamente proporcional al cuadrado de la distancia (y por tanto la potenciacomo inversamente proporcional al distancia a la cuarta). Es decir que el reflejo en elpiso practicamente anula la senal a partir de un cierto punto en que la aproximacionrealizada sea valida.

Existen otros modelos para situaciones mas complejas como por ejemplo para unpar de antenas ubicadas en un entorno urbano (una calle con edificios a ambos ladospor ejemplo) y con antenas cercanas al piso. En este caso, ya no hay un par de rayossolamente que inciden en la antena receptora sino un conjunto muy importante derayos por los diferentes posibles rebotes en los edificios, Un modelo utilizado paraeste caso por ejemplo fue desarrollado por Amitay y utiliza 10 rayos para el analisis.Existen tambien modelos mas complejos que tienen en cuenta no solo la reflexion de lasenal en los obstaculos sino tambien su difraccion. No nos detendremos en este temaen este texto pero pueden encontrarse diferentes modelos de este tipo por ejemplo en[8] y [9].

A continuacion se vera como utilizar estos modelos de rayos para modelar larelacion entrada salida de un canal inalambrico.

4.1.12. Modelo general entrada salida de un canal inalambrico

Se asumira que a la antena receptora arriban m rayos, el de LOS y los restantespor reflexiones en diferentes obstaculos. Asumimos que las antenas se mueven o losobstaculos pero no necesariamente a velocidad constante, aunque luego se hara algunahipotesis sobre este movimiento. Por lo tanto, la senal de salida en bornes de la antenareceptora ante una entrada simusoidal de la formaej2πft sera:

Yf (t) =

m−1∑i=0

gi(t)ej2πf(t−ri(t)/c)

ri(t)(4.24)

donde ri(t) es la distancia entre el transmisor y el receptor pero a traves delobstaculo i. Es decir es la suma de la longitud de los rayos desde el transmisor alobstaculo i y del rayo reflejado en el obstaculo i hasta el receptor. Depende del tiempoporque se asume que puede haber movimiento. gi(t) es el patron de radiacion debido alcamino i, que depende del tiempo porque los angulos (θ, φ) pueden variar al moverselos objetos. Ademas, se ha supuesto que gi no depende de f o al menos que varıa pocoen la banda de interes. En el ejemplo visto de la pared reflectora g0 correspondıa al

120

Page 121: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

patron de radiacion del camino directo (LOS) que denominaremos g y g1 correspondıaa la reflexion perfecta en la pared y valıa −g.

La ecuacion 4.24 se puede escribir de la siguiente forma:

Yf (t) =

m−1∑i=0

qi(t)ej2πf(t−τi(t)) (4.25)

qi(t) =gi(t)

ri(t)(4.26)

τi(t) =ri(t)

c(4.27)

la salida yf (t) la podemos escribir entonces de la siguiente forma

Yf (t) = H(f, t)ej2πft

H(f, t) =

m−1∑i=0

qi(t)e−j2πfτi(t)

La funcion H(f, t) es similar la funcion de transferencia H(f) de un sistema lineale invariante en el tiempo y se denomina funcion de transferencia de un sistema linealvariable en el tiempo. Ya se menciono que se asume que qi(t) variaba poco en elrango de frecuencia de interes. Se asume tambien que qi(t) varıa lentamente en losintervalos de tiempo de interes y por lo tanto asumiremos que es constante en eltiempo qi. Por ultimo se asumira que el retardo τi(t) varıa linealmente con el tiempoes decir τi(t) = τ0

i + τ ′i t.

H(f, t) =

m−1∑i=0

qie−j2πf(τ0

i +τ ′it) (4.28)

Se asume que el sistema es lineal lo cual es una hipotesis razonable por la linealidadde las ecuaciones de Maxwell, por lo tanto ante una entrada suma de sinusoidesx(t) =

∫X(f)ej2πfdf se tendra una salida de la forma:

y(t) =

∫H(f, t)X(f)ej2πftdf

Se define la respuesta al impulso del sistema lineal y variable en el tiempo comola antitransformada de fourier de h(f, t) donde t es visto como un parametro:

h(τ, t) =

∫H(f, t)ej2πfτdf

H(f, t) =

∫h(τ, t)e−j2πfτdτ

H(f, t) se puede ver como la transferencia de un sistema LTI qur varıa lentamentecon el tiempo t y la respuesta al impulso h(τ, t) como la respuesta al impulso de un

121

Page 122: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

sistema LTI h(τ) que varıa lentamente en el tiempo t. Por ultimo de estas ecuacionesse puede escribir:

y(t) =

∫H(f, t)X(f)ej2πftdf

y(t) =

∫X(f)

(∫h(τ, t)e−j2πf(t−τ)dτ

)df

y(t) =

∫h(τ, t)

(∫X(f)e−j2πf(t−τ)df

)dτ

y(t) =

∫h(τ, t)x(t− τ)dτ

La ultima expresion nos muestra que la salida se puede expresar como la convolucionde la entrada con la respuesta al impulso del sistema al igual que en un sistema linealinvariante en el tiempo. La respuesta al impulso h(τ, t) resume todos los efectos delas antenas, la propagacion electromagnetica, etc..h(τ, t) es la respuesta en el tiempot a un impulso en el tiempo t− τ .

Para el modelo simplificado de la ecuacion 4.28, la transferencia y su respuesta alimpulso seran:

H(f, t) =

m−1∑i=0

qie−j2πfτi(t)

h(τ, t) =

m−1∑i=0

qiδ(τ − τi(t))

y por lo tanto la salida y(t) a una entrada x(t) sera:

y(t) =

m−1∑i=0

qix(t− τi(t)) (4.29)

Es decir que el efecto del canal se resume en que la salida es igual a la suma de lasalida correspondiente a cada camino. La salida de un camino es la senal retardadaun retardo variable que depende del camino y una atenuacion tambien dependientedel camino.

4.1.13. Desvanecimiento (Fading) frecuencia y tiempo de cohe-rencia

Hemos visto que

H(f, t) =

m−1∑i=0

qie−j2πfτi(t) =

m−1∑i=0

qie−j2πf(τ ′it+τ0)

Esta ecuacion se puede escribir en funcion del desplazamiento Doppler Di = −fτ ′i

H(f, t) =

m−1∑i=0

qiej2π(Dit−fτ0)

122

Page 123: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Por lo tanto la salida yf (t) corresondiente a una entrada sinusoidad ej2πft sera

yf (t) =

m−1∑i=0

qiej2π((f+Di)t−fτ0) (4.30)

Es decir que ante una entrada sinusoidal de frecuencia f se obtiene una suma desinusoides de frecuencias que varıan entre f +Dmin y f +Dmax. Normalmente Dminy Dmax son pequenas comparadas con f por lo tanto la senal que se recibe es unasenal de banda angosta cuya dispersion en frecuencia es

D = Dmax −Dmin (4.31)

D se denomina dispersion Doppler (o Doppler spread en ingles). Esta disper-sion depende principalmente de la velocidad de movimiento relativo entre antenas yobstaculos. Si la senal tiene un ancho de banda B mucho mayor que D, el efecto dela dispersion Doppler no sera significativo y en este caso se denomina desvanecimien-to lento (slow fading) en caso contrario se denomina desvanecimiento rapido (fastfading). Se puede observar de la ecuacion 4.30 que la salida se puede escribir como:

yf (t) = |H(f, t)|ej2πft+∠H(f,t)

Es decir que la salida es una senal sinusoidal cuya amplitud varıa con el tiempo(tambien la fase). Como se menciono yf (t) es una senal pasabanda con un ancho debanda D. |H(f, t)| sera entonces una senal banda base con limitada en frecuencia aD/2. Se define el tiempo de coherencia del canal como

Tcoh =1

D(4.32)

El tiempo de coherencia da un orden de magnitud del tiempo de desvanecimientoes decir el tiempo en el cual la magnitud de la respuesta al impulso del canal cambiasignificativamente.

El efecto Doppler causa una dispersion en frecuencia como se ha visto. El multi-camino causa una dispersion en el tiempo por los retardos variables de los diferentescaminos. Se define la dispersion temporal (delay spread) como:

T = maxjτj(t)−mın

jτj(t) (4.33)

La diferencia entre caminos en general es menor que algunos kilometros y porlo tanto la dispersion temporal es en general menor que algunos microsegundos. Unparametro relacionado con este es la frecuencia de coherencia del canal definida como:

Fcoh =1

T(4.34)

La frecuencia de coherencia del canal da un orden de magnitud de cuanto se debemover la frecuencia para salir de un desvanecimiento, es decir si en el espectro de la

123

Page 124: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

senal hay un desvanecimiento a la frecuencia f para salir de ese desvanecimiento debomoverme del orden de f +Fcoh. Para entender por que esto es ası, se puede observarla transferencia del canal y la respuesta al impulso en el modelo simplificado:

H(f, t) =

m−1∑i=0

qie−j2πfτi(t)

h(τ, t) =

m−1∑i=0

qiδ(τ − τi(t))

Es decir que la respuesta del canal a un impulso en tiempo 0 es una senal quese extiende en el tiempo desde t = mıni τi hasta t = maxi τi. Es decir se extiende Ten el tiempo. Para tt fijo H(f, t) es en frecuencia una suma de senales sinusoidalesde frecuencias τi y la dispersion de estas frecuencias es T , por lo tanto es razonablepensar que en un rango de frecuencias menores a Fcoh = 1

T la transferencia no tengaun cambio significativo en la magnitud de H(f, t) y para variaciones en frecuenciamayores que Fcoh si puede haber un cambio significativo. Si se transmite una senalpasabanda de ancho de banda B y frecuencia portadora fc. Si se cumple que B << Fentonces H(f, t) ≈ H(fc, t) para todo f en ancho de banda de la senal y por lo tantono hay una modificacion del espectro de la senal de entrada. En este caso se dice quese tiene un desvanecimiento plano (flat fading). Si por el contrario B >> F el espectrode la senal se vera afectado por el multicamino se dice que se tiene un desvanecimientoselectivo en frecuencia (frquency selective fading).

4.1.14. Modelo bandabase del canal en tiempo continuo y dis-creto

Se comenzara analizando en primer lugar el caso de tiempo continuo. En el capıtulode modulacion se ha visto que la senal a enviar se puede escribir como:

s(t) = <(sb(t)ej2πfct)

siendo sb(t) =∑k a[k]p(t−kTs) la senal compleja en bandabase a enviar. La senal

recibida se podra expresar de la misma forma

r(t) = <(rb(t)ej2πfct)

Si se sustituyen entrada y salida en la ecuacion 4.29 que brinda la relacion entradasalida de un canal inalambrico se obtiene:

<(rb(t)ej2πfct) =

m−1∑i=0

qi(t)<(sb(t− τi(t))ej2πfc(t−τi(t))) =

<(rb(t)ej2πfct) = <

(m−1∑i=0

qi(t)sb(t− τi(t))e−j2πfcτi(t)ej2πfct

)

124

Page 125: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

de donde se puede escribir que:

rb(t) =

m−1∑i=0

qi(t)sb(t− τi(t))e−j2πfcτi(t)

rb(t) =

m−1∑i=0

qib(t)sb(t− τi(t)) donde qib(t) = qi(t)e−j2πfcτi(t) (4.35)

donde la ecuacion anterior define lo que se denominara como equivalente banda-base del canal y su respuesta al impulso sera:

hb(τ, t) =

m−1∑i=0

qib(t)δ(t− τi(t))

De esta ecuacion se puede observar tambien que la respuesta en frecuencia delequivalente bandabase del canal sera:

Hb(f, t) = H(f + fc, t)

es decir, es la respuesta en frecuencia del canal desplazada la frecuencia de laportadora.

Se analizara ahora el equivalente bandabase del canal inalambrico en tiempo dis-creto. Se utilizara el teorema de muestreo para representar la senal por sus muestras.Si la senal sb(t) esta limitada en frecuencia a W/2 se puede escribir:

sb(t) =∑i

sb(i/W ) sinc(Wt− i)

Si se denomina sb[i] = sb(i/W ) y se sustituye en la ecuacion 4.35 se obtiene:

rb(t) =

m−1∑i=0

qib(t)∑k

sb[k] sinc(W (t− τi(t))− k)

rb(t) =∑k

sb[k]

m−1∑i=0

qib(t) sinc(W (t− τi(t))− k)

Si la salida se muestrea a la misma frecuencia que la entrada y se denominarb[n] = rb(n/W )

rb[n] =∑k

sb[k]

m−1∑i=0

qib(t) sinc(W (n/W − τi(n/W ))− k)

rb[n] =∑k

sb[k]

m−1∑i=0

qib(t) sinc(n− k −Wτi(n/W )))

rb[n] =∑j

sb[n− j]m−1∑i=0

qib(t) sinc(j −Wτi(n/W )))

125

Page 126: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

donde en la ultima ecuacion se ha realizado el cambio de variable j = n− k. Si sedefine el j-esimo tap de la respuesta al impulso del canal como:

hjb[n] =

m−1∑i=0

qib(t) sinc(j −Wτi(n/W ))) (4.36)

la salida del equivalente bandabase se puede escribir:

rb[n] =∑j

sb[n− j]hjb[n] (4.37)

Se debe observar de la ecuacion 4.36 que el tap j es una funcion principalmentede los qib tales que j −Wτi(n/W ) ≈ 0, es decir aquellos taps en los que el retardo esproximo a j/W .

4.1.15. Modelos de perdidas de camino empıricos

Existen modelos que en lugar de proponer metodos analıticos para calcular lasperdidas de camino entre transmisor y receptor, lo que hacen es utilizar un modeloempırico. Estos modelos las perdidas de camino se miden para un cierto tipo de am-biente y se promedian para remover el efecto del multicamino. En general tambienpara un ambiente urbano por ejemplo, se hacen promedios de mediciones en diferen-tes puntos de diferentes ciudades. Un modelo urbano para el rango de frecuenciasde 150 a 1500 MHz es el modelo de Okumura [10], que se obtuvo empıricamentehaciendo mediciones en la ciudad de Tokio. El modelo establece que las perdidas decamino se obtienen de: PL(d)dB = L(fc, d)+Amu(fc, d)−G(ht)−G(hr)−GAREAdonde L(fc, d) son las perdidas de camino en el espacio libre ya vistas, G(ht) es laganancia de la antena de transmision debido a su altura ht y G(hr) es lo mismopara la antena de recepcion. Estas ganancias estan aproximadas por las siguientesformulas:G(ht) = 20log10(ht/200) para 30m < ht < 1000m y Gr = 10log10(hr/3)para hr ≤ 3m yG(hr) = 20log10(hr/3) para 3m < hr < 10m. Por ultimo, Amu(fc, d)es la atenuacion adicional a las perdidas de camino en el espacio libre y se obtienendeunas tablas calculadas empıricamente por Okumura y GAREA es la ganancia debidaal tipo de ambiente tambien calculada empıricamente y tabuladas. Hay muchos otrosmodelos para diferentes ambientes. Por ejemplo para ambientes urbanos tambien seusan el modelo de Hata [11] [12] (y una extension de este denominada COST231) sonsimilares al modelo de Okumura pero en lugar de utilizar tablas plantean una formulacerrada en funcion de los mismos parametros que el modelo de Okumura.

Todos estos modelos y la mayorıa de los utilizados en la practica tienen una formageneral comun:

Pr(dBm) = Pt(dBm) +K(dB)− 10γ log(d

d0)

donde K depende de las antenas y de la atenuacion promedio del medio γ dependedel ambiente (urbano, suburbano, etc.) y d0 es la distancia de referencia para que lapropagacion se encuentre en el campo lejano o sea el modelo es solo valido para

126

Page 127: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

distancias d > d0. Estos parametros se pueden estimar empıricamente analıticamenteo a partir de modelos existentes. En una version simplificada, d0 se asume entre 1 y10 m para indoor y entre 10 y 100 m para outdoor. La expresion mas simple paraK es asumir que corresponde a las perdidas de la propagacion en espacio libre deuna antena omnidireccional es decir: K(dB) = 20 log( λ

4πd0) y γ varıa entre 6,5 para

macroceldas en ambientes urbanos y entorno a 2 para dentro de una oficina.

127

Page 128: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

128

Page 129: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Bibliografıa

[1] Principles of Digital Communication, Gallager, R. G., Cambridge UniversityPress, Cambridge, UK, 2008.

[2] Introduction to Electrodynamics, David J. Griffiths , Pearson; 4 edition , 2014.

[3] Antennas and Wave Propagation, G Harish, A.R., Sachidananda, M., OxfordUniversity Press , 2007.

[4] Antenna Theory and Design, Warren L. Stutzman, Gary A. Thiele, Wiley; 3edition, 2012.

[5] Antenna Theory: Analysis and Design, Constantine A. Balanis, Wiley; 4 edition,2016.

[6] Wireless Communications, Andrea Goldsmith, Cambridge University Press; 1edition , 2005.

[7] Fundamentals of Wireless Communication, David Tse, Pramod Viswanath,Cambridge University Press; 1 edition , 2005.

[8] Modeling and computer simulation of wave propagation in linealline-of-sight mi-crocells, N. Amitay, IEEE Trans. Vehic. Technol., Vol VT-41, No. 4, pp. 337–342,1992.

[9] Radio propagation at microwave frequencies for line-of-sight microcellular mobileand personal communications, IA.J. Rustako, Jr., N. Amitay, G.J. Owens, andR.S. Roman, IEEE Trans. Vehic. Technol. Conf., Vol VT-40, No. 1, pp. 203–210,1991.

[10] Field strength and its variability in VHF and UHF land-mobile service, Y .Okumura, E. Ohmori, Fukuda, Rev. Elec. Comm. Lab., vol. 16,No. 9-10,pp.825-873, 1968.

[11] Empirical formula for propagation loss in land mobile radio services, M. Hata,IEEE Trans. Veh. Tech., vol. 29, No. 3, pp. 317-325, 1980.

[12] Okumura-Hata propagation prediction model for UHF range, Prediction met-hods for the terrestrial land mobile service in the VHF and UHF bands, ITU-RRecommendation P.529-2. Geneva: ITU, pp. 5-7, 1995.

129

Page 130: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

130

Page 131: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Capıtulo 5

Procesos estocasticos,procesos Gaussianos, ruido ydeteccion

5.1. Introduccion

5.2. Procesos estocasticos

5.2.1. Definicion y ejemplos

Recordamos que una variable aleatoria es una funcion que le asigna a cada eventoposible ω de un espacio muestral un numero X(ω).

Definicion 5.1. Un proceso estocastico X(t) es una funcion que asigna para ca-da ω una funcion X(t, ω). Tambien se puede definir como un conjunto de variablesaleatorias una para cada t. t para nosotros sera el tiempo.

Si el proceso se piensa como un mapeo en el que dado un ω se tiene una funcion deltiempo X(t, ω), a cada una de estas funciones del tiempo se les llama una trayectoria oun “sample path”del proceso. Interesaran dos casos: cuando t ∈ R que se denominaranprocesos de tiempo continuo y cuando t ∈ Z que se denominaran procesos de tiempodiscreto.

Las distribuciones conjuntas para todo n y para todo t1, .., tn se llaman distribu-ciones finito dimensionales del proceso:

FX(t1),..X(tn)(x1, ..xn) = P (X(t1) ≤ x1, .., X(tn) ≤ xn)

y para todo x1, .., xn.Serıa deseable que definidas las distribuciones finito dimensionales del proceso

quedara totalmente definido el proceso, es decir pudieramos conocer la probabilidadde que X(t) pertenezca a cualquier conjunto de numeros reales. Esto es cierto paralos procesos de tiempo discreto pero no para los de tiempo continuo.

131

Page 132: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 5.1: Paseo al azar o caminata aleatoria

Definicion 5.2. Definiremos que un proceso es estacionario si todas las distribucionesfinito dimensionales verifican que:

FX(t1),..X(tn)(x1, ..xn) = FX(t1+τ),..X(tn+τ)(x1, ..xn)

es decir las distribuciones finito dimensionales son invariantes a una traslacion enel tiempo.

Este capıtulo se centrara en este tipo de procesos (en realidad en un subconjunto deestos que definiremos mas adelante). Interesan estos procesos porque son procesos quehan llegado a un estado de “regimen” que es principalmente el foco de este capıtulo.Si se quisiera estudiar transitorios con procesos estocasticos el foco de estudio es otroy la disciplina que se encarga de esto se denomina calculo estocastico. Se veran acontinuacion algunos ejemplos de procesos estocasticos. Se dejara para mas adelanteen este capıtulo el analisis del mas relevante para los objetivos del capıtulo que sonlos procesos Gaussianos.

Ejemplo 5.1. Sea A[n] un conjunto de variables aleatorias independientes e identi-camente distribuidas (i.i.d.) con una distribucion discreta que toma valor 1 o -1 conprobabilidad 1/2. Se define el proceso estocastico de tiempo discreto X[n] de la si-guiente forma:

X[0] = 0

X[n] = A[1] +A[2] + ..A[n]

Este proceso se llama paseo al azar o caminata aleatoria o random walk y unatrayectoria o sample path del proceso se muestra en la Figura 5.1. Explique por queeste proceso no puede ser estacionario. Observe los estados que es posible alcanzar enX[1] y los que es posible alcanzar en X[2] por ejemplo.

Ejemplo 5.2. Veremos ahora un ejemplo de un proceso aleatorio de tiempo continuo.La onda binaria aleatoria. Sea A[n] un conjunto de variables aleatorias i.i.d. conuna distribucion discreta que toma el valor A o -A con probabilidad 1/2. Se define

132

Page 133: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 5.2: Onda binaria aleatoria

el proceso estocastico X(t) de la siguiente forma: X(t) es constante en intervalost ∈ [nT, (n+ 1)T ] y en cada intervalo toma el valor de A[n]. La onda binaria aleatoriase muestra en la Figura 5.2 y es un modelo habitualmente usado para un receptor querecibe una senal binaria que desconoce.

Ejemplo 5.3. Por ultimo veremos un ejemplo que no le daremos una utilidad practicapero si muestra que un proceso aleatorio puede ser algo diferente a lo que uno seimagina en primera instancia. Definimos X(t) = tA , con t ∈ [0, 1] y donde A es unavariable aleatoria con una distribucion continua cualquiera, por ejemplo una variablealeatoria Gaussiana. Las trayectorias de este proceso estan definidas por un sorteoque se hace inicialmente y que define la pendiente de la trayectoria. Las trayectoriasson todas rectas en [0,1] con pendiente aleatoria. Como se puede ver la forma de ondade las trayectorias no es aleatoria, lo unico aleatorio es su pendiente. Explicar por queeste proceso no es estacionario.

5.2.2. Estadısiticos de segundo orden de un proceso

Como menciono anteriormente las distribuciones finito dimensionales dan una ca-racterizacion de los procesos por ejemplo permitiendo definir una clase importante deprocesos estocasticos, los procesos estacionarios. Sin embargo, estos estadısticos deorden n muchas veces no son posibles (o al menos faciles) de calcular. Varios de losprocesos que seran de interes en este texto, estaran caracterizados por sus estadısti-cos de segundo orden solamente. En esta seccion se analizaran estos estadısticos y suspropiedades. Para que los estadısticos de segundo orden y las definiciones de estacio-nariedad en sentido amplio que se definiran a continuacion esten bien definidas, seasumira de aquı en mas que los procesos con los que se trabaja tienen momento desegundo orden finito, es decir E(X(t)2) <∞.

Definicion 5.3. En primer lugar definiremos la funcion de autocorrelacion de unproceso X(t) de la siguiente forma:

RX(t, s) = E(X(t)X(s))

133

Page 134: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Si X(t) es estacionario entonces sabemos que su valor esperado es constante, esdecir E(X(t)) = µ y ademas,

RX(t, s) = E(X(t)X(s)) = E(X(t− s)X(0)) = RX(t− s)

es decir que su autocorrelacion solamente depende de la distancia entre los dostiempos en que se observa el proceso y no de los tiempos especıficos. Tambien sepuede definir la autocovarianza del proceso que en algunos casos es conveniente usaren lugar de la autocorrelacion como

CX(t, s) = E(X(t)X(s))−E(X(t))E(X(s))

Si el proceso es estacionario con E(X(t)) = µ entonces:

CX(t− s) = RX(t− s)− µ2

En general salvo que se diga explıcitamente se trabajara con procesos estacionariosy de media nula, por lo tanto en ese caso la covarianza y la correlacion coinciden.

Las caracterısticas de la media y la correlacion de un proceso estacionario, llevana definir un concepto de estacionariedad menos estricto que el anterior pero que enmuchos casos de interes es suficiente.

Definicion 5.4. Un proceso estocastico es estacionario en sentido amplio (WSS, porsu sigla en ingles), si E(X(t)) = µ constante en el tiempo y RX(t, s) = RX(t− s)

Si bien de los comentarios anteriores se deduce facilmente que un proceso estacio-nario lo es tambien en sentido amplio el recıproco no es cierto.

Veremos algunas propiedades la correlacion para procesos WSS.1. Independencia. Si X(t) y X(t− s) son independientes entonces RX(t− s) = 0.

Recordar que se esta trabajando con procesos de media nula sino esto es valido parala covarianza. El recıproco no es cierto salvo para procesos Gaussianos como se veramas adelante.

2. |RX(τ)| ≤ RX(0). Se puede probar facilmente calculando:

E((X(τ)−X(0))2) = E(X(τ)2) + E(X(0)2)− 2E(X(τ)X(0)) ≥ 0

como el proceso es WSS RX(0) = E(X(0)2) = E(X(τ)2) por lo tanto,

RX(τ) = E(X(τ)X(0)) ≤ E(X(0)2) = RX(0)

Observar que si RX(τ) = RX(0) entonces E((X(τ) − X(0))2) = 0 y por tantoX(τ) = X(0) con probabilidad 1.

De la misma forma pero considerando E((X(τ) + X(0))2) se puede probar queRX(τ) =≥ −RX(0) y por tanto que si RX(τ) = −RX(0) es X(τ) = −X(0) conprobabilidad 1.

Por otro lado, si bien RX(τ) = 0 no implica la independencia, si hay independenciaRX(τ) = 0. Por tanto vemos que la correlacion da una nocion de similitud entredesplazamientos temporales de un proceso del tipo de similitud que brinda el producto

134

Page 135: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

interno entre funciones de L2. Informalmente podemos decir, que si la correlacionRX(τ) es alta (cercana a RX(0)) entonces X(t) y X(t + τ) son aproximadamente lamisma variable aleatoria en cambio si RX(τ) = 0, X(t) y X(t + τ) se parecen pococomo variables aleatorias.

3. RX(τ) = RX(−τ). Esto se puede ver de la propia definicion ya que RX(τ) =E(X(t)X(t+ τ)) = E(X(s− τ)X(s)) = RX(−τ).

Veamos algunos ejemplos.

Ejemplo 5.4. Se considera el siguiente proceso estocastico X(t) = t + A siendo Auna variable aleatoria con una distribucion cualquiera. Por lo tanto,

E(X(t)) = t+ E(A)

RX(t, s) = E(X(t)X(s)) = E((t+A)(s+A)) = E(A2 + ts+At+As)

RX(t, s) = ts+ E(A2) + E(A)(t+ s)

Como se puede observar si se grafican las trayectorias de este proceso, las ecuacionesanteriores muestran que el valor esperado del proceso no es constante y la autoco-rrelacion no depende solo de la diferencia entre tiempos. Por lo tanto, el proceso noes estacionario en sentido amplio ( y obviamente tampoco es estacionario en sentidoestricto).

Ejemplo 5.5. Se considera el siguiente proceso estocastico en tiempo discreto X[n].Este proceso es una secuencia i.i.d. donde para cada n, la variable aleatoria tienedistribucion N (0, σ2). Por lo tanto E(X[n]) = 0 y E(X2[n]) = σ2. Se calculara ahorala autocorrelacion.

RX(n,m) = E(X[n]X[m]) = σ2δ[n−m]

ya que como las variables son independientes y de media nula, el valor esperado delproducto es cero salvo para n = m en cuyo caso es σ2. Como se ve el proceso es WSSya que la media es constante y la autocorrelacion depende solamente de la diferenciade tiempos.

Ejemplo 5.6. Se considera el siguiente proceso estocastico

X(t) = cos(w0t+ θ)

con θ una variable aleatoria con distribucion uniforma en [0, 2π]. EvidentementeE(X(t)) = 0, se calculara entonces la autocorrelacion del proceso

RX(t, s) = E(X(t)X(s)) = E(cos(w0t+ θ) cos(w0s+ θ))

RX(t, s) =1

2cos(w0(t− s)) +

1

2E(cos(w0(t+ s) + 2θ))

Como la distribucion de θ es uniforme en [0, 2π] entonces:

E(cos(w0(t+ s) + 2θ)) =1

∫ 2π

0

cos(w0(t+ s) + 2θ)dθ = 0

135

Page 136: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

y por lo tanto,

RX(t, s) =1

2cos(w0(t− s))

De donde se observa que el proceso es WSS. ¿Que sucederıa con la estacionariedadsi en lugar de θ tener distribucion uniforme tuviera cualquier otra distribucion?

Observarque el proceso tiene las trayectorias periodicas y obtuvimos una autoco-rrelacion periodica.

Ejercicio 5.1. Se considera la onda binaria aleatoria pero con un retardo aleatorioque tiene distribucion uniforme en [0, T ]. Probar que la autocorrelacion RX(τ) =

A2(1 − |τ |T ) para |τ | ≤ T y 0 en otro caso. ¿Que sucederıa con la estacionariedad sino se agregara el retardo aleatorio?

Definicion 5.5 (Correlacion cruzada, senales incoherentes). Ası como se definio laautocorrelacion en dos diferentes instantes de tiempo para un proceso, se puede definirde manera analoga la correlacion cruzada para dos procesos diferentes. Sean X(t) eY (t) dos procesos aleatorios, se define la correlacion cruzada de la siguiente forma:

RXY (t, s) = E(X(t)Y (s))

En muchos casos de interes esta correlacion no depende de t y s sino que solo de ladiferencia t − s. Dos procesos de media nula se dicen incoherentes si RXY (τ) = 0∀τ . Si los procesos son independientes entonces son incoherentes. El recıproco no escierto.

5.2.3. Analisis espectral

En el ejemplo del coseno con fase aleatoria vimos que la informacion frecuencial semantenıa en la autocorrelacion. Esta observacion se puede generalizar. Sin pretenderser formales en el siguiente argumento, se puede ver que si el proceso es tal que paratodo t, X(t) es muy “similar” como variable aleatoria (es decir son muy dependien-tes) a X(t+T0), entonces RX(τ) y RX(τ +T0) tendran valores similares. Esto quieredecir que la informacion frecuencial del proceso se refleja en su autocorrelacion. Evi-dentemente para encontrar las componentes en frecuencia de un proceso no se puedecalcular la transformada de Fourier de X(t) ya que es aleatorio y por tanto no estabien definida su transformada. Pero si es posible calcular la transformada de Fourierde su autocorrelacion y esta brindara informacion de las componentes en frecuenciadel proceso.

Definicion 5.6. Se X(t) un proceso estocastico, se denominara densidad espectralde potencia de X(t) a la transformada de Fourier de su autocorrelacion RX(τ). Re-cordemos que estamos trabajando siempre con procesos WSS. Se usara la siguientenotacion para la densidad espectral de potencia de X(t):

GX(w) = F(RX(τ)) para tiempo continuo

GX(ejΩ) = F(RX(n)) para tiempo discreto

Ejemplo 5.7. Se considera el proceso estocastico del ejemplo 5.5. En este casoRX(n) = σ2δ[n]. Por lo tanto su densidad espectral de potencia sera GX(ejΩ) = σ2.

136

Page 137: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ejemplo 5.8. Se considera el proceso estocastico del ejemplo 5.6. En este casoRX(τ) = 1

2 cos(w0τ). Por lo tanto su densidad espectral de potencia sera GX(w) =π2 (δ(w − w0) + δ(w + w0)). El problema es que en el espacio de funciones RX(τ) notiene transformada de Fourier y para hacerlo adecuadamente deberıamos trabajar enel espacio de las distribuciones donde la δ de Dirac esta bien definida. En este textono se trabajara con procesos en el espacio de distribuciones. Sin embargo, este no esel unico caso que se encontrara y en particular el ruido blanco que se definira masadelante presenta este mismo problema. Se volvera sobre este punto mas adelante.

Ejemplo 5.9. En el ejercicio 5.1, se probo que la autocorrelacion de la onda binaria

aleatoria era RX(τ) = A2(1 − |τ |T ) para |τ | ≤ T y 0 en otro caso. Por lo tanto su

densidad espectral de potencia sera: GX(w) = A2T sin2(wT/2)(wT/2)2

5.2.4. Sistemas lineales con entradas estocasticas

En un sistema lineal invariante en el tiempo con respuesta al impulso h(t), la saliday(t) a una entrada x(t) viene dada por la convolucion de la entrada y la respuesta alimpulso. Es decir,

y(t) = h(t) ∗ x(t) =

∫ ∞−∞

x(τ)h(τ − t)dτ

Se ha visto tambien que si la se la entrada y la respuesta al impulso son L2 la salidaesta bien definida. Ahora bien, si a la entrada de este sistema ingresa X(t) un procesoestocastico es necesario analizar que sucede con la salida. Para cada realizacion delproceso es decir para cada ζ, tendremos que:

y(t, ζ) = h(t) ∗ x(t, ζ) =

∫ ∞−∞

x(τ, ζ)h(τ − t)dτ

Si la trayectoria x(τ, ζ) es una funcion L2 entonces la integral esta bien definida y daun valor real finito. Si ∀ζ las trayectorias de X(t) son funciones L2 entonces para tfijo Y (t) es una variable aleatoria y por tanto Y (t) como funcion de t es un procesoestocastico. Esto que se acaba de concluir se puede formalizar mas rigurosamente.

Ahora bien, el problema es que los procesos WSS tienen potencia constante (RX(0) =E(X2(t)), lo que implica que no son de energıa finita y por tanto, con probabilidad1 sus trayectorias no son funciones de L2. Si bien es cierto que las conclusiones ob-tenidas de esta seccion para procesos con trayectorias L2 se pueden generalizar y laintegral anterior definirse para casos mas generales, esto requiere sin embargo de he-rramientas que estan fuera del alcance de este texto. En algunos textos se mencionaque para que la integral anterior exista alcanza con que las trayectorias sean acotadasy la funcion respuesta al impulso de modulo integrable para que este bien definiday(t, ζ). Si bien lo anterior es cierto no es claro que esta condicion sea menos fuertepara los procesos de interes que la de tener trayectorias de L2 con probabilidad 1.Por ejemplo cualquier proceso Gaussiano por definicion no puede tener trayectoriasacotadas y por tanto tampoco estarıa bien definida en ese caso.

Se asumira por ahora, que los procesos tienen trayectorias L2 y entendiendo queesto se contradice con trabajar con proyectos WSS. Esta contradiccion (o la de suponerque los procesos tienen trayectorias acotadas y la respuesta al impulso es de modulo

137

Page 138: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

integrable) esta implıcita en la mayorıa de los textos de sistemas de comunicacionesque abordan el tema de procesos estocasticos. Esta contradiccion en la realidad no seda ya que siempre trabajamos con procesos y senales con energıa finita. Toda senalreal con la que se puede trabajar es de soporte temporal acotado y de energıa finita,debido a que para poder procesarla en cualquier equipo se la recortara temporalmentey tambien espectralmente ya que cualquier equipo de medida o procesamiento tieneun ancho de banda maximo finito. Por lo tanto, en realidad la contradiccion viene deque los conceptos de estacionariedad y WSS no se adaptan a las senales con que setrabaja en la practica y es mas cercano a los procesos reales con los que trabajamosque tengan trayectorias L2 con probabilidad 1.

Sin embargo, los conceptos de estacionariedad y WSS brindan un marco adecuadopara trabajar sin entrar en mayores complicaciones formales que harıan mas engorrososu tratamiento analıtico. Si bien estos dos conceptos se contraponen se trabajaraasumiendo esta contradiccion (y por lo tanto no con total rigor) en lo que restadel capıtulo. En el Apendice B se vera como es posible levantar esta contradicciony redefinir los conceptos de estacionariedad y WSS para que la teorıa cierre. Esteenfoque lo plantea Gallager en [1] pero no es el enfoque habitual ni el mas directopero el lector interesado puede ver el enfoque en este Apendice y recurrir al texto deGallager.

Con las consideraciones anteriores se calculara la autocorrelacion del proceso Y (t)salida de un sistema lineal invariante en el tiempo con respuesta al impulso h(t):

RY (τ) = E(Y (t)Y (t− τ)) = E((X(t) ∗ h(t))(X(t− τ) ∗ h(t− τ))) =

= E(

∫ ∞−∞

X(t− u)h(u)du

∫ ∞−∞

X(t− τ − v)h(v)dv) =

= E(

∫ ∞−∞

∫ ∞−∞

X(t− u)h(u)X(t− τ − v)h(v)dudv) =

=

∫ ∞−∞

∫ ∞−∞

E(X(t− u)X(t− τ − v))h(u)h(v)dudv =

=

∫ ∞−∞

∫ ∞−∞

RX(u− τ − v)h(u)h(v)dudv =

=

∫ ∞−∞

h(u)

∫ ∞−∞

RX(u− τ − v)h(v)dvdu =

De las ecuaciones anteriores el paso mas delicado es el intercambio del valor es-perado y la integral, que si los procesos tienen trayectorias en L2 con probabilidad1, la variable aleatoria resultado de la integral esta bien definida y es acotada y portanto se puede ver que todo converge y es posible este intercambio. Ahora bien, seha asumido que X(t) es WSS al asumir que su autocorrelacion solo depende de ladiferencia entre tiempos y ya vimos antes que entonces sus trayectorias no podıanser casi seguramente de energıa finita. Este es el tipo de contradicciones que debemosasumir por ahora y que se justificaran al final del capıtulo.

De la ultima ecuacion, la integral interior es la convolucion de la autocorrelacionde X con h. Se denominara a la integral interior: V (u− τ) = RX ∗ h, entonces

138

Page 139: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

RY (τ) =

∫ ∞−∞

h(u)V (u− τ)du

RY (τ) =

∫ ∞−∞

h(−s)V (−s− τ)ds = q ∗ V

siendo q(t) = h(−t) y por tanto,

RY (τ) = h(−t) ∗RX(t) ∗ h(t) (5.1)

tomando transformada de Fourier y recordando que la tranasformada de F(g(−t)) =F(g(t))∗, siendo ∗ el conjugado de un complejo:

GY (w) = |H(w)|2GX(w) (5.2)

De esta ecuacion observamos que si el sistema lineal invariante en el tiempo fueraun pasabanda ideal (un pulso unitario en frecuencia) con soporte entre dos frecuencias[w1, w2], entonces:

RY (t) =

∫ w2

w1

GX(w)ejwtdw

RY (0) =

∫ w2

w1

GX(w)dw

y siendo que RY (0) = E(Y 2(t)), es decir su potencia, la ecuacion anterior muestraque la potencia de la senal es la integral de G y esto justifica por que a G se le llamadensidad espectral de potencia.

Ejercicio 5.2. Probar que la densidad espectral de potencia verifica las siguientespropiedades:

1. G(w) ≥ 02. G(w) es una funcion real y par.3. Si X e Y son dos procesos incoherentes: GX+Y = GX +GY

5.2.5. Procesos ergodicos

Antes de analizar los procesos Gaussianos, se dara otra clasificacion de los proce-sos estocasticos. Un proceso estocastico estacionario se dice ergodico si los promediostemporales sobre las trayectorias convergen cuando el tiempo tiende a infinito a losmomentos del proceso. Esta propiedad tiene sobre todo importancia practica ya quepermite calcular por ejemplo el E(X(t)) a partir de observar una trayectoria suficien-temente larga del proceso.

Para entender mejor la ergodicidad se analizara el caso de un un proceso estocasti-co estacionario de tiempo discreto X[n] con variables aleatorias i.i.d.. En este caso laLey de los Grandes Numeros dice que dada una realizacion del proceso x[n],

lımn→∞

x[1] + x[2] + ...+ x[n]

n= E(X[1]) = E(X[2]) = ...

139

Page 140: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Esta propiedad que la cumplen los procesos i.i.d. es lo que se denomina ergodicidaden este caso en el valor esperado. Sin embargo, no es necesario que el proceso seai.i.d. para que lo cumpla. Hay procesos estacionarios no i.i.d. que son ergodicos. Sinembargo, no debe pensarse que todo proceso estacionario es ergodico. Un caso muysimple que muestra que no es cierto. Sea X[n] = X con X una variable aleatoria.Evidentemente este proceso es estacionario pero no es ergodico, porque cualquiertrayectoria es una constante en el tiempo con el valor del sorteo de X y que engeneral no sera el E(X).

Se pueden probar condiciones para que el proceso sea ergodico. En este texto noahondaremos en este tema pero las condiciones tienen que ver con que el proceso se“ parezca” a un i.i.d., es decir que la correlacion temporal decaiga rapido.

5.3. Procesos Gaussianos

Esta seccion se centrara en uno de los procesos mas importantes en los sistemasde comuncaciones, los procesos Gaussianos. Una variable aleatoria Gaussiana o nor-mal X con media µ y varianza σ que notaremos N (µ, σ2) tiene funcion densidad deprobabilidad

fX(x) =1√2πσ

e−(x−µ)2

2σ2 (5.3)

En adelante los vectores a seran representados en negrita, seran vectores columna yse notaran como a = (a1, .., an)T , siendo T el traspuesto de un vector o una matriz.Observar por lo tanto, que aTa es un escalar y aaT es una matriz. Un vector devariables aleatorias W = (W1, ...,Wn) es un vector Gaussiano si todas las variablesaleatorias que lo componen son Gaussianas. Si las variables aleatorias son todas inde-pendientes y con distribucion N (0, 1) entonces su densidad de probabilidad conjuntaes el producto de todas las funciones de densidad, es decir:

fW(w) =1

(√

2π)ne−wTw

2 (5.4)

Definicion 5.7 (Vectores aleatorios conjuntamente Gaussianos). X = (X1, .., Xn)es un conjunto de variables aleatorias conjuntamente Gaussianas de media cero, sipara algun conjunto finito de variables aleatorias i.i.d. con distribucion N (0, 1), W =(W1, ..,Wm), cada Xj se puede escribir de la siguiente forma:

Xj =

m∑i=1

ajiWi

donde los aji son un conjunto dado de reales. En notacion matricial escribiremos que:

X = AW

siendo A una matriz nxm

140

Page 141: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Se puede definir tambien lo mismo para el caso que no tengan media nula consi-derando las variables aleatorias X ′ = X + µ con X con media nula.

No es difıcil probar que toda combinacion lineal de v.a. Gaussianas con distribu-cion N (0, 1) es tambien una v.a. Gaussiana. Esto se hace calculando la distribucionconjunta de dos de estas variables convolviendo sus densidades y viendo que siguesiendo la densidad de una Gaussiana. Por otra parte, se puede calcular que al multi-plicar por un real a a una variable con distribucion N (0, 1) se obtiene una variable condistribucion N (0, a2). Combiando estos dos resultados se prueba que toda combina-cion linal de Gaussianas es Gaussiana. Respecto de la definicion de variables aleatoriasconjuntamente Gaussianas es importante remarcar que no todo conjunto de variablesaleatorias Gaussianas es un vector conjuntamente Gaussiano. El hecho de provenir to-das de la combinacion linal de un mismo conjunto de Gaussianas i.i.d., hace que tengapropiedades que no las tiene todo vector de Gaussianas. Por ejemplo y adelantando-nos un poco es habitual escuchar que las variables aleatorias no correlacionadas si sonGaussianas entonces son independientes. Esto no es cierto para cualquier conjunto deGaussianas, es siempre cierto si las variables son conjuntamente Gaussianas.

Calculemos entonces la matriz de covarianza del vector de v.a. conjuntamenteGaussianas X donde se hara la hipotesis adicional que n = m.

KX = E(XXT ) = E(AWWTAT )

KX = AE(WWT )AT

KX = AAT

ya que al ser las componentes de W variables aleatorias i.i.d con distribucion N (0, 1)su matriz de covarianza es la matriz identidad. Se asumira que la matriz A es inver-tible. En ese caso si x es una realizacion del vector X y w una realizacion de W,entonces w = A−1x. La densidad de W viene dada por la ecuacion 5.4. Teniendo encuenta la transformacion lineal w = A−1x la densidad de probabilidad conjunta delvector X es:

fX(x) =1

(√

2π)ndet(A)e−xTA−1TA−1x

2 (5.5)

siendo det(A) el determinante de la matriz A. O lo que es lo mismo

fX(x) =1

(√

2π)n√det(KX)

e−xTKX

−1x

2 (5.6)

Si la matriz A no fuera invertible lo que sucede es que algunas de las variablesdel vector X se podrıan escribir como una combinacion lineal de las otras. En esecaso definimos X′ como el subvector de maxima dimension de X donde sus todas suscomponentes son linealmente independientes y trabajamos con X′ en lugar de con X.

Otra conclusion importante es que si se tiene un vector de variables aleatorias con-juntamente Gaussianas y no correlacionadas, se tendra una matriz de autocorrelacionKX diagonal y donde en la diagonal los elementos seran σ2

i , siendo σ2i la varianza de la

141

Page 142: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

i-esima variable aleatoria del vector. Sustituyendo KX en la ecuacion 5.6 y operandose puede ver que se obtiene como funcion de densidad de probabilidad el productode n densidades cada una de la forma de la ecuacion 5.3 y por lo tanto las variablesaleatorias son normales independientes.

Definicion 5.8 (Proceso Gaussiano). Un proceso Gaussiano X(t) es un procesoestocastico donde para todo n y toda eleccion de t1, ..., tn, las variables aleatoriasX(t1), ..., X(tn) es un vector de variables aleatorias conjuntamente Gaussiano.

La funcion de covarianza del proceso Gaussiano X(t) sera

CX(t, s) = E(((X(t)−E(X(t)))(X(s)−E(X(s))))

Observar que los elementos de la matriz de covarianza para cualquier conjunto den variables aleatorias X(t1), .., X(tn) quedan definidos por la funcion de covarianzadel proceso. Por lo tanto, la matriz de covarianza del proceso y su valor medio defi-nen la densidad conjunta para cualquier vector de n variables aleatorias del procesoX(t1), .., X(tn). Es decir que con la covarianza y la media del proceso gaussianoquedan definidas todas sus distribuciones finito dimensionales. Por lo tanto, la esta-cionariedad y la WSS del proceso dependen solo de la media y la funcion de covarianzadel proceso. De lo anterior se concluye que en el caso de un proceso Gaussiano losconceptos de estacionariedad y WSS son equivalentes.

5.4. Ruido Blanco

El ruido en un canal de comunicaciones proviene de muchas fuentes diferentes,ruido termico por ejemplo por la vibracion de los electrones en un conductor, radiacionde diferentes fuentes, etc.. Utilizando el Teorema Central del Lımite, parece razonablemodelar la suma de todas estas fuentes de ruido en un instante dado como una variablealeatoria Gaussiana. Se observa empıricamente ademas, que este ruido tiene densidadespectral de potencia constante en un rango muy amplio de frecuencias. El rangode frecuencias en que la densidad espectral del ruido es constante, es mucho mayorque el ancho de banda de los filtros de los equipos. Por lo anterior, para este ruidose utiliza un modelo idealizado de un proceso Gaussiano con densidad espectral depotencia constante N0/2 para todo el rango frecuencias. Este es un modelo simple ycon el cual es muy comodo trabajar. Sin embargo, se debe tener presente que esteproceso ideal al tener densidad espectral de potencia constante en toda la bandade frecuencias, tendra potencia infinita. Por lo tanto, E(X(t)2) no es finito, lo cualviola una de las hipotesis que por ejemplo se utilizo para definir estacionariedad. Sufuncion de autocorrelacion sera δ(t)N0/2 que como ya se ha dicho no es una funcionsino un funcional. Se pueden definir estos procesos dentro del marco de la teorıa dedistribuciones. Sin embargo, eso requiere formalizar una teorıa que escapa al alcancede este texto. En la practica se acepta ese modelo de ruido y siempre habra algun filtroque limite su ancho de banda. Pensaremos el ruido blanco como un proceso Gaussianode densidad espectral constante en un rango muy grande, mucho mayor que el anchode banda de interes y que tiene una autocorrelacion muy concentrada en el origen.Es decir, para cualquier desplazamiento temporal de interes la autocorrelacion delproceso es cero. En el Apendice B para el lector interesado se analizara una forma decomo se puede abordar este problema de una manera mas rigurosa. Al ser un proceso

142

Page 143: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Gaussiano con autocorrelacion nula fuera del origen eso quiere decir que X(t1) y X(t2)con t1 6= t2 son variables aleatorias independientes.

Ejemplo 5.10. Se considera un filtro pasabajo de primer orden con frecuencia decorte w0. Su funcion de transferencia sera: H(jw) = 1

1+j ww0

. La entrada de este filtro

sera ruido blanco de densidad espectral N0/2. Por lo tanto la salida del filtro sera unproceso Gaussiano de densidad espectral de potencia:

GY (w) = N0

2 |H(jw)|2 =N02

1+w2

w20

y por lo tanto la funcion de autocorrelacion sera:

RY (t) = N0w0

4 e−|t|w0

Este proceso y en general cualquier proceso de filtrado del ruido blanco estarabien definido aunque la entrada al filtro sea una idealizacion. Esta es la utilidad y larazon por la cual se trabaja con este modelo idealizado del ruido a pesar de que noesta formalmente bien definido al menos en el contexto de los procesos estocasticosen un espacio de funciones como se lo acostumbra definir.

Definicion 5.9 (Ruido blanco en tiempo discreto). El proceso de ruido blanco Gaus-siano en tiempo discreto se define como un proceso estocastico Gaussiano en tiempodiscreto com media nula y autocorrelacion:

RX(k) = σ2δ[k]

y por lo tanto la densidad espectral de potencia sera:

GX(ejΩ) = σ2

Se debe observar que en tiempo discreto no hay ninguna dificultad formal conla definicion de ruido blanco a diferencia de lo que se observo en el caso de tiempocontinuo.

Ejemplo 5.11. A la entrada de un filtro digital de respuesta al impulso h(k) =aky[k], siendo y[k] el escalon unitario, se aplica ruido blanco Gaussiano. A la salidase tendra: GX(ejΩ) = |H(ejΩ)|2σ2. Ahora bien, H(ejΩ) = 1

1−ae−jΩ y por lo tanto,

|H(ejΩ)|2 = 11+a2−2a cos(Ω) .

GY (ejΩ) = σ2

1+a2−2a cos(Ω)

RX(k) = σ2

1−a2 |a|

5.5. Ruido aditivo y relacion senal a ruido

El modelo mas simple para un canal de comunicaciones, consiste en asumir que lasenal en el canal solo se ve afectada por ruido y este se suma a la senal en el ingresoal receptor. Este modelo aditivo en general ademas asume que el ruido es blanco. Poreste motivo, dicho modelo de canal se denomina modelo de Ruido Blanco GaussianoAditivo (AWGN por su sigla en ingles). El modelo AWGN es una idealizacion dela realidad pero permite tener una primera aproximacion a los problemas que sufreuna senal al atravesar un canal inalambrico. Mas adelante, en el capıtulo sobre canalinalambrico, se veran modelos mas proximos a la realidad.

143

Page 144: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Primero se asumira un ruido Gaussiano aditivo (no necesariamente blanco) dedensidad espectral de potencia Gn(w) y se asumira que tiene potencia media finita.Se tendra entonces en el receptor una senal de la forma

YR(t) = XR(t) +NR(t)

siendo XR(t) la senal enviada al ingreso al receptor, NR(t) el ruido Gaussianoaditivo e YR(t) la senal recibida. Se asumira que la senal y el ruido son fısicamenteindependientes, lo cual es una hipotesis totalmente razonable y por tanto, son procesosno correlacionados.

Si calculamos en valor esperado de la potencia de la senal recibida, esta sera:

E(YR(t)2) = E(XR(t)2) + 2E(XR(t)NR(t)) + E(NR(t)2)

El segundo termino es cero porque el ruido y la senal son no correlacionados y elruido tiene media cero. Entonces, se verifica que:

E(YR(t)2) = E(XR(t)2) + E(NR(t)2)

En estas condiciones se define la relacion senal a ruido de la siguiente forma:

S/N =E(XR(t)2)

E(NR(t)2)

La relacion senal a ruido brinda la nocion de cuan contaminada esta la senal conel ruido aditivo. Observar que esta definicion tiene sentido en la medida que la senal yel ruido sean aditivos y no correlacionados. Observar que de esta forma no es posibledefinirlo si NR(t) es ruido blanco porque tiene potencia infinita.

En el caso de un canal AWGN, lo que habitualmente se asume es que a la entradadel receptor hay un filtro pasabanda del ancho de banda de la senal modulada. Si lasenal bandabase tenıa ancho de banda B, la senal modulada sera una senal pasabandade ancho 2B. Por lo tanto, la potencia media del ruido luego del filtro pasabanda dela senal modulada sera N0

2 2B = N0B y por lo tanto,

S/N =E(XR(t)2)

N0B

Respecto de la potencia de la senal E(XR(t)2) hay diversas formas de expresarla.Habitualmente se la expresa a traves de Eb, la energıa de bits o a traves de Es laenergıa de sımbolo. Como Eb depende tanto de la Es como del mapeo de la modulacionespecıfica, en esta seccion la expresaremos en funcion de Es y luego dependiendo delas caracterısticas especıficas de la modulacion utilizada se podra llevar a una funcionde Eb. Si rs = 1/Ts es la tasa de sımbolos (Ts es el tiempo entre sımbolos), entoncesla relacion senal a rudo sera:

S/N =E(XR(t)2)

N0B=EsrsN0B

=Es

N0BTs

144

Page 145: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

5.6. Modulacion y deteccion en un canal AWGN

Se asumira en esta parte un canal AWGN y que la sincronizacion en frecuencia, fasey temporal es perfecta. En estas condiciones se vio en el capıtulo 6, que es convenienteusar un filtro de recepcion apareado para proyectar la senal recibida sobre el espaciode funciones definida por la base utilizada para enviar los sımbolos. Es decir el filtrode recepcion que permitıa hacer esta proyeccion era prx = p∗tx(−t). En este apartadose notara ptx al pulso conformador utilizado en transmision y prx al filtro utilizadoen recepcion, ya que esta notacion permitira plantear las ecuaciones mas facilmente.

La senal banda base a enviar:

sb(t) =∑k

a[k]ptx(t− kTs) (5.7)

se puede ver como una senal en el espacio generado por la base Φk(t) = ptx(t−kTs), donde los a[k] son las coordenadas complejas de la senal sb(t) en dicho espacio.La senal recibida, luego de pasada a banda base y asumiendo que el canal es ideal(solo se agrega ruido aditivo) y no hay errores de sincronizacion es:

rb(t) = sb(t) + wb(t) (5.8)

donde wb(t) es el ruido aditivo.Esta senal debido a la componente de ruido en general no pertenece al espacio

generado por las Φk(t) = ptx(t−kTs). Lo que se vio en el Capıtulo 6 es que la senalque se encuentre a menor distancia de rb(t) en el espacio generado por la mencionadabase, es la proyeccion de rb(t) sobre dicho espacio. Para obtenerla en dicho capıtulose vio que en recepcion se debe usar un filtro apareado antes de muestrear, es decirun filtro prx(t) = p∗tx(−t).

El uso de este filtro tiene ademas, algunas propiedades de interes desde el puntode las comunicaciones que se analizaran a continuacion.

Para comenzar se analizara que sucede con la relacion senal a ruido (SNR). Sebuscara ahora el filtro que maximiza el SNR de la senal muestreada a la salida delfiltro. Llamaremos β(t) a la respuesta al impulso de este filtro para distinguirla dela prx(t) vista antes y luego se analizara la relacion entre ambas. Si en el transmisorse introduce un impulso a la entrada del filtro de transmision, la salida del filtro derecepcion sera

x(t) = β(t) ∗ ptx(t) + β(t) ∗ w(t) (5.9)

Ahora bien la parte de senal en el instante de muestreo es:

v(0) := β(0) ∗ ptx(0) =

∫ ∞−∞

B(f)Ptx(f)df (5.10)

utilizando la antitransformada de Fourier y donde B(f) y Ptx(f) son las trans-formadas de Fourier del filtro de recepcion y de transmision respectivamente. Porotra parte el espectro de potencia del ruido filtrado η(t) = w(t) ∗ β(t) sera Sηη(f) =|B(f)|2Sww(f) y su autocorrelacion en τ = 0, que es independiente de t por serestacionario en sentido amplio, sera:

145

Page 146: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

σ2ηη =

∫ ∞−∞|B(f)|2Sww(f)df (5.11)

y por lo tanto la relacion senal a ruido al muestrear sera:

|v(0)|2

σ2ηη

=|∫∞−∞B(f)Ptx(f)df |2∫∞−∞ |B(f)|2Sww(f)df

(5.12)

Teorema 5.1. El filtro de recepcion que maximiza el SNR dado el filtro de transmisionPtx(f) y en un canal ideal con ruido estacionario en sentido amplio y de media nulade densidad espectral de potencia Sww(f) es :

B(f) =cP ∗tx(f)

Sww(f)(5.13)

siendo c una contante arbitraria no nula. En ese caso el SNR vale:

|v(0)|2

σ2ηη

=

∫ ∞−∞

|Ptx(f)|2

Sww(f)df(5.14)

Este teorema se prueba sin mayor dificultad aplicando la desigualdad de Cauchy-Schwarz a la integral del numerador de la ecuacion 10.30. Antes de aplicar esta de-sigualdad se multiplica y divide el integrando por

√Sww(f).

|v(0)|2

σ2ηη

∫∞−∞ |B(f)|2Sww(f)df

∫∞−∞

|Ptx(f)|2Sww(f) df∫∞

−∞ |B(f)|2Sww(f)df=

∫ ∞−∞

|Ptx(f)|2

Sww(f)df (5.15)

Por ultimo, para hallar el maximo se observa en que condicion la desigualdad deCauchy-Schwarz vale con igualdad.La igualdad se obtiene cuando uno de los integran-dos es proporcional al conjugado del otro.

La siguiente pregunta es que sucede si el ruido es blanco Gaussiano. En ese caso,Sww(f) = N0

2 . Como la constante c es arbitraria entonces:

B(f) = P ∗tx(f) (5.16)

β(t) = p∗tx(−t) (5.17)

Es decir que en este caso se encuentra que el filtro que maximiza el SNR es el mismofiltro que proyecta la senal recibida sobre el espacio de las senales generadas por la baseptx(t − kTs). Se debe observar que en este caso, la respuesta al impulso de ambosfiltros v(t) = ptx(t) ∗ p∗tx(−t) es la autocorrelacion de ptx(t). Esta autocorrelacioncuanto mayor es el ancho de banda de la senal mas “concentra la energıa entorno aτ = 0” y por lo tanto maximiza la SNR.

Si bien este analisis se realizo para un pulso aislado, en la medida que los filtroscumplan la condicion de Nyquist, es decir que la autocorrelacion del pulso se anuleen todos los multiplos de kTs con k 6= 0 el analisis sigue siendo valido.

146

Page 147: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Apendice B

Procesos eficazmenteestacionarios y eficazmenteestacionarios en sentidoamplio

Este apendice es una introduccion al tema desarrollado por Gallager en [1].

Definicion B.1. Un proceso estocastico de media nula es eficazmente estacionario en[−T/2, T/2] si las probabilidades conjuntas de las variables aleatorias en t1, ..., tn sonlas mismas que en t1 +τ, ..., tn+τ cuando los tiempos t1, ..., tn y t1 +τ, ..., tn+τ estantodos contenidos en el intervalo [−T/2, T/2]. El procesos es eficazmente estacionarioen [−T/2, T/2] en sentido amplio si su funcion de autocorrelacion es funcion solo dede t− τ para t y τ ambos contenidos en [−T/2, T/2].

La estacionariedad y estacionariedad en sentido amplio se pueden ver como el casolımite en que los procesos son eficazmente estacionarios para todo [−T/2, T/2]. Se debeobservar de la definicion que si bien t y τ estan ambos contenidos en [−T/2, T/2],t− τ varıa entre [−T, T ]. Se puede probar el siguiente teorema:

Teorema B.1. Sea Z(t) cont ∈ R un proceso eficazmente estacionario en [−T/2, T/2]y que cumple que todas sus trayectorias son L2 en [−T/2, T/2] con probabilidad 1.Sea Z(t) la entrada a un filtro con respuesta al impulso h(t) perteneciente a L2 y deoporte acotado en el tiempo a [−A,A] . Entonces para T/2 > A, el proceso aleatoriode salida V (t) es WSS en el intervalo [−T/2 + A, T/2 − A] y sus trayectorias sonfunciones de L2 en [−T/2 +A, T/2−A] con probabilidad 1.

Demostracion. Ver [1].

En la seccion 5.2.4, se obtuvo sin total rigurosidad la ecuacion 5.1 que es clavepara analizar la respuesta de sistemas lineales e invariantes en el tiempo a entradasestocasticas. En el contexto de procesos eficazmente estacionarios y con trayectoriasL2 con probabilidad 1, se puede obtener este resultado con mayor rigor ya que ahora

147

Page 148: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

todas las integrales de convolucion son integrales definidas en el intervalo de tiempoen que el proceso es eficazmente estacionario.

No vamos a seguir mas por este camino pero se puede probar que si se tieneun proceso estocastico estacionario y este proceso se trunca en el tiempo, el procesotruncado se puede expresar mediante una serie de Fourier de coeficientes aleatorios. Siademas este proceso es Gaussiano y su funcion de autocorrelacion es cero a partir deun cierto valor, el proceso estacionario truncado (a un tiempo mayor que el tiempo enque la autorcorrelacion se anula), es estadısticamente identico en el intervalo al cualse trunco que el proceso original. Esto nos permite trabajar con procesos truncados,sin preocuparnos de como es el comportamiento del proceso fuera del intervalo deinteres.

148

Page 149: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Bibliografıa

[1] Stochastic Processes, Theory for Applications, Gallager, R. G., Cambridge Uni-versity Press, Cambridge, UK, 2013.

[2] Principles of Digital Communication, Gallager, R. G., Cambridge UniversityPress, Cambridge, UK, 2008.

[3] Introduction to random processes with applications to signals and systems, W.A. Gardner, McGraw-Hill Publishing Company, New York, Second edition. 1990.

[4] Random Processes for Engineers, Bruce Hajek, Cambridge University Press,Cambridge, UK, 2015.

[5] Communication Systems, Bruce Carlson, McGraw-Hill Publishing Company,New York, 5th edition. 2009.

[6] Probability, Random Variables and Stochastic Processes, Athanasios Papoulis ,S. Unnikrishna Pillai, McGraw-Hill Europe, 4th edition. 2002.

149

Page 150: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

150

Page 151: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Capıtulo 6

Modulacion y DemodulacionDigital

6.1. Introduccion

En este capıtulo se analizaran algunas tecnicas de modulacion digital comenzandopor la menos compleja: Pulse Amplitud Modulation. Luego se estudiaran algunasmas complejas como QAM (Quadrature Amplitud Modulation) y PSK (Phase ShiftKeying). Se analizara las caracterısticas del modulador y del demodulador de cadauno de estos metodos. A su vez se estudiara las caracterısticas de los pulsos o filtrosconformadores utilizados y de su contraparte en el receptor: el filtro apareado. Se veraque una clase importante de filtros conformadores son los que cumplen con el teoremade Nyquist que se explicara tambien en este capıtulo. Por ultimo, se realizaran algunasconsideraciones respecto de la regla de decision de los sımbolos recibidos.

6.2. Modulacion PAM

La modulacion PAM tiene como base del espacio de funciones:

Φ0(t) = p(t) (6.1)

Donde p(t) es un pulso de energıa uno sobre el cual ya ahondaremos mas adelante.Por lo tanto, es un subespacio de dimension 1 del espacio L2. Hasta ahora, en loscapıtulos anteriores hemos estudiado que sucede cuando se envıa un sımbolo si(t) co-rrespondiente al mapeo de un punto de la constelacion utilizada. Ahora extenderemosesa notacion y notaremos s(t) a la senal correspondiente al envıo de un conjunto desımbolos cada uno de duracion Ts:

s(t) =∑k

akp(t− kTs) (6.2)

PAM puede tener diferentes constelaciones dependiendo del parametro M queindica la cantidad de puntos que tiene la constelacion. Para M = 2 la constelacion

151

Page 152: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 6.1: Implementacion en tiempo continuo del transmisor y receptor PAM.

tendra dos puntos: A y −A. Para M = 4 tendra cuatro puntos: −3A,−A,A, 3A. Engeneral la constelacionM tendra M = 2b (siendo b el numero de bits que se agrupanpara obtener un sımbolo) puntos equiespaciados a distancia 2A y simetricos respectoal origen:

M = −A(M − 1), ...,−A,A, ..., A(M − 1) (6.3)

Es importante observar que salvo en el caso M = 2, los sımbolos no tienen todosla misma energıa. La energıa promedio por sımbolo se puede ver que es:

Eavg =A2(M2 − 1)

3(6.4)

Como M = 2b, imaginemos que se desea incrementar la tasa de bits por segundoincrementando la cantidad de bits que se envıan por cada sımbolo. Para valores de bgrandes la energıa promedio por sımbolo crece como 22b. Por lo tanto, se puede hacermuy costoso o impracticable esta tecnica para valores de b grandes.

En la figura 6.1 se muestra una implementacion en tiempo continuo del moduladory demodulador PAM.

Los bits que arriban al modulador PAM (y de acuerdo al parametroM), se agrupande a log2(M) bits. Posteriormente, en una tabla de consulta (LUT, por lookup tableen ingles) se asigna de acuerdo al agrupamiento de bits k-esimo el valor del sımbolocorrespondiente ak. Por ejemplo si M = 4 y llegan los bits 11 se les asignara el valorak = 3A y si llega el bit 10 se les asignara el ak = A, si llegan los bits 01 se asignaraak = −A y a 00 se asignara ak = −3A. Luego de la LUT, se pasa por el filtro delpulso conformador y se obtiene la senal a enviar al receptor dada por la ecuacion 6.2.

En el receptor asumimos que a la senal se le agrego ruido w(t) entonces:

152

Page 153: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

r(t) =∑k

akp(t− kTs) + w(t)

Esta senal se pasa luego por el filtro apareado de respuesta al impulso h(t) = p(−t)y se obtiene:

x(t) =

∫ t+T2

t+T1

∑k

akp(τ − kTs)p(τ − t)dτ +

∫ t+T2

t+T1

w(τ)p(τ − t)dτ

x(t) =∑k

ak

∫ t+T2

t+T1

p(τ − kTs)p(τ − t)dτ + η(t)

x(t) =∑k

akrp(kTs − t) + η(t)

donde [T1, T2] es el soporte del filtro apareado, η(t) es el ruido filtrado por el pulsoapareado y rp(t) es la autocorrelacion del pulso conformador:

rp(t) =

∫ T2

T1

p(τ)p(τ − t)dτ (6.5)

La salida muestreada en nTs tendra la forma:

x(nTs) =∑k

akrp((k − n)Ts) + η(nTs)

Evidentemente se desea recuperar an al muestrear en nTs, por lo cual, sin teneren cuenta el ruido la autocorrelacion del pulso muestreada cada nTs debera cumplirque:

rp(nTs) = 1 si n = 0

rp(nTs) = 0 si n 6= 0 (6.6)

Cuando se discuta sobre las condiciones que deben cumplir los pulsos mas adelanteesta sera una muy importante para que no exista interferencia intersimbolica (ISI porsu sigla en ingles). Por otro lado, si no hay interferencia intersimbolica, se cumpleque:

x(nTs) = an + η(nTs)

Es decir que se obtiene el punto de la constelacion original mas ruido. La reglade decision debera mapear el punto del espacio obtenido x(nTs) en la estimacion del

153

Page 154: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 6.2: Implementacion en tiempo discreto del transmisor y receptor PAM.

sımbolo enviado an. Mas adelante en este capıtulo se discutira sobre como decidir yla regla de decision optima.

Otra posible implementacion del modulador/demodulador PAM es haciendo elprocesamiento en tiempo discreto. Este esquema que se muestra en la figura 6.2 esutilizado actualmente en muchos equipos. Por ejemplo, en equipos de radios definidospor software que se utilizaran en las propuestas de laboratorio de este texto. En estecaso todo el procesamiento en el transmisor se realiza en tiempo discreto y el ultimobloque lo convierte a tiempo continuo para su transmision. En el receptor en cambio lasenal primero convertida a digital y luego se realiza todo el procesamiento en tiempodiscreto.

En el transmisor luego del LUT se tiene una secuencia de numeros (que resultaronde agrupar los bits de a M y asignarles un sımbolo). Estos sımbolos se producirancada tiempo de sımbolo Ts. El pulso conformador sera un filtro FIR con muestrastomadas cada tiempo T del pulso p(t). Por lo tanto, antes de pasar la senal por elfiltro conformador la senal que tiene muestras cada Ts debe ser sobremuestreada atasa N = Ts/T . Este sobremuestreo introduce N − 1 ceros entre las muestras. Luegoel filtro conformador interpola estas muestras y a la salida la senal de tiempo discretose pasa por un conversor analogo/digital que la convierte a tiempo continuo.

En el receptor la senal recibida r(t) es muestreada a tasa T y se obtiene:

r(iT ) =∑k

akp(iT − kTs) + w(iT )

donde w(iT ) es el ruido muestreado. Esa senal es luego pasada por el filtro apa-reado de respuesta al impulso h[i] = p(iT ) por lo que a la salida se obtiene:

154

Page 155: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

x(iT ) =

i+T2/T∑m=i+T1/T

r(mT )p(mT − iT ) +

i+T2/T∑m=i+T1/T

w(mT )p(mT − iT )

x(iT ) =

i+T2/T∑m=i+T1/T

∑k

akp(mT − kTs)p(mT − iT ) + η(iT )

Haciendo el cambio de variable j = m− i se obtiene:

x(iT ) =∑k

ak

T2/T∑j=T1/T

p(jT − (kTs − iT ))p(jT ) + η(iT ) (6.7)

En la ecuacion 6.5 se definio la autocorrelacion del pulso conformador. Esa inte-gral se puede aproximar como una suma dividiendo el soporte del pulso apareado ensubintervalos de largo T y sumando las areas de los rectangulos tomando como alturael valor de integrando en cada punto del intervalo, es decir:

rp(t) =

∫ T2

T1

p(τ)p(τ − t)dτ ≈ TT2/T∑l=T1/T

p(lT )p(lT − t)

Sustituyendo esta aproximacion en la ecuacion 6.7 se obtiene

x(iT ) =1

T

∑k

akrp(kTs − iT ) + η(iT )

Por ultimo se toma una muestra cada Ts/T muestras y se obtiene:

x(nTs) =1

T

∑k

akrp((k − n)Ts) + η(nTs)

Si rp cumple la condicion para que no exista ISI de la ecuacion 6.2, entonces seobtendra x(kTs) = ak + η(kTs) y el bloque de decision dara la estimacion ak.

6.2.1. Espectro PAM

Hasta ahora se ha analizado PAM en bandabase. Para utilizar PAM pasabandaentorno a una portadora fc la idea es desplazar la senal PAM bandabase a fc, multi-plicando sb(t) (la senal PAM bandabase) por ej2πfct. Como la senal bandabase sb(t)tiene espectro acotado entre −B < f < B, la senal pasabanda tendra espectro quevaldra cero salvo entre fc −B < f < fc +B. El problema es que la senal sb(t)e

j2πfct

es compleja y la senal a transmitir debe ser real. Por eso antes de enviarla se toma laparte real o lo que es equivalente se le suma el conjugado:

155

Page 156: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 6.3: Espectro de modulacion PAM pasabanda

s(t) = sb(t)ej2πfct + sb(t)e

−j2πfct = 2<(sb(t)ej2πfct) = 2sb(t) cos(2πfct)

Tomando la transformada de Fourier de la senal pasabanda transmitida obtenemossu espectro:

S(f) = Sb(f + fc) + Sb(f − fc)

El espectro de la senal transmitida se muestra en la figura 6.3Un aspecto importante que se puede ver del espectro de la senal enviada es que hay

un desperdicio de espectro ya que como la senal bandabase sb(t) es real su espectroes simetrico respecto del origen. Por lo tanto, la senal enviada s(t) tiene un espectroque entre (fc − B, fc) es identico al del intervalo (fc, fc + B). Esto implica que serıanecesario enviar uno solo de estos intervalos ya que el otro se podrıa reconstruir enrecepcion. La modulacion QAM que se vera a continuacion mejora esta ineficienciaen el uso del espectro

6.3. Modulacion QAM

QAM es similar a PAM pasabanda salvo porque su forma de onda en bandabasees compleja y no real. Hablaremos de MQAM o QAM para referirnos al igual que enPAM a que pueden existir M niveles. Sin embargo, como se analizara mas adelantela base de funciones sera de dos dimensiones.

Al ser la senal en bandabase sb(t) compleja se transmitira s(t) de la forma:

s(t) =1√2

(sb(t)e

j2πfct + s∗b(t)e−j2πfct

)s(t) =

√2<(sb(t)e

j2πfct) =√

2 (<(sb(t)) cos(2πfct)−=(sb(t)) sin(2πfct))

156

Page 157: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Esta sera la forma de la senal QAM a transmitir. El valor√

2 delante de s(t) es unvalor arbitrario que se puede modificar multiplicando por una constante a sb(t). Sepodrıa haber utilizado cualquier otro valor, pero para que los pulsos tengan energıa1 como se vera mas adelante se ha utilizado este factor.

Luego de esta primera aproximacion a la modulacion QAM, se analizara estamodulacion desde el punto de vista del sub-espacio de senales de L2 que utiliza QAM.Lo primero es definir la base de funciones que se utiliza para genera el subespacio delas senales QAM. La base estara definida por las siguientes senales:

Φ0(t) =√

2p(t) cos(2πfct) (6.8)

Φ1(t) = −√

2p(t) sin(2πfct)

Donde p(t) es un pulso conformador. El pulso p(t) como se menciono antes, seestudiara en este capıtulo en una seccion posterior. Sin embargo, se deben hacer aquıalgunas consideraciones. El pulso p(t) serıa deseable que tuviera dos propiedades. Porun lado, que sea de soporte acotado en el tiempo ya que es deseable que sean causalesy tambien para evitar la interferencia intersimbolica. Por otro lado, es deseable quesean bandabase de frecuencia limitada a un cierto B, tal que P (f) = 0 para |f | > Bpara evitar el aliasing. Estas dos propiedades no se pueden cumplir simultaneamente.Si una senal tiene soporte acotado en frecuencia no puede tener soporte acotado enel tiempo y viceversa. Cuando se estudien las caracterısticas de los pulsos se vera queP (f) se puede elegir de forma tal que si bien la senal en el tiempo no sea acotada,en los puntos donde se muestrea la senal (kTs) no exista interferencia intersimbolica.Estos pulsos se dice que cumplen el criterio de Nyquist. Esto soluciona el problema dela interferencia intersimbolica. Sin embargo, en general los pulsos de Nyquist puedenno ser acotados ni en tiempo ni en frecuencia. Lo que sigue manteniendo los problemasde causalidad y ancho de banda no limitado. En general varios de los pulsos a utilizarse limitaran en frecuencia, es decir seran pulsos donde P (f) = 0 para |f | > B. Estogenerara pulsos no limitados en el tiempo y por tanto anticausales. La anticausalidadse puede solucionar si se lo limita en el tiempo y se lo retarda, pero nuevamente allimitarlo en el tiempo se extiende en frecuencia.

¿Por que se hacen estas disquisiciones respecto de p(t) ? El problema que se vaa abordar ahora es la ortonormalidad de Φ0(t) y Φ1(t). Para probar que estas dossenales forman una base ortonormal se pueden utilizar dos enfoques. Por un lado, esposible probar que son ortogonales si p(t) es de ancho de banda acotado. Por otro sepuede probar que si p(t) es de soporte acotado en el tiempo y la frecuencia portadoraes muy grande (fc → ∞), los pulsos son ortogonales. En este texto se probara laortogonalidad para el caso de ancho de banda acotado en el siguiente teorema.

Teorema 6.1. Sea p(t) una senal de banda limitada a B/2 y se cumple B/2 < fc ytiene energıa 1. Entonces,

Φ0(t) =√

2p(t) cos(2πfct) (6.9)

Φ1(t) = −√

2p(t) sin(2πfct)

son un conjunto ortonormal.

157

Page 158: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Demostracion. Se calcula el producto interno de estas dos senales:

−2

∫p(t)p(t) cos(2πfct) sin(2πfct)dt = −2

∫p(t)p(t) sin(4πfct)dt = 0

La segunda integral es cero por los siguientes motivos:

Si p(t) es de banda limitada a B/2 entonces p(t)p(t) es de banda limitada a Bya que la transformada de Fourier de p(t)p(t) es P (f) ∗ P (f) y la convolucionde dos senales de banda limitadas a X es de banda limitada a 2X.

Si se escribe el sin(4πfct) como suma de exponenciales complejas se puede obser-var que la ultima integral corresponde a la transformada de Fourier de p(t)p(t)en 2fc y −2fc, pero como p(t)p(t) es de banda limitada a B y por hipotesisB < 2fc, ambas transformadas son cero.

Para probar que la energıa es 1 se puede observar que la energıa de Φ0(t) es :

2

∫p(t)p(t) cos2(2πfct)dt =

∫p(t)p(t)(1 + cos(4πfct))dt = 1 +

∫p(t)p(t) cos(4πfct)dt = 1

Donde en el ultimo resultado proviene de que la energıa de p(t) es 1 y que la integral∫p(t)p(t) cos(4πfct)dt = 0 por un razonamiento similar al utilizado para probar la

ortogonalidad. De la misma forma se prueba que Φ1(t) tiene energıa 1.

En realidad es posible probar un teorema mas general que se dejara como ejerciciopara el lector ya que las herramientas para probarlo son las mismas que las utilizadasen la prueba del Teorema anterior

Teorema 6.2. Sea pk(t) : k ∈ Z un conjunto ortonormal de banda limitada a B/2y se cumple B/2 < fc. Se define

Φk0(t) = <√

2pk(t)e2πfct

Φk1(t) = −=√

2pk(t)e−2πfct

(6.10)

entonces el conjunto Φkj(t) : k ∈ Z, j = 0, 1 es un conjunto ortonormal. Ademas,si sb(t) =

∑k akpk(t), la correspondiente funcion pasabanda <

sb(t)e

j2πfct

corres-ponde a la funcion:

s(t) =∑k

<akΦk0(t) + =akΦk1(t) (6.11)

Esto nos brinda una forma general de llevar una funcion bandabase a una funcionpasabanda. Esta correspondencia mapea la base en bandabase a dos funciones realesy ortonormales en pasabanda.

En QAM la senal se conformara de la siguiente forma. Por un lado los bits semapean a sımbolos ak = ak0 + jak1 complejos. Estos sımbolos se pasan por el pulsoconformador obteniendo la senal bandabase a enviar:

sb(t) =∑k

akp(t− kTs) (6.12)

158

Page 159: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 6.4: Constelaciones BPSK, QPSK y 8 PSK

Posteriormente esta senal bandabase se lleva a pasabanda a frecuencia fc y setoma su parte real para transmitirla, es decir:

s(t) =√

2∑k

<akp(t− kTs)ej2πfct

(6.13)

s(t) =√

2∑k

ak0p(t− kTs) cos(2πfct)− ak1p(t− kTs) sin(2πfct) (6.14)

Habitualmente se denomina componente en fase a: I(t) =∑k ak0p(t − kTs) y

componente en cuadratura a: Q(t) =∑k ak1p(t− kTs). Tanto la componente en fase

como la en cuadratura son trenes de pulsos PAM.Hay una gran variedad de conjuntos de senales MQAM. En los ejemplos que siguen

se veran algunos de ellos.

Ejemplo 6.1 (MPSK). MPSK se refiere a la modulacion por desplazamiento de fasede M niveles (M-ary Phase Shift Keying ). En este caso la constelacion esta formadapor M puntos igualmente espaciados en un cırculo del plano complejo. Los puntosdifieren solo en su fase y todos tienen la misma energıa. En la figura 6.4 se muestranlos casos de 2PSK (tambien llamado BPSK), 4PSK (tambien llamado QPSK) y 8PSK.

Ejemplo 6.2 (MQAM cuadrado). MQAM cuadrado se refiere a la modulacion en lacual los puntos de la constelacion estan ubicados en una grilla igualmente espaciaday cuyo borde forma un cuadrado. Estas constelaciones existen para M potencias dedos. En general se piensan como la combinacion de dos senales M-PAM. En la figura6.5 se muestran los casos de 4QAM (observar que es igual a QPSK) y 16QAM.

Ejemplo 6.3 (APSK (Amplitude Phase Shift Keying)). APSK se refiere a una modu-lacion en la cual los puntos de la constelacion estan ubicados igualmente espaciados enanillos concentricos en torno al origen del plano complejo. En la figura 6.6 se muestranpor ejemplo 4+12 APSK (M = 16).

6.3.1. Implementaciones de moduladores / demoduladores MQAM

La senal a transmitir como ya se menciono sera:

s(t) =√

2∑k

ak0p(t− kTs) cos(2πfct)− ak1p(t− kTs) sin(2πfct) (6.15)

159

Page 160: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 6.5: Constelaciones 4QAM y 16QAM

Figura 6.6: Constelacion 4+12 APSK

160

Page 161: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 6.7: Modulador QAM

Por lo tanto, una posible implementacion se muestra en la figura 6.7. Esta im-plementacion es en tiempo continuo y es similar a dos moduladores PAM en tiempocontinuo en paralelo. Un modulador PAM para la senal en fase y otro para la senalen cuadratura.

En la figura 6.8 se puede ver el demodulador. En este caso se proyecta la senalrecibida sobre el espacio generador por Φ0(t),Φ1(t). Esto se realiza en dos etapas:primero multiplicando por un coseno o un seno a la frecuencia de la portadora. En elprimer caso para proyectar sobre Φ0(t) y en el segundo sobre Φ1(t). La proyeccion setermina pasando la senal por un filtro apareado. Las salidas de los filtros apareados(una para la senal en fase y otra para la en cuadratura), se muestrean en los instanteskTs y luego se toma la decision respecto del sımbolo enviado. Es decir, se recibe lasenal

r(t) =√

2∑k

ak0p(t− kTs) cos(2πfct)− ak1p(t− kTs) sin(2πfct) + w(t) (6.16)

Luego r(t) es en la rama en fase multiplicada por√

2 cos(2πfct) en demodulacionen fase y por

√2 sin(2πfct) en cuadratura, se obtiene:

r(t)√

2 cos(2πfct) = I(t) + I(t) cos(4πfct)−Q(t) sin(4πfct) + η0(t) (6.17)

r(t)√

2 sin(2πfct) = −Q(t) + I(t) sin(4πfct) +Q(t) cos(4πfct) + η1(t) (6.18)

donde I(t) =∑k ak0p(t− kTs) y Q(t) =

∑k ak1p(t− kTs). Como estas senales se

pasan luego por el filtro apareado p(−t) el cual es un pasabajo de frecuencia menor quefc, los terminos de las ecuaciones anteriores en 2fc y −2fc seran filtrados obteniendosedos senales:

161

Page 162: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 6.8: Demodulador QAM

x0(t) =∑k

ak0rp(t− kTs) + η0(t) (6.19)

x1(t) =∑k

ak1rp(t− kTs) + η1(t) (6.20)

donde rp(t) es la autocorrelacion de p(t) como se vio antes en el caso PAM. Porultimo, esta senal se muestrea a nTs y se obtiene:

x0(nTs) =∑k

ak0rp((n− k)Ts) + η0(nTs) (6.21)

x1(nTs) =∑k

ak1rp((n− k)Ts) + η1(nTs) (6.22)

y si no hay interferencia intersimbolica se obtendra an0 +w0(nTs) y an1 +w1(nTs)con los cuales se tomara la decision an.

Ejercicio 6.1. Al igual que en el caso PAM tambien es posible implementar el sistemaQAM en tiempo discreto. Utilizando la implementacion en tiempo discreto de PAM yla de tiempo continuo de QAM ya vistas realizar una implementacion QAM en tiempodiscreto. Realizar en GNU Radio la implementacion de un modulador y un demodularQPSK que partiendo de bits genere la senal banda base QPSK a transmitir, lo pasepor un canal simulado que le agregue ruido y luego a partir de esta senal vuelva aobtener la secuencia de bits. Cambie el nivel de ruido del canal y vea la constelaciony la secuencia de bits recibidos comparado con los enviados para diferente nivel deruido.

162

Page 163: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

6.4. Forma del pulso conformador y pulsos de Ny-quist

Como se menciono antes, el pulso p(t) serıa deseable que cumpliera con las siguien-tes dos propiedades. Por un lado, que sea de soporte acotado en el tiempo ya que esdeseable que sean causales y tambien para evitar la interferencia intersimbolica. Porotro lado, es deseable que sean bandabase de frecuencia limitada a un cierto B, talque P (f) = 0 para |f | > B para evitar el aliasing. Estas dos propiedades no se puedencumplir simultaneamente. Si una senal tiene soporte acotado en frecuencia no puedetener soporte acotado en el tiempo y viceversa. Se debera manejar este compromisode manera adecuada en la seleccion del pulso. Lo que se buscara son pulsos que seanaproximadamente de banda limitada y aproximadamente de tiempo limitado, lo quequiere decir que tanto en el tiempo como en frecuencia tiendan a cero rapidamentecuando t→∞ o cuando f →∞ segun el caso.

Por otra parte, hemos visto que la senal de salida de un demodulador en ausenciade ruido y luego de ser muestreada es de la forma:

x(nTs) =∑k

akrp((n− k)Ts) (6.23)

donde rp es la autocorrelacion del pulso conformador. No existira interferencia inter-simbolica si x(nTs) = an, lo cual ocurrira si el pulso verifica que rp(mT ) vale 1 sim = 0 y vale cero en otro caso. Los pulsos que verifican esta condicion se denominanpulsos de Nyquist.

Teorema 6.3 (Nyquist). Un pulso p(t) es un pulso de Nyquist, es decir que rp(kTs) =1 si k = 0 y rp(kTs) = 0 si k 6= 0, si y solo si Rp(f) (Rp(f) la transformada de Fourierde rp(t), y ademas se asume que existe este par transformada/antitransformada )verifica la siguiente ecuacion:

RpΣ(f) =

∞∑m=−∞

Rp(f +m

Ts) = Ts (6.24)

Antes de demostrar el teorema, es importante observar que la condicion implicaque el espectro RpΣ(f) sea plano como se muestra en la figura 6.9. En la figura 6.9a)se muestra como pulso de Nyquist el filtro pasabajo ideal con Rp(f) = rect(fTs) quetiene antitransformada rp(t) = sinc(t/Ts) que verifica la condicion de Nyquist. Comose vera mas adelante existen otros pulsos y de decaimiento mas rapido en el tiempoque la funcion sinc que verifican la condicion de Nyquist. En la figura 6.9b) se muestraotro ejemplo de pulso que verifica las condicion de Nyquist, observar que en este casolos pulsos Rp(f) se solapan.

Demostracion. Para probar el teorema se escribe p(kTs) como la antitransformada deRp(f) evaluada en kTs y se sustituye la integral impropia por una serie de integrales

163

Page 164: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 6.9: Teorema de Nyquist dos pulsos que verifican las condiciones del Teorema

definidas:

rp(kTs) =

∫ ∞−∞

Rp(f)ej2πkTsfdf

rp(kTs) =

∞∑m=−∞

∫ 2(m+1)/2Ts

2(m−1)/2Ts

Rp(f)ej2πkTsfdf

y haciendo el cambio de variable f ′ = f −m/Ts

rp(kTs) =

∞∑m=−∞

∫ 1/2Ts

−1/2Ts

Rp(f +m/Ts)ej2πkTs(f

′+m/Ts)df ′

rp(kTs) =

∫ 1/2Ts

−1/2Ts

ej2πkTsf′∞∑

m=−∞Rp(f +m/Ts)df

′ (6.25)

Para probar la suficiencia, se asume que la condicion 6.24 es cierta y por lo tanto:

rp(kTs) =

∫ 1/2Ts

−1/2Ts

ej2πkTsf′Tsdf

′ =sin(πk)

πk= δk

Para probar que la condicion es necesaria se puede observar de la ecuacion 6.25que

rp(kTs) =

∫ 1/2Ts

−1/2Ts

RpΣ(f)ej2πkTsf′df ′

Es decir que rp(kTs) = rp[k] son los coeficientes de la serie de Fourier de RpΣ(f)y por lo tanto,

RpΣ(f) = Ts

∞∑k=−∞

rp[k]ej2πfkTs

Por lo tanto, si por hipotesis el pulso es de Nyquist rp[k] = 1 solo para k = 0 ysera cero en otro caso por lo que se cumple la condicion del Teorema.

164

Page 165: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 6.10: Ejemplos de pulsos que no verifican las condiciones del Teorema

Es importante observar que si el ancho de banda del pulso B/2 (es decir que rptiene ancho de banda B) cumple que 2B < 1/Ts entonces no se puede cumplir lacondicion del teorema ya que los desplazamientos de Rp(f) cada 1/Ts no se solapan(ver figura 6.10 a)). Si 2B = 1/Ts entonces para que se cumpla la condicion Rp(f) =rect(fTs), y rp(t) = sinc(t/Ts) (ver figuras 6.9 a) y 6.10 b)). Por ultimo, si 2B > 1/Tsexisten muchas formas de pulsos que pueden verificar la condicion como se puede verde la figura 6.9.

Se puede observar que para que se cumpla la condicion del Teorema si B > 1/2Tsse requiere que exista simetrıa de Rp(f) entorno al punto 1/2Ts. El pulso puedeextenderse desde 1/2Ts hasta 1/Ts. En general el pulso se extendera una fraccion de1/Ts que se notara como (1 + α)/2, donde α controla el exceso de ancho de bandasi α = 0 no hay exceso de ancho de banda y si α = 1 se tiene el maximo exceso deancho de banda. El parametro α por este motivo se denomina exceso de ancho debanda. Es importante notar que cuanto mas suave sea la funcion Rp(f) ( es decir,cuanto mas suave sea la transicion en frecuencia hacia cero), mas rapidamente tenderaa cero la funcion en el tiempo. Esto se puede observar a partir de la formula de latransformada de Fourier de la funcion derivada. Sabemos que si f(t) es una funcionn veces derivable y ella y sus derivadas son funciones L2, entonces se cumple que:F (n)(f) = j(2πf)nF (f) y por lo tanto cuanto mas suave sea la funcion (mas derivablesea), como ella y sus derivadas son funciones de energıa finita F (n)(f)→∞ 0, y por lotanto F (f)→∞ 0 mas rapido que f−n.Esta propiedad que se vio para la tranaformadade Fourier es valida por ser las definiciones equivalentes para la antitransformada. Porlo tanto, para que la funcion en el tiempo vaya rapidamente a cero se buscaran pulsosque vayan suavemente a cero en frecuencia.

El pulso mas comunmente utilizado es el denominado Raised Cosine. Este pulsotiene la siguiente definicion de su forma de onda:

Rp(f) =

Ts 0 ≤ |f | ≤ 1−α

2TsTs2

[1 + cos(π|f |Tsα − π(1−α)

2α )]

1−α2Ts≤ |f | ≤ 1+α

2Ts

0 |f | > 1+α2Ts

(6.26)

donde α es el exceso de ancho de banda. En el dominio del tiempo se tiene:

165

Page 166: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 6.11: Pulso Raised Cosine en el tiempo rp(t) comparado con una funcion sinc,donde se aprecia la mayor velocidad de decaimiento

rp(t) = sinc(t/Ts)cos(παt/Ts)

1−(

2αtTs

)2

En la figura 6.11 se muestra la forma del pulso raised cosine en el tiempo y se locompara contra el correspondiente a un filtro pasabajo ideal, es decir, un sinc. Comose puede observar, la suavidad de la funcion raised cosine en frecuencia hace que enel tiempo el decaimiento sea sustancialmente mas rapido que el de la funcion sinc.

En la figura 6.12 se muestra la forma del pulso raised cosine en frecuencia. Endicha figura se compara la forma del pulso para diferentes valores del parametro α,donde se puede apreciar lo que ya se ha mencionado respecto de la relacion de esteparametro con el exceso de ancho de banda.

6.5. Decision de maxima verosimilitud

Hasta ahora en los diagramas de bloques de los moduladores se ha puesto un bloquede decision en la cual se ingresa con la proyeccion de la senal al espacio de senales de lasenal recibida mas ruido y de acuerdo a los puntos de la constelacion se resuelve cualha sido el sımbolo enviado. Intuitivamente para tomar esta decision se tiende a pensarque este bloque simplemente deberıa buscar asignar al sımbolo de la constelacion quese encuentre mas cercano (a menor distancia euclıdea) de la proyeccion obtenida. Enesta seccion se analizara que esta decision intuitiva tiene ademas una justificacionteorica, y es que decidiendo de esta manera, se esta maximizando la verosimilitud.

En primer lugar se estudiara la verosimilitud y su relacion con la probabilidad deerror ya que son dos conceptos relacionados.

166

Page 167: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 6.12: Pulso Raised Cosine en frecuencia Rp(f) para diferentes valores de α ydonde se aprecia la variacion del exceso de ancho de banda dependiendo de los valoresde este parametro

La probabilidad de que el n-esimo sımbolo transmitido s[n] en un cierto instantesea am con m ∈ [0,M−1], dado que se ha recibido r[n] es p(s[n] = am/r[n]) o p(am/r)para simplificar la notacion. Esta probabilidad se denomina probabilidad a posterioriy cuando se busca el sımbolo am de la constelacion que maximiza esta probabilidad,se dice que el sımbolo estimado a es el maximo a posteriori (MAP por su sigla eningles).

Por otro lado, la funcion densidad de probabilidad de que se reciba la senal rdado que el sımbolo enviado es am es f(r/am) y esta funcion se llama funcion deverosimilitud. El estimador que maximiza esta funcion se denomina estimador demaxima verosimilitud o ML. La relacion entre ambos se puede ver de la ley de Bayes:

p(am/r) =f(r/am)p(am)∑m f(r/am)p(am)

(6.27)

Si se tiene en cuenta que la sumatoria de la ecuacion anterior es en todos los k,esta no depende del sımbolo transmitido. Si los sımbolos son equiprobables entoncesambas probabilidades coinciden a menos de una constante. Por lo tanto, en el casoque los sımbolos son equiprobables MAP y ML coinciden.

6.5.1. Probabilidades de error y estimadores MAP o ML

La probabilidad de decodificar erroneamente un sımbolo cuando el sımbolos quese envıa es am es

167

Page 168: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Pe(am) = 1−∫Rm

f(r/am)dr (6.28)

donde Rm es la region tal que si el sımbolo recibido cae en esa region la decodifi-cacion es correcta. De esta ecuacion operando se puede ver que la probabilidad mediade error sobre todos los sımbolos posibles de la constelacion es:

Pe =∑m

Pe(am)p(am) (6.29)

= 1−∫Rf(r)p(am/r)dr (6.30)

donde la region R es la union de todas las regiones disjuntas Rm. La funcion f(r)se define como f(r) =

∑f(r/am)p(am).

De esta ecuacion, se puede ver que minimizar la probabilidad media de error enla decision del sımbolo recibido es equivalente a maximizar la probabilidad aprioripara cada ak. Por lo tanto, la estimacion utilizando MAP minimiza la probabilidadmedia de error de la decision sobre el sımbolo. Si todos lo sımbolos son equiprobables,entonces el estimador ML minimiza la probabilidad media de error en la decision delsımbolo.

6.5.2. ML en el caso de ruido gaussiano blanco

Asumimos que la senal recibida es rn(t) cuando se ha enviado el n-esimo sımbolotomando como inicio del tiempo cuando se comienza a enviar este sımbolo. El sımbolorn(t) con dicho eje se recibira en el intervalo de tiempo [(n − 1)Ts, nTs]. La formade obtener las coordenadas xnk con las que se decidira sobre el sımbolo enviado esproyectando rn(t) sobre cada una de las funciones de la base del espacio de funcionescorrespondiente a la modulacion que se este utilizando Φk(t), es decir

xnk =

∫ Ts

0

rn(t)Φk(t)dt

rn(t) = sn(t)+wn(t), donde wn(t) se asumira que es ruido blanco gaussiano y porlo tanto,

xnk =

∫ Ts

0

sn(t)Φk(t)dt+

∫ Ts

0

w(t)Φk(t)dt = snk + wnk

El sımbolo transmitido en este intervalo de tiempo sn(t) =∑k ankΦk(t). Las

muestras de ruido en cada coordenada k corresponderan a un ruido blanco gaussianoen tiempo discreto.

Si se envıa el sımbolo am como wk es un ruido gaussiano y blanco, cada coordenadaobtenida luego de proyectar sera xnk = amk + wnk y tendra distribucion gaussianade media amk y varianza la del ruido σw. Ademas estas muestras son independientes.Por lo tanto,

168

Page 169: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

f(xnk/amk) =

(1√

2πσ2w

)Kexp

−∑k

(xnk − amk)2

2σ2w

(6.31)

Por lo tanto, se puede ver que encontrar el estimador ML es equivalente a mini-mizar en am la funcion:

d(xn,am) =∑k

(xnk − amk)2

(6.32)

es decir encontrar el punto am de los M posibles de la constelacion tal que seminimice la distancia euclıdea entre el punto proyectado y el am.

Resumiendo si todos los sımbolos tienen la misma probabilidad ML es igual aMAP y por tanto la probabilidad media de error. En el caso de un canal AWGN, MLes equivalente a minimizar la distancia euclıdea entre el sımbolo recibido y el enviado.

169

Page 170: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

170

Page 171: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Capıtulo 7

Sincronizacion en fase yfrecuencia

7.1. Introduccion

La fase del oscilador en el receptor y el transmisor naturalmente no es la misma yesta diferencia no es conocida desde uno u otro extremo del sistema de comunicacion.Por otro lado, el canal de comunicacion inalambrico introduce un diferencia de faseque a priori tampoco es conocida. Este error de fase genera que la constelacion reci-bida se encuentre rotada un cierto angulo que debe ser corregido si se desea decidircorrectamente sobre cuales fueron los sımbolos enviados.

Por otra parte, los osciladores del transmisor y receptor no pueden ser sintoniza-dos exactamente en la misma frecuencia. Por mas preciso que sean estos osciladoressiempre habra una diferencia de frecuencia entre ambos. Esta diferencia en frecuencia,hace que al bajar la senal recibida a bandabase en el receptor esta quede multiplicadapor este error entre las portadoras generando que la constelacion recibida gire a lafrecuencia del error entre ambas portadoras. Analogamente al caso de la diferencia defase esta diferencia en frecuencia debera ser corregida si se desea decidir correctamentesobre cuales fueron los sımbolos enviados.

En este capıtulo se analizara como corregir el error en fase y errores en frecuenciaque varıen lentamente. Para este fin se utilizara una sistema conocido como PLL(Phase Locked Loop). En la siguiente seccion se analizara el funcionamiento del PLL( que tambien se utilizara en capıtulos posteriores) y luego se analizara su aplicaciona la correccion de errores de fase y frecuencia.

7.2. PLL

La idea basica original del PLL es seguir una senal de una cierta frecuencia wc,con fase desconocida y con ruido y poder generar una senal con la misma frecuenciay fase y sin ruido. Este esquema se muestra en la figura 7.1.

La senal que ingresa al PLL sera: r(t) = sin(wct + θ(t)) + η(t). Un oscilador

controlado por voltaje VCO, generara una senal de la forma: u(t) = cos(wct + θ(t)).

171

Page 172: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 7.1: Esquema general de un PLL

En este caso θ(t) es la fase que se desea seguir y θ(t) es la estimacion. Observar quesi las frecuencias no son identicas pero muy cercanas el error en frecuencia ∆wct sepuede considerar como parte de la fase a seguir.

El mutiplicador genera una senal de la forma: sin(2wct+ θ(t) + θ(t)) + sin(θ(t)−θ(t)) + η1(t). Posteriormente el filtro pasabajo de alta frecuencia elimina el primer

termino por lo que se obtiene: a la entrada del filtro del bucle: sin(θ(t)− θ(t)) + ν(t),es decir una senal que varıa lentamente mas ruido. El filtro de loop filtra esta senalgenerando una senal de variacion lenta que ingresa al VCO para corregir el error enla fase.

El bloque multiplicador seguido del filtro pasabajo de alta frecuencia, habitualmen-te se denomina detector de fase y no necesariamente tiene por que ser un multiplicadorseguido de un filtro pasabajo de alta frecuencia. Estos bloques que estiman el errorde fase ası como el mutiplicador son habitualmente bloques no lineales que dan comosalida una funcion no lineal de la diferencia de fase entre las dos senales, en el casodel multiplicador esa funcion no lineal es: sin(θ(t)− θ(t)). Los sistemas no lineales son

difıciles de analizar y en la medida que θ(t)− θ(t) sea pequeno, es posible hacer unaaproximacion lineal y asumir que el bloque detector de fase tiene como salida

e(t) = θ(t)− θ(t) + νθ (7.1)

siendo νθ la componente de ruido en la fase.En un VCO, la senal c(t) a la salida del filtro de bucle y que controla el VCO

se relaciona con la frecuencia instantanea del VCO (que notaremos wV CO(t)) de lasiguiente forma:

wV CO(t) =d(wct+ θ(t))

dt

wV CO(t) = wc +d(θ(t))

dtwV CO(t) = wc + c(t)

Es decir que:

c(t) =d(θ(t))

dt

θ(t) =

∫ t

−∞c(τ)dτ (7.2)

172

Page 173: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 7.2: Esquema general de un PLL linealizado

De las ecuaciones 7.1 y 7.2 se puede modelar el PLL linealizado como se muestraen la figura 7.2.

Es importante hacer notar que para que el PLL funcione correctamente es necesarioestimar correctamente y sin ambiguedades el error e(t) y por lo tanto se debe cumplirque:

|e(t)| = |θ(t)− θ(t)| ≤ π

La transferencia F (s) corresponde a la transferencia del filtro de bucle y como severa mas adelante sera quien determine las caracterısticas del PLL.

Antes de analizar el PLL linealizado en detalle es importante senalar que si bienel esquema del PLL se ha presentado para sincronizar la fase de dos senales es posibleutilizar este mismo esquema para seguir otros parametros como se vera mas adelantecuando se estudie sincronizacion temporal. Por ultimo, es importante hacer notar quesi bien se ha explicado el funcionamiento de un PLL en tiempo continuo por ser elque primero fu utilizado y en algunos aspectos didacticamente mnas facil de entendersu logica, mas adelante veremos implementaciones en tiempo discreto que son las quese utilizaran mayoritariamente en los problemas que mas interesan a este texto.

7.2.1. Analisis del modelo lineal y en tiempo continuo del PLL

Se analizara el sistema de la figura 7.2 que surge de modelar las ecuaciones 7.1 y7.2.

Si se ignora el ruido de fase, la transferencia de la fase de entrada a la fase estimada:

H(s) =Θ(s)

Θ(s)=

k0kpF (s)/s

1 + k0kpF (s)/s(7.3)

H(s) = k0kpF (s)

s+ k0kpF (s)(7.4)

Observar que la misma transferencia relaciona a la transformada del ruido de fasey Θ(s).

Por otra parte es facil ver que la transformada de Lapalce del error E(s) es:

E(s) =sΘ(s)

k0kpF (s) + s(7.5)

173

Page 174: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Por lo tanto, la transferencia del error sera

G(s) =E(s)

Θ(s)=

s

k0kpF (s) + s(7.6)

Utilizando el teorema del valor final de la transformada de Laplace que dice que

e∞ = lımt→∞

e(t) = lıms→0

sE(s)

se obtiene que

e∞ = lıms→0

s2Θ(s)

k0kpF (s) + s(7.7)

PLL de primer orden

En este caso F (s) = k1

Por lo tanto

H(s) = k0kpk1

s+ k0kpk1

es decir que tiene un polo en s = −k0kpk1 = −kT . Si en t = 0 se introduce un

escalon de fase θ0 la fase θ(t) sera

θ(t) = θ0(1− e−kT t)

es decir que θ(t) tiende a θ0 cuando el tiempo crece y la velocidad en la que seacerca esta asociada a kT , cuanto mayor es kT mas rapidamente se acerca a θ0. Sinembargo, al aumentar KT tambien se aumenta el ancho de banda del filtro y portanto el ruido se filtra menos, lo cual no es deseable.

El siguiente paso es analizar que sucede si se tiene un error en frecuencia, es decir,si al sistema se ingresa no solo un escalon de fase sino ademas una fase de la forma∆wct. Su transformada de Laplace sera:

Θ(s) =∆wcs2

+θ0

s(7.8)

La transformada de Laplace de θ(t) sera:

Θ(s) = Θ(s)H(s) = kT

(∆wcs2

1

s+ kT+θ0

s

1

s+ kT

)De donde se puede antitransformando obtener la evolucion en el tiempo de θ(t).Por otra parte utilizando 7.7 y sustituyendo F (s) = k1 y Θ(s) de la ecuacion 7.8,

se obtiene el error a tiempo infinito:

174

Page 175: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

e∞ = lıms→0

s2Θ(s)

k0kpF (s) + s=

∆wckT

(7.9)

Como se puede observar en un PLL de primer orden si existe un error en frecuencia,hay un error constante en estado estacionario que no se corrige. Ademas, para queel PLL pueda funcionar correctamente y seguir el error, utilizando la condicion de laecuacion 7.2 se obtiene que

|e∞| = |∆wckT| ≤ π (7.10)

|∆fc| ≤kT2

(7.11)

PLL de segundo orden

En este caso la funcion de transferencia del filtro de bucle sera:

F (s) = k1s+ a

s+ b

A partir de esta transferencia se puede calcular la transferencia del sistema y latransformada de Laplace del error:

H(s) = kTs+ a

kTa+ (kT + b)s+ s2(7.12)

E(s) =s(s+ b)Θ(s)

kTa+ (kT + b)s+ s2(7.13)

y por lo tanto,

e∞ = lıms→0

s2(s+ b)Θ(s)

kTa+ (kT + b)s+ s2(7.14)

De esta ultima ecuacion se puede ver que si la entrada al sistema es un escalon:Θ(s) = θ0/s, el error tendera a cero. Sin embargo si hay un error en frecuencia elerror en estado estacionario sera:

e∞ =∆wcb

kTa(7.15)

Por lo tanto si hay un error en frecuencia el error en estado estacionario se aproxi-mara a cero solo si b = 0 y por tanto F (s) = k1

s+as . Es decir que en ese caso para que

no exista error en frecuencia en estado estacionario se debe tener una transferenciade la forma:

F (s) = k1 +k1a

s(7.16)

175

Page 176: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Esto significa que el filtro de bucle debera tener un parte proporcional y un inte-grador. Este integrador es el que causa que el error en frecuencia se vaya a cero enestado estacionario. Esto se debe a que de existir un error constante, este se integraaumentando ası la salida hasta que crezca lo suficiente como para que el VCO corrijaeste error.

Para finalizar estudio del PLL de segundo orden se analizara su respuesta enfrecuencia y su respuesta al ruido de fase del PLL cuyo filtro de bucle es el de laecuacion 7.16. En este caso, la transferencia de la fase y del error seran:

H(s) = kTs+ a

kTa+ kT s+ s2(7.17)

G(s) =s2

kTa+ kT s+ s2(7.18)

Se definira a continuacion dos parametros denominados frecuencia natural wn yfactor de amortiguamiento ζ de la siguiente forma

wn =√kTa (7.19)

ζ =1

2

√kTa

(7.20)

Sustituyendo se puede reescribir las transferencia de la siguiente forma:

H(s) =2ζwns+ w2

n

w2n + 2ζwns+ s2

(7.21)

G(s) =s2

w2n + 2ζwns+ s2

(7.22)

A partir de estas ecuaciones se puede ver la respuesta en frecuencia de ambastransferencias como se muestran en las figuras 7.3 y 7.3 . La transferencia H(jw)corresponde a un pasabajo cuya respuesta depende de wn y ζ. El ancho de banda delfiltro pasabajo definido por su frecuencia de corte a 3db es proporcional a wn y estambien influenciada por ζ. Cuanto menor es ζ menor es el ancho de banda y tambienmayor es pico que se produce a w = wn. Este pico en la respuesta en frecuencia generaoscilaciones en la respuesta temporal.

Por ultimo se analizara la respuesta al ruido de fase. Se asumira que el ruido defase es ruido blanco gaussiano de ancho de banda Bν el cual se asumira mucho mayorque el ancho de banda del filtro de bucle. Se denominara σ2

ν a la potencia de este ruidoy por tanto su densidad espectral de potencia sera σ2

ν/2Bν . Por lo tanto, la potencia

de ruido en la salida θ(t), que se denominara σ2θ

sera:

σ2θ

=

∫ Bν

−Bν

σ2ν

2Bν|H(jπf)|2dfσ2

θ≈ σ2

ν

1

2

∫ ∞−∞|H(jπf)|2df (7.23)

176

Page 177: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 7.3: Respuesta en frecuencia de la transferencia H(s)

Figura 7.4: Respuesta en frecuencia de la transferencia G(s)

177

Page 178: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 7.5: Ancho de banda equivalente de ruido en funcion de ζ

La ultima aproximacion es porque se asume que H fuera de la banda del ruido esaproximadamente cero. Se definira el ancho de banda de ruido del PLL como:

BN =1

2

∫ ∞−∞|H(jπf)|2df (7.24)

BN se puede ver como el ancho de banda de un filtro ideal de igual area que|H(jπf)|2 y frecuencia de corte BN .

Con esta definicion de ancho de banda de ruido del PLL se observa que la potenciade ruido a la salida del PLL es:

σ2θ

=BNσ

Bν(7.25)

Por lo tanto, cuanto menor es el ancho de banda de ruido del PLL menor sera elrudio a la salida. En el diseno de un PLL hay un compromiso entre incrementar suancho de banda para poder seguir variaciones mas rapidas de la fase y disminuirlopara filtrar el ruido. Por ultimo se puede operar con la funcion de transferencia parael PLL de segundo orden compuesto por una constante proporcional y un integradory se llega en este caso a que el ancho de banda de ruido es:

BN =wn2

(ζ +

1

)(7.26)

En la figura 7.5 se muestra el grafico de BN/wn como funcion de ζ. se puedeobservar que BN es minimizado cuando ζ = 0,5 y en ese caso BN = 0,5wn.

Sin embargo en muchas aplicaciones practicas se elige ζ = 0,707. En este casoBN = 0,53wn que es marginalmente superior al optimo.

178

Page 179: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 7.6: Esquema general de PLL en tiempo discreto

7.2.2. Analisis del modelo lineal y en tiempo discreto del PLL

Como se ha dicho en los casos de mayor interes en este texto se utilizaran imple-mentaciones del PLL en tiempo discreto. Un PLL en tiempo discreto se puede ver enla figura 7.6.

La senal que ingresa al PLL sera: r[n] = sin(wcnTs + θ[n]) + η[n]. Un oscilador

controlado por voltaje VCO, generara una senal de la forma: u[n] = cos(wcnTs+ θ[n]).

En este caso θ[n] es la fase que se desea seguir y θ[n] es la estimacion.El detector de fase generara una salida que sera un funcion no lineal del error

e[n] = theta[n]− θ[n] es decir : f(e[n]) + ν[n], es decir una senal que varıa lentamentemas ruido. El filtro de loop al igual que en el caso de tiempo continuo, filtra esta senalgenerando una senal de variacion lenta que ingresa al VCO (tambien denominado DDSen tiempo discreto) para corregir el error en la fase. En tiempo discreto la relacion

entre la senal de entrada al DSS c[n] y la fase del DSS θ[n] estara dada por la siguienteecuacion:

θ[n+ 1] = θ[n] + k0c[n] (7.27)

donde k0 es el paso de actualizacion. Reescribiendo esta ecuacion se obtiene:

c[n] =θ[n+ 1]− θ[n]

k0(7.28)

Al igual que en tiempo continuo c[n] puede verse como una derivada en tiempo

discreto de θ[n].Al igaual que en tiempo continuo para analizar los PLLs en tiempo discreto se

linealizan y con las ecuaciones anteriores se puede modelar el PLL en tiempo discretopor la Figura 7.7.

En esta ecuacion F (z) es la transferencia en tiempo discreto del filtro de bucle ytomando la transformada Z de la ecuacion 7.27 :

Θ(z)

C(z)= k0

1

z − 1= k0

z−1

1− z−1(7.29)

Por lo tanto la transferencia entre las fases H(z) sera:

H(z) =Θ(z)

Θ(z)= k0

1

z − 1=

k0F (z)

k0F (z) + z − 1(7.30)

179

Page 180: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 7.7: Modelo de PLL en tiempo discreto linealizado

G(z) =E(z)

Θ(z)=

z − 1

k0F (z) + z − 1(7.31)

Para calcular el error en estado estacionario en este caso se debe hacer:

e∞ = lımz→1

(z − 1)E(z) = Θ(z)(z − 1)2

k0F (z) + z − 1(7.32)

Ejercicio 7.1 (PLL de primer orden en tiempo discreto). El PLL de primer ordenen tiempo discreto tiene transferencia de bucle F (z) = k1.

1. Calcular la transferencia H(z) y G(z) en este caso.

2. Probar que si la entrada en un escalon θ[n] = θ0y[n] siendo y[n] el escalonunitario, el error en estado estacionario es cero.

3. Probar que si hay un error en frecuencia, es decir que la entrada es θ[n] =∆wcnTsy[n], entonces el error en estado estacionario no es cero y encontrar suexpresion.

Ejercicio 7.2 (PLL de segundo orden en tiempo discreto). El PLL de segundo ordenen tiempo discreto tiene transferencia de bucle

F (z) = k11 + az−1

1 + bz−1

1. Calcular la transferencia H(z) y G(z) en este caso.

2. Probar que si la entrada en un escalon θ[n] = θ0y[n] siendo y[n] el escalonunitario, el error en estado estacionario es cero.

3. Probar que si hay un error en frecuencia, es decir que la entrada es θ[n] =∆wcnTsy[n], entonces el error en estado estacionario no es cero salvo que b =−1. En este caso observar que el filtro de bucle se puede escribir como unaconstante de proporcionalidad mas un integrador.

180

Page 181: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 7.8: Esquema general de Costas Loop

7.3. Correccion del error de fase

La idea detras de la correccion del error de fase es utilizar la estructura del PLLvista en la seccion anterior para corregir la fase. Es posible utilizar la estructura delPLL de tiempo continuo o de tiempo discreto para esto. Debido al enfoque de estetexto esta seccion se centrara en el PLL en tiempo discreto.El esquema general semuestra en la Figura 7.8. Este tipo de esquema para corregir la fase de la senal sedenomina habitualmente Costas Loop.

En el esquema anterior es necesario decidir como detectar el error de fase de lasenal. Para esto como se observa en la Figura 7.9 el error de fase se puede estimarcomo:

e[k] = θr − θt = argx′Q[k]

x′I [k]− arg

a1[k]

a0[k](7.33)

θr y θt son los angulos en la recepcion y transmision.Si no se conocen los sımbolos enviados se puede calcular el error con su estimacion

en el receptor:

e[k] = argx′Q[k]

x′I [k]− arg

a1[k]

a0[k](7.34)

El problema que tiene este estimador es que requiere de calcular dos arcotangenteslo cual puede ser costoso en su implementacion. Por esta razon, si el error es pequenose puede aproximar el error por la funcion seno del error :

181

Page 182: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 7.9: Fase transmitida y recibida

e[k] ≈ sin(e[k]) = sin(θr[k]− θt[k]) = sin(θr[k]) cos(θt[k])− cos(θr[k]) sin(θt[k])

e[k] ≈x′I(kTs)a0[k]− x′Q(kTs)a1[k]√

x′I(kTs)2 + x′Q(kTs)2

√a[0]2 + a1[k]2

(7.35)

Para simplificar la expresion anterior se considera solo el numerador y el denomi-nador se asume que son aproximadamente constantes (el segundo termino es fijo y elprimero no depende de la fase) y se absorben en las constantes del PLL. Por lo tanto,se estima el error a traves de:

e[k] = x′I(kTs)a0[k]− x′Q(kTs)a1[k] (7.36)

y si no se cuenta con los sımbolos enviados se puede utilizar su estimacion en elreceptor:

e[k] = x′I(kTs)a0[k]− x′Q(kTs)a1[k] (7.37)

En la Figura 7.10 se muestra el diagrama del sincronizador de fase utilizando elerror definido en la ecuacion 7.37 para el caso QPSK.

Ejercicio 7.3. Realizar el diagrama de un Costas Loop para un sistema BPSK.

7.4. Estimador de maxima verosimilitud

La idea es plantear el problema de correccion de errores como un problema deestimacion de los parametros desconocidos del sistema (por ejemplo, el retardo desco-nocido entre transmisor y receptor τ y la diferencia de fase entre transmisor y receptorφ y otros que se deseen). Se denominara θ = (τ, φ). Es decir que se recibe una senalen el transmisor que luego de bajada a banda base la senal compleja se podra escribircomo:

rb(t) = sb(t, θ) + η(t)

182

Page 183: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 7.10: Costas Loop para QPSK

donde η(t) se asume que es ruido blanco gaussiano y s(t, θ) es la senal que se envioen banda base mas las modificaciones sufridas por el retardo del canal y la diferenciade fase, es decir:

s : b(t, θ) =∑k

a[k]p((t− kTs)− τ)ejφ

Luego de muestrear la senal en el receptor cada tiempo T se obtiene:

rb(kT ) = sb(kT, θ) + η(kT )

Se asume que se tienen L0 muestras, que se utilizaran para estimar los parametros.Como la muestras del ruido son independientes la distribucion de probabilidad delvector η = η(0), η(T ), ..., η((L0 − 1)T )

p(η) =

(1√

2πσ2w

)L0

e

−L0−1∑k=0

η(kT )2

2σ2w (7.38)

Si se denomina rb al vector con las L0 muestras recibidas. La funcion densidad deprobabilidad de que se reciba la senal r dado que se recibio sb(θ) (donde mathbfsb esel vector de muestras recibidas que depende del parametro desconocido θ se notara:es f(rb/θ) y esta funcion se llama funcion de verosimilitud. El objetivo es encontrar elparametro que maximiza esta funcion. Esta funcion dado que el ruido tiene densidadde probabilidad dada por la ecuacion anterior se puede escribir:

183

Page 184: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

f(r/θ) =

(1√

2πσ2w

)L0

e

−L0−1∑k=0

(rb(kT )−sb(kT,θ))2

2σ2w (7.39)

Habitualmente se maximiza el logaritmo de esta funcion, la cual luego de eliminarlos terminos que no dependen de θ se puede escribir como:

Λ(rb/θ) = 2

L0−1∑k=0

Re [rb(kT )s∗(kT, θ)]−L0−1∑k=0

|sb(kT, θ)|2

sb(kT, θ) =∑i

a[i]p((kT − iTs)− τ)ejφ

Se considera ahora el caso en el cual solo afecta la diferencia de fase entre receptory transmisor. En ese caso la ecuacion anterior se reduce a maximizar:

Λ(rb/φ) =

L0−1∑k=0

Re [rb(kT )s∗b(kT, φ)]

sb(kT, φ) =∑i

a[i]p(kT − iTs − τ)ejφ

Observar que esta ecuacion se simplifico porque el |s(kT, φ)| no depende de φ.Entonces,

Λ(rb/φ) =

L0−1∑k=0

Re

[rb(kT )

∑i

a[i]∗p(kT − iTs − τ)e−jφ

]

= Re

[e−jφ

∑i

a[i]∗L0−1∑k=0

rb(kT )p(kT − iTs − τ)

]Si se tiene en cuenta que el pulso es de duracion finita con soporte en [−LsTs, LsTs],

y que cada sımbolo tiene N muestras entonces:

Λ(rb/φ) = Re

e−jφ L0/N−1∑i=0

a[i]∗N(i+Ls)∑

k=N(i−Ls)

rb(kT )p(kT − iTs − τ)

= Re

e−jφ L0/N−1∑i=0

a[i]∗x(iTs − τ)

(7.40)

donde x(iTs − τ) es la salida de la senal muestreada cada tiempo de sımbololuego del filtro apareado de respuesta al impulso p(−t). De la ecuacion anterior si∑L0/N−1i=0 a[i]∗x(iTs− τ) la escribimos como un complejo: er+jψ, es claro que la ecua-

cion 7.40 se maximiza cuando φ = ψ, es decir que el estimador de maxima verosimi-litud sera:

184

Page 185: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

φ = arg

L0/N−1∑i=0

a[i]∗x(iTs − τ)

(7.41)

En el caso de una sistema con modulacion MQAM, si se denomina xI(iTs − τ) ala componente en fase de x(iTs − τ) y xQ(iTs − τ) a su componente en cuadratura ya0[i] a la parte real de a[i] y a1[i] a su parte imaginaria entonces:

φ = arg

L0/N−1∑i=0

a[i]∗x(iTs − τ)

=

∑L0/N−1i=0 a0[i]xI(iTs − τ)− a1[i]xQ(iTs − τ)∑L0/N−1i=0 a0[i]xI(iTs − τ) + a1[i]xQ(iTs − τ)

(7.42)

185

Page 186: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

186

Page 187: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Bibliografıa

[1] Principles of Digital Communication, Gallager, R. G., Cambridge UniversityPress, Cambridge, UK, 2008.

[2] Synchronization Techniques for Digital Receivers (Applications of Communica-tions Theory), Umberto Mengali, Springer, 1997.

[3] Digital Communication Barry, John R., Lee, Edward A., Messerschmitt, David G.Originally published under Leww,E.A.;Messerschmitt,D.G. 3rd ed. 2003, XVII,838 p. In 2 volumes.

[4] Proakis, J. and Salehi, M., Digital Communications, isbn=9780072957167, 2007,McGraw-Hill Education.

[5] Digital Communications: A Discrete-Time Approach, Michael Rice,isbn=9780130304971, 2008, Pearson, Prentice Hall.

[6] Signal Processing Techniques for Software Radios, Behrouz Farhang-Boroujeny,2008, University of Utah.

187

Page 188: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

188

Page 189: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Capıtulo 8

Sincronizacion temporal

8.1. Introduccion

La sincronizacion temporal consiste en alinear las escalas de tiempo de dos o masprocesos que ocurren en puntos separados espacialmente. Esta es una de las funcionesmas crıticas en un sistema de comunicacion. El problema de sincronizacion del receptordigital es como obtener informacion precisa que le indique los instantes de muestreooptimos de la senal recibida.

En los primeros sistemas de comunicacion, la senal de informacion temporal ne-cesaria para sincronizar transmisor y receptor era transmitida en un canal separadoenviando una lınea espectral a una frecuencia multiplo de la senal temporal utiliza-da en los datos. Este metodo utilizado para sincronizar sistemas de comunicacion,presenta diversas desventajas, entre otras, un uso ineficiente del ancho de banda yde la potencia del transmisor. En los sistemas de comunicacion digital modernos lainformacion temporal debe ser obtenida de la senal de datos propiamente dicha pro-curando minimizar alguna senal de error obtenida de la senal recibida y/o la senalmuestreada.

El objetivo ultimo del receptor es recuperar los sımbolos enviados por el transmisormas alla del ruido, fading, errores diversos del receptor, etc.. Para llevar a cabo estatarea, se sabe que se maximiza la relacion senal a ruido si se obtiene una muestra delsımbolo recibido donde se de el maximo del pulso a la salida del filtro apareado. Entiempo continuo esto implica muestrear el pulso a la salida del filtro apareado comose muestra en la figura 8.1a en el tiempo correspondiente a la lınea punteada. Por lotanto, en este caso, el problema es ubicar ese extremo relativo de la senal recibida ytomar la muestra en ese punto.

Sin embargo, en muchos receptores digitales modernos y particularmente en aque-llos con una arquitectura SDR (Software Defined Radio), el muestreo de la senal entiempo continuo se hace en lazo abierto y se obtienen una o mas muestras por pulsocomo se muestra en la figura 8.1b. En este caso se tomaron tres muestras por sımboloy de acuerdo a la numeracion de dicha figura, la muestra que deberıa utilizar el sis-tema es la muestra que tiene el numero 1 de cada sımbolo. Si se toma la muestra 1,se tendrıa para los pulsos muestreados de la figura referida cuatro valores. El primerocorresponderıa a un 0, luego un -1, luego un 1 y luego nuevamente un 0. La primera

189

Page 190: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

(a) Senal de tiempo continuo (b) Senal en tiempo discreto

Figura 8.1: Senal en tiempo continuo y tiempo discreto

Figura 8.2: m∗ y µ∗

pregunta de interes es la siguiente: cual muestra debe tomarse de las tres de cadasımbolo en este caso o de las N de cada sımbolo en general?. Esa pregunta es unade las principales que se buscara contestar en este capıtulo. Se notara con m∗ a esamuestra.

Otro problema es que en general las muestras en el receptor no se encuentran enfase con las muestras en el transmisor. En la figura anterior sı lo estaban, ya que habıauna muestra en los maximos del pulso a la salida del filtro apareado. Por ejemplo en lafigura 8.3a, se muestra la senal analogica y la senal muestreada en el receptor tambiencon tres muestras por sımbolo (la senal analogica y la muestreada tienen un pequenodesfasaje a los efectos de visualizarlas mejor). En este caso ninguna muestra se tomoexactamente en el maximo o mınimo de los pulsos por lo que para obtener el sımbolocon la mayor inmunidad al ruido se debe interpolar. Por lo tanto, en este caso ademasde la pregunta anterior respecto a con cual muestra quedarse surge otra interrogante:¿ A que distancia esta el maximo del pulso de la muestra elegida? Llamaremos a estadistancia µ∗. Se muestran m∗ y µ∗ en la figura 8.2.

No se debe olvidar que en general las senales con las que se trabaja son senalescomplejas. Por ejemplo, en la figura 8.3b se muestran la parte real e imaginaria de lasenal que en las figuras anteriores se mostro solo la parte real. Se ha graficado uniendo

190

Page 191: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

(a) Parte real (b) Real e imaginaria

Figura 8.3: Senal discreta muestreada en el receptor

las muestras de cada senal con lıneas a fin de que sea mas facil de visualizar.

Lo que importa en ultima instancia es recuperar los sımbolos enviados. Se buscapor tanto muestrear en el maximo del pulso a los efectos de tener mayor inmunidadal ruido.

Por ejemplo para la senal compleja de la figura 8.3b que tiene tres muestras porsımbolo, dependiendo de que muestra se utiliza para obtener los sımbolos se obtienenlas tres constelaciones que se muestran en las figuras 8.4a, 8.4b, 8.4c. En este caso seenvio una constelacion QPSK (−1,−j, 1, j). La constelacion que se podrıa decir quees la correcta mas alla de un factor de ganancia es la que se muestra en la figura 8.4c.Sin embargo, si se observa con detalle esta constelacion los puntos no se encuentranexactamente sobre los ejes porque no se esta muestreando en los maximos del pulsoconformador. Para optimizar el muestreo deberıamos realizar una interpolacion y asıobtener una constelacion con menor error.

En las otras dos constelaciones claramente si existe ruido se puede rapidamentellegar a que no se pueda discriminar correctamente los sımbolos.

En los ejemplos anteriores se envio una secuencia de sımbolos constantes y quese repiten indefinidamente (en particular se envıa 00,10,01,11 repetidamente). En lasfiguras 8.5a, 8.5b, 8.5c se muestra el mismo receptor tomando las mismas muestraspara construir la constelacion que en el caso anterior, pero ahora en lugar de enviaruna secuencia fija de sımbolos, los sımbolos se envıan aleatoriamente.

Como se puede ver en la figura 8.5b aun sin ruido (en estos casos estudiados elcanal es totalmente ideal y sin ruido), el tomar la muestra incorrecta puede hacerque la decision sobre el sımbolo enviado pueda estar equivocada. Por otro lado, auntomando la muestra con la que se obtiene la constelacion mas adecuada 8.5c existe unadispersion importante de puntos. Esto se puede mejorar si se interpola correctamente.

Un ultimo problema que se debe abordar a los efectos de realizar una correctasincronizacion es la diferencia entre las bases de tiempo. Es decir, el transmisor y elreceptor tienen relojes diferentes y por tanto, la relacion entre el tiempo de muestreoen el transmisor y el receptor en general no es un numero entero. Eso lleva a que en elreceptor la cantidad de muestras por sımbolo no sea constante en todos los sımbolosy en sımbolos sucesivos no se muestree en los mismos puntos a cada sımbolo. Esteproblema se puede observar en la figura 8.6b. En ella se puede ver que los sımbolos no

191

Page 192: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

(a) (b)

(c)

Figura 8.4: Constelaciones obtenidas utilizando diferentes muestras, secuencia fija desımbolos

se muestrean en los mismos puntos. Por ejemplo en los puntos indicados como A,B,Cse puede apreciar que los puntos de muestreo se van desplazando debido a que eltiempo de muestreo no es un multiplo entero del tiempo de sımbolo. Esto lleva a queno solo se deba identificar la muestrea a considerar, m∗ y la distancia de esta muestraal maximo del pulso µ∗. El problema en este caso es que esa distancia µ∗ varıa con eltiempo y en algun momento la muestra a considerar m∗ ya no es la adecuada porquese pasa del maximo y la adecuada pasa a ser la anterior.

Esta dinamica en la cual las muestras se van moviendo a lo largo del pulso sepuede observar en la constelacion que se obtiene si se toma cualquier muestra fija (1,2, o 3) para obtener el sımbolo. Como esa muestra se mueve por los pulsos (tanto elcorrespondiente a la parte real como al de la parte imaginaria), el sımbolo obtenido seva moviendo en el plano complejo. En la figura 8.6a se puede ver este movimiento. Eneste ejemplo se esta enviando repetitivamente la misma secuencia de cuatro sımbolos(−1,−j, j, 1) y por eso se observa ese patron en el plano complejo.

Ejercicio 8.1. Se considera el diagrama en Gnuradio de la figura 8.7 cuyo codigo seencuentra en el material adjunto a este texto. Este diagrama incluye un transmisor,un receptor y un canal.

En el transmisor, se puede enviar desde una fuente de datos cuya secuencia serepite, utilizando un bloque Vector Source (0,1,2,3) o una secuencia de datos aleatoria

192

Page 193: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

(a)

(b) (c)

Figura 8.5: Constelaciones obtenidas utilizando diferentes muestras, secuencia aleato-ria de sımbolos

(bloque Random Source). Posteriormente se convierten estos datos a sımbolos QPSK,se interpola para tener tres muestras por sımbolo y se lo pasa por el pulso conformadorRRC. Los dos principales parametros que se modificaran en este ejercicio de dichofiltro RRC son: el exceso de ancho de banda: alfa y la cantidad de sımbolos por lasque se extiende el pulso RRC (len sym src).

El modelo de canal en este diagrama esta compuesto por un bloque Channel Model,por un Rational Resampler,seguido por un bloque de retardo y un bloque “1 cada N”.El Rational Resampler, esta utilizado para generar 10 muestras interpoladas por cadamuestra original. El bloque 1 cada N, vuelve a quedarse con la cantidad original demuestras y con el bloque de retardo se selecciona cual de las muestras desfasadasde las muestras originales considerara el bloque 1 de N. Esto emula la conversiona tiempo continuo y el retardo desconocido del canal de una transmision real. Delbloque Channel Model en este ejercicio el parametro que se modificara sera epsilon.Este parametro es el cociente entre las escalas de tiempo de transmisor y receptor. Siepsilon es igual a uno, las escalas de tiempo estan sincronizadas.

El receptor es muy simple, solo tiene el pulso apareado y luego permite seleccionaruna de las tres muestras recibidas como “sımbolo recibido”. Para esto, se utiliza unbloque 1 de N. En las ventanas graficas donde se muestra la senal recibida y la cons-telacion correspondiente se puede cambiar el retardo del receptor para seleccionar unade las 3 muestras de cada sımbolo. Tambien se puede en la ventana grafica cambiar

193

Page 194: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

(a) Constelacion en receptor (b) Senal muestreada en receptor

Figura 8.6: Bases de tiempo diferentes entre transmisor y receptor. Se envıa secuenciarepetitiva de sımbolos.

el retardo del canal para emular diferentes retardos.

Configuracion inicial: Inicialmente se trabajara con la siguiente configuraciony luego se iran modificando algunos parametros: Fuente de datos: Vector source.samp per sym: 3, alfa: 0.35, len sym src: 7. Los otros valores deben mantenersecomo estan configurados por defecto. El Channel Model inicialmente sera de un canalideal. El unico parametro que se modificara en la practica sera epsilon, que se tomaraigual a 1 en la configuracion inicial. Los demas parametros del canal se mantendransiempre en: sin ruido, tap = 1, sin offset de frecuencia.

a) Entienda bien el objetivo de cada bloque. Con la configuracion inicial corra elprograma. Manteniendo el retardo del canal en cero, observe las constelaciones que seobtienen si el retardo del receptor vale 0, 1 o 2. ¿por que varıa la constelacion? ¿Hayalguna muestra que obtenga la constelacion correcta? ¿por que?.

Seleccione la muestra que considere se aproxima mas a la constelacion correcta.Ahora varıe el retardo del canal en 1,2,3, etc. Explique lo que observa.Indique lamuestra y la parte fraccional que deberıa utilizar un interpolador para obtener laconstelacion correcta. ¿ que sucede si el retardo del canal lo pone en 0 y 30? ¿por quesucede esto?

b) Cambie ahora solamente de fuente de datos y utilice la Random Source. Vuelvaa repetir la parte a) y explique por que se dan las diferencias obtenidas. En particularexplique por que tomando la muestra y el retardo del canal optimo no se obtiene unpunto solamente como en caso a) sino un conjunto de puntos muy cercanos. Ahoraobserve que sucede si el parametro len sym src se pone en 1, 3, 7 y 21. Explique loque observa.

c) En las mismas condiciones que en b) repita para len sym src en 3 pero ahoraademas para cada caso cambie alfa en 0.15, 0.35 y 0.9. ¿ que observa? explique lo quesucede. Recuerde una propiedad de la T. de Fourier que dice que cuanto mas derivablees es una funcion g(t) mas rapido tiende a cero su T. de Fourier G(f) y lo mismovale tambien en el otro sentido.

d) Como conclusiones de las partes anteriores que deberıa hacer con alfa y el largodel pulso para minimizar los errores de sincronizacion temporal. Por otro lado, quedesventaja le ve a cambiar alfa y el largo del pulso en la direccion que es optima para

194

Page 195: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 8.7: Ejercicio 1

la sincronizacion temporal.e) Ahora se volvera a la configuracion inicial y solo se modificara el parametro

epsilon del canal a 1.01. Observe como queda la constelacion y explique porque sucedeesto. ¿ se modifica la constelacion si cambia el retardo del receptor? ¿por que? Utiliceahora la fuente Random. Observe que sucede. ¿ es posible sincronizar eligiendo algunamuestra? ¿ que habrıa que hacer?

8.2. Diagrama general de un sincronizador tempo-ral en tiempo discreto

En esta seccion se presentara el esquema general de un sistema de sincroniza-cion temporal. En las secciones siguientes se analizara cada uno de los bloques enparticular.

El esquema general se muestra en la figura 8.8. Se ilustra este esquema con unreceptor PAM en banda base. Mas adelante se veran modificaciones necesarias para elcaso QPSK. Hay que resaltar que en este capıtulo se asume una sincronizacion perfectaen frecuencia y fase. Por tanto, el unico problema a resolver es la sincronizacion en eltiempo.

En el diagrama 8.8 luego de pasar la senal por el filtro apareado, se debe seleccionarcon que muestra quedarse (m∗) y cual es el desplazamiento del maximo del pulsorespecto de esta muestra (µ∗) a los efectos de interpolar correctamente. Para obtenerestos dos datos habitualmente se utiliza un esquema realimentado tipo PLL. A partirde la muestra obtenida por el interpolador, se estima el error que se esta cometiendo

195

Page 196: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 8.8: Diagrama de bloques sincronizador temporal

respecto de la muestra optima y ese error se filtra y se introduce en un bloque decontrol que le informa al interpolador m y µ, los estimadores de m∗ y µ∗.

8.3. Estimacion del error

8.3.1. Introduccion, tiempo continuo

Para una mejor comprension del problema en tiempo discreto, en esta introduccionprimero se formula el problema en tiempo continuo porque ayudara al lector a verde forma mas intuitiva lo que se busca. Se considera en este analisis el caso PAMbandabase y luego se extendera el mismo para otros escenarios. La senal que se recibeen la antena del receptor se llamara r(t) y se puede escribir de la siguiente forma

r(t) = Ga∑m

a[m]p(t−mTs − τ) + w(t)

donde Ga es el acumulado de ganancias y perdidas del transmisor al receptorincluyendo antenas, medio de comunicacion, etc.. a[k] es el k-esimo sımbolo PAMenviado, Ts es el tiempo de sımbolo, p(t) es el pulso conformador con soporte en−LpTs ≤ t ≤ LpTs, τ es el retardo variable y desconocido que existe entre transmisory receptor y w(t) es ruido blanco aditivo y gaussiano.

La salida del filtro apareado se denominara x(t) y verifica la siguiente ecuacion:

x(t) = Ga∑m

a[m]rp(t−mTs − τ) + ν(t)

donde ν(t) = w(t) ∗ p(−t) y rp(.) es la convolucion del pulso y el pulso apareadoes decir:

rp(u) =

∫ LpTs

−LpTsp(t)p(t− u)dt (8.1)

Por lo tanto,luego de muestrear la senal, se obtiene

x(kTs + τ) = Gaa[k]rp(τ − τ) +Ga∑m 6=k

a[m]rp((k −m)Ts + τ − τ)

196

Page 197: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

x(kTs + τ) = Gaa[k]rp(−τe) +Ga∑m 6=k

a[m]rp((k −m)Ts − τe)

Donde τe es el error de sincronizacion y en las ultimas dos ecuaciones no se haconsiderado la componente de ruido a los efectos de estudiar solamente el problema desincronizacion. Observar que si el pulso conformador verifica la condicion de Nyquistel segundo termino es cero para τe = 0.

Si τ fuera estimado correctamente se sabe que kTs + τ deberıa coincidir con elpunto donde el pulso conformador tiene un maximo. Es decir si τe = 0 entonces seestarıa tomando las muestras en el receptor en el maximo del pulso (que coincide conel maximo de rp por ser el pulso simetrico). Si se considera una senal PAM binaria siτe = 0 se estarıa muestreando en un maximo o un mınimo de la senal de salida delfiltro apareado como se muestra en la figura 8.1a y por lo tanto la derivada de la senalen el punto de muestreo serıa cero. Si τe no es cero entonces se estarıa muestreandoen un flanco de la senal y su derivada no serıa cero. Se esta sumiendo que hay uncambio de sımbolo en este razonamiento. Si no hubiera cambio de sımbolo la derivadapodrıa ser cercana a cero aun cuando se estuviera muestreando en el lugar equivocado.Por este motivo, se asume que hay suficientes cambios de sımbolos como para que elsincronizador pueda actuar. Muchas veces lo que se hace es “aleatorizar” la secuenciaenviada para asegurar suficientes cambios de sımbolos y evitar largas secuencias delmismo sımbolo.

Por lo tanto, ya se tiene una estimacion del error: la derivada de la senal x(t)en el punto de muestreo. Ahora bien, no solo interesa el error sino tambien saber sise esta muestreando antes o despues del maximo a los efectos de mover el muestreoen la direccion correcta. Se esta adelantado si el sımbolo es positivo y la derivada esnegativa o si el sımbolo es negativo y la derivada es positiva. Por el contrario se estaatrasado si el sımbolo es positivo y la derivada es positiva o si el sımbolo es negativoy la derivada es negativa. De donde el error se puede escribir como:

e[k] = a[k]x(kTs + τ [k])

Como en general el verdadero a[k] no se conoce, se utiliza la estimacion del sımboloa[k], es decir:

e[k] = a[k]x(kTs + τ(k))

Para el caso de PAM binario;

e[k] = signo(x(kTs + τ [k])x(kTs + τ [k])

Se resalta nuevamente que este estimador del error asume la existencia de sufi-cientes transiciones de sımbolos.

8.3.2. Tiempo Discreto

En esta seccion se seguira considerando un sistema PAM y luego se extenderanlos resultados a otros tipos de sistemas. Si se considera el sistema de la figura 8.8,y utilizando la misma nomenclatura que en la seccion anterior, se tiene que si semuestrea la senal recibida cada tiempo T :

197

Page 198: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

r(nT ) = Ga∑m

a[m]p(nT −mTs − τ) + w(nT )

Se asumira tambien que los sımbolos no estan correlacionados en el siguiente sen-tido:

E[a[k]a[m]] = Epromδ(m− k)

donde Eprom es la energıa promedio de los sımbolos.

Luego esta senal discreta se pasa por un filtro p(−nT ) y la salida del mismo es

x(nT ) =GaT

∑m

a[m]rp(nT −mTs − τ) + ν(nT )

donde rp(.) corresponde al muestreo de la senal en tiempo continuo de la ecuacion8.1, por lo cual aparece el 1

T en esta ecuacion al aproximar la integral por la sumatoria.

En general, en tiempo discreto el bloque que estima el error producira una senalde error cada tiempo de sımbolo. Si se asume un interpolador que se queda con unamuestra por sımbolo, la salida del interpolador se puede expresar como:

x(kTs + τ) =GaT

∑m

a[m]rp((k −m)Ts + τ − τ) + ν(kTs + τ) (8.2)

La salida del bloque detector de errores e[k], sera una funcion de τe = τ − τ . Estasmuestras variaran en el tiempo dependiendo de los sımbolos y de la interpolacionobtenida, por lo tanto es razonable caracterizarla por lo que se denomina curva-Sg(τe) = E[e[k]]

8.3.3. Deteccion de error: Estimador de maxima verosimilitud

El estimador de maxima verosimilitud utiliza la pendiente de la curva de transi-ciones entre sımbolos para estimar el error. En la siguiente seccion se vera porque esteestimador es de maxima verosimilitud. Esta seccion se centrara en estudiar la curva-Sde este estimador.

e[k] = a[k]x(kTs + τ [k]) (8.3)

Como en general el verdadero a[k] no se conoce, se utiliza el sımbolo que se estimaa[k], es decir:

e[k] = a[k]x(kTs + τ [k]) (8.4)

Para el caso de PAM binario;

e[k] = signo(x(kTs + τ [k])x(kTs + τ [k])

Se vera en primer lugar como calcular la curva-S de este estimador y en segundolugar como calcular la derivada necesaria para este estimador en tiempo discreto.

198

Page 199: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

g(τe) = E[e[k]]

= E[a[k]x(kTs + τ)

]= E

[a[k]

GaT

∑m

a[m]rp((k −m)Ts − τe))]

En esta ecuacion, rp(.) corresponde al muestreo de la derivada de la senal en tiempocontinuo de la ecuacion 8.1 y se tuvo en cuenta que el ruido no esta correlacionadocon la senal. Ademas si se utiliza la hipotesis sobre la no correlacion de la secuenciade sımbolos enviados, el unico termino de la sumatoria que no se anula es el terminoen k y por lo tanto:

g(τe) =GaTEpromrp(−τe)) (8.5)

En la figura 8.9 se muestra la curva-S para este estimador de error. Esta curva fueobtenida mediante simulaciones con GNU-Radio. Se muestran dos curvas. La curvaen azul corresponde al estimador cuando se utiliza el verdadero a[k] segun la ecuacion8.3. La curva en rojo es utilizando un estimador de a[k] segun la ecuacion 8.4. Como seobserva en la figura la curva que utiliza el estimador de a[k] (en rojo) cuando el errores importante se aparta de la curva azul. Esto se debe a que en esta zona comienzana aparecer muchos errores y por tanto se estima mal el valor de a[k].

La pendiente de la curva de la figura 8.9 en τe = 0 es la ganancia de este bloqueen el sistema realimentado e influye en el desempeno del control de la interpolacion.Esta pendiente depende de la amplitud de la senal recibida, de la energıa media delos sımbolos y de la pendiente de

drpdt en τe = 0 segun la ecuacion 8.5. La ganancia

de este bloque depende del pulso p(t) y de la senal recibida y por lo tanto es difıcilsintonizar el bloque realimentado. Por esta razon, se recomiendo utilizar un bloquecontrol de ganancia que fije la amplitud de la senal en un punto determinado.

Para realizar este estimador es necesario emplear un derivador segun las ecuacionesvistas. Para este fin se pueden usar los diferentes filtros derivadores vistos en el capıtulode filtros del curso. El esquema serıa como el indicado en la figura 8.10. Sin embargo,tambien es posible juntar estos dos bloques en uno solo segun las siguientes ecuaciones:

x(nT ) = x(nT ) ∗ d(nT )

= (r(nT ) ∗ p(−nT )) ∗ d(nT )

= r(nT ) ∗ (p(−nT ) ∗ d(nT ))

= r(nT ) ∗ p(−nT )

Es decir que en lugar de colocar el filtro apareado y luego el bloque derivador sepuede utilizar directamente un bloque con la derivada del pulso apareado.

8.3.4. Deteccion de errores: otros estimadores

Existen varios estimadores de error en el siguiente ejercicio se veran dos de ellosde uso habitual.

199

Page 200: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 8.9: Cueva S estimador ML. Pulso SRRC 35 % exceso de ancho de banda. N=20 muestras por sımbolo. La derivada se calcula como la diferencia entre la muestray la anterior

Figura 8.10: Derivador

200

Page 201: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ejercicio 8.2. 1) El Detector de errores temporales “early-late” aproxima la derivaday por tanto el estimador de maxima verosimilitud y calcula el error segun:

e[k] = a[k] (x(kTs + τ + ∆Ts)− x(kTs + τ −∆Ts))

∆ depende de las muestras por sımbolo que se tengan. Por ejemplo si se tuvieran dosmuestras por sımbolo ∆ = 0,5.

Calcular la curva S g(e) = Ee[k].2) El estimador de Muller & Mueller estima el error segun la siguiente ecuacion

e[k] = a[k − 1]x(kTs + τ)− a[k]x((k − 1)Ts + τ)

Calcular la curva S g(e) = Ee(k). Se deberıa llegar a que es proporcional arp(Ts − τe) − rp(−Ts − τe) Observar que rp(t) es simetrica entorno a 0 ¿por que?.Interpretar el resultado.

3) En el adjunto a este texto correspondiente al ejercicio 2 se entrega un estimadordel error similar al early late. Explicar la funcionalidad de cada elemento del receptor,escribir las ecuaciones del estimador del diagrama entregado. Verificar que para lamuestra en la cual se obtiene la constelacion correcta se obtiene error cercano a cero.Graficar la curva S empıricamente. Utilizar la fuente vector y la aleatoria.

4) Opcional: Disenar un estimador del error M&M y repetir lo solicitado en laparte 3 para este caso.

8.3.5. Calculo del estimador del error de maxima verosimilitud

En las seccion 8.3 se analizo como estimar el error a partir de un analisis cualitativode la senal recibida. En esta seccion veremos que ese analisis cualitativo brinda unestimador del error que tiene una interpretacion formal como el estimador de maximaverosimilitud.

Para esto se retomara el analisis de los estimadores de maxima verosimilitud vistoen capıtulos precedentes. En esta seccion se retomara el analisis del estimador de maxi-ma verosimilitud en tiempo discreto. Se asumira que la sincronizacion en frecuenciay fase es perfecta y que solo hay error de tiempo.

Retomando lo visto se tenıa que el logaritmo del estimador de maxima verosimi-litud se podıa expresar a menos de una constante multiplicativa como:

Λ(r/τ) = 2∑i

Re [r(iT )s∗(iT, τ)]−∑i

|s(iT, τ)|2

s(iT, τ) =∑k

a[k]p((iT − kTs)− τ)

donde se asumira por el momento y a los efectos de simplificar los calculos que setiene un numero infinito de muestras y que el pulso se extiende infinitamente. Luegoharemos las consideraciones para acotar estas sumatorias.

De estas ecuaciones derivando respecto al parametro y observando que s = a ∗ pse llega a :

201

Page 202: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

dΛ(r/τ)

dτ=

d

∑i

2Re

[r(iT )

∑k

a∗[k]p((iT − kTs)− τ)

]−∑i

∣∣∣∣∣∑k

a[k]p((iT − kTs)− τ)

∣∣∣∣∣2

Intercambiando las sumatorias,

dΛ(r/τ)

dτ=

d

2∑k

Re

[a∗[k]

∑i

r(iT )p((iT − kTs)− τ)

]

− d

∑i

∑m

∑n

a[m]a∗[n]p((iT −mTs)− τ)p∗((iT − nTs)− τ)

=d

2∑k

Re

[a∗[k]

∑i

r(iT )p((iT − kTs)− τ)

]

− d

∑m

∑n

a[m]a∗[n]∑i

p((iT −mTs)− τ)p∗((iT − nTs)− τ)

Observando la definicion del pulso apareado y la salida de este (x = r ∗ papareado)y tomando la derivada se llega a:

dΛ(r/τ)

dτ= 2

L0−1∑k=0

Re [a∗[k]x(kTs + τ)]

+ 2

L0−1∑m=0

m+D∑n=m−D

a[m]a∗[n]h((n−m)Ts) (8.6)

donde x(.) es la senal a la salida del filtro apareado e x(.) su derivada. Se defineh(t) = p(t)∗p(−t) y h(t) es su derivada. En esta ultima ecuacion se considero tambienque se tiene un conjunto finito de muestras L0 y que el pulso es de duracion finita.

Una consideracion especial se debe hacer sobre el segundo termino de la ecuacion8.6. Este termino representa una suma de 2D terminos, donde se ha asumido quela respuesta del filtro es despreciable o nula a partir de la muestra numero D. Estetermino habitualmente se desprecia en el estimador de maxima verosimilitud que seencuentra en la literatura sobre el tema. Algunos autores este termino lo desprecianporque proviene de

∑i |s(iT, τ)|2 que es la energıa de la senal enviada y si el perıodo de

observacion es suficientemente largo tiene poca dependencia de τ . Se observa tambienque h(.) verifica que h(0) = 0 y h(t) = −h(−t). De esta propiedad se aprecia quedespreciar este termino es similar a considerar D = 0. Por otro lado, cuando se calculacurva-S de este estimador si los sımbolos son no correlacionados y como h(0) = 0 altomar valor esperado la suma de los 2D terminos da cero y por tanto no influyen enel valor medio del error.

Por lo tanto de aquı en adelante se considerara una aproximacion al estimador demaxima verosimilitud que desprecia este termino.

202

Page 203: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

∂Λ(r/τ)

∂τ=

L0−1∑k=0

Re [a[k]∗x((kT ) + τ)]

La suma en los terminos anteriores deben ser iguales a cero para obtener el esti-mador de maxima verosimilitud. Observar que si la cantidad de muestras es suficien-temente grande por la Ley de los grandes numeros

∑e[k] ≈

∑E[e[k]]

Para llevar a cero suma anterior se trata de llevar a cero en media el error en untiempo k definido como:

eτ [k] = Re [a[k]∗x((kTs) + τ [k])]

Se analizara ahora con mas detalle el error temporal.

eτ [k] = Re [a[k]∗x((kTs) + τ [k])]

= Re[a[k]]Re [x((kTs) + τ [k])] + Im[a[k]]Im [x((kTs) + τ [k])]

(8.7)

De esta ecuacion se puede observar que en el caso PAM, donde los sımbolos sonreales, se obtiene:

eτ [k] = a[k]x((kTs) + τ [k])

Esta ecuacion coincide con la que se habıa obtenido anteriormente de forma masintuitiva en la ecuacion 8.3.

Para el caso de senales con sımbolos complejos como QPSK por ejemplo, de laecuacion 8.7 se observa que en este caso se deben sumar los errores de la parte real yla parte imaginaria y por tanto un posible diagrama de bloques para un sincronizadortemporal discreto en el caso QPSK serıa el que se muestra en la figura 8.11

8.4. Interpolacion

8.4.1. Introduccion

En el receptor, se tienen muestras de la senal x(t) cada intervalos de tiempo T .La muestra deseada no tiene por que coincidir con ninguna de las muestras que setienen. Es decir, el extremo de la senal puede darse en un punto t = kTI que notiene porque coincidir con ninguna de las muestras que estan tomadas cada T . Elpunto optimo, estara entre dos de las muestras que se tienen en nT y (n + 1)T . Loque se busca es interpolar la senal x(t) entre estos dos puntos. A estos puntos se losdenominara m(k) y m(k) + 1 ya que corresponden a la muestra que obtendremosdel k-esimo pulso en kTI . La distancia entre el punto m(k)T y kTI es una fraccionde T y la denominaremos µ(k)T con 0 ≤ µ(k) ≤ 1. El problema del bloque decontrol del interpolador es suministrarle al interpolador m(k) y µ(k). El problemadel interpolador es conocidos m(k) y µ(k) obtener x(m(k)T + µ(k)T ) a partir de lasmuestras que se tienen de la senal.

203

Page 204: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 8.11: Esquema sincronizador QPSK

8.4.2. Interpolador polinomico

Este es el interpolador mas simple y la idea es aproximar x(t) entre los puntosm(k)T y (m(k) + 1)T por un polinomio. En esta seccion se vera el interpolador deprimer orden o lineal y quedara como ejercicio ver alguno de los de mayor orden. Elinterpolador lineal aproximara x(t) por la recta a1t + a0 entre las muestras corres-pondientes a m(k) y m(k) + 1. Por lo tanto se verifica que:

x(m(k)T ) = a1m(k)T + a0 (8.8)

x((m(k) + 1)T ) = a1(m(k) + 1)T + a0 (8.9)

x((m(k) + 1)T )− x(m(k)T ) = a1 (8.10)

Ademas en el punto de interes se debe cumplir que:

x((m(k) + µ(k))T ) = a1((m(k) + µ(k))T ) + a0

A partir de esta ultima ecuacion y utilizando las ecuaciones 8.8 y 8.10 para sustituira0 y a1 y operando se obtiene:

x((m(k) + µ(k))T ) = x((m(k) + 1)T )µ(k) + x(m(k)T )(1− µ(k))

Es decir que se puede obtener la estimacion de la senal en el punto deseado apartir de las muestras en m(k) y m(k) + 1 y del valor µ(k) que suministre el bloquede control del interpolador.

Ejercicio 8.3. Observar que el interpolador anterior se puede escribir como un filtroFIR de la forma:

x((m(k) + µ(k))T ) =

l2∑i=−l1

x((m(k)− i)T )h(i) (8.11)

204

Page 205: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

donde los h(i) dependen solo de µ(k). Utilizando esta expresion dibujar el filtro inter-polador correspondiente para el interpolador lineal de primer orden.

8.4.3. Interpolador polifasico

Es comun utilizar en sistemas de tiempo discreto un interpolador polifasico porsu eficiencia y desempeno. En esta seccion se analizara el fundamento de dicho inter-polador.

El teorema de muestreo dice que la senal x(t) se puede representar:

x(t) =∑k

x(kT )sinc

(t− kTT

)(8.12)

Por lo tanto de 8.12

x(t+ τ) =∑k

x(kT )sinc

(t− kT + τ

T

)si ahora se muestrea esta senal cada nT ,

x(nT + τ) =∑k

x(kT )sinc

((n− k)T + τ

T

)Esta ultima ecuacion dice que las muestras de la senal desplazadas un tiempo τ

se pueden recuperar de las muestras de la senal sin desplazar pero utilizando un filtrodesplazado τ . Esto por lo tanto permite con un banco de filtros obtener las muestrasde una senal con el desplazamiento τ que se desee respecto del muestreo original dela senal. Este esquema se muestra en la figura 8.12.

La idea anterior es la que permite construir un interpolador polifasico adecuado alas necesidades de la sincronizacion temporal como se vera en las ecuaciones siguientes.

Se considera la senal x(nT ) a la salida del filtro apareado y de la que se desearecuperar muestras desplazadas una cantidad arbitraria del muestreo original. En lu-gar de utilizar un filtro ideal como en el teorema de muestreo se utilizara un filtropasa bajo con respuesta al impulso h(t). Las muestras a obtener no tendran un des-plazamiento arbitrario sino que el intervalo de muestreo del receptor T se dividira enQ partes iguales. Se podra obtener la senal interpolada a intervalos de duracion q

Q .Se identifica con una variable q = 0, 1, .., Q− 1 a cada una de esas partes y se puedeescribir:

x(nT +q

QT ) =

∑k

x (kT )h

((n− k)T +

q

QT

)=

∑i

x ((n− i)T )h

(iT +

q

QT

)con q = 0, .., Q− 1

205

Page 206: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 8.12: Filtro

Estas ecuaciones se pueden entonces representar por el diagrama de bloques de lafigura 8.12, donde hq(nT ) = h(nT + q

QT ) con q = 0, ..Q − 1. Ahora bien, si se tieneen cuenta que el filtro apareado es tambien un filtro pasabajos, se puede utilizar estefiltro en lugar del filtro h(.) y resulta entonces el diagrama de bloques de la figura8.14. El conmutador a la salida del banco de filtros elije de acuerdo al µ que le indiqueel control del interpolador el filtro a utilizar para interpolar en el punto correcto.

8.5. Control del interpolador

En esta seccion se analizara un algoritmo para definir cual es la muestra del k-esimosımbolo que se debe elegir del conjunto de muestras de x(nT ). Esta sera la muestradenominada m(k) y el desplazamiento respecto de esta muestra para interpolar, µ(k).

8.5.1. Contador modulo-1

Existen diferentes formas de obtener los valores m(k) y µ(k). En primer lugar seanalizara el esquema de la figura 8.15 donde el control es realizado por un contadordescendente modulo-1.

Si no hay error, como se tienen N muestras por sımbolo el contador modulo-1 daraunderflow cada N muestras. El underflow se dara en realidad en la muestra m(k)+1 yel punto de cruce por cero de este oscilador determinara µ(k). Este oscilador juega el

206

Page 207: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 8.13: Filtro

Figura 8.14: Implementacion del Filtro Interpolador Polifasico

Figura 8.15: Implementacion del control del interpolador contador modulo-1

207

Page 208: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 8.16: underflow contador modulo-1

rol del VCO (en los PLL de tiempo continuo), es decir sera un oscilador de frecuenciamedia 1/NT y cuya fase se modificara de acuerdo con el error filtrado v(nT ).

Como se muestra en la figura 8.16 donde se grafica la salida del contador en funciondel tiempo. El contador tendra un underflow en (m(k) + 1)T donde se reseteara y lesumara uno a la salida para comenzar a decrecer nuevamente. Este underflow es laprimera senal de control que recibira el filtro interpolador para conocer el conjunto demuestras con las que debe interpolar. La segunda senal debe ser µ(k) que se calculade la siguiente forma.

Utilizando la nomenclatura del diagrama de la figura 8.15, se puede observar quela salida del contador modulo-1 (η) verifica la siguiente ecuacion:

η((n+ 1)T ) = η(nT )− 1

N− v(nT )

Si el error es cero desciende con pendiente 1NT .

Un modelo linealizado como PLL de este sistema se puede observar en la figura8.17.

Observar que en el sımil con el PLL, K0 = −1 por ser un contador descendentey como vimos Kp = KEprom > 0. En un lazo de PLL de segundo orden KpK0K1 =2ξwn y KpK0K2 = w2

n. De estas ecuaciones se puede deducir que K1 y K2 serannegativas. Por lo tanto si el error es positivo, v(nT ) sera negativo y la pendiente dedescenso disminuye, atrasando ası el instante de muestreo y si el error es negativo, lapendiente aumenta, adelantando ası el instante de muestreo.

Si se denomina W (nT ) = 1N − v(nT ), para los puntos m(k)T y (m(k) + 1)T se

verifica:

η((m(k) + 1)T ) = η(m(k)T ) + 1−W (m(k)T )

208

Page 209: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 8.17: modelo de pll linealizado en tiempo discreto

Observar que W (nT ) es una estimacion de TTI

, siendo TI el tiempo entre dosmaximos de dos sımbolos consecutivos.

Segun se puede observar en la figura 8.16 se verifica la siguiente relacion entre lostriangulos:

1− η((m(k) + 1)T )

η(m(k)T )=

1− µ(k)

µ(k)

de donde,

µ(m(k)) =η(m(k)T )

1 + η(m(k)T )− η((m(k) + 1)T )

=η(m(k)T )

W (m(k)T )

Es decir que a partir del valor del contador en m(k)T y de W (m(k)T ) es posibleobtener el valor µ(k) que necesita el filtro interpolador.

8.5.2. Algoritmo recursivo

Se vera a continuacion otro metodo alternativo para controlar la interpolacion. Sise denomina kTI al tiempo en que se toma la muestra del k-esimo sımbolo, entoncesse verifica que

kTI = (m(k) + µ(k))T

(k + 1)TI = (m(k + 1) + µ(k + 1))T

209

Page 210: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

de donde,

TI = (m(k + 1) + µ(k + 1))T − (m(k) + µ(k))T (8.13)

m(k + 1) = m(k) +TIT

+ µ(k)− µ(k + 1) (8.14)

Como m(k) y m(k+ 1) son enteros los restantes terminos deben tener parte frac-cional nula y por lo tanto:

µ(k + 1) =

(TIT

+ µ(k)

)modulo 1

Esta ecuacion nos permite calcular recursivamente el valor de µ que se le debe daral filtro interpolador. Por lo tanto m(k) se podra calcular recursivamente utilizandola parte entera de los tres ultimos terminos de la ecuacion 8.14

m(k + 1)−m(k) =

⌊TIT

+ µ(k)− µ(k + 1)

⌋donde T

TIse estima como W (kT ) = 1

N + v(kT ).

Ejercicio 8.4. Sean r(nT ) la senal muestreada que ingresa al receptor digital, p(nT )la respuesta a impulso del filtro apareado y p(nT ) la de la derivada del filtro apareado.Escribir un diagrama completo de un sincronizador temporal que cumpla lo siguiente:

1. Utilice como interpolador el polifasico visto en clase.

2. Calcule el error usando alguno de los algoritmos vistos para tal fin.

3. Tenga un bloque proporcional e integral en la realimentacion del error.

4. Calcule recursivamente m(k) y µ(k), es decir el momento donde debe muestrear.

Ejercicio 8.5. En este ejercicio se pide en primer lugar estudiar la documentaciondel sincronizador polifasico de gnuradio. Posteriormente implementar el transmisorQPSK y canal vistos en el ejercicio 8.1 y un receptor que utilice un sincronizadorpolifasico.

a) El sincronizador polifasico en gnuradio tiene 4 salidas. Explique que es cadauna de las 4 salidas e indique de donde se obtienen en el diagrama de bloques querealizo en el ejercicio 8.4. Empiece por hacer funcionar el receptor cuando epsilon vale1 y un retardo canal =0.

b)El parametro crıtico para sintonizar este bloque es el denominado: loop band-width. Explique que representa y que efecto tiene. En particular explique que sucedesi lo pone en un valor muy pequeno o muy grande. Le sugerimos comenzar con esteparametros en π/100 y luego probar que sucede si lo cambia a 10π, π y π/100000.Pruebe cambiar el retardo del canal de 0 a 7 por ejemplo y observar la respuestadinamica de la constelacion y de la fase del bloque de sincronizacion.

Al cambiar el retardo del canal, observe que cambia en la salidas del bloque po-lifasico y la constelacion. Explique lo que observe.

210

Page 211: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

c)Para esta parte cambie la base de tiempo del receptor modificando epsilon ycolocandolo por ejemplo en 1.001. Observe los cambios en las 4 salidas del interpoladorpolifasico y explique lo que observa. Encuentre aproximadamente en que rango de loopbandwidth logra sintonizar el receptor. Le sugerimos probar por ejemplo 5π, π, π/10,2π/50,2π/100, 2π/1000 y 2π/2000.

d)Por ultimo, cambie el parametros epsilon a 1.009 y analice si el sincronizadorfunciona correctamente o no en 5π, π, π/10, 2π/20 2π/50.

Explique por que a medida que la diferencia entre las bases de tiempo es mayor elrango de sincronizacion del PLL del sincronizador polifasico disminuye.

211

Page 212: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

212

Page 213: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Bibliografıa

[1] Digital Communication Barry, John R., Lee, Edward A., Messerschmitt, David G.Originally published under Leww,E.A.;Messerschmitt,D.G. 3rd ed. 2003, XVII,838 p. In 2 volumes.

[2] Proakis, J. and Salehi, M., Digital Communications, isbn=9780072957167, 2007,McGraw-Hill Education.

[3] Digital Communications: A Discrete-Time Approach, Michael Rice,isbn=9780130304971, 2008, Pearson, Prentice Hall.

[4] Signal Processing Techniques for Software Radios, Behrouz Farhang-Boroujeny,2008, University of Utah.

213

Page 214: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

214

Page 215: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Capıtulo 9

Codificacion

9.1. Introduccion

El tema de este capıtulo, correccion de errores, es un tema de muchos anos dedesarrollo en el area de las comunicaciones y la electronica. Es por tanto, un temaque se encuentra muy bien abordado en diferentes textos y cursos. En estas notasse pretende dar una introduccion al tema haciendo enfasis en aquellos aspectos queinteresan para el curso de comunicaciones inalambricas. En diversos libros de comu-nicaciones inalambricas (por ejemplo [1], [3]) este tema esta tratado y se han tomadode ellos la forma de abordar algunas de las secciones de este capıtulo. Tambien enel curso del MIT [6] hay una buena introduccion a la correccion de errores que hasido de utilidad tambien para ver la forma de explicar algunos temas. Un estudiomas profundo de este tema se puede encontrar el libro de Lin y Costello [5] y queha sido referencia para estas notas en varias secciones. Este tema tiene relacion conel fundamento teorico en la Teorıa de la Informacion. En este curso se estudiaransolamente algunas cosas mınimas de esta teorıa buscando hacer menos arida la pre-sentacion del tema. El lector interesado puede consultar diferentes libros sobre teorıade la informacion (por ejemplo [1] o una introduccion mas basica en [2]).

La gestion de errores es un tema muy relevante en cualquier sistema de comunica-cion pero particularmente en los sistemas de comunicacion inalambricos donde la tasade errores del medio fısico es importante. Por un lado, se utilizan los codigos de detec-cion de errores cuyo objetivo es detectar (aunque no sea posible corregir) los erroresgenerados en la comunicacion. Por otro lado, se encuentran los codigos de correccionde errores que son disenados no solo para detectar sino tambien para corregir errores.

Cuando se utilizan codigos para detectar errores, estos habitualmente se empleanjunto con un mecanismo de requerimiento de repeticion automatica (automatic repeatrequest, ARQ). Este mecanismo puede funcionar de diferentes maneras, pero habi-tualmente, el receptor envıa un ACK si una trama de datos llego sin errores ( o masprecisamente sin que se hayan detectado errores) y cuando el transmisor no recibe elACK retransmite la trama. Este mecanismo si bien permite solucionar el problemagenerado por la introduccion de errores en una trama, agrega retardos que puedenser importantes si el medio fısico introduce muchos errores y por tanto si bien se lo-gra un sistema de comunicaciones sin errores o con baja tasa de errores, los retardos

215

Page 216: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

introducidos pueden no ser aceptables. Por este motivo, particularmente en las redesinalambricas es muy importante buscar mecanismos que permitan corregir errores sinnecesidad de realizar retransmisiones.

Si bien este capıtulo se concentrara en los codigos de correccion de errores, esimportante resaltar que en general los codigos de deteccion de errores y de correccionde errores se utilizan conjuntamente aunque muchas veces a diferentes niveles. Porejemplo se utilizan codigos de correccion de errores en ciertos bloques y luego la tramaglobalmente tiene un CRC para detectar por si algun error no pudo ser corregido.

9.2. Introduccion a los codigos de correccion de erro-res

Existen muchos tipos de codigos de correccion de errores. Este capıtulo se centraraparticularmente en dos clases de las muchas que existen. La primera clase que seanalizara es la de los codigos lineales de bloques, que son una subclase de los codigosalgebraicos. Estos codigos han sido ampliamente utilizados sobre todo para corregirerrores en la escritura/lectura de dispositivos electronicos (memorias, discos, etc.).Como se vera mas adelante, hoy en dıa en sistemas de comunicaciones inalambricos noson los mas utilizados. Sin embargo, estos codigos y algunas subclases como los codigoscıclicos siguen siendo utilizados y ademas didacticamente ayudan a comprender elfuncionamiento de otros tipos de codigos por lo que se analizara su operacion enprimer termino. En segundo lugar se analizaran los codigos convolucionales. Esta clasede codigos y derivados de ella son muy utilizados en comunicaciones inalambricas.Por ejemplo GSM, 802.11, ISDBT, utilizan codigos convolucionales para correccionde errores en las comunicaciones.

Antes de analizar las clases de codigos antes mencionados, se presentaran algunaspropiedades y caracterısticas de la codificacion en un canal de comunicaciones.

9.3. Modelo de canal, tasa de informacion, proba-bilidad de decodificacion erronea

9.3.1. Canal BSC

Se denominara pe a la probabilidad de error de un solo bit. Se asume que losbits son corrompidos de manera independiente y todos con la misma probabilidadpe. Esto es lo que se denomina, canal binario simetrico (BSC) y con este modelo setrabajara en lo que resta de este capıtulo. Para una trama de S bits en un BSC, laprobabilidad de que sea recibida correctamente, sera entonces: (1− pe)S . En generalse asume tambien que pe < 0,5, esto ademas de corresponder a un canal ’razonable’tiene una justificacion que se vera mas adelante.

9.3.2. Una primera aproximacion: codigos de repeticion

¿Cual es la primera idea que se le ocurre al lector para aumentar la confiabilidadde un canal con errores? Probablemente la primera idea sea repetir varias veces cada

216

Page 217: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

bit a enviar. Por ejemplo si se quiere enviar un 0 se envıa 000 y si se quiere enviarun 1 envıo 111. En el receptor si hay errores en el canal se podra recibir cualquiercombinacion de 3 bits.

La siguiente pregunta que se plantea es: ¿ Como se decodifica? es decir, si serecibe por ejemplo 010 que se decidirıa que se envio: ¿0 o 1?. La respuesta intuitivaes que se decodificarıa como un 0 porque lo mas probable es que exista un solo errory en ese caso lo que se envio debe haber sido 000. Esta respuesta intuitiva, se puedeformalizar y se formalizara mas adelante. Se analizara que la regla de asignacion demaxima verosimilitud para decodificar, es aquella que asigna la palabra de codigo queesta a menor distancia de la palabra recibida. Se probara para un canal BSC conprobabilidad de error de bit menor a 0,5, con lo cual tambien se justificara nuestrahipotesis inicial de que se trabajara en un BSC con pe < 0,5.

Se supone entonces un BSC con pe < 0,5 y donde se utiliza el codigo de repeticionpor tres y con la regla de decodificacion comentada antes. ¿Cual es la probabilidadque no existan errores, cual que se cometa uno y solo uno, cual que se comentan dosy solo dos errores y cual que se cometan tres errores? El lector puede verificar que laprobabilidad de que no se cometa ningun error es (1 − pe)3. La probabilidad de queexista un solo error es

(31

)pe(1−pe)2 (donde

(31

)indica combinaciones de tres tomadas

de a uno). La probabilidad de que existan dos y solo dos errores es(

32

)p2e(1− pe) y de

que existan 3 errores es p3e.

Por lo tanto, la probabilidad de que una palabra en el receptor se interpreteerroneamente es igual a la probabilidad de que existan 2 o 3 errores, esto es: 3p2

e(1−pe) + p3

e. Para pe pequeno esto es aproximadamente igual a 3p2e y si por ejemplo

pe = 0,01, la probabilidad de que el mensaje se interprete mal es: 3 10−4. Es decir querepitiendo 3 veces cada bit, se reduce en dos ordenes de magnitud la probabilidad deerror. Sin embargo, esto se logra al costo de reducir a 1/3 la tasa de informacion quese envıa, ya que por cada 3 bits se envıa un solo bit de informacion.

Si el lector realiza este ejercicio para un codigo de repeticion de 5 o 7 bits, veraque la probabilidad de error bajara sustancialmente pero tambien a costa de bajarla tasa de informacion a 1/5 y 1/7 respectivamente. Por lo tanto, generalizando elrazonamiento anterior, con un codigo de repeticion es posible hacer que la probabilidadde error se acerque a cero tanto como se quiera pero a costa de acercar a cero tambienla tasa de informacion enviada.

La pregunta que se presenta inmediatamente es si existira una forma de hacerasintoticamente nula la probabilidad de mensaje erroneo, pero sin tener que hacerasintoticamente nula la tasa de informacion enviada.

La respuesta a la pregunta anterior la dio Shannon en la decada de 1950, y larespuesta es que efectivamente es posible hacer la probabilidad de mensaje erroneoasintoticamente cero sin que necesariamente la tasa de informacion tienda a cero.

En este capıtulo no se vera la demostracion del segundo teorema de Shannon, elcual puede verse cualquier libro sobre Teorıa de la Informacion (ver por ej. [1]).

El Teorema dice que para una canal discreto sin memoria (esto es mas general queel canal BSC que se esta considerando), todas las tasas por debajo de la capacidaddel canal C son alcanzables. Esto es que para toda tasa de informacion R < C, existealgun codigo cuya probabilidad de error tiende a cero con n (el largo de las palabrasdel codigo).

La capacidad del canal es un concepto de Teorıa de la Informacion y solo se

217

Page 218: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

recuerda al lector su definicion: es la maximo de la informacion mutua entre transmisory receptor. Por ejemplo, para un canal binario simetrico la capacidad del canal secalcula a partir de la definicion de informacion mutua y se obtiene:

C = 1 + pe log(pe) + (1− pe) log(1− pe)Notar que cuando pe = 0 la capacidad es 1 y cuando pe = 0,5, la capacidad del

canal es nula, ya que cuando llega un bit no tengo ninguna informacion sobre el bitque fue enviado.

9.3.3. Distancia de Hamming, capacidad de detectar y corregirerrores de un codigo

Una forma de pensar sobre como elegir las palabras de codigo es asumir que seutilizaran palabras de cierto largo N y que se tienen que elegir M de estas palabraspara transmitir los log(M) bits de informacion que es necesario enviar.

Ejercicio 9.1. Por ejemplo en el caso del codigo con repeticion N = 3, M = 2.Cuando M = 2 se eligieron como palabras a utilizar de las 8 posibles 000, 111. Si seasume que se produce un solo error ¿es posible corregir el error? ¿de que manera? ysi se pueden producir dos errores ¿es posible corregir los errores? ¿es posible detectarque hubieron errores? Explique porque. Explique porque es conveniente tomar esas dospalabras y no por ejemplo 000, 110

Ahora bien, si la cantidad de palabras que se quieren enviar fuera M = 4, esnecesario elegir 4 palabras del conjunto: 000, 001, 010, 011, 100, 101, 110, 111. ¿cualeselegirıa? ¿es posible corregir algun error? ¿es posible detectar que hubo un error?Explique porque.

Definicion 9.1. Distancia de Hamming para dos secuencias de N bits w1 y w2. Esel numero de bits en que difieren ambas palabras.

Con esta definicion se puede probar facilmente que es una metrica en el espaciode las palabras de N bits. Esto quiere decir que:

1. H(w1, w2) ≥ 0, en particular 0 ≤ H(w1, w2) ≤ N

2. H(w1, w2) = 0 si y solo sı w1 = w2

3. H(w1, w2) = H(w2, w1)

4. H(w1, w3) ≤ H(w1, w2) +H(w2, w3), desigualdad triangular.

Ejemplo 9.1. w1 = 000000 y w2 = 101010 H(w1, w2) = 3.

Definicion 9.2. Distancia mınima de Hamming de un codigo. Es la menor distanciade Hamming entre dos palabras cualesquiera del codigo.

Ahora bien, si se tienen dos palabras tales que H(w1, w2) = 1, si se produce unerror en el bit en que difieren no sera posible saber si se cometio un error. Si ladistancia mınima de un codigo es 2, esto quiere decir H(wi, wj) ≥ 2 para todo wi, wjdel conjunto S de mensajes posibles del codigo. En este caso, si se transmite wi y hayun error la palabra recibida r no puede pertenecer a S ya que de ser ası la distanciamınima del codigo serıa 1 y no 2. Por lo tanto, en este caso se puede detectar un

218

Page 219: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 9.1: Diagrama ejemplo 9.2 .

Figura 9.2: Esquema de codigo con distancia mınima de Hamming 3

error. En cambio con el mismo razonamiento, se puede ver que no todo patron de doserrores puede ser detectado.

El razonamiento anterior se puede generalizar facilmente en el siguiente teorema:

Teorema 9.1. Un codigo con distancia mınima de Hamming D puede detectar D−1o menos errores. Ademas, existe al menos un patron con D errores que no puede serdetectado.

Ejemplo 9.2. Se considera el caso N = 2 y M = 2. Se eligen como palabras delcodigo (00, 11). En la figura 9.1 se muestra una representacion del codigo donde cadatransicion representa un error en un bit, es decir que dos palabras unidas por unatransicion tienen una distancia de Hamming igual a 1. Como se puede observar eneste caso el codigo tiene distancia mınima 2 y por tanto se puede detectar 1 error.Sin embargo, no es posible corregir porque las palabras erroneas se encuentran a lamisma distancia de Hamming de las dos palabras de codigo.

Se considera entonces el codigo de repeticion ya visto y del que se muestra undiagrama parcial de transiciones en la figura 9.2. En este caso si se producen uno odos errores la palabra recibida no pertenecera a S (el conjunto de las palabras delcodigo) porque la distancia mınima de este codigo es 3. Ademas, si se produce unerror es posible saber que palabra lo mando ya que cualquier otra palabra de codigoestara a distancia mayor a uno. En cambio ¿es posible corregir si se producen doserrores?

Teorema 9.2. Un codigo con distancia de Hamming mınima D puede corregir cual-quier patron de errores de D−1

2 o menos errores.

Demostracion. La idea para probar este Teorema es considerar el conjunto Gwi queresulta de cambiar D−1

2 o menos bits a una palabra de codigo wi. Si la distancia

219

Page 220: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

mınima de Hamming es D, entonces Gwi ∩Gwj = ∅ ∀wj porque si no fuera ası por ladesigualdad triangular habrıa dos palabras de codigo a distancia menor que D.

Para terminar esta seccion se presentara un teorema que se ha utilizado anterior-mente de manera intuitiva.

Teorema 9.3. En un canal BSC con probabilidad de error menor a 0.5, la estrategiade decodificacion de maxima verosimilitud es mapear la palabra recibida a la palabravalida con menor distancia de Hamming

Demostracion. Siendo N el largo de las palabras del codigo. Sea r la palabra recibida.Se busca la palabra del codigo c tal maximice el logP(r/c). Sea d la cantidad de bitsen que difieren r y c (la distancia de Hamming entre ambas palabras). Por lo tanto,

log(P (r/c)) = log(pde(1− pe)N−d) (9.1)

= d log(pe) + (N − d) log(1− pe) (9.2)

= d log(pe

1− pe) +N log(1− pe) (9.3)

y por lo tanto si pe < 0,5 se cumple que log( pe1−pe ) < 0 lo que concluye el teorema

ya que max logP(r/c) = mın d

Ejercicio 9.2. a)Encuentre la distancia mınima de los siguientes codigos

1. 0000, 1100, 1010, 1001, 0110, 0101, 0011, 1111 ;

2. 10000, 01010, 00001 ;

3. 000000, 101010, 010101 .

En cada caso especifique el numero de errores que pueden ser detectados y corregidos,y cual es la eficiencia de cada codigo.

b)¿Cuales de los codigos anteriores pueden ser extendidos agregando una palabramas de codigo sin alterar su capacidad de corregir o detectar errores?

c) Determine la distancia mınima de la funcion de codificacion

e(000) = 00000000

e(001) = 01110010

e(010) = 10011100

e(011) = 01110001

e(100) = 01100101

e(101) = 10110000

e(111) = 00001111

¿Cuantos errores detectara e?

¿Cuantos errores corregira e?

220

Page 221: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

9.4. Codigos lineales y codigos lineales de bloques

9.4.1. Introduccion

En las secciones anteriores se analizo como calcular la mınima distancia de Ham-ming necesaria de un codigo de acuerdo a la cantidad de errores que se desea quepueda detectar y corregir. El siguiente problema que se plantea es como elegir laspalabras de codigo. Por ejemplo si se quieren transmitir mensajes de 4 bits con uncodigo que pueda corregir errores de un bit, son necesarias 16 palabras de codigocon distancia mınima de Hamming 3 entre todas ellas. La pregunta es cuanto valeel mınimo N que puede cumplir con este requerimiento. El mınimo N vale 7, peroencontrarlo implica una busqueda exhaustiva para cada caso. Por lo tanto, se hacenecesario disenar tecnicas que permitan generar codigos de forma mas inteligente.La primera clase de codigos que se estudiara son lo codigos lineales de bloques. Acontinuacion se daran algunas definiciones para caracterizar estos codigos.

Definicion 9.3 (Codigos de bloques). Un codigo de bloques mapea un conjunto dek bits a transmitir (2k palabras) en un bloque de n bits. Se habla entonces de codigos(n, k).

Los codigos algebraicos realizan el mapeo mediante operaciones algebraicas sobreel bloque de k bits. En un codigo lineal binario, el mapeo es una funcion lineal conlas operaciones modulo-2. Se transmiten las palabras de n bits y por tanto la tasa deinformacion del codigo sera k

n .

Definicion 9.4 (Codigos lineales (de bloque o no)). Un codigo lineal binario C delargo n es un conjunto de n-uplas binarias tal que la suma modulo-2 componente acomponente de cualesquiera dos palabras de codigo genera una palabra de codigo.

Los codigos convolucionales que se veran mas adelante tambien son lineales aunqueno de bloques.

Observar que la definicion anterior implica que la palabra de todos 0s es siempreuna palabra de codigo de un codigo lineal ¿por que?.

Ejemplo 9.3. Por ejemplo el codigo (000, 101, 011) no es un codigo lineal. ¿por que?¿Es posible transformarlo en un codigo lineal?

Teorema 9.4. Si se define el peso de una palabra como el numero de 1s que contiene.La mınima distancia de Hamming en un codigo lineal es igual al peso de la palabradistinta de cero y con menor peso.

Demostracion. La idea de la prueba se basa en las siguientes observaciones:1. La suma de dos palabras del codigo es una palabra del codigo2. La distancia de Hamming entre dos palabras es la cantidad de lugares en la que

difieren y por tanto si las sumo, la distancia de Hamming es la cantidad de lugaresen que la suma tiene un uno.

3. La observacion anterior se puede expresar como: H(w1, w2) = peso(w1 + w2)4. De lo anterior se infiere que la distancia entre dos palabras es siempre el peso

de otra palabra del codigo.Los detalles de la prueba se dejan al lector.

221

Page 222: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

9.4.2. Una vision desde el algebra del problema de codificacion

Introduccion

Cuando se estudio modulacion, se busco en el espacio de todas las senales, unsubespacio tal que las senales que se envıan son combinaciones lineales de un conjun-to de senales ortogonales que generan dicho subespacio. Luego de transmitidas estassenales por efecto del ruido por ejemplo, pueden dejar de pertenecer a dicho subespa-cio. Lo que se hace para demodular es encontrar dada la senal recibida la proyecciona dicho subespacio y decidir la senal enviada como aquella que esta a menor distanciade la proyeccion.

El problema de la codificacion es conceptualmente el mismo. Se desean enviarpalabras de n bits para codificar 2k mensajes. El problema es en el espacio de todoslos vectores de n bits (2n vectores, n > k), como elegir un conjunto de 2k vectores. Esteconjunto definirıa un subespacio vectorial y una vez recibida una palabra se podrıaproyectar sobre dicho subespacio con la misma idea que lo visto en modulacion.

Se analizara a continuacion el espacio vectorial de mensajes de n bits a los efectosde evaluar la factibilidad del procedimiento descripto antes y de otros procedimientosque permitan codificar. Esta formalizacion algebraica de los codigos resulta de utilidadpara entender diferentes tecnicas que se veran mas adelante. Tambien se observaraque el producto interno y por tanto las nociones de ortogonalidad y proyeccion en esteespacio, no cumple todas propiedades habituales del producto interno. Por lo tanto, elprocedimiento para codificar/decodificar no podra utilizar las nociones de proyeccionque estamos habituados a utilizar en otros espacios.

El cuerpo finito GF (2), el espacio vectorial GF (2)n y los codigos como subes-pacios vectoriales

Se puede probar sin dificultad que el alfabeto binario 0,1 junto con las ope-raciones de suma y multiplicacion modulo dos son un cuerpo finito. Se recuerda allector que hablando informalmente un cuerpo es un conjunto de elementos sobre elcual se definen las operaciones de suma, resta, multiplicacion y division dando comoresultado elementos del propio conjunto. Las operaciones de suma y multiplicaciondeben ser conmutativas asociativas y distributivas. El cuerpo binario se denominahabitualmente GF (2) (Galois Field de orden 2).

Tambien se puede probar que las n-uplas binarias junto con el cuerpo GF (2) sonun espacio vectorial. Este espacio vectorial se nota habitualmente como GF (2)n. Apartir de este punto las nociones de independencia lineal y base del espacio vectorialse aplican directamente. Ası mismo la nocion de subespacio vectorial y la propiedadde que un subconjunto del espacio es un subespacio si toda combinacion lineal delvectores del subespacio es cerrada en el subespacio.

Un codigo lineal (n,k) de mensajes de k bits codificado con palabras de codigode largo n, es un subespacio del espacio n dimensional de las palabras de n bits conla aritmetica modulo-2 GF (2)n. ¿por que? Esta observacion establece una primerarelacion entre el algebra y la teorıa de codificacion: un codigo lineal es un subespaciovectorial del espacio GF (2)n. En la proxima seccion se analizara como un base deeste espacio proporciona una forma simple de codificar un codigo lineal.

222

Page 223: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

9.4.3. Base de un codigo lineal binario y matriz generadora

Sea x = (x1, .., xk) uno de los mensajes a transmitir sin codificar. Sea c = (c1, .., cn)la palabra codificada correspondiente. Como el codigo de bloques lineal y binario cadabit de C se obtiene a traves de un mapeo lineal y con operaciones binarias sobre losbits de x, es decir,

cj = x1g1j + x2g2j + ......+ xkgj∀j = 1, ...n.

Se puede entonces escribir esa ecuacion matricialmente

c = xGdonde G se denomina la matriz generadora del codigo:

G =

g11 ... g1n

... ... ...gk1 ... gkn

Como se menciono antes, un codigo (n, k) es un subespacio vectorial del espacio

de las palabras de n bits. Por lo tanto, este subespacio vectorial estara especificadopor una base de dicho subespacio. Eso lleva a una definicion formal de la matriz G:

Definicion 9.5 (Matriz generadora de un codigo C). Es una matriz G(k × n) cuyasfilas son una base del sub-espacio vectorial definido por el codigo lineal (n, k), C.

Lo que dice la definicion, es que el codigo C es el subespacio vectorial generadopor las filas de G. Evidentemente esto implica que las filas de G deben ser l.i. y porlo tanto G es una matriz de dimensiones k × n y de rango k. Como la base de unsubespacio no es un conjunto unico de vectores, G no es unica para un codigo C.

Ejemplo 9.4. Sea el codigo C = 000, 100, 001, 101 ¿Es un codigo lineal de bloques?¿Es un subespacio vectorial de GF (2)3? Se puede responder estas preguntas obser-vando que la suma de dos palabras cualesquiera del codigo da una palabra del codigo.¿Cual es la dimension de este subespacio? En este caso se puede ver facilmente que100, 001 es una base del subespacio ya que cualquier otra palabra de codigo se formacomo combinacion lineal de estas dos. La dimension del subespacio es 2 y tendra unamatriz generadora de dimensiones 2×3. Por lo tanto, si utilizamos esta base la matrizgeneradora sera:

G =

(1 0 00 0 1

)Con esta matriz, a los cuatro mensajes posibles a mandar de dos bits: 00, 10, 01, 11 le

corresponderan las siguientes palabras codificadas (obtenidas multiplicando por G losmensajes): 000, 100, 001, 101. ¿que sucede si en lugar de la base anterior utilizo otrabase, por ejemplo: 100, 101? ¿es el mismo codigo? ¿cual es la diferencia entre usaruna base u otra de las anteriores?

Ejercicio 9.3. a) Sea C un codigo lineal definido por la siguiente matriz generadora

G =

1 0 0 00 1 0 00 0 1 1

223

Page 224: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

¿Cual es la dimension del codigo? ¿de que largo son las palabras codificadas? ¿Cuales la codificacion del mensaje de todos 1s?

b) Se necesita generar un codigo C de mensajes de dos bits a ser codificados en3 bits, esto es un subespacio de dimension dos del espacio GF (2)3. Arbitrariamentese elige como base los vectores 110, 011. ¿Cual es la matriz generadora del codigo?¿cuales son las palabras del codigo?

Definicion 9.6 (Codigo sistematico). Un codigo lineal de bloques se dice sistematicosi su matriz G puede escribirse de la siguiente forma:

G =[Ik|P

]donde Ik es la identidad de orden k. P es una matriz k × (n − k) que determina

los bits de paridad. Observar que:

c = xG = x[Ik|P

]= (x1, .., xk, q1, .., q(n−k))

donde:qj = x1p1j + ..+ xkpkj

La pregunta que surge es si todo codigo lineal de bloques puede escribirse enforma sistematica. Es decir, si siempre es posible cambiando de base obtener unamatriz generadora en forma sistematica y que sus filas generen el mismo codigo. Larespuesta es que no siempre, pero si no posible, siempre existe un codigo equivalenteque tenga representacion en forma sistematica.

Definiremos a continuacion que se entiende por codigo equivalente, pero lo impor-tante para entender en que sentido son equivalentes es que son codigos que mantienenlos mismos 3 parametros: (n, k, d) es decir que utilizan n bits para las palabras decodigo y son capaces de codificar 2k mensajes con una distancia mınima de Hammingigual a d.

Definicion 9.7 (Codigos equivalentes). Dos codigos binarios son equivalentes si laspalabras de uno pueden ser obtenidas de las del otro mediante permutaciones de lasposiciones en las palabras de codigo.

Ejemplo 9.5. Los siguientes codigos son equivalentes C = 000, 101, 010, 111 y C ′ =000, 011, 100, 111 ya que uno se obtiene del otro permutando los dos primeros bits.

Observar que como un codigo se obtiene del otro permutando posiciones, la dis-tancia mınima del codigo no se modifica ya que la distancia mınima como se vio anteses igual al peso de la palabra no nula de de menor peso. Al permutar posiciones elpeso de cada palabra no cambia.

Teorema 9.5. Dos matrices k× n generan codigos equivalentes si una matriz puedeser obtenida de la otra mediante las siguientes operaciones:

1. Permutacion de las filas.2. Combinacion lineal de filas3. Permutacion de columnas.

Demostracion. Las primeras dos operaciones simplemente cambian de base y generanel mismo codigo. La segunda convierte una matriz generadora de un codigo en lamatriz generadora de uno equivalente.

224

Page 225: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Teorema 9.6. Dado un codigo lineal de bloques (n, k, d) existe un codigo equivalentecuya matriz se puede escribir de forma sistematica.

Demostracion. La idea de la prueba es que dada la matriz G aplicar el metodo deeliminacion Gaussiana para llevarla a su forma en escalera. Si la nueva matriz esta ensu forma sistematica, el codigo que se obtiene de esta nueva matriz es el mismo queel original. Si no estuviera en la forma sistematica es facil ver que se puede llevar aesta forma mediante permutaciones de columnas.

En el ejercicio 9.3 b) se eligio arbitrariamente la base como 110, 011, obteniendocomo matriz generadora:

G =

(1 1 00 1 1

)Se podrıa haber elegido otro conjunto como base haciendo permutaciones de estos

vectores y por ejemplo intercambiando la segunda y la tercera columna de cada vectory se obtendrıa:

G′ =

(1 0 10 1 1

)que es la forma sistematica de la matriz G.El representar las matrices generadoras en forma sistematica, hace mas simple que

la tarea de decodificacion. Esto se vera mas adelante.

Ejemplo 9.6. Se considera el codigo (7, 4) donde la matriz generadora del codigoen forma sistematica es:

G =

1 0 0 0 1 0 10 1 0 0 1 1 10 0 1 0 1 1 00 0 0 1 0 1 1

Por lo tanto la palabra de codigo correspondiente a la palabra a enviar (1101) es

(1101)G = (1101001)

En este caso el calculo de los bits de la palabra de codigo a partir de los bits deinformacion se hace a traves de las siguientes ecuaciones c0 = x0; c1 = x1; c2 = x2;c3 = x3; c4 = x0 + x1 + x2; c5 = x1 + x2 + x3; c6 = x0 + x1 + x3.

9.4.4. Matriz de chequeo de paridad

Definicion 9.8 (Matriz de chequeo de paridad H ). Sea C un codigo lineal (n, k).Una matriz (n− k)× n, H, es de chequeo de paridad de C si y solo si cHt = 0 paratodo c ∈ C.

Ejemplo 9.7. Sea C el codigo de repeticion de 3 bits 111, 000 entonces decimos queuna matriz valida de chequeo de paridad para este codigo sera:

Ht =

1 00 11 1

225

Page 226: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

ya que cHt es

(u, v, w

)1 00 11 1

= (u+ w, v + w)

Si las unicas palabras de codigo posible son 000, 111, se cumple que para toda palabravalida u = v = w, y por lo tanto u+ w = 0 y v + w = 0.

Volviendo al algebra, el lector recordara que el espacio nulo de una matriz H es elconjunto de vectores x tales que Hxt = 0. Por lo tanto, vemos una conexion directaentre el espacio nulo de H y el codigo C. Las palabras de codigo de C forman elespacio nulo de H. Recordar que si x verifica Hxt = 0, entonces tambien verifica(Hxt)t = xHt = 0 y viceversa.

Dada la matriz generadora de un codigo lineal de bloques en su forma sistematica:

G =[Ik|P

]La matriz de chequeo de paridad de dicho codigo tiene la siguiente forma:

H =[Pt|In−k

]Ejemplo 9.8. Por ejemplo para el codigo (7, 4) y la matriz generadora correspon-diente vista en el ejemplo anterior, la matriz de paridad correspondiente sera:

H =

1 1 1 0 1 0 00 1 1 1 0 1 01 1 0 1 0 0 1

El lector puede verificar que cumple la definicion de matriz de paridad.

Con la definicion dada a la matriz de paridad en este caso se verifica que:

GHt =[Ik|P

] [ PIn−k

]= P + P = 0

HGt =[Pt|In−k

] [IkPt]

= Pt + Pt = 0

La ultima identidad de ambas ecuaciones se debe a que se esta trabajando enaritmetica modulo dos y por lo tanto la suma de un numero con sigo mismo es cero.

Por lo tanto es facil verificar que definida de esa forma la matriz de paridad apartir de la matriz generadora es realmente una matriz de paridad ya que para todapalabra de codigo c

cHt = xGHt = 0 (9.4)

En general cuando la matriz G no se encuentra en forma sistematica tambien sepuede definir H como la matriz que cumple que

GHt = 0

226

Page 227: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ejemplo 9.9. Por ejemplo para el codigo (7, 4) visto antes

GHt =

1 0 0 0 1 0 10 1 0 0 1 1 10 0 1 0 1 1 00 0 0 1 0 1 1

1 0 11 1 11 1 00 1 11 0 00 1 00 0 1

El lector puede verificar que cumple la propiedad anterior.

La ecuacion 9.4 dice que multiplicando cualquier palabra del codigo por la matrizde paridad el resultado debe ser el vector nulo. Esto permite en el receptor decidir sihubo errores. Es decir, si se multiplica la palabra recibida por la matriz de paridady el resultado es diferente de cero esto indica que se produjeron errores. Si da ceropodemos asumir que no hubo errores. Esto es cierto salvo que se produjeran tantoserrores que una palabra de codigo se transforme en otra palabra valida del codigo.

9.4.5. El sındrome y la decodificacion

Sea c la palabra de codigo transmitida y r la correspondiente secuencia recibida.Se cumple que:

r = c + e

Siendo e el patron de errores producido durante la transmision, es decir la secuen-cia de bits que tiene un 1 en los lugares donde se modifico un bit. Para corregir erroresse observa que si e puede ser determinado entonces es posible reconstruir la palabraenviada usando:

c = r + e

Definicion 9.9 (Sındrome). Se define el sındrome s de la siguiente forma:

s = rHt

Se observa que

s = rHt = (c + e)Ht = eHt

El sındrome depende solo del patron de error y no de la palabra transmitida y porlo tanto cada patron de error tiene un sındrome asociado. Hay que hacer notar sinembargo que varios patrones de error pueden conducir al mismo sındrome.

Por otra parte, se debe observar que el sındrome correspondiente a patrones deerrores de un solo bit corresponde a las columnas de la matriz H. ¿ por que? Es mas, apartir de la ecuacion anterior es facil probar que el sındrome de una palabra de codigorecibida es un vector que es igual a la suma de las columnas de H que correspondena posiciones donde ocurrieron errores.

En general, el sistema de ecuaciones

227

Page 228: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

s = eHt

tiene n− k ecuaciones y n incognitas. Por lo tanto, hay 2k patrones de error queconducen al mismo sındrome. En general se asume que el patron mas probable esaquel con peso mınimo.

Ejemplo 9.10. Se utiliza el codigo (7, 4) visto antes, y la palabra recibida es 1101000.

(1101000)Ht = (1101000)

1 0 11 1 11 1 00 1 11 0 00 1 00 0 1

= (001)

Al no ser el vector nulo quiere decir que se ha producido al menos un error. Sise produjo un solo error, hay que ver a que columna de H corresponde el sındromeobtenido. En este caso corresponde a la ultima columna de H. Por lo tanto, el patronde error e = (0000001) y por lo tanto la palabra enviada mas probablemente fue1101001. Observar que este resultado es consistente con lo visto en el ejemplo 9.6.En segundo lugar se puede observar que todos los patrones de error que verifiquen elsiguiente sistema de ecuaciones daran el mismo sındrome :

eHt =

e0 + e1 + e2 + e4 = 0e1 + e2 + e3 + e5 = 0e0 + e1 + e3 + e6 = 1

Ası por ejemplo (0, 0, 0, 1, 0, 1, 1) que tiene 3 errores tambien darıa el mismo sındro-

me.

Ejercicio 9.4. a) Sea C un codigo lineal definido por la siguiente matriz de paridadH

H =

1 1 0 1 0 11 1 0 0 1 01 0 1 1 0 0

Si se recibe la palabra 110110 y solo se comete un error ¿cual es la palabra de

codigo enviada?b) Considere un codigo (7, 4) con matriz generadora

G =

0 1 0 1 1 0 01 0 1 0 1 0 00 1 1 0 0 1 01 1 0 0 0 0 1

(b.1) Encuentre todas las palabras del codigo.(b.2) ¿Cual es la distancia mınima del codigo?(b.3) Encuentre la matriz de paridad H del codigo.

228

Page 229: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

(b.4) Encuentre el sındrome del vector recibido R = [1101011]. ¿Que conclusionespuede extraer respecto de la secuencia enviada?

(b.5) Usando operaciones sobre las filas y las columnas lleve G a su forma sis-tematica y encuentre la matriz de paridad H correspondiente. Bosqueje una imple-mentacion como un filtro de este codigo.

Por ultimo enunciaremos dos teoremas cuya prueba puede verse en [5].

Teorema 9.7. La mınima distancia de un codigo lineal de bloques es igual al mınimopeso de sus palabras no nulas y viceversa.

Teorema 9.8. Sea C un codigo lineal (n, k) con matriz de paridad H.Por cada palabrade codigo de peso l existen l columnas de H tales que el vector suma de estas l columnases igual al vector nulo. En el otro sentido, si existen l columnas de H cuyo vector sumaes el nulo, existe una palabra de codigo de peso l en C.

Estos Teoremas permiten evaluar la distancia de Hamming de un codigo a partirde observar las palabras de codigo o la matriz H.

9.4.6. OPCIONAL: El problema de decodificacion y la proyec-cion ortogonal

Antes de estudiar algunos tipos particulares de codigos lineales de bloques, enesta seccion se analizara el problema de la proyeccion y la ortogonalidad en el espacioGF (2). En el espacio vectorial GF (2)n se puede definir el producto escalar de dosvectores:

Definicion 9.10 (Producto escalar de dos vectores de GF (2)n ). Sean u = (u1, .., un)y v = (v1, .., vn) dos vectores de GF (2)n. El producto escalar de ellos u.v = u1v1 +..+ unvn, donde la suma y la multiplicacion son las habituales en GF (2).

Definicion 9.11 (Ortogonalidad en GF (2)n ). Dos vectores u = (u1, .., un) y v =(v1, .., vn) son ortogonales si u.v = 0

Definicion 9.12 (Subespacios ortogonales en GF (2)n ). Dado un subespacio de S deGF (2)n, el espacio de todos los vectores ortogonales a S es llamado el complementoortogonal de S y se nota S⊥

Se debe observar que dada una matriz, el subespacio nulo es complemento orto-gonal del subespacio generado por las filas de la matriz. Esto es facil de observar yaque las filas de la matriz contienen una base de este subespacio y el subespacio nuloes el de todos los vectores ortogonales a todas las filas de la matriz.

Definicion 9.13 (Codigo dual ). Dado un codigo lineal (n, k) , C, el codigo dualde C notado C⊥, es el formado por todos los vectores de GF (2)n ortogonales a todapalabra de codigo de C.

Por lo tanto, los conceptos de codigo dual y complemento ortogonal son los mis-mos. En este punto el lector podrıa aventurarse y decir que si se tiene la nocion deortogonalidad y de subespacio ortogonal, es posible proyectar y utilizar la distanciagenerada por el producto interno definido para decodificar.

229

Page 230: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Sin embargo, este camino es incorrecto. Si bien se ha definido un producto escalarentre vectores, este producto no cumple una propiedad basica para ser realmente unproducto interno y definir una norma:

u.u = 0 si y solo si u = 0.

Se debe observar que u.u = 0 para todo vector u que contenga un numero parde unos. Esto tiene consecuencias tambien sobre la nocion de ortogonalidad en esteespacio. Hay muchos vectores que son ortogonales a si mismos. Por lo tanto, en esteespacio un subespacio y su subespacio ortogonal no son disjuntos (a menos del vectornulo) como es habitual en Rn por ejemplo.

Por este motivo, la decodificacion es un proceso que se hace a traves de la matrizH y el estudio del sındrome como ya se ha estudiado. Sin embargo, las nociones deortogonalidad estan presentes en el proceso de decodificacion ya que se puede probarque:

Teorema 9.9. Sea C un codigo lineal, G su matriz generadora y H su matriz deparidad. Sea C⊥ el codigo dual de C. Entonces se verifica que:

1. H es la matriz generadora de C⊥, es decir que C⊥ es el espacio generado porlas filas de H.

2. C es el espacio nulo de H.

3. Las filas de G son ortogonales con las filas de H.

La matriz H permite encontrar que vectores son ortogonales al complemento or-togonal del codigo C. El codigo ortogonal al complemento ortogonal de C es decir(C⊥)⊥ es facil verificar que es igual a C. Por lo tanto, si es ortogonal al complementoortogonal de C es una palabra de codigo. En caso contrario hay un error y que seanalizara utilizando el sındrome y la palabra mas probable (con menor cantidad deerrores) que me puede generar dicho sındrome.

Ejemplo 9.11. Para terminar y como ejemplo interesante para ver las particulari-dades de este espacio le proponemos al lector verificar que el codigo generado por lamatriz

G =

(1 1 0 00 0 1 1

)es ortogonal a si mismo. Es decir su codigo dual es el mismo codigo.

9.4.7. Codigos de Hamming

Los codigos de Hamming son un tipo particular de los codigos lineales de bloques.Estan disenados para corregir errores de un solo bit. El codigo de Hamming (n, k) sedefine a traves de un parametro m y verifica las siguientes propiedades:

Largo del bloque: n = 2m − 1

Numero de bits de datos: k = 2m −m− 1

Numero de bits de paridad: n− k = m

Distancia mınima de Hamming del codigo: dmin = 3

230

Page 231: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Una propiedad importante para su utilizacion es que la matriz H tiene comocolumnas todos los posibles vectores binarios de largo m (excepto el vector nulo).Chequear esta propiedad en el codigo (7, 4) que se ha utilizado como ejemplo en estaseccion.

9.4.8. Codigos cıclicos

Los codigos cıclicos son tambien un tipo particular de codigos lineales de bloques.

Definicion 9.14 (Codigos cıclicos). Un codigo lineal de bloques (n, k) es llamadocodigo cıclico si cada desplazamiento cıclico de un vector de codigo c es tambien unvector de codigo.

Esta estructura particular hace que sea mas simple su codificacion y decodificacion.Cuando se trabaja con codigos cıclicos es conveniente asociar a los vectores del codigoc = (c0, ..cn−1) de largo n, a polinomios de grado menor o igual que n cuyo coeficientesson las componentes del vector c(X) = c0 + c1X + ...+ cn−1X

n−1 .Entre los vectores y los correspondientes polinomios existe una relacion uno a uno.

Por este motivo se utilizara en adelante los terminos palabra de codigo y polinomiode codigo de forma intercambiable, como dos representaciones de una misma cosa.

Como se vera mas adelante la representacion polinomica de la palabra de codigotiene ventajas ya que facilitara el proceso de codificacion y decodificacion.

Ejemplo 9.12. El polinomio correspondiente a la palabra de codigo 1101 serav(X) = 1 + x+ x3

Si se considera la palabra de codigo v = (v0, ..vn−1) y los componentes de v soncıclicamente corridos hacia la derecha i lugares obtenemos el vector:

v(i) = (vn−i, ., v0, .., vn−i−1)

El polinomio correspondiente a este vector sera:

v(i)(X) = vn−i + vn−i+1X + ...+ v0Xi + ..+ vn−i−1X

n−1

Existe una relacion entre v(X) y v(i)(X). Multiplicando v(X) por Xi se obtiene:

Xiv(X) = v0Xi + v1X

i+1 + ...+ vn−1Xn+i−1

Operando se obtiene:

Xiv(X) = vn−i + vn−i+1X + ...+ v0Xi + ..+ vn−i−1X

n−1

+vn−i(Xn + 1) + vn−i+1X(Xn + 1) + ..+ vn−1X

i+1(Xn + 1)

= q(X)(Xn + 1) + v(i)(X)

De esta ecuacion podemos ver que v(i)(X) es el resto que resulta de dividir elpolinomio Xiv(X) por Xn + 1. Esto implica que si un vector del codigo se multiplicapor Xi modulo Xn+1 se obtiene otro vector de codigo. Generalizando, si un vector decodigo se multiplica por cualquier polinomio a(x) binario (modulo Xn + 1) se obtieneotro vector de codigo. Esto es facil verlo ya que la multiplicacion de una palabra decodigo por cada termino del polinomio Xi es otra palabra de codigo y la suma de losterminos del polinomio no nulos es otra palabra de codigo por ser el codigo lineal.

231

Page 232: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ejemplo 9.13. Sea el codigo (0, 0, 0), (0, 1, 1), (1, 0, 1), (1, 1, 0) Se puede ver facil-mente que es un codigo lineal, la suma de dos de estos vectores da otro vector delcodigo.Tambien que es cıclico ya que cualquier desplazamiento cıclico de un vectordel codigo da otro vector del codigo.

Los polinomios asociados a los elementos no nulos son : x + x2, 1 + x2, 1 + x. Sise multiplica x + x2 por x2 se obtiene x3 + x4 y esto modulo x3 + 1 es 1 + x que esel polinomio asociado a la palabra del codigo (1, 1, 0). Si por ejemplo multiplicamosesa palabra de codigo x+ x2 por el polinomio x2 + 1, se obtiene x+ x2 + x3 + x4 quemodulo x3 + 1 es x2 + 1, o sea, x+ x2 + x3 + x4 = (1 + x)(x3 + 1) + x2 + 1

De todos los polinomios asociados a las palabras de un codigo habra al menos unode grado mınimo. En el ejemplo anterior g(x) = 1 + x.

Con las propiedades vistas se puede probar sin mayor dificultad que el polinomiono nulo y de menor grado de un codigo cıclico g(x) :

a) es unico. Ya que si hubiera dos de igual grado, su suma serıa un polinomio delcodigo (por ser suma de dos y ser lineal el codigo). Su suma tendra grado menor, locual es absurdo salvo que sea el polinomio nulo.

b) el termino que no depende de X es igual a uno.Es decir el polinomio de grado mınimo es unico y tiene la forma:g(X) = 1 + g1X + ..+Xr

Como se vio antes los corrimientos cıclicos de g(X), es decir Xig(X) moduloXn + 1, son tambien palabra de codigo. Se puede probar que g(X) y todos sus des-plazamientos cıclicos son una base generadora del codigo.

De donde se observa lo siguiente. Sea g(X) el polinomio de grado mınimo de uncodigo cıclico (n, k). Un polinomio de grado n− 1 o menor es una palabra valida deeste codigo si es multiplo de g(X).

g(X) se denomina polinomio generador del codigo cıclico.Se puede verificar facilmente que en el ejemplo anterior 1+x2 y x+x2 son divisibles

por g(x) = 1 + x que es el polinomio generador de este codigo.Una palabra de codigo c(X) es una palabra valida de un codigo cıclico generado

por el polinomio g(X) si y solo si g(X) divide a c(X), es decir :

c(X)

g(X)= q(X)

Se puede probar tambien que en un codigo cıclico (n, k) el polinomio generadortiene grado n− k: g(X) = 1 + g1X + ...+Xn−k y como g(X) divide a toda palabrade codigo, entonces se puede expresar la palabra de codigo de la forma:

c(X) = (u0 + u1X + ..+ uk−1Xk−1)g(X)

Por lo tanto si los coeficientes de u corresponden a los k dıgitos de informacion acodificar, la palabra de codigo se obtiene multiplicando el polinomio correspondientea la palabra a codificar por el polinomio generador.

Los codigos cıclicos se utilizan muchas veces para deteccion de errores por sufacilidad de codificacion y decodificacion. Los codigos de redundancia cıclicos (CRC)son muy utilizados para este fin. Existen varios codigos CRC estandarizados. Porejemplo 802.11 utiliza para detectar errores en las tramas el codigo CRC-32 cuyopolinomio generador es:

g(X) = X32 + X26 + X23 + X22 + X16 + X12 + X11 + X10 + X8 + X7 + X5 +X4 +X2 +X + 1

232

Page 233: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ejercicio 9.5. a)¿Cuales de los siguientes codigos son cıclicos?

1. 000, 100, 010;

2. 000, 100, 010, 001;

3. 000, 111;

4. 0000, 1010, 0101, 1111.

b) El codigo de Hamming (15,11) tiene como polinomio generador g(X) = 1 +X+X4. Determinar si las siguientes palabras de codigo son validas c1(X) = 1 +X+X3 +X7 y c2(X) = 1 +X3 +X5 +X6

d) El codigo de Hamming cıclico (7,4) tiene un polinomio generador g(X) =1 +X2 +X3 .

(d.1) Encontrar la matriz generadora del codigo.(d.2) Encontrar la matriz de chequeo de paridad.(d.3) Suponga que la palabra de codigo C = [1011010] es transmitida y la palabra

correspondiente recibida es C = [1010011]. Encuentre el sındrome asociado con estapalabra.

(d.4) Encuentre todas las posibles palabras de codigo recibidas tal que si se trans-mite C = [1011010], la palabra de codigo recibida tenga sındrome 0.

Antes de finalizar es importante resaltar una ultima propiedad que permite codi-ficar cuando se utiliza un codigo cıclico. Si se quiere codificar la siguiente palabra:

u(X) = u0 + u1X + ...+ uk−1Xk−1.

Si se multiplica u(X) por Xn−k y se lo divide por el polinomio generador delcodigo g(X) se obtiene:

Xn−ku(X) = a(X)g(X) + b(X)donde a y b son el cociente y resto. Como g(X) es de grado n−k el grado de b(X)

sera n − k − 1 o menos. Por lo tanto, reordenando se obtiene el siguiente polinomiode grado n− 1 o menor

b(X) +Xn−ku(X) = a(X)g(X)que es multiplo del polinomio generador y por tanto b(X) + Xn−ku(X) es una

palabra de codigo valida que corresponde a la palabra de codigo:(b0, b1, ..., bn−k−1, u0, u1, ..., uk−1).que corresponde a los dıgitos de la palabra sin codificar seguido de los bits de

paridad. Hemos de esta forma llevado el codigo a su forma sistematica. Ademas estobrinda una forma simple de codificar. Se toman los digitos de mensaje se los multiplicapor Xn−k se divide por el polinomio generador y se envıan los digitos del mensajeseguidos del resto de la division.

9.5. Codigos Convolucionales

9.5.1. Introduccion

Los codigos de bloques toman k bits y producen n bits de salida, donde k y nson habitualmente ’grandes’. Por otro lado no hay dependencia entre bloques, cada

233

Page 234: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 9.3: Diagrama de la ventana deslizante de un codigo convolucional .

bloque se codifica independientemente de la informacion que hubiere en los bloquesanteriores y posteriores.

Por el contrario, los codigos convolucionales, que mas adelante se vera como sedefinen, parten de los bits de informacion y generan un numero ”pequeno” de bitsde manera tal que los datos pasan por el codificador como un flujo continuo de bits.Por esta razon, son muy utiles en comunicaciones porque generan pocos retardos yaque no hay que esperar que llegue todo un bloque para decidir si hay o no errores yeventualmente corregirlos. Otro aspecto interesante de los codigos convolucionales esque se enviaran solo ’los bits de paridad’, en el sentido que los datos de informacioncomo tales no se transmiten.

Los codigos convolucionales son un tipo de codigo de correccion de errores linealque utiliza una ventana deslizante de L bits (L se denomina la restriccion del codigo).Mediante operaciones lineales de los datos que se encuentran en la ventana en cadamomento se generan r bits de paridad que son los datos que se envıan al transmisor.En la figura 9.3 se muestra un ejemplo de la forma de operacion de un codigo con-volucional. Se debe observar que la tasa de informacion de un codigo convolucionalsera 1

r , ya que por cada bit nuevo que ingresa en la ventana deslizante se sacan rbits de paridad que son los que se mandan. En el ejemplo de la figura 9.3 la tasa deinformacion del codificador es 1

2 .

9.5.2. Formas de representacion de un codigo convolucional

Existen varias formas de representar la operacion de un codigo convolucional. Laprimera de ellas se muestra en la figura 9.4 y es representar al codigo convolucionalcomo un shift register. Los datos anteriores al actual son almacenados en un shiftregister de largo L− 1 y sobre el dato actual y los datos del shift register se realizanlas operaciones para calcular los bits de paridad. En el ejemplo de la figura 9.4, sealmacenan los dos datos anteriores y los bits de paridad se calculan como la suma delbit actual y cada uno de los bits almacenados.

Otra forma de representar un codigo convolucional es a traves de un diagrama deestados. La cantidad de estados sera 2L−1. Cada transicion implica la llegada de unnuevo bit y el nuevo estado sera aquel en el que queda el shift register luego del arribode este nuevo bit. Ademas en cada transicion se indican los r bits de paridad que segeneran estando en el estado de partida y habiendo llegado un nuevo bit. En la figura9.5 se muestra esta representacion para el mismo codigo representado en la figura 9.4como shift register.

Una ultima forma de representar un codigo convolucional (y que sera util en elproceso de codificacion que se vera mas adelante) es a traves del diagrama de Trellis.

El diagrama de Trellis es una representacion de diagrama de estados pero dondese agrega ademas el eje temporal. Esta representacion se realiza para una secuencia

234

Page 235: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

+

+

x[n]x[n-1] x[n-2]

Figura 9.4: Diagrama como shift register de un codigo convolucional .

0/00

1/11

0/01

1/10

0/10

1/01

0/11

1/00

00 01

1011

Figura 9.5: Diagrama de estados de un codigo convolucional .

de entradas y por tanto, permite ver por los estados por los que va pasando el codigoy las salidas que genera de acuerdo a las entradas que recibe. Por ejemplo en la figura9.6 se muestra el mismo codigo que el usado en las figuras 9.5 y 9.4. En este caso parala secuencia de entrada: 0, 1, 0, 0, 1, el codigo pasa por los estados 00, 00, 10, 01, 00, 10y genera las salidas 00, 11, 00, 01, 11.

00

01

10

11

0 1 0 0 1bits de información

ESTADOS

bits a enviar

0/00

1/11

0/01

1/10

0/10

1/01

0/11

1/00

0/00

1/11

0/01

1/10

0/10

1/01

0/11

1/00

0/00

1/11

0/01

1/10

0/10

1/01

0/11

1/00

0/00

1/11

0/01

1/10

0/10

1/01

0/11

1/00

0/00

1/11

0/01

1/10

0/10

1/01

0/11

1/00

00 11 10 01 11

Figura 9.6: Diagrama de Trellis .

235

Page 236: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

9.5.3. OPCIONAL: El codigo convolucional como un sistemalineal invariante en el tiempo

El codificador de un codigo convolucional involucra operaciones de retardo y lassalidas son combinaciones lineales ( en modulo-2) de la senal de entrada retardada. Espor lo tanto un sistema lineal invariante en el tiempo y la salida puede ser obtenidamediante la convolucion de la secuencia de entrada y la respuesta al impulso. Paraobtener la respuesta al impulso, se pone como entrada el vector u = (1, 0, 0, ...) y seobservan las salidas. Si el codificador es de orden L, la senal debe terminar a lo sumoen L+ 1 unidades de tiempo. Si el codificador tiene M salidas entonces se tendra unarespuesta al impulso de la siguiente forma:

g(i) = (g(i)0 , ..g

(i)L ) con i = 0..M − 1

Las respuestas al impulso g(i) se denominan secuencias generadoras del codificador.Podemos a partir de la respuesta al impulso escribir las ecuaciones de codificacion

utilizando el producto de convolucion discreto modulo-2:v(0) = u ∗ g(0)

.......v(M−1) = u ∗ g(M−1)

El producto de convolucion implica para cada componente n del vector v, la si-guiente operacion:

v(i)n =

∑j=Lj=0 un−jg

(i)j

donde un−j es cero para n < j.

Ejemplo 9.14. Para el codigo convolucional de la figura 9.4, se tiene que M = 2 larespuesta al impulso sera

g(0) = (1, 1, 0) y g(1) = (1, 0, 1) Aplicando la ecuacion de convolucion para dicho

codigo convolucional las salidas seran: v(0)n = un + un−1 y v

(1)n = un + un−2

Luego de ser codificadas las M secuencias de salida son multiplexadas en una solasecuencia denominada palabra de codigo. La palabra de codigo viene dada por:

v = (v(0)0 v

(1)0 ..v

(M−1)0 , v

(0)1 v

(1)1 ..v

(L−1)1 , .....)

El hecho que la secuencia de salida sea una convolucion, sugiere el uso de unanotacion polinomica donde la convolucion se transforme en producto.

Definiremos entonces las series de potencia u(D) =∑k ukD

k, gi(D) =∑k g

ikD

k

y v(D) =∑k v

ikD

k. Estas son llamadas “Transformadas-D” de las secuencias. Enestas ecuaciones D no es mas que una variable sin embargo puede ser pensado comoun operador de retardo, observando que si la transformada-d de g es g(D), entoncesla transformada-D de Dg es Dg(D).

Estas expresiones aparecen totalmente analogas a la transformada-Z sustituyen-do D por z−1. La diferencia principal que hay que tener en cuenta es que en latransformada-z, z es una variable compleja y la transformada toma valores sobre loscomplejos y tiene una interpretacion en el dominio de la frecuencia. En cambio eneste caso la transformada-D sigue estando en el dominio temporal. Es facil ver quecon esta definicion de transformada-D la convolucion de dos secuencias se transfor-ma en el producto de los polinomios correspondientes a las transformadas-D de cadasecuencia.

Ası entonces se obtiene:vi(D) = u(D)gi(D)

236

Page 237: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Se puede escribir la palabra de codigo entonces como:V(D) = vi(D)/i ∈ [0, L− 1]o luego de multiplexarlosv(D) = v0(DL) +Dv1(DL) +D2v2(DL) + ..+DL−1vL−1(DL)

Ejemplo 9.15. Para el ejemplo de la figura 9.4, se tiene que:g(0)(D) = 1 + D y g(1)(D) = 1 + D2 Si la secuencia de informacion enviada es

(1, 0, 1, 1, 1) entonces:u(D) = 1 +D2 +D3 +D4 y por lo tanto:v(0)(D) = (1 +D2 +D3 +D4)(1 +D) = 1 +D +D2 +D5

yv(1)(D) = (1 +D2 +D3 +D4)(1 +D2) = 1 +D3 +D5 +D6

y por lo tanto,V(D) = [1 +D +D2 +D5, 1 +D3 +D5 +D6]v(D) = 1 + D2 + D4 + D10 + D + D7 + D11 + D13 = 1 + D + D2 + D4 + D7 +

D10 +D11 +D13

Ejemplo 9.16. Verificar para el caso de la figura 9.4 que se obtiene la misma sali-da que el ejemplo anterior a la entrada (1, 0, 1, 1, 1), haciendo la convolucion con larespuesta al impulso.

Con la representacion en el dominio de la transformada-D es posible tambienconstruir matrices generadoras G(D) que permiten caracterizar el codigo y obtenerpropiedades de el. No nos detendremos en ese tema en estas notas pero el lectorinteresado puede consultar por ejemplo el libro [5].

9.5.4. Decodificacion de un codigo convolucional

El problema de decodificar un codigo convolucional no es simple. La primera ideaserıa utilizar la ’fuerza bruta’. Esto quiere decir que una vez recibida una secuencia sebusque dentro del conjunto de secuencias posibles generadas por el codigo cual de estasse encuentra a menor distancia de Hamming de la secuencia recibida. Evidentementeeste es un trabajo que implica un esfuerzo de computo y tiempo muy importante.Afortunadamente a Viterbi se le ocurrio un algoritmo que permite hacer de formaeficiente la decodificacion de un codigo convolucional. Este algoritmo se basa en eldiagrama de Trellis que ya se vio antes que representa la secuencia de estados y lassalidas generadas por las que pasa un codigo dada una secuencia de entrada. La ideaahora es ver el problema de manera inversa. Es decir, dada una salida (la secuenciarecibida) la idea es encontrar la secuencia de estados y entradas que es mas probableque hubiere generado la salida dada. En este contexto la secuencia de estados y deentradas mas probable quiere decir aquella que genere una salida que se encuentre amenor distancia de Hamming de la secuencia recibida.

Se explicara en primer lugar sobre el diagrama de Trellis el algoritmo de Viterbiy luego de haber comprendido su operacion, se veran algunas consideraciones sobredicho algoritmo.

La idea del algoritmo de Viterbi es ir calculando la distancia de Hamming entrela palabra recibida y todas las secuencias posibles de bits que pudieran haber sidoenviadas. Esto ultimo quiere decir: todos los caminos posibles en el diagrama de Trellis

237

Page 238: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 9.7: Algoritmo de Viterbi.

Figura 9.8: Algoritmo de Viterbi.

con el largo del bloque. Lo que aporta el algoritmo de Viterbi es que no es necesarioconsiderar todos los caminos posibles y plantea una forma de ir descartando caminos.

Se asume un estado inicial conocido para cada secuencia, en este ejemplo se asu-mira que es el estado 00. Por lo tanto, la distancia al 00 se inicializa en 0 y en∞ la detodos los demas estados, como se muestra en la figura 9.7. En esta figura se muestraen la parte superior la secuencia de bits recibidos (agrupados de a dos porque cadatransicion de estados genera dos bits). Observar que respecto a la secuencia enviada(ver figura 9.6) hay un cambio en solo un bit.

Los primeros dos bits recibidos fueron 00. Partiendo del estado 00 puedo ir alestado 00 y la distancia acumulada es 0, es decir 0 del estado anterior mas 0 ya queen esa transicion se generarıa 00 como salida. La otra posible transicion desde 00 esal estado 10. En este caso como se muestra en la figura 9.7 la distancia de Hammingacumulada, del estado 10 sera 2 ya que en esa transicion se hubiera generado 11 comosalida y se recibio 00. Los otros dos estados tendran distancia acumulada ∞ ya queparten de estados con esta distancia. Por lo tanto, los caminos que parten de losestados que no son el 00 se pueden descartar.

En el segundo paso como se muestra en la figura 9.8, se recibio la secuencia 10.De los dos estados con distancia finita se puede pasar a los cuatro estados, con lasdistancias acumuladas que se muestran en la figura 9.8. Por lo tanto, en este momentose tienen cuatro caminos posibles. Observar que no se pueden descartar los que generanestados con mayor distancia porque mas adelante los caminos pueden tener distanciasdiferentes y la distancia acumulada variar de un camino a otro.

En el tercer paso, como se muestra en la figura 9.9, se recibio la secuencia 10. Se

238

Page 239: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 9.9: Algoritmo de Viterbi.

Figura 9.10: Algoritmo de Viterbi.

analizara cada uno de los estados destino en la tercera transicion. Al estado destino00 se puede llegar desde el estado 00 o desde el estado 01. Si se llega desde el estado00 se tendra una distancia acumulada 1 (del estado origen) mas 1 porque se generarıaen esta transicion la secuencia 00 y se recibio la 10. Desde el estado 01 se llegarıaal estado 00 con distancia acumulada 4, 2 del acumulado del estado anterior mas 2porque se generarıa 01 y no 10 como se recibio. Esto permite eliminar el camino quepasa por los estados 00, 10, 01, 00 porque su distancia acumulada termina en el estado00 pero con distancia acumulada mayor que la del camino 00,00,00,00. Es decir, si uncamino C1tiene mayor distancia acumulada hasta un estado que otro C2, el de mayordistancia puede ser eliminado porque a partir de allı todos los caminos posibles Citendran la misma distancia y por tanto la distancia total de C1 +Ci, sera mayor quela de C2 + Ci. De esta forma, en el paso 3 se queda nuevamente solo con 4 caminosposibles.

El paso 4 se muestra en la figura 9.10 al igual que el paso 5, la ultima transicion,que se muestra en la figura 9.11. En esta ultima figura se llega al final y allı se decidecual es el camino de menor distancia acumulada. Una vez decidido esto, como semuestra en la figura, se obtiene volviendo hacia atras la secuencia mas probable debits de informacion que pueden haber generado la secuencia recibida.

Ejercicio 9.6. a) Considere el determine el codigo convolucional definido por la fun-cion de transferencia en transformada-D:

[1, 1 +D +D2, 1 +D2

]. Este es un codigo

de tasa 1/3.a.1) Dibuje un diagrama tipo shift-register y un diagrama de estados de este codigo.a.2) Dibuje un diagrama de Trellis de 4 transiciones de estados del codigo anterior.

239

Page 240: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 9.11: Algoritmo de Viterbi.

a.3) Utilizando el algoritmo de Viterbi encuentre la secuencia de entrada masprobable si la secuencia de salida recibida es 111,100,001,011.

b) Opcional: Considere el codigo convolucional generado por el codificador mos-trado en la Figura 9.12.

(b.1) Bosqueje el diagrama de Trellis del codigo.

(b.2) Si se recibe R=[001010001] encuentre la palabra de informacion y la pa-labra codificada mas probable que se puede haber enviado. ¿Cual es la distancia deHamming?

(b.3) Encuentre un camino que se encuentre a distancia mınima de Hamming delcamino de todos 0s y calcule dicha distancia.

Figura 9.12: Diagrama del codigo.

9.5.5. Algunas consideraciones de implementacion de Viterbi

Muchas veces las secuencias que se envıan son un flujo continuo o son secuenciaslargas de sımbolos o bits. El algoritmo de Viterbi necesita almacenar la informaciondel camino mas probable para cada estado ademas de la metrica acumulada paracada estado. El camino mas probable crece a medida que la secuencia crece y porrazones de memoria y de retardos en general en la practica las secuencias se truncan.Existen varias tecnicas que se utilizan para truncar las secuencias, de todas ellas quese resaltaran dos:

240

Page 241: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

1. Establecer un valor de retardo o de almacenamiento maximo. Cuando por pri-mera vez se alcanza este valor de almacenamiento maximo se saca la primera salida deViterbi correspondiente a los bits mas antiguos recibidos. Esto se hace luego secuen-cialmente por cada nuevo sımbolo recibido y se va obteniendo la salida con el retardocorrespondiente al valor de almacenamiento maximo. El problema es que cuando sellega a este valor maximo la secuencia que se saca no sea la de maxima verosimilitudsino que puede ser una secuencia mas probable a este punto pero que en el futuropodrıa cambiar. Se puede probar que si el retardo es suficientemente grande con altaprobabilidad la secuencia que se obtiene corresponde a la de maxima verosimilitud.

2. Otra alternativa es al final de cada secuencia de largo fijo enviada se lleva elcodificador al estado nulo adicionando bits ficticios al final de la secuencia a enviar.Esto permite que con alta probabilidad se obtenga la secuencia enviada de maximaverosimilitud ya que el decodificar sabe que el codificador utilizo esta tecnica y uti-liza esta informacion al decodificar. El inconveniente que tiene es se esta bajando laeficiencia del codigo ya que se estan enviando bits que no son de informacion por elcanal.

Cuando se envıa tramas de largo fijo en general se las termina tambien agregandobits adicionales para que el codificador retorne al estado cero. Esto se hace porqueen caso contrario los primeros bits de la trama tienen menor probabilidad de errorque los ultimos. Se debe observar que los primeros bits se utilizaron para obtener lassalidas del codificador desde que llegaron al shift register hasta que salieron de el.En cambio, si no se completa con bits adicionales, el ultimo bit de la trama solo seutilizara una vez al arribo al shift register.

9.5.6. Decodificadores hard y soft

El decodificador de Viterbi que se ha descrito en la seccion anterior es del tipodecodificador hard. Esto quiere decir que el algoritmo actua sobre los bits y no sobrelos sımbolos recibidos. Se podrıa decodificar sobre los sımbolos recibidos y no sobre losbits. Por ejemplo si se supone que los dos bits de salida de un codificador convolucionalde tasa 1

2 se modula utilizando QPSK. En el receptor, cuando se recibe un sımboloen el plano (I,Q), se podrıa usar la misma logica que se vio en la seccion anteriorcon el diagrama de Trellis y el decodificador de Viterbi, pero ahora tomando ya no ladistancia de Hamming sino la distancia euclıdea entre el sımbolo recibido y los cuatrosımbolos posibles que se podrıan haber transmitido. Veremos en la seccion siguientecomo funciona este mecanismo en Gnuradio.

9.6. Correccion de errores en Gnuradio

Debajo el directorio de instalacion de Gnuradio, en el subdirectorio /gr − trellis,se encuentran diferentes codificadores y decodificadores que utilizan la representacionde Trellis para codificar y decodificar. La maquina de estado es un parametro deestos algoritmos y la clase que define la maquina de estados esta especificada en/gr − trellis/src/lib/fsm.cc y fsm.h.

Estas maquinas de estados se pueden especificar en archivos con un formato que severa a continuacion. En el directorio, /gr− trellis/src/examples/python/fsm files,

241

Page 242: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

existen varios archivos donde estan definidas diferentes maquinas de estado de dife-rentes codificadores/decodificadores.

Estos archivos tienen el siguiente formato:La primer lınea tiene 3 numeros que representan: la cantidad de posibles sımbolos

de entrada (2 si es binario el alfabeto), la cantidad de posibles estados, y la cantidadde posibles salidas.

Luego, se especifica en cada lınea cada transicion de estados. Para esto el estadoactual esta implıcito en las filas (0,1,2,3 para cuatro estados) y las columnas corres-ponden tambien de manera implıcita a los diferentes sımbolos que pueden llegar (0,1para un alfabeto binario) y el valor que se muestra es el nuevo estado para cadatransicion.

Por ultimo, se especifica en cada estado y dependiendo del sımbolo que llegue lasalida que se tendra (0,1,2,3 si saca dos bits por cada transicion),

Tanto los estados como las salidas se representan en decimal. Por ejemplo la si-guiente especificacion del archivo awgn1o2 4.fsm, que se encuentra en el directoriomencionado :

2 4 4

0 20 21 31 3

0 33 01 22 1dice que es un alfabeto binario con cuatro estados y salida de dos bits por cada

transicion (4 salidas posibles). La primera lınea de las transiciones de estado dice queestando en el estado 0 si llega un 0 paso al estado 0 y si llega un 1 paso al estado 2.La primera lınea de las salidas generadas dice que estando en el estado 0 si llega un0 se genera la salida 0 y si llega un 1 se genera la salida 3. Esta maquina de estadocorresponde a un codigo convolucional de tasa 1

2 con las siguientes salidas: p1 = 1+D2

y p2 = 1 +D +D2.En gnuradio-companion existen varios bloques que permiten implementar codifi-

cadores y decodificadores. Varios de ellos son algoritmos de codificacion decodificacionespecıficos.

En el curso se utilizara un bloque generico denominado Trellis-encoder. Este bloquecuya especificacion se muestra en la figura 9.13, tiene ademas de los parametros basicos(el ID y el tipo), dos parametros especıficos. El primero, denominado FSM args,permite especificar la maquina de estados que se utilizara para codificar, en esteparametro va la ruta y el nombre del archivo con la especificacion de la maquina deestados. El segundo parametro es el estado inicial.

Existen otros tres bloques para decodificar utilizando el algoritmo de Viterbi. Elbloque Viterbi, tiene asociada la maquina de estado, la misma que se utilizo paracodificar. Esta maquina define ademas de las transiciones de estado las salidas co-rrespondientes a cada entrada. Pero estas las salidas en la maquina de estados estanidentificadas por un entero de 0 al numero de salidas. Para poder utilizar el algoritmo

242

Page 243: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 9.13: gnuradio-companion Trellis encoder.

de Viterbi, con esta especificacion de las salidas no es suficiente ya que el algoritmorequiere saber cada salida a que conjunto de bits o sımbolos corresponde para podercalcular las distancias requeridas por el algoritmo. Por este motivo, estas distanciasle son suministradas externamente al bloque. La entrada de este bloque son floats(las distancias entre el sımbolo o conjunto de bits recibido y los sımbolos o conjuntode bits de la constelacion). Por ejemplo, si la maquina de estados tiene 4 posiblessalidas por cada sımbolo recibido, debe recibir 4 floats que corresponden a la dis-tancia a los 4 sımbolos. Por este motivo, este bloque debe utilizarse con otro bloqueen el flujo que calcule estas distancias para cada sımbolo recibido. Este bloque es eldenominado Trellis Metrics. Este bloque recibe los sımbolos y calcula las distancias.La implementacion actual del Trellis-Metric de GnuRadio calcula distancias sobresımbolos y no sobre bits. Esto quiere decir que no calcula las distancia de Hammingentre por ejemplo la salida 00 y las posibles salidas 00,01,10 y 11, sino que calculauna distancia entre el sımbolo recibido por ejemplo el correspondiente al 00, -1,-j +ruido y los cuatro sımbolos posibles. El bloque permite calcular la distancia euclıdeaentre el sımbolo recibido y los sımbolos de la constelacion o una distancia Hard entreel sımbolo recibido y los de la constelacion. Esta distancia Hard vale 0 para el sımbolomas cercano de la constelacion y 1 para los restantes.

El ultimo bloque que se utilizara es el bloque denominado Viterbi Combo. Eneste bloque la entrada seran sımbolos complejos e implementara un decodificador deViterbi sobre los sımbolos, para una maquina de estado que se especificada comoargumento al igual que el largo de bloque. Este bloque es la combinacion del bloqueTrellis Metric y Viterbi descriptos antes. Por alguna razon este bloque ”carga” menosel PC por lo que es recomendable utilizar este bloque Viterbi Combo en lugar de losdos anteriores.

Ejercicio 9.7. a) Analizar el archivo ejercicio 7 a.grc y calcular el BER para losvalores de snr= 5,4,3,2,1,0,-1,-2,-3,-4,-5

b) Analizar el archivo ejercicio 7 b.grc y calcular el BER para los valores de snr=5,4,3,2,1,0,-1,-2,-3,-4,-5. Graficar el BER de la parte a) y b) y compararlos. Se pro-pone utilizar una fsm de las que vienen con gnuradio awgn1o2 4.fsm. Debera referirla variable fsm a la ubicacion del archivo en su maquina.

En los archivos de las partes a) y b) hay una variable delay que permite ajustarel retardo de los bits para poder restar los bits de entrada y salida y calcular el BER

243

Page 244: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

correctamente. Verifique que cuando el ruido es despreciable el BER sea 0, si no loes, modifique el valor de delay hasta que lo sea antes de comenzar a realizar las partesa y b. Importante: Como el BER resulta de un promedio demora en modificar suvalor una vez que se cambia. Por esto se sugiere que una vez que se modifica en snrse aumente α para reseterar el promedio anterior y luego ir bajando α hasta que seestabilice el promedio.

c) Analizar el archivo ejercicio 7 c.grc, y utilizar un archivo wav que tenga ensu equipo. Aumentar la potencia de ruido hasta el punto en que se comienza a sentirruido y registrar estos dbs. Modificar el archivo anterior para utilizar un codificadorde Trellis y decodificador de Viterbi Combo. Volver a calcular ahora el punto en elque comienza a sentirse ruido y registrar los dbs. ¿Cual es la ganancia en dbs en lacalidad percibida del audio por utilizar un codigo de correccion de errores,

244

Page 245: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Bibliografıa

[1] Cover, Thomas M. and Thomas, Joy A., Elements of Information Theory (WileySeries in Telecommunications and Signal Processing), 2006, isbn = 0471241954,Wiley-Interscience,

[2] Abramson N., Teorıa de la Informacion y de la CODIFICACION, Paraninfo,Madrid., 1986.

[3] Goldsmith, Andrea, Wireless Communications, 2005, 0521837162, CambridgeUniversity Press, New York, NY, USA, Chapter 8

[4] Proakis, J. and Salehi, M., Digital Communications, isbn=9780072957167, 2007,McGraw-Hill Education

[5] Shu Lin and Daniel Costello, Error Control Coding, isbn=0-13-042672-5, 2004,Pearson Prentice Hall

[6] Curso: Digital Communications , MIT, Lectures: 7,8,9,http://web.mit.edu/6.02/www/f2010/

245

Page 246: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

246

Page 247: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Capıtulo 10

Ecualizacion

10.1. Introduccion

Cuando se estudiaron los problemas de sincronizacion, se asumio que el canalpodıa ser modelado como un filtro con la siguiente respuesta al impulso h(t) mas unruido blanco gaussiano.

h(t) = h0δ(t− τ) (10.1)

donde h0 es una constante y τ el retardo introducido por el canal.En este capıtulo se trabajara con un modelo del canal menos ideal y se analizara

el impacto que tiene sobre la senal recibida y como debe disenarse un receptor parasolucionar los problemas que trae aparejados.

Se comenzara estudiando el problema en tiempo continuo para luego llegar almodelo discreto con el que se trabajara en el resto del capıtulo. Como se ha visto encapıtulos anteriores la senal banda base transmitida es

s(t) =∑k

a[k]ptx(t− kTs) (10.2)

siendo a[k] los sımbolos complejos, ptx(t) el pulso conformador de transmision yTs el tiempo entre sımbolos. En este capıtulo se notara a los pulsos de transmisiony recepcion ptx y prx y no p como en otros capıtulos porque uno de los objetivos esestudiar como deberıan ser estos pulsos cuando el canal no es ideal.

La senal bandabase es luego convertida en una senal pasa banda (BP)

sBP (t) = Re[s(t)ej(2πfct+θ(t))

]= Re

[sLP (t)ej2πfct

]sLP (t) = s(t)ejθ(t) (10.3)

siendo fc la frecuencia portadora y θ(t) el jitter o las variaciones del oscilador deltransmisor entorno a la frecuencia portadora. A sLP se lo denomina equivalente pasabajo (LP) de sBP

247

Page 248: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

En el receptor en pasa banda se tendra:

rBP (t) = hBP (t− τ) ∗ sBP + wBP (t) (10.4)

donde hBP (t) es la respuesta al impulso del canal (que asumimos invariante en eltiempo) y τ como ya se menciono es el retardo introducido por el canal. Se denominawBP (t) al ruido introducido por el canal. La hipotesis de que la respuesta al impulsodel canal es invariante en el tiempo se mantendra en casi todo este capıtulo salvosobre el final del mismo cuando se vean algoritmos de ecualizacion adaptivos.

En el receptor esta senal es bajada en frecuencia y filtrada obteniendose:

x(t) = A prx(t) ∗(rBP e

−j(2πfct+θ(t)))

(10.5)

siendo A, la ganancia del control automatico de ganancia, prx(t) el filtro de recep-

cion, fc y θ son las frecuencia portadora y el jitter del oscilador local de recepcion.Se asumira en este capıtulo que fc aproxima bien a fc, que θ(t) y θ(t) varıan

lentamente en el tiempo y que el filtro de recepcion es un filtro pasabajo.Se definen las siguientes senales equivalentes pasabajo:

rBP (t) = Re[rLP (t)ej2πfct

]wBP (t) = Re

[wLP (t)ej2πfct

]hBP (t) = 2Re

[hLP (t)ej2πfct

](10.6)

Sustituyendo en la ecuacion 10.4, las definiciones 10.6 y 10.3 se llega a:

Re[rLP (t)ej2πfct

]= 2Re

[hLP (t)ej2πfct

]∗Re

[sLP (t)ej2πfct

]+Re

[wLP (t)ej2πfct

]Tomando transformada de Fourier de esta ecuacion:

12 (RLP (f − fc) +R∗LP (−f − fc)) =

(HLP (f − fc)) +H∗LP (−f − fc)) 12 (SLP (f − fc) + S∗LP (−f − fc)) + 1

2 (WLP (f − fc) +W ∗LP (−f − fc))

Si se tiene en cuenta que estas senales son pasabajos y por lo tanto los terminosen (f − fc) y (−f − fc) tienen producto cero se puede observar que:

RLP (f) ∗ δfc = (HLP (f)SLP (f)) ∗ δfc +WLP (f) ∗ δfc

y por lo tanto,

rLP (t) = hLP (t− τ) ∗ sLP (t) + wLP (t)

248

Page 249: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

teniendo en cuenta la definicion de sLP y la hipotesis de que θ(t) varıa lentamente,la expresion anterior se puede aproximar por:

rLP (t) = ejθ(t) [hLP (t− τ) ∗ s(t)] + wLP (t) (10.7)

Por otra parte de 10.6 y 10.5 se llega a que:

x(t) =A

2prx(t) ∗

(rLP e

−j(2π(fc−fc)t+θ(t)) + r∗LP e−j(2π(fc+fc)t+θ(t))

)(10.8)

de donde teniendo en cuenta la hipotesis de que el filtro de recepcion es un pasabajose llega a la siguiente aproximacion:

x(t) ≈ A

2prx(t) ∗

(rLP e

−j(2π(fc−fc)t+θ(t)))

(10.9)

Sustituyendo 10.7 en 10.9:

x(t) ≈ A

2e−j∆θ(t) (prx(t) ∗ hLP (t− τ) ∗ s(t)) + w(t) (10.10)

∆θ(t) = 2π(fc − fc)t+ θ(t)− θ(t) (10.11)

w(t) =A

2e−j(2π(fc−fc)t+θ(t) [prx(t) ∗ wLP (t)] (10.12)

(10.13)

de esta ecuacion se llega a:

x(t) ≈ e−j∆θ(t)∑k

a[k]h(t− kTs − τ) + w(t) (10.14)

h(t) =A

2prx(t) ∗ hLP (t) ∗ ptx(t) (10.15)

Esta senal como se vio en el capıtulo de sincronizacion temporal es luego mues-treada a nTs + τ donde τ es una estimacion del retardo realizada por el mecanismode sincronizacion temporal. Se considerara en primera instancia que se trabaja a unamuestra por sımbolo y posteriormente se analizara el caso de ecualizacion con variasmuestras por sımbolo.

Luego de este muestreo se obtiene:

x[n] = x(nTs + τ) ≈ e−j∆θn∑k

a[k]h((n− k) + w[n] (10.16)

= e−j∆θn(h[n] ∗ a[n]) + w[n] (10.17)

∆θn = ∆θ(nTs + τ) (10.18)

w[n] = w(nTs + τ) (10.19)

h[n] = h(nTs + τ − τ) (10.20)

249

Page 250: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

De esta ecuacion vemos que el problema de recuperar los sımbolos que fueron en-viados implica eliminar la interferencia entre sımbolos que genera el filtro equivalenteh[n]. Se debe observar que esta interferencia se puede deber al filtro de transmision,de recepcion, al canal y tambien al estimador del retardo τ .

Se ha visto en capıtulos anteriores que si el canal es ideal y los filtros de transmisiony recepcion cumplen el criterio de Nyquist se puede evitar o mitigar la interferenciaentre sımbolos con un sincronizador preciso.

Sin embargo, el canal y la estimacion del retardo hacen que el filtro equivalenteno necesariamente cumpla esta propiedad. A continuacion se analizara el filtro derecepcion para el caso de un canal AWGN. Como ya se ha visto es conveniente utilizaren este caso el denominado filtro apareado. Se repasaran las caracterısticas que tieneel filtro apareado primero en el caso de un canal donde la unica interferencia es elruido y luego cuando el canal agrega ademas distorsion debido al fading por ejemplo.

10.2. Filtro de recepcion

10.2.1. Canal ideal con ruido

En este primer analisis repasaremos propiedades para un canal donde hLP = δ(t)y el ruido del canal es estacionario en sentido amplio y de media nula. Se asumiratambien que la sincronizacion en frecuencia, fase y temporal es perfecta en este primeranalisis. Como se vio anteriormente es conveniente usar un filtro de recepcion apareadoprx = p∗tx(−t). La idea es que la senal

s(t) =∑k

a[k]ptx(t− kTs) (10.21)

se puede ver como una senal en el espacio generado por la base Φk(t) = ptx(t−kTs), donde los a[k] son las coordenadas complejas de la senal s(t) en dicho espacio.La senal recibida, luego de pasada a banda base y asumiendo que el canal es ideal(solo se agrega ruido aditivo) y no hay errores de sincronizacion es:

rLP (t) = s(t) + wLP (t) (10.22)

Esta senal debido a la componente de ruido en general no pertenece al espaciogenerado por las Φk(t) = ptx(t − kTs). Pero para recuperar la senal s(t) se buscala senal que se encuentre a menor distancia de rLP (t) en el espacio generado por lamencionada base, es decir que se proyecta rLP (t) sobre dicho espacio:

rLP (t) =∑k

∫T

rLP (t)Φ∗k(t)dtΦk(t) (10.23)

xk =

∫T

rLP (t)Φ∗k(t)dt (10.24)

siendo xk las coordenadas de rLP (t) en dicho espacio. Tambien se vio que paraobtener xk se podıa pasar la senal recibida en bandabase por un filtro de respuesta alimpulso prx = p∗tx(−t) y luego muestrear la senal obtenida ya que la salida de dichofiltro es:

250

Page 251: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

xk(t) =

∫T

rLP (τ)p∗tx(τ − t)dτ (10.25)

xk(0) =

∫T

rLP (τ)p∗tx(τ)dτ = xk (10.26)

Es decir que si utilizamos el filtro apareado visto, obtenemos la senal del espacioptx(t− kTs) que se encuentra a menor distancia de la senal recibida con ruido.

El uso de este filtro tiene algunas propiedades de interes desde el punto de lascomunicaciones que se analizaran a continuacion.

Para comenzar se analizara que sucede con la relacion senal a ruido (SNR). Sebuscara ahora el filtro que maximiza el SNR de la senal muestreada a la salida delfiltro. Llamaremos β(t) a la respuesta al impulso de este filtro para distinguirla dela prx(t) vista antes y luego se analizara la relacion entre ambas. Si en el transmisorse introduce un impulso a la entrada del filtro de transmision, la salida del filtro derecepcion sera

x(t) = β(t) ∗ ptx(t) + β(t) ∗ w(t) (10.27)

Ahora bien la parte de senal en el instante de muestreo es:

v(0) := β(0) ∗ ptx(0) =

∫ ∞−∞

B(f)Ptx(f)df (10.28)

utilizando la antitransformada de Fourier y donde B(f) y Ptx(f) son las trans-formadas de Fourier del filtro de recepcion y de transmision respectivamente. Porotra parte el espectro de potencia del ruido filtrado η(t) = w(t) ∗ β(t) sera Sηη(f) =|B(f)|2Sww(f) y su autocorrelacion en τ = 0, que es independiente de t por serestacionario en sentido amplio, sera:

σ2ηη =

∫ ∞−∞|B(f)|2Sww(f)df (10.29)

y por lo tanto la relacion senal a ruido al muestrear sera:

|v(0)|2

σ2ηη

=|∫∞−∞B(f)Ptx(f)df |2∫∞−∞ |B(f)|2Sww(f)df

(10.30)

Teorema 10.1. El filtro de recepcion que maximiza el SNR dado el filtro de transmi-sion Ptx(f) y en un canal ideal con ruido estacionario en sentido amplio y de medianula de densidad espectral de potencia Sww(f) es :

B(f) =cP ∗tx(f)

Sww(f)(10.31)

siendo c una contante arbitraria no nula. En ese caso el SNR vale:

251

Page 252: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

|v(0)|2

σ2ηη

=

∫ ∞−∞

|Ptx(f)|2

Sww(f)df(10.32)

Este teorema se prueba de manera simple utilizando la desigualdad de Cauchy-Schwarz a la integral del numerador de la ecuacion 10.30. Antes de aplicar esta de-sigualdad se multiplica y divide el integrando por

√Sww(f). Por ultimo para hallar el

maximo se observa en que condicion la desigualdad vale con igualdad, es decir cuan-do uno de los integrandos es proporcional al conjugado del otro. La demostraciondetallada se deja a cargo del lector.

La siguiente pregunta es que sucede si el ruido es blanco Gaussiano. En ese caso,Sww(f) = N0

2 . Como la constante c es arbitraria entonces:

B(f) = P ∗tx(f) (10.33)

β(t) = p∗tx(−t) (10.34)

Es decir que en este caso se encuentra que el filtro que maximiza el SNR es el mismofiltro que proyecta la senal recibida sobre el espacio de las senales generadas por la baseptx(t − kTs). Se debe observar que en este caso, la respuesta al impulso de ambosfiltros v(t) = ptx(t) ∗ p∗tx(−t) es la autocorrelacion de ptx(t). Esta autocorrelacioncuanto mayor es el ancho de banda de la senal mas “concentra la energıa entorno aτ = 0” y por lo tanto maximiza la SNR.

Si bien este analisis se realizo para un pulso aislado, en la medida que los filtroscumplan la condicion de Nyquist, es decir que la autocorrelacion del pulso se anuleen todos los multiplos de kTs con k 6= 0 el analisis sigue siendo valido.

10.2.2. Canal no ideal

Se analizara ahora que sucede si el canal tiene una respuesta al impulso generalen banda base h(t) que ya no es simplemente δ(t− τ). En esta h(t) se asumira que seagrega la respuesta al impulso del filtro de transmision y del canal para simplificar lanotacion.

La salida de este canal en banda base es la senal rLP (t). Posteriormente la senalse pasa por un filtro de respuesta al impulso prx(t) obteniendo la senal x(t) que semuestrea cada tiempo de sımbolo Ts. Se obtiene entonces las muestras xd[n] = x(nTs).La primera pregunta que se formulara es si es posible reconstruir con la informacionde la senal xd[n] la informacion contenida en las senales originales, en particular:

1. ¿ contiene xd[n] toda la informacion de rLP (t) ?y luego2. ¿ contiene xd[n] toda la informacion de s[n]?.Se asumira en este primer analisis que no hay ruido. La respuesta a las preguntas

anteriores es: “depende del filtro prx”. En primer lugar se debe observar que es ne-cesaria la existencia de un filtro prx. No filtrar antes de muestrear puede hacer quepierda la informacion de rLP (t). Si la respuesta al impulso del canal h(t) es tal queh(nTs) = 0 ∀n, entonces xd[n] = 0 ∀n y no es posible recuperar la informacion. Sinembargo aun en este caso poniendo un filtro adecuado es posible recuperar la senal.

252

Page 253: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 10.1: Ejercicio 10.1

Se vera que siempre existe un filtro de recepcion que permite reconstruir rLP (t) apartir de las muestras xd[n].

Teorema 10.2. Dado cualquier canal de transferencia H(f), si el filtro de recepcion,tiene transferencia Hrx(f) = H∗(f), es posible reconstruir rLP (t) de las muestras

xd[n]. Si ademas se cumple que:∑k

∣∣∣H (f + kTs

)∣∣∣2 > 0 entonces, es tambien posible

reconstruir s[n].

La demostracion de este Teorema se encuentra en el apendice de este capıtulo.El teorema anterior dice que apareando el filtro de recepcion al filtro de transmision

mas el canal, siempre es posible reconstruir rLP (t) y ademas cuando se cumple la

condicion:∑k

∣∣∣H (f + kTs

)∣∣∣2 > 0 se puede tambien reconstruir s[n].

Una observacion importante sin embargo, es que en un canal no ideal aparear soloel pulso de transmision puede hacer que se pierda informacion y no se pueda recuperarrLP (t). Si se elige prx(t) = p∗tx(−t) y el canal tiene respuesta al impulso hLP (t), latransferencia discreta total desde s[n] a xd[n] sera la siguiente integral de convolucion:

h[n] =

∫hLP (t)rp(nTs − t)dt (10.35)

donde rp es la autocorrelacion del pulso de transmision. Si por ejemplo, el pulsode transmision esta acotado a (0, Ts2 ) su autocorrelacion sera una senal en general

simetrica respecto del origen y acotada a (−Ts2 , Ts2 ). Si la respuesta al impulso delcanal hLP (t) fuera antisimetrica respecto del origen, la integral anterior darıa ceropara todo n.

Ejercicio 10.1. Mostrar que si el pulso y el canal utilizados tienen respuesta alimpulso que se muestra en la figura 10.1 , entonces utilizar como filtro de recepcion elapareado del filtro de transmision y luego muestrear puede hacer perder informacion.

Se analizara en lo que sigue con mas detalle la reconstruccion de s[n] a partir delas muestras xd[n]. Se sabe que si se cumple la condicion vista en el Teorema anteriores posible dicha reconstruccion.

253

Page 254: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Reconstruccion de la fuente e independencia lineal

Se analizara ahora la condicion que se vio antes para que sea posible reconstruir lasmuestras s[n], y su relacion con la independencia lineal de las senales h(t−kTs). Estarelacion dara un enlace entre la condicion vista para la reconstruccion y la existenciade una base en el sub-espacio de las senales L2 en la que se pueda representar la senalenviada s(t).

Teorema 10.3. Dada una funcion h(t) con transformada H(f), las siguientes afir-maciones son equivalentes:

1. Las funciones h(t− kTs) son linealmente independientes.

2.∑k

∣∣∣H (f + kTs

)∣∣∣2 > 0

3. No existe una region de frecuencias A = f : θ1 ≤ f ≤ θ2 en donde H(f) seanule en todo A y en todo desplazamiento de A+ k

Ts.

La prueba de este Teorema se encuentra en el apendice de este capıtulo.De lo anterior se deduce que si se utiliza un filtro apareado al filtro de transmision

y el canal prx(t) = h∗(−t) o en frecuencia Hrx = H∗(f) y luego se muestrea no hayperdida de informacion de la secuencia xd[n] respecto de la senal r(t). Si ademas secumplen las condiciones del Teorema anterior tampoco hay perdida de informacionrespecto de la secuencia de la fuente s[n]. La siguiente pregunta es si este filtro apa-reado es el unico filtro con el cual no hay perdida de informacion respecto de r(t).La respuesta a esta pregunta es que no es el unico. Por ejemplo cualquier filtro dela forma Hrx(f) = H∗(f)D(f) con D(f) > 0 para todo f tambien es un filtro sinperdida de informacion. La ventaja sin embargo de utilizar como filtro de recepcionel apareado H∗(f) es que este filtro maximiza el SNR en el tiempo de muestreo, parael caso de ruido blanco gaussiano.

Ejercicio 10.2. Opcional. a) Probar que cualquier filtro de recepcion elegido de lasiguiente forma es tambien un filtro sin perdida de informacion.

Hrx(f) = H∗(f)D(f) con D(f) > 0 para todo f Observar que se puede probarextendiendo la demostracion del Teorema 10.2. b) Probar que el filtro de recepcion quemaximiza el SNR en el caso de que se tenga ruido gaussiano coloreado de densidad

espectral Sww(f) tiene la forma B(f) = H∗(f)Sww(f) . Ver que es tan solo extender lo ya

visto para el canal ideal. Mostrar que este filtro no pierde informacion.c) Muchas veces se utiliza un filtro de recepcion de la forma Hrx(f) = H∗(f)D(f)

donde D(f) se elige de forma tal que blanquee el ruido que sale del filtro H∗(f) queno es blanco. ¿este filtro compuesto del filtro apareado al canal mas el blanqueador esun filtro sin perdida de informacion?

10.3. Estimacion optima de secuencias de sımbolos

La probabilidad de que el sımbolo transmitido s[n] en un cierto instante sea sk,dado que se ha recibido r[n] es p(s[n] = sk/r[n]) o p(sk/r) para simplificar la notacion.Esta probabilidad se denomina probabilidad a posteriori y cuando se busca el sımbolo

254

Page 255: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

sk que maximiza esta probabilidad, se dice que el sımbolos estimado sest es el maximoa posteriori o MAP.

Por otro lado, la funcion densidad de probabilidad de que se reciba la senal rdado que el sımbolo enviado es sk es f(r/sk) y esta funcion se llama funcion deverosimilitud. El estimador que maximiza esta funcion se denomina estimador demaxima verosimilitud o ML. La relacion entre ambos se puede ver de la ley de Bayes

p(sk/r) =f(r/sk)p(sk)∑k f(r/sk)p(sk)

(10.36)

teniendo en cuenta que la sumatoria de la ecuacion anterior es en todos los k nodepende del sımbolo transmitido. Si los sımbolos son equiprobables entonces ambasprobabilidades coinciden a menos de una constante. Por lo tanto, en el caso que lossımbolos son equiprobables MAP y ML coinciden.

Otra observacion importante es que si el canal no es ideal y por ejemplo introduceISI, existe informacion del sımbolo enviado en el tiempo n (s[n]) en todos los sımbolosrecibidos en n y en las L muestras posteriores a n (siendo L, el largo de ISI del canal).Por lo tanto para detectar el sımbolo enviado en n mirar toda la secuencia de senalesrecibidas desde n hasta n+ L aporta informacion y deberıa mejorar la estimacion.

Tambien debido a que la fuente s[n] puede tener memoria, existira correlacionentre s[n] y las muestras recibidas anteriores a n y por lo tanto tambien estas muestraspueden aportar informacion para decidir el sımbolo enviado en el tiempo n.

En general conviene que la deteccion no se haga en funcion de muestras indivi-duales, sino de secuencias. Por lo tanto, se hablara de la probabilidad a priori p(sk/r)de que la secuencia enviada sea sk dado que se recibio la secuencia r. La secuenciaestimada que se obtiene de maximizar esta probabilidad se denomina estimador MAP.Lo mismo se aplica para el caso de maxima verosimilitud, denominando estimadorML al que maximiza: f(r/sk) y ambos coincidiran si los sımbolos son equiprobables.

10.3.1. Probabilidades de error y estimadores MAP o ML

La probabilidad de decodificar erroroneamente una secuencia de sımbolos cuandola secuencia de sımbolos que se envıa es sk es

Pe(sk) = 1−∫Rk

f(r/sk)dr (10.37)

donde Rk es la region tal que si la secuencia recibida cae en esa region la decodifi-cacion es correcta. De esta ecuacion operando se puede ver que la probabilidad mediade error sobre todos los sımbolos es:

Pe =∑k

Pe(sk)p(sk) (10.38)

= 1−∫Rf(r)p(sk/r)dr (10.39)

255

Page 256: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

donde la region R es la union de todas las regiones disjuntas Rk. La funcion f(r)se define como f(r) =

∑f(r/sk)p(sk).

De esta ecuacion, se puede ver que minimizar la probabilidad media de error dela secuencia es equivalente a maximizar la probabilidad a priori para cada secuenciask. Por lo tanto, la estimacion utilizando MAP minimiza la probabilidad media deerror de la secuencia. Si todos lo sımbolos son equiprobables, entonces el estimadorML minimiza la probabilidad media de error de la secuencia.

10.3.2. ML en el caso de ruido gaussiano blanco

Se supone que se tiene una secuencia recibida de K muestras r y se quiere estimarlas K muestras correspondientes que fueron enviadas s, de forma tal que f(r/sk)sea maximizada. Si la constelacion tiene M sımbolos, sk es uno de las MK posiblessecuencias. En esta seccion se asume que se cumple que:

r[n] = s[n] + w[n]Si se envıa el sımbolo sk[n] como w es un ruido gaussiano y blanco, cada mues-

tra r[n] tendra distribucion gaussiana de media sk[n] y varianza σw. Ademas estasmuestras son independientes. Por lo tanto,

f(r/sk) =

(1√

2πσ2w

)Kexp

−K−1∑n=0

(r[n]− sk[n])2

2σ2w

(10.40)

Por lo tanto, se puede ver que encontrar el estimador ML es equivalente a mini-mizar:

d(r, sk) =

K−1∑n=0

(r[n]− sk[n])2

(10.41)

es decir, la distancia euclıdea entre ambas secuencias.Resumiendo si todos los sımbolos tienen la misma probabilidad ML es igual a

MAP y en el caso de un canal AWGN, ML es equivalente a minimizar la distanciaeuclıdea entre la secuencia enviada y la recibida. Tambien se debe resaltar que MAPes equivalente a minimizar la probabilidad media de error de toda la secuencia, lo queno implica que se minimiza la probabilidad de error de cada sımbolo.

10.3.3. El algoritmo de Viterbi y el diagrama de Trellis

El calculo del estimador ML para secuencias de sımbolos es un problema complejo.Aun en un canal AWGN ideal en que es equivalente a calcular la distancia mınima en-tre la salida y la entrada, implicarıa recorrer todas las posibles secuencias de sımbolosy para cada una calcular la distancia con la secuencia recibida. Este procedimientotiene un costo computacional muy alto. Viterbi desarrollo un algoritmo que se puedeaplicar a un canal AWGN con ISI. El algoritmo de Viterbi se basa en modelar elcanal como un filtro FIR y en considerar este filtro como una maquina de estados,

256

Page 257: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 10.2: Ejemplo Viterbi

de la misma forma que se modelaron los codigos convolucionales cuando se utilizo elalgoritmo de Viterbi para decodificar estos codigos.

Un filtro FIR se puede modelar como una maquina de estados donde el estadoesta dado por el valor de la secuencia de entrada al filtro en los L − 1 instantesprevios. Es decir que el estado sera (s(n − 1), .., s(n − (L − 1))). Con este estado yde acuerdo a la secuencia de entradas que se reciban se puede construir un diagramade Trellis al igual que en los codigos convolucionales. La salida y del filtro sera:y[n] = h0s[n] + h1s(n− 1) + ..+ hL−1s(n− L+ 1). Utilizando esta funcion se puedecalcular el valor de la salida para cada transicion del diagrama de Trellis.

Ejemplo 10.1. Veamos un ejemplo. Se tomara el caso particular en el cual el canalse modela como un filtro FIR con tres taps segun se muestra en la figura 10.2.

El diagrama de Trellis correspondiente a la figura 10.2, asumiendo que es unsistema PAM, con sımbolos 1,−1 y el sistema comienza en el estado (1, 1) se muestraen la figura 10.3. En el diagrama se muestran para cada estado y las entradas posibles1,−1, las transiciones de estado y la salida correspondiente del canal. Ademas semuestra para una secuencia de entrada especıfica el recorrido de estados y las salidascorrespondientes.

El algoritmo de Viterbi, realizara sobre el diagrama de Trellis el recorrido “inverso”al visto en el ejemplo. Es decir, tratara de reconstruir la secuencia de entrada s, dadauna secuencia de salida y, o mejor aun una secuencia de salida con ruido r. Para talfin, dada una secuencia recibida con ruido r,se calculara el costo de cada transicioncomo (r[n] − y[n])2. Recorriendo el diagrama desde el primer sımbolo recibido seira sumando los costos. En la figura 10.4 tal se muestra para el canal del ejemploanterior el diagrama de Trellis para los tres primeros valores de la secuencia con ruidorecibida (en este ejemplo 1.1,-0.5,1) y donde en este caso se han tomado como tapsh0 = 0,5, h1 = 0,25, h2 = 0,25. En el diagrama se muestra el costo acumulado paracada sımbolo recibido de la secuencia. para los dos primeros sımbolos hay un unicocamino y el costo acumulado se muestra en cada cırculo que representa el estado, parael tercer sımbolo recibido hay dos caminos posibles a cada estado que se muestran ala derecha del estado. En la primera columna se muestra para la transicion marcadaen negrita y en la segunda columna el costo acumulado para el camino marcado enlınea punteada.

257

Page 258: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 10.3: Ejemplo Diagrama de Trellis del modelo de la Figura 10.2 para un sistemaPAM. Si la secuencia de entrada es la indicada en la figura se recorren los estados enrojo y las salidas seran las correspondientes al camino marcado en negrita e indicadasen la Figura.

Figura 10.4: Ejemplo del calculo de costos para la secuencia recibida con ruido que seindica en la figura del modelo de la Figura 10.2 para los taps del filtro indicado en lafigura.

258

Page 259: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 10.5: Ejemplo de poda del calculo de costos para la secuencia recibida conruido que se indica en la figura del modelo de la Figura 10.2 para los taps del filtroindicado en la figura.

En el proceso se utiliza el algoritmo de poda de Viterbi que se utiliza tambienen codificacion, con el cual de los caminos que llegan a un nodo del diagrama deTrellis se pueden eliminar todos los caminos que conducen a ese nodo y que no seanel camino de costo mınimo hasta ese nodo. Esto se muestra en la figura 10.5 para elejemplo anterior, donde se eliminaron todos los caminos posibles hasta haber recibidoel tercer elemento de la secuencia. A medida que se sigan recibiendo mas elementosde la secuencia se iran podando de la misma forma otros caminos.

De esta forma al llegar al final del diagrama se identifica la secuencia de de entradas

s[n] que minimizan la distanciaK−1∑n=0

(r[n]− y[n])2.

Observar que en el ejemplo anterior, hasta el tercer elemento recibido de la se-cuencia lo unico que se puede afirmar es que el sımbolo que es mas probable que sehaya enviado como primer elemento de la secuencia es un 1.

En este punto se deben hacer varias consideraciones. En primer lugar, en generalcon las K salidas del vector r se logran decodificar efectivamente K − D entradas.Esto se debe a que en el proceso de poda, por cada nuevo sımbolo recibido no selogran podar todos los caminos menos uno hasta ese punto, sino que en general quedaun unico camino hasta cierto punto anterior del diagrama y a partir de allı mas deuno posible. Ese valor D que se le suele llamar retardo de decodificacion, es un valorque varıa en cada iteracion del algoritmo y no es facil ni siempre posible dar una cotaen funcion del largo L del filtro.

En segundo lugar, no se esta minimizandoK−1∑n=0

(r[n] − sk[n])2 como requerıa el

algoritmo ML en el caso de ruido blanco sino la distancia con y. Si entre la secuencias y la secuencia y existiera una relacion biunıvoca, entonces no habrıa problema y elalgoritmo de Viterbi darıa un estimador de ML en el caso de ruido blanco y gaussiano.La relacion entre estos dos vectores viene dada por el canal, es decir

259

Page 260: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

y(0)y(1)...

y(L− 1)

=

h0 0 0 ... 0h1 h0 0 ... 0hL−1 hL−2 ... h0

s(0)s(1)...

s(L− 1)

(10.42)

Si h0 es diferente de 0, entonces este sistema es invertible y a cada vector s lecorresponde un vector y y viceversa. En estas condiciones entonces el algoritmo deViterbi, brinda el estimador ML si el canal es AWGN y ademas, si los sımbolos sonequiprobables este estimador es tambien el estimador MAP y por tanto minimiza laprobabilidad de error media de la secuencia. Como se menciono anteriormente paraasegurarse de tener ruido blanco luego del filtro apareado al canal es necesario utilizarun filtro blanqueador.

Ejercicio 10.3. 1. Considere un canal modelado como un filtro FIR con la siguientetransferencia: H(z) = 1 + 0,5z−1.

a) Construya el diagrama de Trellis.b) Si la secuencia de entrada es 1;−0,4;−0,8; 0,1; 1,1 , Corra el algoritmo de

Viterbi en el diagrama de Trellis. ¿cuales de los sımbolos s(n) pueden ser decodificadoscuando llegaron estos 5 sımbolos?

c) Si ahora en lugar de la secuencia anterior se reciber[n] = 1;−0,4;−0,8; 0,1; 0,1; 0,1; 1,1,Corra el algoritmo de Viterbi en este caso. ¿cual es el retardo de decodificacion de

s(2) y como se compara con el caso anterior?2. GnuRadio tiene un bloque denominado Viterbi Combo (de Viterbi Trellis Com-

bination) que puede ser utilizado tanto para codificacion como para ecualizacion ML.Asuma que se tiene un canal (pulso Tx+canal+pulso Rx) modelado como un filtro FIRcon los coeficientes del ejemplo 10.1. Se adjunta el codigo de dicho sistema en Gnu-Radio Companion. Observar la salida del receptor. Agregar un bloque Viterbi Combo.En este caso se le debe pasar como parametros: 1. el archivo donde se encuentra lamaquina de estados especificada. 2. El tamano de bloque. El estado inicial y final (-1si no se especifica). La dimension de la constelacion (1 en este caso). La Metrica,euclıdea en este caso como se vio en esta seccion. La Constelacion, en este caso co-rresponde a un mapeo entre las salidas especificadas en la maquina de estado y elvalor de la salida correspondiente para el modelo de canal.

Analizar la salida y compararla con la entrada. Para esto es conveniente un vectorsource y poner diferentes secuencias de datos de entrada y verificar que se obtienela secuencia correcta. Agregar ruido y verificar en que niveles de ruido comienza acometer muchos errores.

10.4. Ecualizacion Lineal

La ecualizacion utilizando el algoritmo de Viterbi en el caso de ruido blanco gaus-siano y con sımbolos equiprobables minimiza la probabilidad media de error de lasecuencia de sımbolos enviados. Por este motivo en algunos textos se dice que estealgoritmo es optimo. Sin embargo, la implementacion del algoritmo de Viterbi tieneun costo computacional alto y en algunos casos practicos por este motivo no se puede

260

Page 261: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 10.6: Modelo en tiempo discreto

implementar. Por esta razon, se han buscado formas de ecualizar mas simples, pro-bablemente con peor desempeno pero que den un compromiso razonable entre costocomputacional y grado de ecualizacion.

Se veran dos formas de ecualizar el canal mediante filtros lineales: ecualizacion“zero forcing” (se denominara ecualizacion ZF) y ecualizadores que minimizan elerror cuadratico medio (se denominaran ecualizadores MSE).

En esta seccion se trabajara sobre el modelo en tiempo discreto del sistema comose muestra en la figura 10.6.

Respecto del filtro de recepcion existen dos opciones. Si se desea que el filtromaximize la relacion senal a ruido es necesario que este filtro este apareado al filtrode recepcion y el canal: h(t) = ptx(t) ∗hLP (t). Ademas como se vio este filtro aseguraque no se pierde informacion (siempre que el canal cumpla las condiciones vistas ycomo tambien se vio eso no necesariamente pasa si se utiliza un filtro apareado soloal filtro de transmision).

Para que esto sea posible es necesario conocer o tener una identificacion de latransferencia del canal hLP (t). En muchos sistemas de comunicacion se conoce es-ta respuesta al impulso o es posible estimarla (por ejemplo a partir del envıo deuna secuencia conocida por transmisor y receptor) y se coloca un filtro de recepcionprx(t) = h∗(−t). En otros casos sin embargo, no se conoce la transferencia del canaly no se tiene una forma de estimarla. En estos casos se utiliza un filtro de recepcionapareado al filtro de transmision solamente es decir, prx(t) = p∗tx(−t).

Estas dos opciones hacen que la ecualizacion sea algo diferente en un contexto (seconoce la respuesta al impulso del canal) que en el otro (la respuesta al impulso delcanal no es conocida).

Otro aspecto a considerar en ambos contextos es el ruido. Aun si se asume que elruido en el canal es AGWN, el ruido a la salida del filtro de recepcion y de muestrearla senal sera gaussiano pero no blanco, salvo que el filtro de recepcion cumpla laecuacion

1

Ts

∑k

∣∣∣∣Prx(f +k

Ts

)∣∣∣∣2 = c (10.43)

Observar que esto se cumple si el filtro de recepcion verifica el criterio de Nyquist,por ejemplo si es un filtro SRRC (square root raised cosine). Si no se cumple lacondicion anterior,se tiene a la salida del muestreador ruido gaussiano no blanco. Paraalgunos algoritmos es necesario que el ruido sea blanco (por ejemplo el de Viterbi vistoantes en este capıtulo). Por lo tanto, en muchos casos se utiliza luego de muestrearun filtro “blanqueador” que transforme el ruido no blanco, en ruido blanco.

261

Page 262: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

En esta seccion se asumira que se utiliza como filtro de recepcion un filtro apareadoal canal mas el filtro de transmision, es decir que:

Prx(z) = H∗(z∗−1) (10.44)

y que a continuacion se utiliza un filtro blanqueador antes del ecualizador quetendra transferencia

Hw(z) =1

H∗(z∗−1)(10.45)

Puede parecer absurdo si se mira el modelo en tiempo discreto que luego de unfiltro Prx(z) = H∗(z∗−1) se coloque un filtro que “anula” esta transferencia. Nose debe olvidar que en la realidad el primer filtro se coloca antes de muestrear paramaximizar el SNR en el instante de muestreo y el segundo se coloca luego de muestrearpara blanquear el ruido.

En resumen el conjunto filtro de transmision, canal, filtro de recepcion, se puedever en el caso que se utilice un blanqueador como un sistema cuya transferencia esH(z) = Ptx(z)HLP (z) y por lo tanto se ecualizara la senal que se obtiene a la salidade este filtro. En el dominio del tiempo la entrada al ecualizador sera:

x[n] =∑k

a[k]h[n− k] + w[n] (10.46)

En esta ecuacion, si no se utiliza un blanqueador entonces habra que hacer dos con-sideraciones: h debe incluir tambien el filtro de recepcion, y ademas el ruido quedarafiltrado por el filtro de recepcion.

El ecualizador sera un filtro Q(z) y el canal mas el ecualizador sera un filtroV (z) = H(z)Q(z). La salida del canal y ecualizador (u[n]) cumplira entonces que

u[n] =∑k

a[k]v[n− k] +∑j

w[j]q[n− j] (10.47)

= a[n]v[0] +∑k 6=n

a[k]v[n− k] +∑j

w[j]q[n− j] (10.48)

habitualmente se normaliza v[0] = 1 y por lo tanto el segundo termino de la ecuacionrepresenta la interferencia por ISI y el tercero la componente de ruido. El problemaque se presenta entonces es como elegir los coeficientes del filtro ecualizador q[n]. Severan en esta seccion dos criterios. En un primer caso se considerara un sistema conSNR = ∞, es decir con potencia de ruido cero. En el segundo caso se estudiara unsistema con SNR finito.

10.4.1. SNR = ∞, criterio de distorsion de pico, ecualizadorZF

Si el SNR =∞ entonces la ecuacion de la salida del equalizador se reduce a:

262

Page 263: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

u[n] =∑k

a[k]v[n− k] =∑k

a[n− k]v[k] (10.49)

la distorsion del sistema sera:

D(q) =∑k 6=n

a[n− k]v[k] (10.50)

|D(q)| ≤ max |a[n]|∑k 6=n

|v[k]| (10.51)

≤ max |a[n]|∑k 6=n

∑j

|h[j]||q[k − j]| (10.52)

Por lo tanto, para eliminar la distorsion se debe lograr que la respuesta al impulsodel filtro ecualizador q[n] verifiquen la siguiente condicion:

v[n] =∑j

h[j]q[n− j] =

1 si n = 00 en otro caso

(10.53)

tambien se puede formular como la transformada z de esta ecuacion, es decir que:

H(z)Q(z) = 1 (10.54)

y por lo tanto el ecualizador debe invertir el canal:

Q(z) =1

H(z)(10.55)

Si el filtro ecualizador tiene infinitos taps es posible ecualizar perfectamente elcanal y eliminar la interferencia inter-simbolica.

A la salida del ecualizador ZF si se considera que a la entrada hay ruido blancogaussiano w[n] con densidad espectral de potencia N0

v[n] = a[n] + ν[n] (10.56)

donde ν[n] es un ruido gaussiano coloreado de densidad espectral de potencia:

Sν(ejΩ) = N0|Q(ejΩ)|2 (10.57)

=N0

|H(ejΩ)|2(10.58)

y la varianza de este ruido es por lo tanto:

263

Page 264: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

σν = Ts

12Ts∫−12Ts

N0

|H(ejΩ)|2df (10.59)

Si se asume que la energıa media de los sımbolos se normaliza a 1, la relacion senala ruido queda de la forma

SNRZF =1

Ts

12Ts∫−12Ts

N0

|H(ejΩ)|2 df

(10.60)

De esta ecuacion se debe observar que si H(z) tiene ceros cerca del cırculo unitario,entonces la relacion senal a ruido tiende a cero. Esta es la principal desventaja de losecualizadores ZF. En la medida que en su calculo no se tuvo en cuenta el ruido, lainversion del canal hace que en frecuencias con “deep fading” se amplifique mucho elruido y la SNR tienda a cero.

Ejemplo 10.2. Considere el canal con transferencia:

H(z) =1√

1 + a2(1− az−1) (10.61)

El ecualizador sera:

Q(z) =√

1 + a2z

z − a(10.62)

Se deben considerar dos casos segun |a| < 1 o |a| > 1.1. |a| < 1 En este caso es posible obtener una secuencia causal y estable, con

region de convergencia (ROC) |z| > |a| (tambien una anticausal e inestable, con ROC|z| < |a| pero que no es de interes) de la forma:

q[k] =√

1 + a2aky(k) (10.63)

siendo y(k) un escalon unitario. Como se puede apreciar el ecualizador ZF eneste caso tiene respuesta al impulso infinita. Como se menciono antes en general losecualizadores ZF necesitan infinitos taps. Por ejemplo si se quisiera implementar comoun filtro transversal

Q(z) =√

1 + a21

1− az−1=√

1 + a2

∞∑k=0

akz−k (10.64)

1. |a| > 1 En este caso si se quiere un filtro estable la ROC debe contener el cırculounitario y por lo tanto se tendra un filtro anticausal.

264

Page 265: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

q[k] =

√1 + a2

aak+1y(−(k + 1)) (10.65)

siendo y(k) un escalon unitario.En ambos casos si se utiliza la ecuacion 10.60 operando se llega a que el SNR es

SNR =1

N0

||a|2 − 1|1 + |a|2

(10.66)

Como se puede observar el SNR tiende a cero si a tiende a 1.

Implementacion del ecualizador ZF como un filtro FIR

En esta seccion se vera como minimizar la distorsion sin en general anularla,uyilizando como ecualizador un filtro FIR de largo 2K en un canal que se modelacomo un filtro FIR de largo L. Por lo tanto

mınqD(q) = mın

q

K+L−1∑k=−K,k 6=0

|v[k]| (10.67)

= mınq

K+L−1∑k=−K,k 6=0

|∑j

h[j]q[k − j]| (10.68)

Si se quisiera forzar a cero el mınimo se tienen 2k+L− 1 ecuaciones para igualara 0 y 2K − 1 variables para ajustar y por lo tanto en general no es posible. Porlo tanto, con un filtro finito siempre hay una interferencia residual. El problema deoptimizacion a resolver es el siguiente, tomando n = 0 para simplificar la notacion

mınqD(q) (10.69)

sujeto a |∑j

h[j]q[−j]| = 1 (10.70)

Este problema de optimizacion se prueba [1] que es un problema de optimizacionconvexo y en el caso general debe ser resuelto mediante algun metodo numerico. Sin,embargo en el citado articulo se prueba tambien que si :

1

|h[0]|

L∑j=1

|h[j]| < 1 (10.71)

es decir que la interferencia no es excesivamente severa, entonces el optimo delproblema de optimizacion anterior es el mismo punto que se obtiene de resolver elsistema de ecuaciones:

v[k] = 0 ∀k,−K < k < K, k 6= 0 (10.72)

v[0] = 1 (10.73)

265

Page 266: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ejemplo 10.3. H(z) = h[0] + h[1]z−1

Se busca un ecualizador con 3 taps, es decir K = 1 q[−1], q[0], q[1].La funcion de distorsion a minimizar en este ejemplo serıa;D(q) = |q[−1]h[0]|+ |q[0]h[1] + q[1]h[0]|+ |q[1]h[1]|sujeto a la condicion q[−1]h[1] + q[0]h[0] = 1.

Como se menciono antes si |h[1]||h[0]| < 1, entonces el optimo se obtiene de resolver el

siguiente sistema de ecuaciones:

q[−1]h[0] = 0 (10.74)

q[0]h[1] + q[1]h[0] = 0 (10.75)

q[−1]h[1] + q[0]h[0] = 1 (10.76)

de donde se obtiene:

q[−1] = 0 (10.77)

q[0] =1

h[0](10.78)

q[1] =−h[1]

h[0]2(10.79)

(10.80)

La distorsion residual es |q[1]h[1]| = h[1]2

h[0]2

Si se considera ahora el filtro ecualizador con los siguientes coeficientes:

q[−1] =1

h[1](10.81)

q[0] = 0 (10.82)

q[1] = 0 (10.83)

(10.84)

La distorsion de este filtro es |q[−1]h[0]| = h[0]h[1]

Si se verifica que |h[1]||h[0]| < 1 como es de esperar la distorsion residual del filtro 10.80

(h[1]2

h[0]2 ) es menor que la del filtro 10.84 (h[0]h[1] ). Sin embargo, si la interferencia es severa,

|h[1]||h[0]| > 1, el optimo ya no sale de resolver el sistema de ecuaciones 10.76, lo que se

puede observar ya que en ese caso por ejemplo el filtro 10.84 tiene menor distorsionresidual.

Ejercicio 10.4. 1. En un transmisor PAM si se ingresa un 1,a la salida del mues-treador posterior al filtro de recepcion se obtiene: x−1 = 0,3;x0 = 0,9;x1 = 0,3y xi = 0 ∀i 6= −1, 0, 1

a) Encontrar un filtro ecualizador+blanquedaor ZF ideal que anule completa-mente la ISI de esta senal. Este filtro sera la cascada del blanqueador y el

266

Page 267: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

ecualizador propiamente dicho. Encontrar la transferencia del blanqueador y delecualizador propiamente dicho.

b) Calcular un ecualizador+blanqueador ZF con tres taps.

c) Cuanto vale la salida del ecualizador+blanqueador qm para m = −3,−2, 2, 3.

2. OPCIONAL: Repetir el ejercicio anterior para el caso x−1 = 0,3;x0 = 1;x1 =0,2 y calcular el ISI residual luego de ecualizar.

10.4.2. SNR finito, Ecualizador error cuadratico medio, MSE

En este caso lo que se buscara como criterio de ecualizacion que el error cuadraticomedio sea mınimo, es decir que se minimice ε definido por

e[n] = a[n]− a[n] (10.85)

ε = E [e[n]e∗[n]] (10.86)

Teniendo en cuenta que:

x[n] =∑j

a[j]h[n− j] + w[n] (10.87)

a[n] =∑j

q[j]x[n− j] (10.88)

a[n] se puede ver como una combinacion lineal de los vectores x[n − j]. Por lotanto la minimizacion del error se puede obtener de la condicion de ortogonalidad delerror respecto a los vectores x[n− j], es decir,

E [e[n]x∗[n− j]] = 0 ∀j (10.89)

E

[(a[n]−

∑k

q[k]x[n− k]

)x∗[n− j]

]= 0 ∀j (10.90)∑

k

q[k]rxx[j − k] = rax[j] ∀j (10.91)

siendo ruv la correlacion de u y v.Tomando Transformada z de la ecuacion 10.91 se obtiene:

Q(z)Sxx(z) = Sax(z) (10.92)

siendo Suv el espectro de potencia de los procesos u y v.Por otra parte de la ecuacion 10.87 multiplicando ambos miembros por a∗[n− k]

y tomando valor esperado se obtiene:

E [x[n]a∗[n− k]] = E

∑j

a[j]h[n− j] + w[n]

a∗[n− k]

(10.93)

Sxa(z) = Saa(z)H(z) + Swa(z) (10.94)

267

Page 268: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Teniendo en cuenta que Sax(z) = S∗xa(1/z∗) = Sax(z) y que Saa(z) = S∗aa(1/z∗).el filtro ecualizador MSE verifica:

Q(z) =Saa(z)H(z) + Saw(z)

Sxx(z)(10.95)

Se asumira en adelante la hipotesis que en la practica es razonable que el ruido yla senal de la fuente estan no correlacionados y por tanto : raw(k) = 0 y Saw(z) = 0.

Es posible calcular Sxx de la siguiente forma:

rxx(k) = E [x[n]x∗[n− k]] (10.96)

= E

(∑j

a[j]h[n− j] + w[n])(∑l

a∗[l]h∗[n− k − l] + w∗[l])

(10.97)

= E

(∑j

a[j]h[n− j])(∑l

a∗[l]h∗[n− k − l])

+ rww[k] (10.98)

=∑j,l

raa[j − l]h[n− j]h∗[n− k − l] + rww[k] (10.99)

de donde,

Sxx(z) = Saa(z)H(z)H(z) + Sww(z) (10.100)

y por lo tanto la transferencia del ecualizador MSE queda finalmente:

Q(z) =Saa(z)H(z)

Saa(z)H(z)H(z) + Sww(z)(10.101)

o en su respuesta frecuencial:

Q(ejΩ) =Saa(ejΩ)H∗(ejΩ)

Saa(ejΩ)|H(ejΩ)|2 + Sww(ejΩ)(10.102)

Observar que en el caso sin ruido el ecualizador MSE se reduce al ZF de la ecuacion10.55. Tambien se debe observar que este ecualizador es en general de respuesta alimpulso infinita al igual que en el caso del ZF.

Este ecualizador MSE cuando el SNR es muy alto se comporta de forma similaral ZF pero cuando el SNR es muy bajo la respuesta en frecuencia tiende a 0. Elecualizador MSE contempla el ruido y por tanto atenua el problema de los polos delcanal cerca del cırculo unitario. Sin embargo, cuando el ruido no es nulo no ecualizatotalmente el canal.

268

Page 269: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ejemplo 10.4. Considere el canal con transferencia:

H(z) =1√

1 + a2(1− az−1) (10.103)

H(z) =1√

1 + a2(1− az) (10.104)

El ecualizador sera:

Q(z) =√

1 + a21− az

1 + a2 +N0(1 + a2)− az − az−1(10.105)

Implementacion del ecualizador MSE como un filtro FIR

Como se vio antes, en general el ecualizador MSE requiere de un filtro IIR. Veremosahora que sucede si se utiliza un filtro FIR como ecualizador. La ecuacion 10.91 queda:

K∑k=−K

q[k]rxx[j − k] = rax[j] ∀j (10.106)

Teniendo en cuenta ademas que la correlacion entre los procesos x y a los introduceel canal que se modela como un filtro FIR de orden L, rxx[j − k] = 0 si |j − k| > L yrax[j] = 0 si |j| > L. La ecuacion 10.106 se puede escribir de forma matricial como:

Rxxqopt = rax (10.107)

siendo: Rxx una matriz de dimensiones (2K + 1)x(2K + 1) y donde el elementoRxx[i, j] = rxx[i − j] y qopt y rax dos vectores columna de dimension (2K + 1). Elelemento rax[j] = rax[j].

El filtro optimo es entonces:

qopt = R−1xx rax (10.108)

Por ultimo, si se conoce el canal, la matriz Rxx y el vector rax se pueden calcularen funcion de los taps del canal. Se asume que el ruido y los sımbolos no estancorrelacionados y que los sımbolos son i.i.d.. Los elementos de la matriz se puedencalcular de la siguiente forma:

Rxx[i, j] = rxx[i− j] (10.109)

= E

[L∑l=0

h[l]a[i− l]L∑

m=0

h∗[m]a∗[j −m]

]+N0δij (10.110)

= E[|a[k]|2]

L∑l=0

h[l]h∗[l − [i− j]] +N0δij (10.111)

(10.112)

269

Page 270: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Los elementos del vector se pueden calcular de la siguiente forma:

rax[j] = E

[a[k]

L∑m=0

a∗[m]h∗[k − j −m] + w∗[k − j]

](10.113)

= h∗[−j] (10.114)

Ejemplo 10.5. Sea el canal + filtro de recepcion con transferencia H(z) = h0+h1z−1

y el ruido es blanco gaussiano con potencia N0

Rxx =

h20 + h2

1 +N0 h0h1 0h0h1 h2

0 + h21 +N0 h0h1

0 h0h1 h20 + h2

1 +N0

(10.115)

rax =

h1

h0

0

(10.116)

Ejercicio 10.5. Repetir el ejercicio 10.4 para el caso de un ecualizador MSE infinitoy con tres taps cuando el ruido del canal es blanco aditivo y con potencia N0

10.5. Ecualizacion de espaciado fraccional

10.5.1. Introduccion

En este capıtulo se ha analizado el caso donde la senal recibida se muestrea a unatasa de una muestra por sımbolo. Estos ecualizadores en la literatura se denominanhabitualmente baud rate equalizer (BRE). Se analizara en esta seccion el caso dondese muestrea a mas de una muestra por sımbolo. Estos ecualizadores se denominanfractionally spaced equalizer (FSE).

En la arquitectura FSE se muestrea a una tasa mayor a Ts y el filtro apareadode recepcion se implementa de forma digital. Luego del muestreo solo se realiza unfiltrado antialiasing que se asumira que se hace con un filtro ideal.

Por lo tanto, el filtro apareado y el ecualizador trabajan a una tasa de L muestraspor sımbolo. Posteriormente de la ecualizacion se hace un downsampling de tasa Lpara estimar los sımbolos enviados.

La cascada del filtro apareado y el ecualizador se analiza muchas veces como unsolo filtro.

Los ecualizadores FSE tiene ventajas y desventajas respecto de los ecualizadoresBRE. La desventaja principal es que se requieren mas taps en general y por tantoaumentan los requerimientos de memoria a medida que aumenta L. Sin embargo,algunas ventajas son muy importantes.

En primer lugar, el FSE exhibe una mayor inmunidad a los errores debidos ala sincronizacion temporal. En el caso de los ecualizadores BRE si hay un error deestimacion temporal, se asumira que se muestrea la senal x(t) en los tiempos kTs+ τ0

x(kTs + τ0) =∑j

a[j]h(kTs + τ0 −mTs) + w(kTs + τ0) (10.117)

270

Page 271: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

El espectro de frecuencia de la senal muestreada sera entonces:

Xd(ejΩ) = Ad(e

jΩ)∑k

H(Ω2π + k

Ts)e(j(Ω+2kπ)

τ0Ts

) (10.118)

Si se observa la transferencia periodica del canal muestreado y se piensa en unpulso con exceso de ancho de banda, es posible que para ciertos valores de Ω en el

entorno de π y error de sincronizacion τ0 que H( Ω2πTs

)e(jΩτ0Ts

) y H(Ω2π−1

Ts)e(j(Ω+2π)

τ0Ts

)

sumen cero o aproximadamente cero, haciendo practicamente imposible ecualizar sinamplificar el ruido.

Diferente es el caso de muestrear la senal recibida cada un tiempo T′< Ts

1+α dondeα es el exceso de ancho de banda.

En este caso los terminos de la sumatoria H(Ω2π+k

T ′)e

(j(Ω+2kπ)

τ0

T′

)no se solapan.

Por lo tanto el ecualizador FSE para compensar el error en la sincronizacion temporallo puede hacer solo con una compensacion de fase y el problema que existan frecuenciasen que la transferencia se anule no aparece.

La otra ventaja importante es la siguiente. Como se vio anteriormente para com-pensar perfectamente un canal modelado como un filtro FIR en el caso de ecualiza-dores BRE es en general necesario utilizar un filtro IIR, que no es implementable ypor tanto se utilizan aproximaciones con filtro FIR pero que generan una distorsionresidual. Por el contrario, con ecualizadores FSE es posible ecualizar completamenteun canal FIR con un ecualizador FIR.

x(kTs/L) =∑j

a[j]h(kTs/L− jTs) + w(kTs/L) (10.119)

definiendo h(kTs/L) = hL[k], w(kTs/L) = wL[k], x(kTs/L) = xL[k] la ecuacionanterior se puede escribir de la siguiente forma:

xL[k] =∑j

a[j]hL[k − jL] + wL[k] (10.120)

Si se supone que se utiliza un filtro ecualizador QL y que a la salida del ecualizadorse sub-muestrea para volver a tener una muestra por sımbolo (a[k]). La transferenciadesde a[k] hasta a[k], es

V (z) = HL(z)QL(z)|↓L (10.121)

Esta es la funcion que genera la distorsion en ausencia de ruido. El objetivo seralograr un ecualizador QL(z) que sea implementable como un filtro FIR tal que:

V (z) = HL(z)QL(z)|↓L = 1 (10.122)

Para disenar un ecualizador de este tipo se puede por ejemplo plantear las ecua-ciones MSE como se hizo para el ecualizador de tasa de sımbolo y se llega a ecuacionessimilares.

271

Page 272: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Tambien existe un procedimiento alternativo para disenar este filtro. Para en-tender este procedimiento es necesario entender un Teorema de Euclıdes que en sudemostracion plantea una metodologıa que sera de utilidad para disenar el filtro.

10.6. Ecualizadores adaptivos

En los ecualizadores vistos anteriormente, se asume que se conoce el canal, que estees invariante en el tiempo y a partir de esta informacion se disenan los ecualizadores.En general, no es cierto que se conozca la respuesta del canal, por lo que en la practicalo que se hace es estimar el canal. Para hacerlo es necesario que se envıe informacionconocida por fuente y receptor. Para esto muchos sistemas contienen prefijos queanteceden a los mensajes o que se envıan periodicamente para realizar esta estimacion.El envıo periodico es necesario ademas porque el canal en general no es invariante enel tiempo. Por lo tanto, es necesario que el ecualizador se adapte a las variaciones delcanal. Existen diversos metodos para hacer ecualizacion adaptiva al canal. En estaseccion veremos algunos ejemplos. El planteo general de muchos de estos metodoses formular el problema de ecualizacion como el problema de minimizacion de unafuncion de costo J (q). Posteriormente se buscara dinamicamente utilizar un algoritmoiterativo como el algoritmo del gradiente para encontrar el mınimo de esta funcion.El empleo de un algoritmo iterativo hace que si el canal se modifica este algoritmodeberıa converger hacia el nuevo mınimo. En general como se dijo para minimizaresta funcion se utilizara una secuencia de datos conocidos enviados por la transmisor.Ahora bien, en muchos sistemas no es posible enviar datos para realizar la estimaciondel canal. En estos casos se utilizan tecnicas conocidas como ecualizacion a ciegas(blind equalization BEQ). Se vera en primer lugar una tecnica adaptiva que asumela existencia de una secuencia de datos conocida y utiliza mınimos cuadrados (LeastMean Square, LMS). Posteriormente se estudiara una tecnica de ecualizacion a ciegasdenominada Constant Modulus Algorithm (CMA).

10.6.1. Algoritmo adpativo LMS

Se considera la siguiente funcion de costo:

J (q) = E[(a[k]− a[k])(a∗[k]− a∗[k])] (10.123)

a[k] =

K∑j=−K

q[j]x[k − j] (10.124)

= q′x(k) (10.125)

x(k) = (x(k +K), .., x(k), .., x(k −K))′ (10.126)

Con la anterior expresion, se puede calcular el gradiente del costo:

272

Page 273: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

J (q) = E[e[k]e∗[k]] (10.127)

∇qJ (q) = ∇qE[(a[k]− a[k])e∗[k]] (10.128)

= −E[x(k)e∗[k]] (10.129)

y el algoritmo en este caso serıa

qt+1 = qt + βE[x(k)e∗(k)] (10.130)

Se deben realizar dos observaciones.La primera es que se debe tener cuidado al derivar una funcion compleja respecto

de una variable compleja (los taps q pueden ser complejos). La definicion de diferen-ciacion en los complejos hace por ejemplo que no exista la derivada ∂z∗

∂z , siendo estauna funcion muy simple.

Habitualmente en calculo complejo se trabaja sobre funciones analıticas dondeesta bien definido el diferencial complejo. Sin embargo, en este problema podemos verla necesidad de obtener extremos de funciones que no son analıticas. Para el estudiode extremos de funciones reales de variables complejas, se puede realizar una gene-ralizacion del concepto de diferenciacion compleja. La idea es considerar las funcionesde variable compleja f(z, z∗) como funciones de R2− > R y utilizar una extensionde la definicion de derivada definiendo la derivada-R de una funcion real de variablecompleja como: ∂f(z,z∗)

∂z |z∗=cte y la derivada-R conjugada de una funcion real de va-

riable compleja como ∂f(z,z∗)∂z∗ |z=cte. Estas definiciones tiene la propiedad importante

de coincidir en el caso de funciones analıticas con la definicion de diferencial complejo.Se prueba que a la condicion necesaria y suficiente para que una funcion real de

variable compleja f(z) = f(x, y), z = x+ iy tenga un punto estacionario con respectoa los parametros reales r = (x, y) ∈ R2 es que su R-derivada se anule. Quien quieraprofundixar y formalizar en este aspecto puede consultar el trabajo [3] y las referenciasque el contiene.

Para el calculo del gradiente anterior se utilizo la derivada-R.La segunda observacion es que la ecuacion 10.130 requiere el calculo de valores

esperados que sin conocimiento del canal es muy difıcil de hacer en la practica. Lo quehabitualmente hace en el algoritmo LMS es aproximar ese valor esperado simplementepor: x(k)e(k) y el algoritmo es un algoritmo de gradiente estocastico que tiene lasiguiente forma simple:

qt+1 = qt + βx(k)e∗[k] (10.131)

10.6.2. Ecualizacion a ciegas: Algortimo CMA

La pregunta que origina el area de ecualizacion a ciegas (blind equalization) es sies posible ecualizar la senal recibida sin tener informacion del canal ni una muestrade entrenamiento conocida por el transmisor y el receptor. Lo unico que se asumeconocido es alguna estadıstica de los sımbolos que se envıan.

273

Page 274: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Se trabajo mucho empıricamente desde hace muchos anos en lograr ecualizadoresde este tipo a partir de proponer funciones que minimizaran algun costo que tengaen cuenta la diferencia en alguna propiedad estadıstica de los sımbolos transmitidosy recibidos.

El primer resultado teorico relevante para comprender este problema se presenta enel trabajo de los anos 80 de Benviste et al. [4]. En este trabajo los autores demuestranque la condicion suficiente para la ecualizacion total de una senal sin ruido (ZF) eslograr que la distribucion de los sımbolos de salida sea igual a la de los sımbolos deentrada.Sin embargo, esta propiedad es poco util en la practica porque lograr ecualizarla distribucion no es un trabajo en general simple.

Sin embargo, uno de los trabajos que mas ha aportado en este tema, es un trabajode Shalvi et al. de los anos 90 [5]. En este trabajo se prueba que para la ecualizaciontotal de un canal sin ruido, la condicion necesaria y suficiente es que se cumplan lassiguientes dos propiedades estadısticas entre los sımbolos de entrada a[k] y salida b[k]

E[|b|2] = E[|a|2] (10.132)

K(b) = K(a) (10.133)

donde K(.) es la funcion de Kurtosis de un proceso definida como

K(a) = E[|a|4]− 2E2[|a|2]− |E[a2]|2 (10.134)

La funcion de Kurtosis de una distribucion de probabilidad tiene un significadointuitivo en estadıstica. El ındice de Kurtosis refleja el grado de concentracion de losvalores de la densidad en la region central de la misma. A mayor ındice de Kurtosismas puntiaguda es la densidad y cuanto menor mas aplanada es la densidad. Ladistribucion normal tiene ındice de Kurtosis 3 y por eso muchas veces en la definiciondel ındice de Kurtoss de la ecuacion 10.134 se le resta 3 para que las de ındice posisitvosean mas puntiagudas que la normal y las con ındice negativo mas aplanadas que lanormal.

La condicion a la que se llega en este trabajo sı tiene sentido practico porque ahorase deben igualar dos propiedades de la distribucion y no toda la funcion.

Se vera con mas precision lo que se prueba en dicho artıculo a continuacion.Sea v[k] = h[k] ∗ q[k] la respuesta al impulso del canal y el ecualizador. Sea a[k]

y a[k] la entrada al canal y la salida del ecualizador. Se asume que la secuencia deentrada a[k], es una secuencia de variables aleatorias (discretas o continuas), i.i.d.,con media cero y distribucion de probabilidad arbitraria, que existen los momentoshasta orden cuatro y que K(a) 6= 0.

Se busca que

v[k] = ejθ(0, 0, .., 0, 1 , 0, .., 0)

↑ m (10.135)

Es decir que la respuesta al impulso del sistema incluyendo el ecualizador sea unaδ. Mas precisamente se busca que no modifique la senal de entrada a menos de undesfasaje θ y un retardo m.

274

Page 275: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

A partir de que a[k] = v[k]∗a[k] y de que la secuencia de entrada es i.i.d. se puedeprobar simplemente operando que:

E[|a[k]|2] = E[|a[k]|2]∑j

|v[j]|2 (10.136)

K(a[k]) = K(a)∑j

|v[j]|4 (10.137)

Hay que observar que el ındice k en las ecuaciones anteriores es innecesario porquela secuencia es i.i.d.

Teorema 10.4 (Shalvi y Weinstein). Si E[|a|2] = E[|a|2] entonces:1) K(a) ≤ K(a)2) K(a) = K(a) si y solo si la respuesta al impulso del sistema ecualizado v[k]

verifica 10.135.Prueba:Sea v un vector tal que

∑j |v[j]|2 < K <∞. Entonces,

∑j

|v[j]|4 ≤ (∑j

|v[j]|2)2 =∑j

|v[j]|4 + 2∑j

∑l

|v[j]|2|v[l]|2 (10.138)

y para que se cumpla la igualdad todos los dobles productos del desarrollo de la partederecha de la ecuacion deben ser cero. Para que esto se cumpla solo una componentedel vector puede ser no nula. Por lo tanto si

∑j |v[j]|2 = 1 entonces:

a)∑j |v[j]|4 ≤ 1.

b)∑j |v[j]|4 = 1 si y solo si v tiene una sola componente no sula y de valor 1.

De estas conclusiones la tesis del teorema queda probada utilizando las ecuaciones10.136 y 10.137 .

A partir de este teorema es facil ver que es posible formular la ecualizacion comoun problema de optimizacion:

max K(a[k]) (10.139)

sujeto a : (10.140)

E[|a[k]|2] = E[|a[k]|2] (10.141)

En el mencionado artıculo luego de diversas transformaciones de este problemade optimizacion con restricciones se concluye que dicho problema es equivalente alsiguiente problema de optimizacion sin restricciones:

mın

((|a[k]|2 − E[|a[k]|4]

E[|a[k]|2]

)2)

(10.142)

Diez anos antes de esta publicacion Godard [6] propuso la siguiente funcion decosto (la denomino funcion de dispersion) para realizar ecualizacion a ciegas:

D(p) = E[|a[k]|p −Rp]2 (10.143)

275

Page 276: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

donde Rp es alguna constante de la estadıstica de los sımbolos. Propuso minimizaresta funcion para ecualizar.

A partir del calculo del gradiente de la dispersion observo que el gradiente seanulaba cuando

Rp =E[|a[k]|2p]E[|a[k]|p]

(10.144)

En particular el caso mas utilizado fue el de p = 2, y a este metodo se le llamoCMA (“constant modulus algorithm”). En este caso la funcion de dispersion queda:

R2 =E[|a[k]|4]

E[|a[k]|2](10.145)

Si los sımbolos tienen modulo constante (QPSK por ejemplo), entonces minimizarla dispersion equivale a ecualizar el modulo de los sımbolos recibidos : |a(k)| =

√R2.

Sin embargo, se observo que este ecualizador funcionaba bien aun para constelacionesque no tuvieran modulo constante. La explicacion formal de esto como ya vimos, ladieron Shalvi et al. al demostrar que minimizar la dispersion D2 equivale a ecualizarel el valor esperado del modulo al cuadrado y la funcion de Kurtosis que como se vioes condicion necesaria y suficiente para ecualizar ZF el canal.

Definida la dispersion :

D(2) = E[|a[k]|2 −R2]2 (10.146)

a[k] = q′x(k) (10.147)

Se puede calcular el gradiente de esta funcion de costo con respecto al vector delos taps del ecualizador q y aplicar el algoritmo del gradiente:

∇qD(2) = 2E[(a[k]|2 −R2)a[k]∗x(k)] (10.148)

qt+1 = qt − µ(a[k]|2 −R2)a[k]∗x(k) (10.149)

donde en la ultima ecuacion al igual que en el algoritmo LMS se elimino el valoresperado y se utiliza un algoritmo de gradiente estocastico.

Ejercicio 10.6. La ecuacion 10.149 la implementa GnuRadio en el bloque CMA.Este bloque tiene como parametros la cantidad de taps del ecualizador, el parametroµ (ganancia), y el modulo o valor R2 en la ecuacion. El parametro mu debe ser unvalor suficientemente pequeno para que converja el algoritmo. En general µ = 0,01 esun valor recomendado.

Ecualizar el sistema del ejercicio C.3 parte C. utilizando un bloque CMA de gnu-radio en lugar del filtro utilizado en dicho ejercicio. Estudiar como varıa la ecualiza-cion al variar el numero de taps: 3,7,11,21,31 por ejemplo. Estudiar la sensibilidadrespecto de µ.

276

Page 277: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Apendice C

Material complementario

C.1. Prueba de Teoremas

C.1.1. Teorema 10.2.

Demostracion. La transformada de Fourier de la salida del filtro de recepcion sera:

Sd(ej2πfTs)H(f)Hrx(f) = Sd(e

j2πfTs)|H(f)|2 (C.1)

La Trasformada de Fourier de la senal discreta xd[n] es por lo tanto,

Xd(ejΩ) =

Sd(ejΩ)

Ts

∑k

∣∣∣∣∣H(

Ω2π + k

Ts

)∣∣∣∣∣2

(C.2)

Ahora debemos distinguir dos casos.

Caso 1. El mas simple es cuando la sumatoria del termino de la derecha de laecuacion C.2 es diferente de cero para todo Ω. En ese caso se puede reconstruir lasenal s[n] pasando la salida del muestreador por un filtro digital de transferencia:

Dd(ejΩ) =

1

Ts

∑k

∣∣∣∣∣H(

Ω2π + k

Ts

)∣∣∣∣∣2−1

(C.3)

Ejercicio C.1. (Opcional). ¿Una transferencia H(f) como la mostrada en la figuraC.1 corresponde al caso 1? ¿porque? Observar que dicha transferencia es un pasabajopero con ceros para algunas regiones de frecuencia en el reango [−Ts/2, Ts/2].

Caso 2. El segundo caso es cuando la sumatoria del termino de la derecha de laecuacion C.2 es cero para algunos valores de Ω.

En ese caso se define,

277

Page 278: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura C.1: Transferencia con ceros

Dd(ejΩ) =

(

1Ts

∑k

∣∣∣H ( Ω2π+k

Ts

)∣∣∣2)−1

si H( Ω2πTs

) 6= 0

0 en otro caso

Cundo H( Ω2πTs

) > 0 para algun Ω entonces para esos Ω la sumatoria de la derechaes positiva y el inverso esta bien definido.

La senal discreta xd[n] se pasa por el filtro Dd(ejΩ). La senal obtenida luego de

este filtrado sera

Yd(ejΩ) = Xd(e

jΩ)Dd(ejΩ) (C.4)

=

Sd(ejΩ)Dd(ejΩ)

Dd(ejΩ) si H( Ω2πTs

) 6= 0

0 en otro caso(C.5)

=

Sd(e

jΩ) si H( Ω2πTs

) 6= 0

0 en otro caso(C.6)

y luego se convierte a tiempo continuo se pasa por el filtro H(f). La senal recons-truida sera:

Y1(f) =

Sd(e

j2πfTs)H(f) si H(f) 6= 00 en otro caso

(C.7)

= RLP (f) (C.8)

donde RLP (f) es la T de F de la senal recibida del canal en equivalente pasabajo.

C.1.2. Teorema 10.3

Demostracion. Primero se probara que 2) implica 1). Supongamos por absurdo que lash(t−kTs) son linealmente dependientes y se cumple la condicion 2). Si son linealmentedependientes, entonces existirıa un conjunto de coeficientes λk no nulos tales que:∑

k

λkh(t− kTs) = 0 ∀t (C.9)

278

Page 279: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Tomando Transformada de Fourier, esto implica que Λd(ej2πfTs)H(f) = 0 ∀f ,

siendo Λd(ejΩ) la T de F discreta de la senal discreta λk. Por lo tanto:

∣∣Λd(ej2πfTs)∣∣2∑k

∣∣∣∣H (f +k

Ts

)∣∣∣∣2 = 0 ∀f (C.10)

Como Λd(ej2πfTs) es la T.F. de una secuencia no nula, entonces debe ser diferente

de cero en alguna region fa ≤ f ≤ fb. Por lo tanto, la sumatoria de C.10 debe seridenticamente nula en esa region de f , lo cual es absurdo porque se habıa supuestoque la condicion 2) era cierta. De donde, si la sumatoria es diferente de cero para todof las h(t− kTs) deben ser linealmente independientes.

Veamos ahora que 1) implica 2). Asumamos independencia lineal y por tanto quela parte izquierda de la ecuacion C.10 debe ser mayor que cero en alguna region paratoda secuencia de λk. Como Λ(ej2πfTs) es la T.F. de una secuencia no nula, entonceses no nula en alguna region de frecuencias y como se debe cumplir para cualquiersecuencia, se puede elegir secuencias cuya T. de F. se concentren en una region defrecuencia arbitrariamente pequena y de allı concluir que 2) debe cumplirse.

Por lo tanto, 1) y 2) son equivalentes. Veamos la equivalencia entre 2) y 3). Porun lado, si se cumple 3) al no existir una tal region A para todo f al menos uno de losterminos de la sumatoria de 2) es positivo y por lo tanto la suma es positiva para todof . Es decir, 3) implica 2). Por otro lado, si 3) no se cumple, entonces hay una regionde frecuencias donde todos los terminos de la sumatoria de 2) son nulos y por lo tanto2) no se cumple. De ambas conclusiones se deduce que 2) y 3) son equivalentes.

C.2. Bases ortonormales y filtro blanqueador

Se vio que si la T. de F. del canal (canal + filtro de transmision) cumple lacondicion 2) del Teorema 10.3, las funciones h(t− kTs) forman una base de funcioneslinealmente independientes de un sub-espacio de L2.

La pregunta que se plantea ahora es como hacer que esa base sea una base orto-normal. En la hipotesis que H(f) cumple la condicion 2) del Teorema 10.3 se definela siguiente funcion:

Hort(f) =1

Ts

∑k

∣∣∣∣H (f +k

Ts

)∣∣∣∣2 (C.11)

y se construye un nuevo filtro de transferencia Hnew(f) de la siguiente forma:

Hnew(f) =H(f)√Hort(f)

(C.12)

Se vera que Hnew verifica la siguiente propiedad:

279

Page 280: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

1

Ts

∑k

∣∣∣∣Hnew

(f +

k

Ts

)∣∣∣∣2 = 1 (C.13)

Para eso sustituimos la definicion de Hnew,

1

Ts

∑k

∣∣∣∣∣∣H((f + k

Ts

))√

Hort(f + kTs

)

∣∣∣∣∣∣2

=1

Ts

1

Hort(f)

∑k

∣∣∣∣H(

(f +

k

Ts

))

∣∣∣∣2 (C.14)

Para obtener la ultima igualdad, se debe observar que por construccion Hort(f)es una senal periodica de perıodo 1

Ts. Por lo tanto, en cada termino de la sumatoria

del lado izquierdo de la igualdad, el denominador es la misma funcion de f y comoconsecuencia se lo puede sacar como factor comun. La ecuacion C.13 se deduce de laanterior solamente aplicando la definicion de Hort(f) de la ecuacion C.11.

La ecuacion C.13 se puede escribir en el dominio del tiempo hnew(t)∗h∗new(−t)|t=kTs =δ(k), o lo que es lo mismo:

∫hnew(t)h∗new(t− kTs)dt = δ(k) (C.15)

o lo que es lo mismo:

∫hnew(t−mTs)h∗new(t− kTs)dt = δ(m− k) (C.16)

es decir que las funciones hnew(t− kTs) forman un conjunto ortonormal.Resumiendo, si la T. de F. del canal (canal + filtro de transmision) cumple la

condicion 2) del Teorema ??, las funciones h(t − kTs) forman una base de funcioneslinealmente independientes de un sub-espacio de L2. Si ademas, se modifica h y seconstruye hnew como se explico antes se tiene una base ortonormal.

Se debe observar que si se utiliza como filtro de recepcion prx(t) = h∗new(−t) elsubespacio generado por hnew(t − kTs) y por prx(t − kTs) son iguales y ambas sonbases ortonormales de ese espacio.

Este filtro es la concatenacion de dos filtros, cuya respuesta en frecuencia es:Hrx(f) = H∗(f) 1√

Hort(f). Si en el canal ingresa ruido blanco, a la salida del filtro

H∗(f) el ruido no es blanco y las muestras obtenidas luego del filtro apareado no sonblancas. Ahora bien, si luego del filtro H∗(f) se utiliza el filtro 1√

Hort(f), las muestras

que se obtienen son de ruido blanco y por eso este filtro se denomina blanqueador.Si se utiliza como filtro de recepcion el antes mencionado,y en el canal ingresa ruidoblanco de potencia de ruido N0, la potencia espectral del ruido de las muestras a lasalida del filtro Hrx(f) sera,

Sww(ejΩ) = N01

Ts

∑k

∣∣∣∣∣Hrx

(Ω2π + k

Ts

)∣∣∣∣∣2

(C.17)

280

Page 281: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

El ruido sera blanco si y solo si Sww(ejΩ) = c, con c una constante arbitraria. Conla definicion dada de Hrx(f) = H∗(f) 1√

Hort(f)se cumple que Sww(ejΩ) = 1 y por

lo tanto el ruido luego del filtro apareado H∗(f), del muestreo y de pasarlo por elblanqueador 1√

Hort(f)es blanco y gaussiano. Esto se utiliza habitualmente cuando se

necesita que el ruido sea blanco para aplicar alguna tecnica como por ejemplo maximaverosimilitud para decidir los sımbolos que fueron enviados a partir de lo recibido. Enla siguiente seccion se vera la estimacion por maxima verosimilitud de secuencias esoptima en un sentido que se precisara en el caso de ruido blanco gaussiano. Antes definalizar se proponen los siguientes ejercicios.

Ejercicio C.2. (Opcional). Se consideran los siguientes filtros de recepcion. Indicaren cada caso si cumplen la condicion de ortogonalidad vista y si no lo cumplen, versi es posible ortonormalizarlo y en caso que sea posible explicitar el filtro ortonorma-lizado.

a)

Hrx(f) =

1 −1

2Ts≤ f ≤ 1

2Ts0,1 1

2Ts≤ |f | ≤ 1

Ts0 en otro caso

(C.18)

b)

Hrx(f) =

1 0 ≤ |f | ≤ 0,9

2Ts0 en otro caso

(C.19)

c) Hrx(f) = 11+jf

C.3. Ecualizadores fraccionales y Teorema de Euclıdes

C.3.1. El Teorema de Euclıdes

Se recordara antes de proseguir algunas propiedades que se utilizaran en estaseccion y el Teorema de Euclides que servira para disenar el ecualizador.

En primer lugar se recuerdan las siguientes propiedades del downsampling y elupsampling.

X(z)|↓L =1

L

L−1∑k=0

X(z1/Le−j2πk/L) (C.20)

X(z)|↑L = X(zL) (C.21)

Tambien se recuerda las descomposiciones polifasicas de un filtro H(z)

H(z) =

M∑k=0

z−kRk(zM ) tipo 1

M∑k=0

zkEk(zM ) tipo 2

(C.22)

281

Page 282: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Por ultimo enunciaremos el teorema de Euclides para polinomios, que se utilizaramas adelante. Se enunciara para dos polinomios por simplicidad pero es sencillo ge-neralizarlo y ademas se estudiara la demostracion ya que es constructiva y de ellase puede construir la solucion al problema de diseno del ecualizador que se vera masadelante.

Teorema C.1 (Teorema de Euclıdes). Se consideran dos polinomios de grado N0 yN1:

R0(x) =

N0∑n=0

r0[n]xn , R1(x) =

N1∑n=0

r1[n]xn (C.23)

Por hipotesis se asumira que estos dos polinomios no tienen raıces comunes degrado > 0. Entonces existe un unico par de polinomios

E0(x) =

N1−1∑n=0

e0[n]xn , E1(x) =

N0−1∑n=0

e1[n]xn (C.24)

tales que,

R0(x)E0(x) +R1(x)E1(x) = 1 ∀x (C.25)

Observar que los polinomios Ei(x) son de grado menor que el Rj(x). Si se dejalibre el grado de los polinomios y se permite que sean de grado superior se puedenencontrar infinitos que verifiquen la igualdad.

Prueba:

La ecuacion de la tesis del Teorema se puede escribir como un conjunto de ecua-ciones para cada grado del polinomio. Para el grado 0, esta ecuacion debe ser igual a1 y para todos los demas igual a 0.

Las ecuaciones tendran la forma

r0[0]e0[0] + r1[0]e1[0] = 1 , para grado 0

r0[1]e0[0] + r0[0]e0[1] + r1[1]e1[0] + r0[0]e1[1] = 0 , para grado 1N∑n=0

e0[n]r0[N − n] +

N∑n=0

e1[n]r1[N − n] = 0 , para grado N > 0

(C.26)

282

Page 283: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

r0[0] 0 ... 0r0[1] r0[0] ... 0

0 0 ... r0[N0]

e0[0]e0[1]...

e0[N1 − 1]

+

r1[0] 0 ... 0r1[1] r1[0] ... 0

0 0 ... r1[N1]

e1[0]e1[1]...

e1[N0 − 1]

(C.27)

=

10...0

(C.28)

(C.29)

es decir que se puede escribir matricialmente como

R0e0 + R1e1 = u (C.30)

Esto se puede escribir tambien concatenando las matrices y los vectores de la forma:

(R0 R1

)(e0

e1

)= u

(C.31)

La matriz R =(R0 R1

)es ahora una matriz cuadrada de dimension N0 + N1

y el vector e =

(e0

e1

)es un vector de dimension N0 + N1. Por lo tanto existira un

unico e solucion de

Re = u (C.32)

si la matriz R es invertible, es decir si es no singular. Si por absurdo se asume queefectivamente existe un vector e 6= 0 tal que Re = 0. Por lo tanto, existirıan E0(x) yE1(x) en las hipotesis del teorema tales queda

R0(x)E0(x) +R1(x)E1(x) = 0 (C.33)

R0(x)E0(x) = −R1(x)E1(x) (C.34)

Como R0(x) y R1(x) no tiene factores comunes, esto implica que E1(x) debecontener todos los factores de R0(x) lo cual es absurdo por la condicion de los gradosde ambos polinomios.

283

Page 284: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Algunas observaciones sobre el Teorema anterior. En primer lugar, que sucede silos polinomios tienen factores comunes. Es decir, por ejemplo si R0(x) y R1(x) tienefactor comun G(x). Este factor sera comun a a la suma de R0(x)E0(x) +R1(x)E1(x)y por lo tanto esta suma no podra ser igual a 1. Por lo tanto, la condicion equivalea decir que el maximo comun divisor (mcd) de R0(x) y R1(x) debe ser 1. Si elmcd(R0(x), R1(x)) = G(x), entonces el teorema se aplica pero para probar que existenlos dos polinomios que verifican R0(x)E0(x) +R1(x)E1(x) = G(x).

La ultima observacion corresponde a que sucede si se tienen mas de dos polinomios.Se analizara el caso de 3 y la generalizacion del procedimiento sigue de este caso. Si seasume que los tres no tienen factores comunes pero que por ejemplo para dos de ellosse cumple que mcd(R0(x), R1(x)) = G(x). Entonces, el teorema anterior dice que exis-ten y son unicos dos polinomios que verifican R0(x)E0(x)+R1(x)E1(x) = G(x). Al noexistir factores comunes entre los tres polinomios entonces el mcd(G(x), R2(x)) = 1.Por lo tanto el teorema anterior establece que G(x)A0(x) +R2(x)A1(x) = 1. Sustitu-yendo se llega a que: R0(x)E0(x)A0(x) +R1(x)E1(x)A0(x) +R2(x)A1(x) = 1.

C.3.2. Diseno de ecualizadores FSE con filtros FIR

En lo que sigue expresaremos el canal y el ecualizador por sus formas polifasicas.

HL(z) =

L−1∑k=0

z−kRk(zL) (C.35)

QL(z) =

L−1∑k=0

zkEk(zL) (C.36)

Teorema C.2. Dado un canal FIR HL(z) =∑Nn=0 cL[n]z−n, existe un filtro FIR

QL(z) tal que cumple:

V (z) = HL(z)QL(z)|↓L = 1 (C.37)

si y solo si todos los componentes Rk(x) del filtro HL(z) no tienen ningun factorcomun de la forma (1− az−1) con a 6= 0

Prueba:

El producto del canal y el ecualizador se puede escribir:

HL(z)QL(z) =

L−1∑k=0

z−kRk(zL)

L−1∑l=0

zlEl(zL) (C.38)

=

L−1∑m=−L+1

zmAm(zL) (C.39)

donde la ultima sumatoria surge de ordenar los productos de las otras dos adecua-

284

Page 285: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

damente. Por otra parte se puede observar a partir de esta ultima expresion que:

HL(z)QL(z))|↓L =

L−1∑m=−L+1

zmAm(zL))|↓L (C.40)

= A0(z) (C.41)

=

L−1∑l=0

Rl(z)El(z) (C.42)

Si los Rk(z) no tienen factores comunes como los referidos en la hipotesis entoncespor el Teorema de Euclıdes existen un conjunto unico de Ek(z) que verifican que

L−1∑l=0

Rl(z)El(z) = 1 (C.43)

HL(z)QL(z))|↓L = 1 (C.44)

lo cual es la tesis del Teorema. Podrıa suceder que los polinomios Ek(z) tuvieran unfactor comun de la forma z−J , pero esto puede solucionarse encontrando un conjuntode polinomios con un factor comun zJ .

Ejemplo C.1. Sea L=2 y el canal

HL(z) = 1 + 2z−1 + 4z−2 + z−3 + z−5 (C.45)

Por lo tanto,

R0(z) = 1 + 4z−1 , R1(z) = 2 + z−1 + z−2 (C.46)

la ecuacion matricial correspondiente al teorema de Euclides serıa

1 0 24 1 10 4 1

e0(0)e0(1)e1(0)

=

100

(C.47)

El determinante de la matriz vale 29 y alcanza con encontrar el valor de la primerafila de la inversa que es,

1

29

−3 .. ..−4 .. ..16 .. ..

Por lo tanto,

E0(z) =−3− 4z−1

29, E1(z) =

16

29(C.48)

Por lo tanto, el ecualizador sera Por lo tanto,

Q2(z) = E0(z2) + zE1(z2) =16z − 3− 4z−2

29(C.49)

285

Page 286: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Ejercicio C.3. (Opcional). Se considera un transmisor canal y receptor que trabajacon BPSK, a dos muestras por sımbolo y donde el canal tiene una transferencia :HL(z) = 1 + 2z−1 + 4z−2 + z−3 + z−5

a) Urilizar como ecualizador el filtro FIR que se diseno en el ejemplo anterior.Implementar el sistema Tx-Canal-Rx en GnuRadio utilizando el archivo que se ad-junta a estas notas para este ejercicio. Verificar primero la constelacion y la respuestaen frecuencia solo con el canal y luego con el canal y el ecualizador.

b) Agregar al modelo anterior en GnuRadio el pulso de Tx y Rx RRC. Con estospulsos, el canal y el ecualizador, ¿se logra ecualizar correctamente el sistema? ¿porque?

c) Considere ahora el sistema con los pulsos RRC de Tx y Rx y un canal contransferencia C(z) = 1 − αz. Los pulsos RRC modelaran con un filtro FIR en elCompanion y para simplificar las operaciones se utilizaran solo tres taps. Los tres tapsde un RRC son aproximadamente 0,5, 1, 0,5 multiplicados una constante de ganancia,que se considerara que vale 0.25. Disene un ecualizador para el conjunto pulso Rx,Canal, pulso Tx. Implemente el sistema en el Companion y verifique que ecualizacorrectamente.

286

Page 287: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Bibliografıa

[1] Automatic Equalization for Digital Communications, R.W. Lucky, The Bell Sys-tem Technical Journal, 1965.

[2] Signal Processing and optimization for transceiver systems, P. P. VAIDYANAT-HAN, SEE-MAY PHOONG, YUAN-PEI LIN, Cambridge University Press , 2010

[3] The Complex Gradient Operator and the CR-Calculus, Ken Kreutz–Delgado,http://arxiv.org/pdf/0906.4835.pdf, June 25, 2009.

[4] Robust identification of a nonminimum phase system: Blind adjustment of alinear equalizer in data communication, A. Benveniste, M. Goursat, and G.Ruget, IEEE Trans. Automatic Control, vol. AC-25, no. 3, pp. 385-399, June1980

[5] New Criteria for Blind Deconvolution of Nonminimum Phase Systems (Chan-nels), O. Shalvi and E.Weinstein, IEEE Transactions Information Theory, vol.36, pp. 312-321, March 1990

[6] Self-Recovering Equalization and Carrier Tracking in Two-Dimensional DataCommunications Systems, D. N. Godard, IEEE Transactions on Communica-tions, vol. COM-28, pp. 1867-1875, Nov. 1980.

[7] Digital Communication, Barry, John R., Lee, Edward A., Messerschmitt, Da-vid G., Originally published under Leww,E.A.;Messerschmitt,D.G., 3rd ed. 2003,XVII, 838 p. In 2 volumes,

287

Page 288: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

288

Page 289: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Capıtulo 11

Sistemas multiportadora yOFDM

11.1. Introduccion

En los sistemas vistos hasta ahora la senal en bandabase se modula en una por-tadora y se transmite. Si se quiere aumentar la tasa de bits por segundo en estossistemas en general es necesario aumentar el ancho de banda de la senal transmitida.Es decir, se puede aumentar el orden M en un sistema M-QAM hasta cierto puntopara mandar mas bits por sımbolo, pero luego es necesario si se desea aumentar lastasa de bits por segundo disminuir en ancho de pulso, lo que equivale a aumentarel ancho de banda de la senal transmitida. Como se estudio en el capıtulo sobre ca-nal inalambrico el multicamino genera el desvanecimiento de la senal (fading) y siel ancho de banda es mayor que la frecuencia de coherencia del canal, el fading esselectivo en frecuencia, es decir afecta de forma diferente a las diferentes frecuenciasde la senal. En el capıtulo sobre ecualizacion, se vieron tecnicas para reponerse delfading selectivo en frecuencia. El problema es que estas tecnicas muchas veces no sonsimples de implementar y no siempre se logra corregir totalmente el fading.

Por esta razon hace ya muchos anos se analizo la posibilidad de dividir la senalen N subsenales y cada una enviarla por un canal de banda suficientemente estrechapara que el fading en cada subcanal fuera plano. La idea es dividir el flujo de bitsque ingresan al sistema en N-subflujos, de forma que los bits se envıen en paralelo enel tiempo y no secuencialmente. Cada uno de estos N subflujos de bits se mapean enalguna constelacion y se forman N sub-senales bandabase. Para eso se utilizara unabase de funciones de la siguiente forma para construir la senal en banda base de cadasubcanal. La base de funciones estara compuesta de N senales de la forma:

Φk(t) = p(t)ej2πfkt (11.1)

Posteriormente se llevara a la frecuencia portadora a cada una de estas senalescomo es habitual, pero dejemos esa parte de momento y mas adelante veremos susdetalles. Por ahora concentraremos nuestra atencion en las senales en banda-baseconstruidas a partir del conjunto de senales anterior.

289

Page 290: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Se menciono anteriormente que el conjunto de funciones de la ecuacion 11.1 erauna base. En principio, salvo que se impongan condiciones adicionales este conjuntode funciones no tiene por que ser ortogonales. Como se recuerda la ortogonalidad esla clave que permita luego proyectar en recepcion para recuperar la senal enviada.

La primera idea que se planteo para lograr la ortogonalidad es la siguiente. Sesupone que para transmitir a una tasa R de bits por segundo, el ancho de banda lasenal con una portadora es B en pasabanda. Este B se asume que es mayor que lafrecuencia de coherencia del canal pero BN = B/N es mucho menor que la frecuenciade coherencia del canal. Entonces, se podrıa usar un conjunto de pulsos p(t) de anchode banda limitado a BN en pasabanda y un conjunto de frecuencias para la base dela forma fk+1 = fk + B/N . De esta forma no habrıa solapamiento entre subcanales,cada subcanal podrıa transmitir a una tasa R/N con un ancho de banda B/N (la tasatotal serıa R), tener fading plano y en el receptor con un filtro pasabanda centradoen cada portadora se podrıa recuperar la senal transmitida.

La propuesta anterior sin embargo tiene muchos defectos. En primer lugar, en larealidad no es cierto que los pulsos vayan a ser de banda acotada a BN ya que lospulsos son de duracion finita por lo cual habra superposicion en frecuencia. Esto llevaa la necesidad de hacer dos cosas. Por un lado, usar un ancho de banda adicional deguarda entre cada para de frecuencias fk. Esto lleva a que si hay N suportadoras sedeba incrementar el espectro en N veces esta cantidad lo cual hace realmente que sevuelva muy ineficiente en el consumo de ancho de banda. Por otro lado, para poderseparar bien en el receptor los subcanales se deben usar filtros de corte muy abruptolo cual complica el diseno. Ademas, si las senales de la base se implementan conun conjunto de N moduladores para llevar la senal a la frecuencia fk esto tambiencomplica el diseno. Se vera mas adelante que trabajando en tiempo discreto esteultimo inconveniente se puede resolver. Pero el problema de la eficiencia en el anchode banda hace pensar en buscar otro tipo de ortogonalidad en que los subcanalespuedan superponerse en frecuencia pero que continuen siendo ortogonales.

Para lograr esta ortogonalidad se elijen las senales tales que la diferencia entre dosfrecuencias cualesquiera del conjunto cumpla que fk − fj = nBN con n = 0, .., N1

siendo BN = B/N , con B el ancho total del canal. Sea Ts = 1/BN y se limita elsoporte temporal de las Φk(t) al intervalo (0, Ts). Por lo tanto el producto interno dedos funciones de la base Φ(t) sera:

1

Ts

∫ Ts

0

ej2πfkte−j2πfjtdt =1

Ts

∫ Ts

0

ej2π(fk−fj)tdt =1

Ts

∫ Ts

0

ej2πntTs dt =

sin(πn)

πn= δn

Es decir que el producto interno es cero para todo n, salvo para n = 0 que es 1 ypor lo tanto esta base es ortonormal. En adelante se considerara que fk = k/Ts comosecuencia de frecuencias que cumple con la propiedad de ortogonalidad.

Observar que el conjunto de funciones de esta base quedo de la forma :

Φk(t) =

1√Tsej2πfkt para 0 ≤ t ≤ Ts

0 en otro caso

(11.2)

Es decir que no hay pulso p(t) o el pulso es constante en el perıodo en que lafuncion no es cero. Si bien existen versiones de OFDM que utilizan pulso conformador,

290

Page 291: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

la version habitualmente utilizada no lo hace y en lo que resta del texto se trabajarade esta forma. Por lo tanto si se envıa un conjunto de sımbolos por el sub canal k, lasenal bandabase en ese subcanal sera de la forma:

sbk(t) =∑n

ak[n]Φk(t− nTs) (11.3)

Por lo tanto, la senal que se envıa y que involucra a los N subcanales sera

sb(t) =∑n

N−1∑k=0

ak[n]Φk(t− nTs) =1√Ts

∑n

N−1∑k=0

ak[n] rect

t− nTsTs

ej2πfk(t−nTs)

(11.4)

Si se considera que fk = k/Ts se obtiene

sb(t) =1√Ts

∑n

rect

t− nTsTs

N−1∑k=0

ak[n]ej2πk(t−nTs)

Ts (11.5)

sb(t) =1√Ts

∑n

rect

t− nTsTs

N−1∑k=0

ak[n]ej2πkTst (11.6)

Si se trabaja en tiempo discreto, existen varias ventajas en su implementacion.Por lo tanto, si la senal se muestrea cada T y se elije T = Ts/N entonces la senalbanda base a enviar en tiempo discreto sera:

sbn(mT ) =1

N

N−1∑k=0

ak[n]ej2πkmN (11.7)

donde para simplificar la ecuacion hemos considerado solo un sımbolo OFDM. Unsımbolo OFDM contendra un conjunto de N numeros complejos a0, a1, ..., aN−1donde cada uno sera el mapeo de un conjunto de bits. No necesariamente todos lossubcanales se mapean usando la misma constelacion. Es posible que el sımbolo aicorresponda a un punto de una constelacion BPSK y el aj a una 64QAM. De laecuacion anterior se desprende que la senal banda base en tiempo continuo sera:

sb(t) =N√Ts

∑n

rect

t− nTsTs

sbn(t) (11.8)

La observacion mas importante para implementar en tiempo discreto OFDM esque la ecuacion 11.7 corresponde a la inversa de la transformada discreta de Fourier(IDFT) de los puntos a0, a1, ..., aN−1.

La forma de implementar en tiempo discreto el modulador OFDM serıa como semuestra en la figura 11.1.

En el receptor la senal recibida sera r(t) = <(rb(t)ej2πfct) siendo rb la senal

compleja recibida en banda base. Luego de bajar la senal a banda base y pasarla

291

Page 292: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 11.1: Modulador y Demodulador OFDM

por el filtro pasabajo debemos recuperar los sımbolos enviados. La senal recibida enbanda base sera rb(t) = sb(t) + η(t), donde η(t) es el ruido introducido por el canal.Si se considera el n-esimo sımbolo OFDM y se lo muestrea cada tiempo T = Ts/N seobtiene

rbn(mT ) = sbn(mT ) + η(mT )

Si se consideran ahora las N muestras del sımbolo es decir :

rbn[0], rbn[1], ..., rbn[N − 1]y se le aplica la transformada discreta de Fourier a la salida se tendrıa:

xk[n] =

N−1∑m=0

sbn[m]e−j2πkmN + w(t)

xk[n] =1

N

N−1∑m=0

N−1∑i=0

ai[n]ej2πimN e−j2π

kmN + w(t)

xk[n] =1

N

N−1∑i=0

ai[n]

N−1∑m=0

e−j2π(k−i)mN + w(t) =

N−1∑i=0

ai[n]δ(k−i) + w(t) = ak[n] + w(t)

Por ultimo, sobre cada xk se toma la decision sobre el sımbolo a asignarle deacuerdo a la constelacion del k-esimo canal y se obtiene la estimacion de los sımbolosenviados ak.

292

Page 293: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

11.2. Efecto del canal e imperfecciones del receptoren OFDM

11.2.1. El prefijo cıclico

Antes de avanzar en analizar los problemas que genera un canal inalambrico enOFDM y las soluciones a los mismos repasaremos brevemente una propiedad de latransformada discreta de Fourier DFT. En particular es de interes recordar lo que esel la convolucion circular o cıclica y su DFT. Si se tienen dos secuencia de largo Nx[k] e y[k], la convolucion circular se define de la siguiente forma:

z[n] = x~ y =

N−1∑k=0

x[k]y[n− k]N

donde la notacion [.]N significa modulo N , es decir que por ejemplo y[−1]N =y[N−1]. La propiedad que interesa recordar es que si se toma la transformada discretade Fourier de la ecuacion anterior y si la DFT de x[n] es X[k], la de y[n] es Y [k] y lade z[n] es Z[k] entonces:

Z[k] = X[k]Y [k]

Ejercicio 11.1. Probar la propiedad anterior que establece que la DFT de una con-volucion circular de dos secuencias es el producto de las DFT de las secuencias.Se recomienda probar primero que si X[k] es la DFT de x[n], entonces la DFT dex[n−m]N es X[k]ej2πkm/N

Analizaremos entonces que le sucede a una senal OFDM que atraviesa un canalinalambrico. Se utilizara para esto un modelo en tiempo discreto del canal. La senalbandabase recibida sera:

rb[n] =∑k

hk[n]sb[n− k] + w[n]

Se asumira en lo que sigue que el canal es invariante en el tiempo, es decir quelos hk no dependen de n y ademas que el canal tiene un conjunto de taps finito en elcual se dispersa, que se asumira es L, entonces

rb[n] =

L−1∑k=0

hksb[n− k] + w[n]

Si se transmite un sımbolo OFDM formado por N muestras de sb[m] en la recep-cion debido a los L taps del canal el sımbolo tendra una cantidad de muestras N+L−1ya que el filtro “expande” el sımbolo enviado. Esto significa que esta extension delsımbolo enviado se superpondra con el siguiente sımbolo generando interferencia in-tersimbolica. Para solucionar este problema se podrıa enviar los sımbolos separados

293

Page 294: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

L− 1 muestras. Sin embargo, lo que se hace es utilizar esa separacion de L muestraspara enviar en esos primeros lugares del siguiente sımbolo una copia de los ultimos Lmuestras del sımbolo. Como se vera esto tiene algunas ventajas que quedaran clarasmas adelante. Es decir que en lugar de enviar sb[m] com m = 0, ..., N − 1 se envıaub[m] = sb[N − L + m + 1] con m = 0, ...., L − 2 y ub[m] = sb[m − L + 1] para m=L− 1, ..., N + L− 2.

Por lo tanto la senal recibida al agregar este prefijo (denominado prefijo cıclico)sera:

vb[n] =

L−1∑k=0

hkub[n− k] + w[n]

El ISI se extiende sobre las primeras L − 1 muestras de vb y por lo tanto estasprimeras L− 1 muestras se descartaran y se consideraran solamente las muestras devb para n = [L,L + N − 1]. Sin embargo, en la etapa de sincronizacion este prefijopodra cumplir un rol importante en algunos sistemas. Debido al prefijo cıclico sobreeste intervalo de largo N la salida vb sera igual a:

vb[n] =

L−1∑k=0

hksb[n− L− k]N + w[n]

si se considera los vectores rb = vb[L], ..., vb[L+N − 1], h = h0, h1, ..., hL−1, 0, ..., 0de largo N y w = w[L], ..., w[L+N − 1], entonces:

rb = h ~ sb + w

y por lo tanto luego de hacer la FFT del vector rb y se denomina X[k] a la DFTde rb y A[k] a la DFT de sb obtiene que:

X[k] = H[k]A[k] +W [k] (11.9)

Observar en la figura 11.1 que el vector X[k] tiene elementos x0, ..xN en dichafigura y el vector A[k] tiene elementos a0, ..aN. Esto significa que para cada sımboloOFDM recibido, para cada una de sus muestras luego de la FFT k = 0, ..., N − 1 secumple que :

xk = H[k]ak +W [k]

donde H[k] es la componente de la DFT del canal correspondiente al subcanal k.Se deben hacer diversas consideraciones relativas al largo de la trama y al largo

del prefijo . Por un lado, el prefijo cıclico es poco eficiente ya que involucra unafraccion de tiempo L

N+L en la cual no se transmiten datos y ademas se usa potenciade los dispositivos. Por el lado la falta de eficiencia temporal, es posible minimizarlaaumentando lo mas posible N . Sin embargo, se tiene una limitante y es que si se

294

Page 295: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

aumenta mucho N se esta achicando la distancia entre subcanales BN . Como se vio

cuando se estudiaron los modelos de canal inalambrico, el efecto dopler hace que lafrecuencia varıe y esta variacion es inversamente proporcional al tiempo de coherenciadel canal. Para que este tiempo no afecte severamente el sistema OFDM la distanciaentre subcanales debe ser mucho mayor que el inverso del tiempo de coherencia delcanal y esto impone un lımite en el largo de sımbolo OFDM. Respecto de la potenciadesperdiciada, se podrıan mandar ceros en el espacio del prefijo largo, sin embargoesto por un lado genera inconvenientes porque al cortar bruscamente la transmisionse generan componentes armonicas en frecuencia no deseadas y que no son faciles deeliminar. Por otra parte, el prefijo cıclico como se vera mas adelante se puede utilizarpara sincronizar en tiempo y frecuencia las tramas lo que le agrega una utilidadadicional.

Para terminar, al agregar el prefijo cıclico al sımbolo OFDM en el transmisor yquitarselo en el receptor es necesario modificar el diagrama de bloques de la figura11.1. Es necesario agregar luego del bloque IFFT en el transmisor un bloque queagregue el prefijo cıclico, el cual copia las ultimos L − 1 salidas de la IFFT al iniciodel sımbolo OFDM cambiando su largo. Ası mismo, hay que eliminar el prefijo cıclicoantes de realizar la FFT en el receptor.

11.2.2. El espectro de OFDM y la relacion pico a promedio(PAR)

Para analizar el espectro de OFDM lo primero es observar que la senal a enviar esuna combinacion lineal de los N elementos de la base de la ecuacion 11.2. Si se calculala correspondiente transformada de Fourier de los elementos de la base se obtiene:

Φk(f) =1√Ts

∫ Ts

0

ej2πkt/Tse−j2πftdt =√Ts

sin(π(f − k/Ts)Ts)π(f − k/Ts)Ts

e−jπ(f−k/Ts)Ts

Por lo tanto, el espectro son funciones sinc centradas en f = k/Ts. Estas funcionesse anulan en todos los multiplos de 1/Ts. El espectro de la senal OFDM sera entoncesuna combinacion lineal de estas funciones sinc cada una centrada en la frecuencia de susubcanal y los coeficientes de la combinacion lineal son los sımbolos de cada subcanal.El espectro tendra por lo tanto la forma de la Figura 11.2.

Ejercicio 11.2. Observar que los sımbolos a enviar en cada subcanal corresponden alas muestras del espectro de la Figura 11.2 cada k/Ts ¿ por que? Explicar la ortogo-nalidad desde el punto de vista de la frecuencia con estas consideraciones.

El sımbolo OFDM tiene duracion Ts y y como se vio el espectro es una suma defunciones sinc. En cada cambio de sımbolo OFDM (cada Ts ) hay saltos de fase yde amplitud debido a que los sımbolos ak de cada subcanal cambian. Estos saltoshacen que la senal tenga un decaimiento lento fuera de la banda B con lobulos quepueden ser importantes. Para mitigar este problema habitualmente se utiliza algunao varias de las siguientes soluciones. Por un lado, en algunos sistemas se le aplica unenventanado al sımbolo OFDM de forma de hacer las transiciones mas suaves en eltiempo y por tanto lograr un decaimiento mas rapido fuera de banda. En la Figura

295

Page 296: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 11.2: Espectro OFDM

11.3a se muestra el espectro de una senal OFDM sin ventana y en la Figura 11.3b elmismo espectro pero utilizando una ventana.

Tambien en algunos casos en lugar de enventanar en el tiempo se le aplica unfiltro pasabajo a la senal bandabase a enviar. Una ultima alternativa y que en muchossistemas se implementa es no utilizar los subcanales de los extremos de la banda ycon eso tener una banda de guarda. Obviamente esto reduce la tasa de informacionque se puede enviar pero tambien hace mas viable el filtrado permitiendo utilizarfiltros de corte menos abrupto. Hay que tener presente que muchos sistemas OFDMtampoco utilizan las bandas cercanas a la frecuencia central ya que estos subcanalescorresponden a DC y bajas frecuencias que muchas veces son contaminados por senalesespurias en el receptor.

Otro aspecto relacionado con el canal OFDM es su relacion pico promedio (PARpor sus siglas en ingles). El PAR de una senal x(t) se define como:

PAR =maxt(|x(t)|2)

E(|x(t)|2)

PAR =maxn(|x[n]|2)

E(|x[n]|2)

La primera para una senal de tiempo continuo y la segunda de tiempo discreto.Si se asume que un sımbolo OFDM que esta compuesto de N senales i.i.d con medianula y de potencia 1, entonces, la potencia promedio de la senal sera 1 y la maximapotencia (cuando todas las portadoras toman coherentemente el mismo valor) sera N .Por lo tanto, en este calculo simplificado se puede ver que el PAR crece en el orden delnumero de portadoras. Esto genera complicaciones a los sistemas OFDM. Para que losamplificadores y demas componentes del sistema de recepcion/transmision trabajenen la zona lineal se debe lograr que en todo el rango de las senales que ingresan alos amplificadores, estos trabajen en su zona lineal. De lo contrario se introducen nolinealidades y distorsiones en las senales de salida. la variacion importante entre lamedia y el pico (particularmente para sistemas con una cantidad importante de sub-portadoras) impone una exigencia severa para los sistemas OFDM. Por este motivo,se buscan diversas tecnicas para reducir el PAR en estos sistemas. Estas tecnicas van

296

Page 297: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

(a) Espectro OFDM sin enventanado

(b) Espectro OFDM utilizando enventanado

Figura 11.3: Espectro OFDM con y sin enventanado

297

Page 298: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

desde recortar el nivel de la senal por encima de cierto umbral o usar algun tipo descrambling en los sımbolos a transmitir para reducir los picos.

11.3. Sincronizacion en OFDM

Se analizara en primer lugar el efecto del canal y las imperfecciones de un siste-ma de recepcion. Las imperfeccciones consideradas en esta seccion son: el error enfrecuencia del oscilador para llevar la senal a banda base, la diferencia de fase desco-nocida entre el transmisor y el receptor y el error en la base de tiempo del receptorque genera imperfecciones al muestrear.

11.3.1. Efecto en OFDM del error en frecuencia

Si el oscilador del receptor en lugar de fijar la frecuencia fc que utilizo el transmisor,fija la frecuencia fc y se denomina ∆fc = fc−fc. Si se incluye el prefijo cıclico entoncesse tendran M= L+N muestras tomadas cada T . Entonces, luego de muestrear cadatiempo T la senal recibida y bajada a banda base se obtendra para la muestra m-esima del n-esimo sımbolo OFDM, utilizando la ecuacion 11.7 y por el momento noconsiderando el ruido, se obtiene:

rbn[m] = sbn(mT )ej2π∆fc(mT+n(N+L)T+LT )

rbn[m] =1

N

N−1∑k=0

an[k]ej2πkmN ej2π∆fc(mT+n(N+L)T+LT ) (11.10)

Este conjunto de N muestras se pasa luego por el bloque FFT. Si se denominaΦ(n) = (n(N + L) + L) a la salida del bloque FFT se obtiene:

xn[l] =

N−1∑h=0

rbn[h]e−j2πhlN =

1

Nej2π∆fcΦ(n)T

N−1∑h=0

N−1∑k=0

an[k]ej2πkhN ej2π∆fchT e−j2π

hlN

(11.11)

xn[l] =1

Nej2π∆fcΦ(n)T

(N−1∑k=0

an[k]

N−1∑h=0

ej2πhk−l+∆fcNT

N

)(11.12)

Antes de continuar conviene analizar esta ecuacion. ∆fcNT = ∆fc1/Ts

es la relacion

entre la diferencia de frecuencia y la separacion de los subcanales. Esta relacion sepuede pensar que tiene una parte entera y una fraccional: (εI + εf ), donde εI es unentero que mide la cantidad de subcanales que se desplaza la frecuencia y −0,5 ≤εf ≤ 0,5 es la parte fraccional del corrimiento en frecuencia.

xn[l] =1

Nej2π(εI+εf )

Φ(n)N

(N−1∑k=0

an[k]

N−1∑h=0

ej2πhk−l+εI+εf

N

)(11.13)

298

Page 299: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

xn[l] =1

Nej2π(εI+εf )

Φ(n)N

(N−1∑k=0

an[k]

N−1∑h=0

ej2πhk−l+εIN ej2πh

εfN

)(11.14)

Para comprender mas facilmente el impacto de la parte fraccional y de la parteentera del desplazamiento en frecuencia se supone primero que no hay parte fraccionaly luego que no hay parte entera. Esto tiene sentido ya que ademas de facilitar analizarel problema, muchas veces para estas dos partes del desplazamiento en frecuencia comose vera mas adelante se buscan soluciones diferentes.

Si no hay parte fraccional, la ecuacion anterior se reduce a:

xn[l] =1

Nej2πεI

Φ(n)N an[l − εI ] (11.15)

Esta ultima ecuacion se debe a que∑N−1h=0 e

j2πhk−l+εIN = δk−(l−εI) ya que εI es

entero. Por consiguiente se puede ver que la parte entera del desplazamiento en fre-cuencia genera por una parte un fase constante para todas las muestras en frecuenciadel mismo sımbolo OFDM (n en nuestro caso). Por otra parte, genera un corriemientoen frecuencia y en lugar de recuperar xn[l] = an[l] se recupera la muestra en frecuenciadesplazada εI , es decir, xn[l] = an[l − εI ].

Por otra parte, si se considera que se tiene solo la parte fraccional del desplaza-miento y recordando que la suma parcial de una serie geometrica permite calcular:

N−1∑h=0

ekh =

N−1∑h=0

(ek)h

=1− ekN

1− ek(11.16)

Se obtiene:

xn[l] =1

Nej2πεf

Φ(n)N

(N−1∑k=0

ak[n]1− ej2π(k−l+εf )

1− ej2πk−l+εfN

)(11.17)

Operando se puede escribir:

xn[l] =1

Nej2πεf

Φ(n)N

(N−1∑k=0

ak[n]ej2πN−1N (k−l+εf ) sin(π(k − l + εf ))

sin(πk−l+εfN )

)(11.18)

La ecuacion anterior se puede escribir:

xn[l] = ej2πεfΦ(n)N

(al[n]ej2π

N−1N (εf ) sin(πεf )

N sin(πεfN )

+

N−1∑k=0,k 6=l

ak[n]ej2πN−1N (k−l+εf ) sin(π(k − l + εf ))

N sin(πk−l+εfN )

(11.19)

299

Page 300: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

De esta ecuacion se puede ver que el primer sumando es el an[l] que se quiererecuperar pero con una atenuacion y un corrimiento de fase. El segundo sumando esla interferencia de los otros subcanales (Inter Carrier Interference, ICI), generada porel desplazamiento fraccional en frecuencia.

11.3.2. Efecto en OFDM del error en la fase

La diferencia de fase entre el receptor y el transmisor Φ0 provoca un error de faseconstante luego de la FFT de forma que:

xn[l] = an[l]ejΦ0 (11.20)

11.3.3. Efecto en OFDM del error en el tiempo de muestreoen el receptor

Se considera ahora que el receptor tiene un error temporal en el tiempo de mues-treo. Es decir que se muestreara en (m(1 + ∆θ)T +n(1 + ∆θ)(N +L)T +L(1 + ∆θ)T .Luego del bloque FFT se obtiene:

xn[l] =1

N

N−1∑h=0

N−1∑k=0

an[k]ej2πk(1+∆θ)h

N ej2πk(1+∆θ)n(N+L)T+LT

N e−j2πhlN

xn[l] =1

N

N−1∑k=0

an[k]ej2πk(1+∆θ)n(N+L)T+LT

N

N−1∑h=0

ej2πh(k−l+k∆θ)

N

xn[l] =1

N

N−1∑k=0

an[k]ej2πk(1+∆θ)n(N+L)T+LT

Nsin(π(k − l + k∆θ))

sin(π (k−l+k∆θ)N )

ejπ(N−1)(k−l+k∆θ)

N

xn[l] = an[l]ej2πl(1+∆θ)n(N+L)T+LT

Nsin(πl∆θ)

N sin(π l∆θN )ejπ

(N−1)l∆θN

+

N−1∑k=0,k 6=l

an[k]ej2πk(1+∆θ)n(N+L)T+LT

Nsin(π(k − l + k∆θ))

N sin(π (k−l+k∆θ)N )

ejπ(N−1)(k−l+k∆θ)

N (11.21)

Del primer termino de esta ecuacion se puede ver que el error en el muestreo proun lado genera una atenuacion del sımbolo esperado an[l] y tambien un corrimientode fase. Este corrimiento en fase para un sımbolo OFDM fijo n crece linealmente conel ındice de la subportadora y tambien con ∆θ. Por otra parte este desfasaje tambiense incrementa linealmente al variar n para un l fijo.

El segundo termino de la ecuacion corresponde a interferencia entre subcanalesICI introducido por el error de muestreo.

300

Page 301: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 11.4: Posibles ubicaciones de la ventana FFT

11.3.4. Efecto en OFDM del error en la sincronizacion de latrama

Cuando se recibe una trama un aspecto clave es lograr alinear correctamente laventana en la cual se va a hacer la FFT en el receptor. Si esta ventana no se alineacorrectamente se pueden dar varios casos diferentes como se muestra en la Figura11.4.

En un primer caso, si esta ventana se corre hacia el prefijo cıclico una cantidad demuestras L1 y el tiempo de coherencia del canal τ es tal que τ + L1 < L, entoncesutilizando la propiedad de un corrimeinto circular en el tiempo de la DFT, a la salidadel bloque FFT se tendra:

xn[l] = an[l]e−j2πlτNT (11.22)

Es decir que en este caso lo unico que se produce es una fase que varıa linealmentecon el numero de subcanal.

Por el contrario si el corrimiento es hacia adelante la ventana toma muestras delsiguiente sımbolo OFDM. En este caso ademas de un corrimiento de fase y atenua-cion del sımbolo de interes an[l], se sumaran componentes de los otros subcanales delsımbolo provocando ICI y tambien terminos que corresponden a subcanales del si-guiente sımbolo provocando ISI. Algo similar ocurre si la ventana se corre hacia atraspero se cumple que τ + L1 > L.

11.4. Sincronizacion y correccion de errores de sin-cronismo en OFDM

Existen diversas tecnicas para sincronizar, alinear la trama OFDM y corregir erro-res de sincronizacion. Estas tecnicas dependen de las caracterısticas del sistema peroal menos hay dos categorıas diferentes que se deben distinguir. Por un lado, se tienensistemas orientados a paquetes como las diferentes variantes de 802.11 que utilizanOFDM (802.11 a,g, etc.) y por otro sistemas de streaming como por ejemplo la tele-vision digital.

301

Page 302: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

En los sistemas orientados a paquetes habitualmente se envıa un agrupamiento desımbolos OFDM. Este agrupamiento contiene algunos sımbolos OFDM destinados aespecıficamente a sincronizar, otros con informacion sobre el resto del agrupamientocomo por ejemplo la modulacion utilizada, y luego un cierto conjunto de sımbolosOFDM con los datos del usuario. Tambien se envıan con los datos senales piloto quesirven para sincronizar o ecualizar como se vera mas adelante.

En cambio en los sistemas orientados a streaming no existe este concepto de agru-pamiento y el receptor en el momento que se conecta al sistema de streaming debesincronizar utilizando la informacion que viene en el propio simbolo OFDM con losdatos.En estos casos tambien se envıan senales piloto con los datos para colaborar enla sincronizacion y en la ecualizacion.

Otro aspecto a tener en cuenta es si la sincronizacion se realiza en el dominio deltiempo o de la frecuencia, es decir si se hace antes o despues de realizar la FFT enel receptor. Habitualmente es necesario sincronizar en el dominio del tiempo, aunquemuchas veces tambien se hacen ajustes adicionales en el dominio de la frecuencia.

11.4.1. Tecnicas de sincronizacion en el dominio del tiempo

En el receptor la primera operacion es detectar el comienzo de un nuevo sımboloOFDM. Como se menciono antes el tipo de operacion a realizar depende del tipode sistema. En sistemas se streaming habitualmente se utiliza el prefijo cıclico paradetectar el inicio de una nueva trama y alinearse a los efectos de pasarle a la FFTla ventana de muestras correcta. Esta operacion se hace para cada sımbolo OFDM.Ademas se realiza un primer ajuste del error en frecuencia. Posteriormente, en eldominio de la frecuencia se realizara una segunda correccion en frecuencia y de latasa de muestreo.

En cambio en sistemas de tipo paquete se utilizan preambulos enviados antes delos datos para sincronizarse y alinear correctamente la ventana de la FFT. En estecaso, esta alineacion se hace una vez para todos los sımbolos OFDM del paquete.Por ejemplo, en 802.11 antes de los sımbolos OFDM con datos (y de un sımboloOFDM con informacion de la modulacion utilizada,etc.) se envıan dos preambulosque se utilizan para sincronizar (denominados preambulo corto y largo). En el casode 802.11 se recomienda realizar una primera alineacion de la trama con el preambulocorto y luego ajustarlo con el largo. Ademas con el preambulo corto y largo se haceuna correccion del error en frecuencia. Posteriormente tambien se podran hacer otrosajustes en el dominio de la frecuencia

Se analizara a continuacion algunos metodos de sincronizacion en el dominio deltiempo utilizados para alinear las tramas y ajustar en frecuencia. Si bien los metodosque se analizaran son generales, para su mejor comprension se explicaran usando comoejemplo el sistema OFDM de 802.11 para los sistemas que empaquetan los sımbolosOFDM y para los sistemas de streaming se tomara como ejemplo el estandar ISDBTutilizado para la television digital en casi toda America Latina.

Sincronizacion en el dominio del tiempo en sistemas de paquetes

Deteccion del paquete OFDMEn los sistemas de tipo paquete, los paquetes arriban esporadicamente y en tiempos

que son ignorados por el receptor. Por este motivo, la primera operacion a realizar es

302

Page 303: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 11.5: Estructura de una trama 802.11

detectar que se esta ante un nuevo paquete y ademas utilizar esta deteccion para haceruna alineacion gruesa de los sımbolos OFDM que forman el paquete. Esta deteccionse realiza utilizando preambulos que contienen los paquetes especialmente disenadospara sincronizar. Por ejemplo, en el sistema OFDM 802.11 se envıan al inicio de todopaquete dos preambulos. Un preambulo corto que consiste en 10 repeticiones de lasmismas 16 muestras. Un preambulo largo que consiste en 2 repeticiones de 64 muestrasprecedidas por un prefijo cıclico de 32 muestras. Esto se muestra en la Figura 11.5

Observar que ambos preambulos son de 8 microsegundos y 160 muestras cadauno. Estas 160 muestras en el tiempo equivalen a 2 sımbolos OFDM de datos con susprefijos cıclicos (de 4 microsegundos), ya que se utilizan 64 subcanales en 802.11 y unprefijo cıclico de largo 16 muestras.

Los metodos para sincronizar en general no estan especificados en los estandares.Ese es el caso de 802.11 donde se dice en el estandar que los preambulos debenutilizarse para alinear la trama y ajustar el error en frecuencia pero no se dice comohacerlo. Por este motivo se han propuesto varios metodos en la literatura. En estaseccion se analizara uno de ellos que es de caracter general mas alla de la especificidadde 802.11.

Uno de lo metodos propuestos para detectar que se esta recibiendo una trama802.11 consiste en utilizar las caracterısticas mencionadas del preambulo corto [6]. Elpreambulo corto en el tiempo consiste de 16 muestras repetidas 10 veces. Por lo tantosi se realiza la autocorrelacion de la senal recibida con un retardo de 16 muestras yluego se promedia por en un intervalo de muestras L se tendra una senal tipo trapecioy se podra detectar que comienza una trama 802.11 cuando esta senal supere un ciertoumbral.

El problema es que la energıa con que se reciben los diferentes dispositivos 802.11puede ser muy variable habiendo senales que se reciben con mucha potencia y otrascon muy baja potencia. Por este motivo, una de las tecnicas propuestas consiste endividir la autocorrelacion mencionada antes, entre la energıa promedio de la senalrecibida. De esa forma el maximo del cociente deberıa ser 1 y por tanto se puededecidir que hay una trama 802.11 si se pasa un umbral por ejemplo de 0.6 o 0.7 eneste cociente durante un numero de muestras H. Es decir se calcula:

a[n] =

L−1∑k=0

x[n+ k]x∗[n+ k + 16]

e[n] =

D−1∑k=0

x[n+ k]x∗[n+ k]

c[n] =|a[n]|e[n]

303

Page 304: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

y se decidira que hay una nueva trama por ejemplo si c[n] > 0,6 por al menos Hmuestras consecutivas.

Ejercicio 11.3. En el archivo adjunto al texto del capıtulo OFDM se encuentra elarchivo canal11.dat aplicar el algoritmo anterior y detectar cuantas tramas 802.11 hayen la muestra. Para esto se recomienda graficar: e[n], a[n] y c[n]. Puede implmentarlas ecuaciones anteriores en GnuRadio o en Octave u otro software que Ud. desee.Este archivo tiene el formato en graba GnuRadio con los complejos recibidos de unatransmision real en una red 802.11

Correccion en frecuenciaSi se envıa la senal s(t) y se asume que el canal por ahora es ideal, la senal r(t)

recibida al haber un offset en frecuencia quedara multiplicada por: ej2πα∆ft siendoα = δf

∆f y siendo δf el offset en frecuencia y ∆f = 1Ts

el salto en frecuencia entre

subportadoras. Cuando la senal en banda base se muestrea cada Ts/N entonces setiene que

x[n] = s[n]ej2παnN + v[n]

siendo N el tamano de la ventana FFT y v[n] el ruido.La autocorrelacion a[n] quedara entonces de la siguiente forma:

a[n] = e−j2πα16N

L−1∑k=0

|x[n+ k]|2

y por lo tanto,

tan−1(a[n]) = −2πα16

N

α = tan−1(a∗[n])N

2π16

Como N = 64 esta correccion en frecuencia permite realizar correcciones para−2 ≤ α ≤ 2

Ejercicio 11.4. Para cada una de las tramas detectadas en el ejercicio 11.3 hacer unaestimacion de la correccion en frecuencia que serıa necesario realizar para corregir eloffset correspondiente.

Deteccion precisa del inicio de tramaEs muy importante tener una determinacion precisa del inicio de la trama. Si esto

no se logra como se vio en la Seccion 11.3.4 la salida del bloque FFT tendra ISI e ICI.Para tal fin, es necesario conocer donde comienzan los dos campos del preambulo largoy por tanto donde comienzan los demas sımbolos OFDM del paquete. En particularen 802.11 luego de los preambulos viene un sımbolo OFDM denominado SIGNAL(que especifica las caracterısiticas de los sımbolos de datos, por ejemplo modulacion

304

Page 305: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

utilizada, rate, etc. ) y luego el conjunto de sımbolos con los DATOS como se muestraen la Figura 11.5.

Como se menciono, el preambulo largo consiste de la repeticion de dos bloques cadauno de 64 muestras (T1 y T2 en la Figura 11.5) y un prefijo cıclico de 32 muestras.

Existen tambien diferentes propuestas para lograr la alineacion precisa de la tra-ma. Una de ellas es correlacionar la senal recibida con la palabra de 64 muestrascorrespondientes a cada una de las mitades del preambulo largo que denominaremosPL[n]. La correlacion a calcular sera:

y[n] =

63∑k=0

x[n+ k]PL∗[k] (11.23)

para n = 0..Npreambulo (11.24)

donde Npreambulo corresponde a la suma del largo del preambulo corto y largo.Esta correlacion tendra dos picos principales (cuando se alinean las dos mitades delpreambulo largo de los datos recibidos con PL) . Al detectar estos picos se tendran lospuntos donde comienza cada una de las dos secuencias repetidas del preambulo largo.A partir de allı se puede detectar donde comienza cada una de estas mitades (cadauna se pasara a la FFT porque seran utilizadas tambien para sincronizar y ecualizaren el dominio de la frecuencia). Ademas, como se conoce que luego del preambulolargo vienen sımbolos OFDM con 64 muestras de largo mas un prefijo cıclico de 16muestras se puede alinear la ventana de la FFT correctamente para todos los sımbolosOFDM del paquete.

Algunos autores recomiendan por seguridad dado que se tiene un prefijo cıclicocorrerse hacia atras alguna muestra para tener seguridad que un pequeno error enla alineacion no toma el inicio del prefijo cıclico del proximo sımbolo OFDM. Si sedesplaza hacia atras como se vio en la ecuacion 11.22 lo unico que se introduce es uncambio de fase lineal con el numero de subcanal En cambio si por error el corrimientofuera hacia adelante se generarıa ISI e ICI.

La fase lineal con el numero de subcanal introducida si hay un error en la alineaciondentro del margen de seguridad del prefijo cıclico, se puede detectar y corregir luegoen el dominio de la frecuencia.

Ejercicio 11.5. Continuar con el ejercicio 11.4 y graficar y[n]. Observar si aparecenlos dos picos mencionados y detectar en que muestra comienza el preambulo largo(luego de su prefijo) de cada trama detectada.

Sincronizacion en el dominio del tiempo en sistemas de streaming

En estos sistemas no se cuenta con preambulos para sincronizacion por lo que seutiliza en general el propio prefijo cıclico para alinearse y hacer una primera sincro-nizacion en frecuencia.

Un algoritmo tıpicamente utilizado en estos sistemas proviene de un trabajo devan de Beek et al. [?], el cual considera dos incertidumbres : el tiempo de arribo deun sımbolo OFDM (θ) y el error en la frecuencia de la portadora (ε). La idea basicaes utilizar que las primeras y las ultimas L muestras transmitidas de cada sımboloson las mismas (siendo L el largo del prefijo cıclico). Por lo tanto, la autocorrelacion

305

Page 306: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Figura 11.6: Aplicacion del algoritmo de maxima verosimilitud para detctar el iniciodel sımbolo OFDM en ISDB-T

de las muestras recibidas con un retardo igual al largo del sımbolo OFDM N (ypromediado sobre L muestras) deberıa tener un maximo al final del prefijo cıclico.En efecto se prueba que la funcion de maxima verosimilitud para estimar θ es laautocorrelacion mas un termino que evita falsos maximos debido a muestras convalores particularmente altos:

θML = arg maxθ

∣∣∣∣∣θ+L−1∑k=θ

r[k]r∗[k +N ]

∣∣∣∣∣−ρ

θ+L−1∑k=θ

|r[k]|2 + |r[k +N ]|2

2, (11.25)

donde r[k] son las muestras recibidas y ρ = σ2s/(σ

2s + σ2

n) = SNR/(1 + SNR). Esteultimo parametro debe ser estimado de los datos recibidos. En la figura 11.6 se muestrael resultado de aplicar este algoritmo.

Una vez que se determina la frontera del sımbolo OFDM queda por determinarel error en frecuencia. Para determinar este error se debe observar que la unica di-ferencia entre las primeras y las ultimas L muestras recibidas es precisamente esteerror (ademas del ruido), lo cual se manifiesta a traves de una diferencia de fase. Estosugiere que se puede estimar ε de la siguiente forma (el cual se puede probar tambienque es el estimador de maxima verosimilitud):

εML = − 1

2πarg

θML+L−1∑k=θML

r[k]r∗[k +N ]

, (11.26)

Debido a la ambiguedad de la funcion arg arbitraraimente se asume que 0 < ε <1. Esto se denomina correccion de la parte fraccional del error en frecuencia. Laparte entera sera corregida mas adelante. Una vez que se estima mediante la ecuacion11.26 el error fraccional en frecuencia las muestras seran rotadas multiplicando pore−j2πεMLn siendo n el numero de la muestra correspondiente.

En general en los sistemas de streaming una vez que se adquirio el sımbolo, seconoce toda la informacion necesaria para los siguientes sımbolos ya que cada sımbolovine a continuacion del anterior (a diferencia de los sistemas de paquetes en los cualesentre paquetes no se transmite). Por eso a priori, se puede pensar que una vez que sesincronizo ya no es necesario volver a hacerlo para los demas sımbolos. Sin embargo,esto no es necesariamente cierto. Por ejemplo, se pueden perder muestras en algunaetapa del receptor y por tanto la sincronizacion debe modificarse. Por este motivo,

306

Page 307: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

es razonable verificar en cada sımbolo que el sincronismo es el correcto. Si el numerode muestras N del sımbolo es grande (por ejemplo 8192 en uno de los modos detransmision de ISDBT) aplicar el procedimiento de la ecuacion 11.25 para todos losposibles valores de θ puede ser muy costoso en tiempo consumido para cada sımbolo.Sin embargo, se puede hacer la busqueda para los siguientes sımbolos solo entorno almaximo encontrado para el primer sımbolo.

Una consideracion similar vale para la frecuencia. La diferencia de la frecuenciaportadora entre el transmisor y el receptor no es fija en el tiempo debido por ejemplo afenomenos termicos y fluctuaciones de los relojes de cada sistema. Por otra parte, aunluego de realizar la correccion fraccional del error en fecuencia puede quedar un errorresidual. Por este motivo como se vera mas adelante en el dominio de la frecuenciaademas de realizar un ajuste de la parte entera del error en frecuencia se podranhacer ajustes a esta estimacion del error fraccional, en general a traves de sistemasrealimentados.

Estimacion de canal, ecualizacion y sincronizacion en el dominio de lafrecuencia en sistemas de paquetes

La principal diferencia en cuanto a herramientas para ecualizar y sincronizar en eldominio de la frecuencia en sistemas de paquetes respecto de streaming es nuevamentela existencia de preambulos. Alguno de estos preambulos puede ser utilizado en lossistemas de paquetes como se observara mas adelante. Por otra parte, tanto en lossistemas de paquetes como los de streaming por regla general se envıan en algunossubcanales senales pilotos que tambien serviran para este fin. Al igual que en eldominio del tiempo se vera a continuacion como pueden usarse tanto los preambuloscomo los pilotos para estimar el canal, ecualizar y sincronizar tomado como ejemplo802.11.

Luego de eliminado el prefijo cıclico, el preambulo largo se corresponde a dossımbolos OFDM iguales de 64 muestras. estas muestras se pasan por la FFT y setiene el preambulo largo de 802.11 en el dominio de la frecuencia.

El sımbolo largo OFDM de entrenamiento en el dominio de la frecuencia consistede 53 subportadoras (incluyendo el valor 0 en dc) :

L(–26, 26) = (1, 1, –1, –1, 1, 1, –1, 1, –1, 1, 1, 1, 1, 1, 1, –1, –1, 1,

1, –1, 1, –1, 1, 1, 1, 1, 0, 1, –1, –1, 1, 1, –1, 1, –1, 1,

–1, –1, –1, –1, –1, 1, 1, –1, –1, 1, –1, 1, –1, 1, 1, 1, 1)

El valor de DC (subportadora 0) en 802.11 siempre va en 0 (no solo en el preambulolargo) al igual que las primeras 6 y ultimas 5 subportadoras. Esta estructura permiteutilizando los dos preambulos largos hacer una correccion entera en frecuencia si elerror en frecuencia es mayor que el rango que permitıa corregir el algoritmo utilizadoen el dominio temporal. Para tal fin si se observa la salida de la FFT de los preambuloslargos, estos deben tener en 0 las primeras 6 muestras, en 0 la muestra central y en 0las ultimas 5 muestras. Si hay un corrimiento en frecuencia existira un desplazamientode este patron y los ceros se encontraran en otras ubicaciones. Se debe tener en cuentaque el valor 0 en el subcanal central puede no estar en cero debido a un valor de DCintroducido por el receptor.

307

Page 308: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

En 802.11 los sımbolos de datos contienen senales pilotos que tambien puedenutilizarse para este fin. En particular hay 4 portadoras piloto en las ubicaciones−21,−7, 7, 21. En estas posiciones se envıa un 1 o un −1 con una secuencia co-nocida. Por lo tanto correlacionando varios sımbolos se puede ver si efectivamente lospilotos se encuentran en estas posiciones o estan desplazados.

Respecto de la estimacion de canal y la ecualizacion tambien se utilizan para estefin los preambulos largos y las portadoras piloto. Como se obtuvo en la ecuacion 11.9 elvalor obtenido en el receptor luego de la FFT en cada subcanal xk y el valor del sımboloenviado en ese subcanal ak estan relacionados por la ecuacion xk = akH(k) +W (k).

Como en las senales piloto y en los preambulos el sımbolo enviado es conocidoes posible estimar el canal y ecualizarlo. Para su ecualizacion se utiliza ecualizacionlineal y se pueden utilizar diferentes tecnicas como las analizadas en el capıtulo sobreecualizacion. En general se utiliza el forzado a cero. Es decir, se asume que el ruido escero y se invierte el canal a partir de su estimacion H[k] = xk

ak. Con esta estimacion

obtenida por ejemplo del preambulo largo se corrigen los sımbolos de datos para cadasubcanal. Lo mismo se puede hacer con las senales piloto y en ese caso interpolar paralas subportadoras que no tienen piloto.

El metodo anterior de forzado a cero se utiliza muchas veces por su simplicidad,sin embargo como se vio en el capitulo sobre ecualizacion para subcanales que tenganun desvanecimiento importante, la inversion genera una amplificacion del ruido y porlo tanto no es adecuada. Por tal motivo, se pueden utilizar ecualizadores de errorcuadratico mınimo por ejemplo utilizando varios sımbolos y sus pilotos para hacer laestimacion.

Estimacion de canal, ecualizacion y sincronizacion en el dominio de lafrecuencia en sistemas de streaming

Luego de obtener utilizando el prefijo cıclico las N muestras del sımbolo OFDMestas se pasan por la FFT y se pasa a trabajar en el dominio de la frecuencia. En eldominio de la frecuencia se realizaran ajustes adicionales al error en frecuencia y alos errores de tiempo de muestreo ası como la ecualizacion del canal. Para este fin, enlos sistemas de streaming no se cuenta como en el caso de paquetes con preambulospor lo que se deberan utilizar los pilotos incluidos en las portadoras solamente.

El primer error a corregir es la parte entera del error en frecuencia ya que enel dominio temporal solamente se corrigio la parte fraccional del error. En algunastecnologıas de streaming como por ejemplo en DVB-T se transmiten pilotos en sub-portadoras fijas como se vio tambien en el caso de 802.11. En estos casos es posiblecorrelacionar algunos sımbolos consecutivos para detectar si los pilotos se encuentranen la posicion correcta o tienen un corrimeinto en frecuencia.

En otros sistemas como el ISDB-T no hay pilotos fijos. En ISDB-T se cuentade todas formas con ciertos pilotos y senales que siguen un patron conocido y quepueden utilizarse para ajustar en frecuencia o ecualizar. Por ejemplo en ISDB-T haydos senales que tienen patrones conocidos. Por un lado estan los scattered pilots (SP)que cambian de posicion de sımbolo a sımbolo pero donde el valor de que llevan esassubportadoras es conocido. Ademas este cambio de posicion de sımbolo a sımbolo noes arbitrario sino que sigue una secuencia conocida. Ademas de estos pilotos, ISDB-Ttiene varias subportadoras dedicadas a transferir informacion de los parametros de

308

Page 309: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

modulacion utilizados ( por ejemplo tasa del codigo convolucional utilizado, esquemade modulacion, ası como otros parametros). Hay 204 bits que son transmitidos parabrindar toda la informacion necesaria para demodular la trama. En cada sımboloOFDM se transmite uno de estos bits. Estos bits se denominan TMCC (TransmissionMultiplexing Configuration Control). Ellos ocupan portadoras fijas en los sımbolosOFDM y en cada sımbolo OFDM transmiten el mismo bit TMCC y utilizando unesquema de modulacion DBPSK. Si bien cambian de sımbolo a sımbolo como dentrodel mismo sımbolo hay varias portadoras con el mismo valor se pueden utilizar paracorregir el error en frecuencia como se vera a continuacion.

Se asume que hay M TMCC portadoras por cada sımbolo OFDM, se denominaraT [i] (i ∈ 0, . . . ,M − 1) sus posiciones cuando no hay error en frecuencia, y Y [k]la salida del bloque FFT. si bien los bits transmitidos en las portadoras TMCC sonlos mismos se utiliza modulacion DBPSK, donde el valor inicial para la modulaciondiferencial depende de T [i]. Esto significa que dependiendo de sus posiciones algunossımbolos sera 4/3 y otros -4/3. Se denominara w(T [i]) a este valor inicial. Se puedever facilmente que la siguiente correlacion es maximizada cuando m = ∆fI (la parteentera del error en frecuencia):

Γ[m] =

M−2∑i=0

w(T [i])Y [T [i] +m].w(T [i+ 1])Y ∗[T [i+ 1] +m] (11.27)

Al igual que se analizo para el caso de sistemas de paquetes una vez conocida laposicion de las portadoras se puede pasar a ecualizar, utilizando que la portadorai-esima verifica que Y [i] = X[i]H[i] +W [i], donde H[i] es la ganancia del canal paraesa subportadora y X[i] e Y [i] son el valor complejo (en el dominio de la frecuencia)enviado y recibido en esa portadora. Con estos valores se obtiene la estimacion deH[i] y el canal es ecualizado. Para este fin en el caso de no tener portadoras fijascomo en ISDB-T se pueden utilizar los scattered pilots (SP) que ya se comentaronanteriormente y cuya posicion si bien varıa sımbolo a sımbolo siguen una secuenciaconocida y por tanto su posicion se puede determinar. Para las portadoras que notienen pilotos habitualmente se interpola la estimacion del canal realizada para lassubportadoras con piloto.

Seguimiento del error en frecuencia y en el tiempo de muestreo

Como se menciono anteriormente, con las correcciones realizadas en el dominiodel tiempo y la frecuencia se debe tener una buena estimacion del error en frecuenciay de la alineacion del sımbolo. Sin embargo, puede persistir un pequeno error enfrecuencia (que notaremos ε′) que si no se corrige puede introducir ICI. Por estemotivo es conveniente utilizar un sistema realimentado de seguimiento de este errorque permita mejorar la estimacion. Tambien conjuntamente se puede corregir erroresdel tiempo de muestreo que como se analizo en la Seccion 11.3.3 se producen si lasenal se muestrea cada (1 + ∆θ)T en lugar de cada T .

Como se analizo en las Secciones 11.3.1 y 11.3.3 la combinacion de ε′ and ∆θproduce ademas del ICI una fase variante en el tiempo tal que el sımbolo complejodel subcanal k del sımbolo OFDM n es multiplicado por el fasor exp(j2πφi(k(N +L) + L)/N), con φi = ε′ + ∆θi.

309

Page 310: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Universidad de la Republica,Facultad de Ingenierıa - IIE Comunicaciones Inalambricas

Interpolator

δ ε'

Derotator S/P ... FFT

CP

... Freq.offset

Equalizer ...

...

...

ErrorEstimation

Loopfilter

Loopfilter

ε'e [k]

e [k]δ

8192samples

8192carriers

5617active carriers

5617symbols

5617channel

gains

r[k]

Figura 11.7: Un diagrama de bloques funcional de la sincronizacion OFDM en unsistema ISDB-T

El resultado anterior sugiere una estructura tipo PLL como se muestra en la Figura11.7, donde el calculo del error puede ser interpretado como ajustar a una recta lospuntos (i, argHk[i]Hk−1[i]∗)i=−I,...,I (con I la cantidad de portadoras con datos).Esto significa que la senal de error kse calcula como sigue:

eε′ [k] = arg

I∑

i=−IHk[i]Hk−1[i]∗

,

e∆θ[k] = arg

(I∑i=1

Hk[i]Hk−1[i]∗

)(0∑

i=−IHk[i]Hk−1[i]∗

)∗.

310

Page 311: Comunicaciones Inal ambricas - iie.fing.edu.uy · Comunicaciones Inal ambricas Notas del Curso Facultad de Ingenier a Universidad de la Republica Pablo Belzarena y Federico Larroca

Bibliografıa

[1] Wireless Communications, Andrea Goldsmith, Cambridge University Press; 1edition , 2005.

[2] Tzi-Dar Chiueh, Pei-Yun Tsai OFDM Baseband Receiver Design for WirelessCommunications Wiley ISBN-13: 978-0470822340 1 edition, 2007

[3] Proakis, J. and Salehi, M., Digital Communications, isbn=9780072957167, 2007,McGraw-Hill Education.

[4] Digital Communications: A Discrete-Time Approach, Michael Rice,isbn=9780130304971, 2008, Pearson, Prentice Hall.

[5] Signal Processing Techniques for Software Radios, Behrouz Farhang-Boroujeny,2008, University of Utah.

[6] Chia-Horng Liu, On the design of OFDM signal detection algorithms for hardwa-re implementation,Global Telecommunications Conference, 2003. GLOBECOM’03. IEEE (Volume:2 ) Date of Conference: 1-5 Dec. 2003

311