instituto politécnico nacional - tesis.ipn.mxtesis.ipn.mx/jspui/bitstream/123456789/15544/1/i.c....
TRANSCRIPT
0
Instituto Politécnico Nacional
Escuela Superior de Ingeniería Mecánica y Eléctrica Unidad Profesional Culhuacan
Departamento de Ingeniería en Computación
Tesis
“INTERFAZ GRÁFICA PARA EL
ANÁLISIS EN EL DOMINIO TEMPORAL Y
FRECUENCIA DE SEÑALES DE AUDIO EN
TIEMPO REAL”
Integrantes:
Daniel Palestina Reyes
Asesores:
Dr. Rogelio Reyes Reyes
M. en C. Héctor Becerril Mendoza
Abril de 2013
1
“INTERFAZ GRÁFICA PARA EL ANÁLISIS EN EL DOMINIO TEMPORAL Y
FRECUENCIA DE SEÑALES DE AUDIO EN TIEMPO REAL”
CONTENIDO
ÍNDICE DE ILUSTRACIONES ............................................................................................... 3
AGRADECIMIENTOS .............................................................................................................. 5
INTRODUCCIÓN ...................................................................................................................... 6
CAPÍTULO 1
ESTADO DEL ARTE ................................................................................................................. 9
1.1 ANTECEDENTES HISTÓRICOS. ............................................................................. 9
1.2 TENDENCIAS ACTUALES ...................................................................................... 17 1.2.1. Hardware de Analizadores de espectros. ................................................................ 17
1.2.2. Software de Analizadores de espectros. ................................................................. 19
CONCLUSIONES .................................................................................................................... 23
CAPÍTULO 2
MARCO TEÓRICO. ................................................................................................................ 25
2.1 PROCESAMIENTO DE SEÑALES ......................................................................... 25
2.2 PROCESAMIENTO DIGITAL DE SEÑALES ........................................................ 25 2.2.1. Propósito ................................................................................................................ 25
2.2.2. Aplicaciones ........................................................................................................... 26
2.2.3. Transformadas ........................................................................................................ 27
2.2.4. Procesadores Digitales De Señales ........................................................................ 27
2.3 ANÁLISIS DE SEÑALES .......................................................................................... 27 2.3.1. Señales Senoidales ................................................................................................. 28
2.3.2. Representación en el Dominio del Tiempo ............................................................ 29
2.3.3. Representación en el Dominio de la Frecuencia .................................................... 31
2.3.4. Ondas periódicas no senoidales. ............................................................................ 34
2.3.5. Serie de Fourier. ..................................................................................................... 34
2.4 ANALIZADORES DE ESPECTROS. ...................................................................... 35
2.5 ANTECEDENTES DE LA FFT ................................................................................. 35
2.6 TRANSFORMADA DISCRETA DE FOURIER ...................................................... 37
2.7 TRANSFORMADA RÁPIDA DE FOURIER. ......................................................... 38
2.8 TIEMPO REAL ........................................................................................................... 39
2.9 COMPUTACIÓN EN TIEMPO REAL .................................................................... 39
2.10 UNIDADES DE MEDIDA ACÚSTICA .................................................................. 40
2
2.10.1. Decibel ................................................................................................................. 40
2.10.2. Umbral Auditivo................................................................................................... 42
2.11 RANGO DINÁMICO ............................................................................................... 43
2.12 TARJETAS DE ADQUISICIÓN DE AUDIO ......................................................... 44 2.12.1. Historia de las tarjetas de sonido para la arquitectura del IBM PC ..................... 45
2.12.2. Características Generales ..................................................................................... 45
2.12.3. Conexiones ........................................................................................................... 46
2.12.4. Muestreo de sonido .............................................................................................. 47
2.12.5. Frecuencia de muestreo ........................................................................................ 48
2.12.6. Canales de sonido y polifonía .............................................................................. 48
2.13 FORMATOS DIGITALES DE ARCHIVOS DE AUDIO ...................................... 48
CONCLUSIONES .................................................................................................................... 49
CAPÍTULO 3
DESARROLLO. ....................................................................................................................... 51
3.1 DESCRIPCIÓN DEL SISTEMA ............................................................................... 51 3.1.1. Diagrama de Flujo y Algoritmo Empleado ............................................................ 51
3.1.1.1 Inserción de datos por parte del usuario. .............................................................. 52
3.1.1.2 Adquisición de audio. ........................................................................................... 52
3.1.1.3 Adquisición de cierto número de muestras de audio. .......................................... 52
3.1.1.4 Graficación de las muestras de audio adquiridas en el Dominio del Tiempo. ..... 52
3.1.1.5 Calculo de la FFT con las muestras de audio adquiridas. .................................... 53
3.1.1.6 Graficación de los resultados de la FFT, componentes espectrales en escala
logarítmica. ......................................................................................................................... 53
3.1.2. Interfaz Gráfica. ..................................................................................................... 54
CONCLUSIONES .................................................................................................................... 57
CAPÍTULO 4
PRUEBAS. ................................................................................................................................ 59
4.1 PRUEBAS DEL SISTEMA. ....................................................................................... 59 4.1.1. Señal senoidal. ........................................................................................................ 60
4.1.2. Señal cuadrada. ...................................................................................................... 62
4.1.3. Señal triangular. ...................................................................................................... 64
4.1.4. Dos instrumentos tocando la misma nota. .............................................................. 66
CONCLUSIONES .................................................................................................................... 69
REFERENCIAS Y BIBLIOGRAFÍA. .................................................................................... 71
3
“INTERFAZ GRÁFICA PARA EL ANÁLISIS EN EL DOMINIO TEMPORAL Y
FRECUENCIA DE SEÑALES DE AUDIO EN TIEMPO REAL”
ÍNDICE DE ILUSTRACIONES
CAPÍTULO 1
ESTADO DEL ARTE
Fig.1.1 Analizador de espectros en tiempo real Federal Scientific UA-7. 9
Fig.1.2 Analizador Spectral Dinamics AN/BQR-20. 10
Fig.1.3 Analizador FFT Time Data 100. 11
Fig.1.4 Analizador Nicolet Scientific 440A Mini Ubiquitous. 12
Fig.1.5 Analizador HP 3582A. 12
Fig.1.6 Componente Track/Hold y el Conversor Analógico/Digital (12 bit). 13
Fig.1.7 Espectro obtenido. 14
Fig.1.8 Commodore PET y Analizador Digital de Señales modelo LA-160. 15
Fig.1.9 ADS funcionando como osciloscopio con retención de imagen. 16
Fig.1.10 Analizador Digital de Señales modelo LA-160 II. 16
Fig. 1.11 Analizadores de espectros HAMEG HM5530. 18
Fig. 1.12 Analizador de espectros Agilent U8903A. 18
Fig. 1.13 Analizador de espectros Audio Control SA3052. 19
Fig. 1.14 Software analizador de espectros Sigview. 21
Fig. 1.15 Software analizador de espectros SpectraScope. 21
CAPÍTULO 2
MARCO TEORICO
Fig.2.1 Representación en el dominio del tiempo (forma de onda de la señal) de una onda
senoidal de frecuencia única [12]. 30
Fig.2.2 Forma de onda cuadrada [12]. 30
Fig.2.3 Forma de onda triangular 31
Fig.2.4 Representación en el dominio de la frecuencia (espectro) de una onda senoidal de
frecuencia única [12]. 32
Fig.2.5 Espectro de frecuencias de la forma de onda cuadrada [12]. 32
Fig.2.6 Espectro de frecuencias de la forma de onda triangular [12]. 32
Fig.2.7 Representación de gráficas en el domino del tiempo y frecuencia 33
Fig.2.8 Gráfica de DT contra FFT [12]. 36
4
Fig.2.9 Niveles de Sonidos 43
Fig. 2.10 Tarjeta de sonido PCI Sound Blaster Live! Fotografía de David Henry 2005-07-
06 44
CAPÍTULO 3
DESARROLLO
Fig. 3.1 Diagrama de Flujo. 51
Fig. 3.2 Diagrama UML Casos de Uso. 54
Fig. 3.3 Interfaz inicial. 55
CAPÍTULO 4
PRUEBAS
Fig. 4.1 Señal senoidal de amplitud 50mV y frecuencia de 100hz. 61
Fig. 4.2 Señal cuadrada de amplitud 50mV y frecuencia de 100hz. 63
Fig. 4.3 Señal triangular de amplitud 50mV y frecuencia de 100hz. 65
Fig. 4.4 5ta. Cuerda - A (La) - Electroacústica. 67
Fig. 4.5 5ta. Cuerda - A (La) - Acústica. 67
5
AGRADECIMIENTOS
Durante el desarrollo de este proyecto he podido darme cuenta del tipo de proyectos que es
posible llevar a cabo cuando se tiene el apoyo de profesores y asesores que están a disposición de
la institución y de la patria, dando lo mejor de sí para que nuestro esfuerzo sea empleado en
proyectos de uso práctico para la institución, utilizando las herramientas con las que cuenta y
desarrollando sistemas de software que permitan a los estudiantes y profesores hacer del análisis
y procesamiento de señales una tarea mas fácil de llevar a cabo.
Quiero expresar mi agradecimiento
A mi director de Tesis, Dr. Rogelio Reyes Reyes por su generosidad al brindarme la oportunidad
de recurrir a su capacidad y experiencia científica en un marco de confianza, afecto y amistad,
fundamentales para la concreción de este trabajo.
Al M. en C. Héctor Becerril Mendoza, por sus valiosas sugerencias y acertados aportes durante
el desarrollo de este trabajo.
A mis padres y hermanos por brindarme un apoyo incondicional en todas las circunstancias de la
vida y por enseñarme que la perseverancia y el esfuerzo son el camino para lograr objetivos.
6
“INTERFAZ GRÁFICA PARA EL ANÁLISIS EN EL DOMINIO TEMPORALY
FRECUENCIA DE SEÑALES DE AUDIO EN TIEMPO REAL”
INTRODUCCIÓN
El análisis y procesamiento de señales es ampliamente aplicado en las ramas de la ciencia donde
se estudian las características de señales generadas por fenómenos naturales o por elementos
experimentales que los representen. Algunos ejemplos de lo mencionado anteriormente son las
señales senoidales, las cuales surgen al describir el movimiento de los planetas, el
comportamiento periódico del clima de la tierra, las señales transmitidas por radio y televisión,
los análisis sobre la periodicidad de las olas del mar para el diseño de barcos.
En el análisis y procesamiento de señales de audio es necesario representar las características de
las mismas en el dominio temporal y en el dominio espectral para un mejor tratamiento y
comprensión. Actualmente existen herramientas que brindan la posibilidad de analizar señales
generadas por elementos experimentales o señales tratadas previamente, estas herramientas
procesan las señales de entrada y entregan como salida su espectro de frecuencias
correspondiente con la desventaja de que el valor económico de estas herramientas es muy
elevado y no es muy fácil su adquisición, esto, por ser diseñados con microcomputadores de
arquitectura y diseño especifico, orientados a realizar tareas de procesamiento digital de señales.
Los seres humanos no percibimos la intensidad sonora de forma lineal, sino lo hacemos de forma
logarítmica, es decir, que distinguimos la intensidad de un sonido siempre haciendo referencia a
otro y a la diferencia de intensidad con este. Es por ello que los músicos utilizan un analizador de
espectros para que pueda diferenciar la intensidad y frecuencia de las notas musicales; los
desarrolladores de moto sierras y de cortadores de céspedes tienen que analizar las vibraciones de
estas herramientas ya que de ser muy fuertes pueden dañar la salud de quienes lo utilizan;
científicos utilizan los analizadores de espectros para medir los campos electromagnéticos que
producen ciertos equipos o maquinarias y evitar enfermedades causadas por largos periodos de
exposición ante estos campos, como el cáncer.
El objetivo de este trabajo es desarrollar un software analizador de espectro de frecuencias para
una señal de audio adquirida en tiempo real que brinde la capacidad de almacenamiento y
7
visualización de los resultados generados por las pruebas realizadas y que cumpla con las
especificaciones necesarias para su uso práctico en los laboratorios de acústica.
Debido al rápido desarrollo de la tecnología digital con la aparición de microprocesadores de uso
general cada vez más potentes en las PC’s de uso común, se propone desarrollar un software
capaz de ser implantado en las PC’s existentes en los laboratorios de ingeniería que realice los
procesos de un analizador de espectros de frecuencia para señales de audio.
Con el uso de esta herramienta se brindara apoyo a carreras de Ingeniería (computación,
comunicaciones y electrónica, acústica, etc.), ampliando la capacidad de los alumnos para
realizar estudios y análisis de señales de audio en tiempo real en el dominio de la frecuencia de
una manera precisa y muchísimo más factible en términos económicos haciendo más fácil y
práctico el análisis de las señales el cual es usado para diversas aplicaciones tanto académicas
como tecnológicas. Esto es posible porque la institución ya cuenta con equipo de cómputo en el
cual es posible la implantación del sistema de software sin necesidad de adquirir equipo adicional
para su funcionamiento.
Mediante el uso de herramientas de programación, interfaces gráficas de usuario, algoritmos
matemáticos como la Transformada Rápida de Fourier (FFT), análisis y procesamiento de
señales, se podrá desarrollar el analizador de espectros que tenga una respuesta de análisis y
adquisición de la señal en tiempo real sin requerir de un hardware adicional, implementado los
sistemas de computo comunes existentes en los laboratorios de ingeniería.
8
“INTERFAZ GRÁFICA PARA EL ANÁLISIS EN EL DOMINIO TEMPORAL Y
FRECUENCIA DE SEÑALES DE AUDIO EN TIEMPO REAL”
CAPÍTULO 1
ESTADO DEL ARTE
9
“INTERFAZ GRÁFICA PARA EL ANÁLISIS EN EL DOMINIO TEMPORAL Y
FRECUENCIA DE SEÑALES DE AUDIO EN TIEMPO REAL”
ESTADO DEL ARTE
1.1 ANTECEDENTES HISTÓRICOS.
El desarrollo de los analizadores de espectros a lo largo del tiempo ha superado numerosas
barreras técnicas, desafiando obstáculos físicos y técnicas de medición. El análisis de espectros
de frecuencia en tiempo real ha sido usado para prevenir y analizar fallas en maquinaria rotatoria,
movimientos vibratorios de componentes, sistemas o estructuras; para analizar los componentes
ruidosos en estos sistemas; y para muchos otros propósitos entre los cuales se encuentra el
análisis de señales de audio.
En acústica, el analizador de espectros es también referido como un espectrógrafo, que convierte
ondas de sonido en un espectrograma. El primer analizador de espectros fue desarrollado durante
la segunda guerra mundial en los laboratorios Bell Telephone, y fue usado ampliamente en el
estudio del habla, acústica fonética y estudio de audiología, antes de ser sustituido por las
técnicas de procesamiento digital de señales.
Uno de los primeros analizadores de espectros en tiempo real desarrollados fue el UA-7
Ubiquitous, de la Federal Scientific, mostrado en la figura 1.1. Fueron desarrollados alrededor de
100 analizadores capaces de analizar señales con una frecuencia de hasta 20kHz., cada uno a un
precio aproximado de 35000 dólares, permitiendo a un número limitado de científicos realizar
estudios de análisis de audio.
Fig.1.1 Analizador de espectros en tiempo real Federal Scientific UA-7.
10
La compañía Spectral Dinamics realizó un progreso muy significativo en los analizadores de la
época, dotándolos de una pantalla de cascada diseñada primeramente para aplicaciones de sonar,
pero utilizada en estos dispositivos para la graficación del espectro de frecuencias. En la figura
1.2 se muestra el Analizador AN/BQR-20.
Fig.1.2 Analizador Spectral Dinamics AN/BQR-20.
En 1965 J. W. Cooley, doctor en matemáticas aplicadas e investigador de IBM, y John W. Turkey,
doctor en estadística de la universidad de Princeton, publicaron su histórico artículo que daba a
conocer una nueva técnica de procesamiento computacional de transformadas de Fourier
discretas, la Transformada Rápida de Fourier o FFT (llamada así por sus siglas en ingles Fast
Fourier Transform), un algoritmo capaz de calcular el espectro de frecuencias de las cuales está
conformada una señal de entrada de una forma más eficiente en términos de complejidad
computacional. Esta técnica permitió el procesamiento de una transformada FFT de 1024 puntos
(512 lineas) ser procesada en un centésimo del tiempo necesario por la técnica original. También
requirió 50% menos memoria para completar el cómputo. De esta manera este adelanto inspiró a
científicos entusiastas a desarrollar analizadores de espectros implementando estas nuevas
técnicas de procesamiento y haciendo uso nuevas tecnologías de desarrollo de componentes
electrónicos.
En 1967 la compañía Time Data diseño el primer sistema que implementaba el algoritmo FFT, un
analizador que estableció las bases de los analizadores que son utilizados hasta nuestros días, el
Time Data 100, mostrado en la figura 1.3.
11
Fig.1.3 Analizador FFT Time Data 100.
En la década de los setenta el análisis y procesamiento de las señales tuvo un auge muy
importante debido al diseño de nuevas herramientas que permitían a los especialistas en esta área
llevar a cabo tareas de análisis con mucho más facilidad, herramientas que conjuntaban una serie
de tecnologías de nueva generación que eran producidas por empresas muy importantes, debido a
esto los analizadores de espectro tenían un costo prohibitivo para los laboratorios comunes y
desgraciadamente esto sigue ocurriendo en la actualidad.
Dos de los instrumentos más necesarios en los laboratorios de acústica a finales de los años 70
eran un osciloscopio para señales de baja frecuencia, y un analizador de espectro. En esa época
los osciloscopios con retención de imagen tenían un alto costo, y no almacenaban la forma de
onda en memoria digital, sino en fósforo de alta persistencia, el cual sólo conservaba la imagen
durante algunos segundos.
Empresas como Hewlett Packard, General Radio Company y Nicolet Scientific desarrollaron
analizadores con mejores prestaciones, más precisos y mucho más rápidos, teniendo la capacidad
de procesar transformadas de 2048 puntos en 30 ms.
Muchos de los fabricantes de instrumentos se esforzaron principalmente por desarrollar equipos
cada vez más portátiles, y lo lograron implementando mejores procesos de diseño y desarrollo de
componentes electrónicos, también bajaron los costos de producción de dichos instrumentos,
permitiendo así a muchos más científicos llevar a cabo sus tareas de análisis.
12
En la figura 1.4 se muestra el analizador Nicolet Scientific 440A Mini Ubiquitous, uno de los
analizadores más ligeros para aquella época, alrededor de 30 libras, que ya incluía una pantalla
con resoluciones de 400 líneas y tenía un costo de alrededor de 13000 dólares.
Fig.1.4 Analizador Nicolet Scientific 440A Mini Ubiquitous.
En los años 80, dentro de las mejoras en la producción de componentes electrónicos, uno de los
grandes avances en el desarrollo de los analizadores de espectros fue el uso de procesadores
especialmente diseñados para llevar a cabo el procesamiento FFT, permitiendo a compañías como
la HP, desarrollar sistemas como el 3582A, con un rango de trabajo de frecuencias de 0.02 Hz a
25.599 kHz, el cual se muestra en la figura 1.5; incluye cuatro procesadores diseñados para
realizar mejor las tareas de graficación de resultados y mostraba al usuario una interfaz de
controles separados en botones, en vez de selecciones entre menús.
Fig.1.5 Analizador HP 3582A.
13
Con el auge de los sistemas de cómputo adquiridos por las universidades y algunas empresas,
comenzó una nueva era de analizadores basados en sistemas computacionales multipropósito,
mediante el uso de los lenguajes de programación era posible implementar los algoritmos de
procesamiento de señales de audio.
Algunos laboratorios disponían de computadoras personales PET desarrolladas por la empresa
Commodore, la primera computadora de casa con todo incluido. Su procesador 6502, que corría a
1 MHz controlaba la pantalla, el teclado, lectores de cassettes y cualquier periférico conectado a
alguno de sus múltiples puertos de expansión. Se trataba de una computadora con capacidad de
realizar procesamiento digital de señales de audio. El único lenguaje de programación de alto
nivel disponible en aquel tiempo era BASIC interpretado, almacenado en cintas magnéticas de
solo lectura. Es en este lenguaje de programación que se implementó el algoritmo y fue
ejecutado. El computador tardaba más de 10 de minutos en calcular una FFT de una señal de
audio de tamaño pequeño, demasiado tiempo como para construir un instrumento práctico, así
que fue necesario hacer uso de nuevas técnicas de adquisición de audio de los sistemas
computacionales para hacer posible la construcción de un analizador basado en un sistema de
cómputo personal.
En 1982 se empleaba un Track/Hold y un Conversor A/D de alto rendimiento (para la época), y
se montó un sistema de adquisición de datos, el cual funcionaba a una tasa de muestreo fija, la
más alta que podía lograrse (200.000 m/s). En la figura 1.6 se muestra el Track/Hold y el
Conversor A/D (12 bit), los cuales eran módulos híbridos, construidos con elementos discretos y
circuitos integrados.
Fig.1.6 Componente Track/Hold y el Conversor Analógico/Digital (12 bit).
14
El borde izquierdo del convertidor contenía los pines análogos, y el borde derecho los pines
digitales. Un panel metálico vertical rodeaba el convertidor en el centro, para reducir el
acoplamiento de ruido desde la parte digital a la análoga, disminuyendo la fluctuación de los bits
menos significativos.
Simultáneamente, se desarrolló un programa para calcular la FFT en lenguaje ensamblador,
logrando reducir el tiempo de cálculo a 4 segundos. Además se construyó un filtro anti-alias de
octavo orden. Debido a la baja velocidad del computador, los datos no se podían transferir en
tiempo real, de modo que se almacenaban en un banco de memoria y luego se transferían por la
puerta serial a menor velocidad. Con los elementos descritos se ensambló un analizador de
espectro rudimentario, con una banda única, de 0 a 50 kHz. En la figura 1.7 se muestra uno de los
espectros obtenidos. El eje X corresponde a magnitud en dB, y el eje Y a frecuencia en Hz.
Fig.1.7 Espectro obtenido.
El programa podía dibujar también la forma de onda, actuando como osciloscopio con retención
de imagen. El prototipo pasó a denominarse "Analizador Digital de Señales", o ADS, modelo
LA-160. El ADS funcionaba sólo en una banda de frecuencia. Cambiar la velocidad de muestreo
era relativamente simple, pero junto a ella debía cambiar la frecuencia de corte del filtro antialías,
lo cual era mucho más complejo, dado el alto orden del filtro.
15
En 1984, se agregaron varias frecuencias de muestreo menores y un filtro antialías de frecuencia
de corte variable. El problema del cambio de la frecuencia de corte se resolvió con filtros de
capacitor conmutado (switched capacitor filter) controlados por un reloj obtenido a partir de la
frecuencia de muestreo multiplicada por un PLL. Se construyó una caja para el ADS, la cual se
observa en la figura 1.8 a la derecha del Commodore PET, sobre la mesa.
Fig.1.8 Commodore PET y Analizador Digital de Señales modelo LA-160.
En 1987, se desarrolló una "Unidad de Traslación Espectral" para el ADS, la que permitía
analizar señales de alta frecuencia (algunos MHz). En la figura 1.9 se observa el ADS
funcionando como osciloscopio con retención de imagen, mostrando la respuesta impulso de un
acelerómetro usado como sensor de sismos, cuya frecuencia de resonancia es 1 Hz. (El eje
vertical corresponde al tiempo).
16
Fig.1.9 ADS funcionando como osciloscopio con retención de imagen.
En 1990, el PET ya no estaba operativo, pero se disponía de PCs tipo XT. Se desarrolló una
tarjeta de expansión para un PC-XT, y re diseñó el ADS para conectarse a dicha tarjeta. La mayor
velocidad del PC y la comunicación mediante una tarjeta de expansión conectada al bus del
equipo, permitió efectuar la transferencia en tiempo real, y eliminar la memoria del ADS. El
equipo fue re-ensamblado en una caja más compacta y nombrándolo modelo LA160 II, figura
1.10.
Fig.1.10 Analizador Digital de Señales modelo LA-160 II.
17
1.2 TENDENCIAS ACTUALES
1.2.1. Hardware de Analizadores de espectros.
Los analizadores de espectros utilizados en la industria del análisis de señales son totalmente
digitales, éstos poseen procesadores que integran mejores tecnologías y aumentan su desempeño,
en los cuales se implementan técnicas modernas como la Transformada Rápida de Fourier (FFT)
y los Filtros Digitales; en realidad estas técnicas han sido investigadas y desarrolladas con mucha
más anterioridad, solo que su aplicación no era posible en forma óptima debido al estado de la
electrónica en los tiempos que estas técnicas aparecieron.
Para la industria existe la posibilidad de adquisición de este tipo de equipo, las características de
estos varían, entre las cuales se encuentran las siguientes:
Márgenes de frecuencia desde 150 kHz hasta 3 Ghz.
Margen de medida de amplitud de –120 dBm hasta +20 dBm
Síntesis de frecuencia digital directa, sincronizada en fase.
Resoluciones de ancho de banda (RBW) 9 kHz, 120 kHz y 1 Mhz
Conexión serie para la documentación y el control del equipo
Anchos de banda de resolución (RBW) 20 kHz y 500 kHz
Teclado para introducción de la frecuencia y los niveles
Elaboración y presentación analógica de la señal
El analizador de espectros mostrado en la figura 1.11 fue diseñado por la empresa HAMEG,
conocida por diseñar productos robustos y económicos. Este analizador de espectros es de los que
ofrecen mejores prestaciones. Su margen de frecuencias que es capaz de analizar va desde los 150
kHz hasta los 3GHz. Tiene un margen de medida de amplitudes de -110 hasta 20dBm [4].
Este tipo de analizadores pueden ser usados en el estudio de las características de señales
eléctricas, acústicas u ópticas, pero para lograr analizar los diferentes tipos de señales es
necesario adecuar las salidas de los elementos que los producen a las entradas especiales de este,
un problema que a veces pueda ser sencillo y otras veces muy complejo, como por ejemplo en
cuanto al análisis de audio en tiempo real, es necesaria la creación de una interfaz de hardware
18
que logre adquirir el audio y convertirlo en señales capaces de ser ingresadas al analizador de
espectros. Es necesario hacer saber que este tipo de analizadores representan dificultad en su
adquisición, debido al costo.
Fig. 1.11 Analizadores de espectros HAMEG HM5530.
La empresa Agilent produce el analizador U8903A, capaz de procesar señales de audio que van
de los 10 Hz hasta los 100 kHz, con un costo de alrededor de $12000 dólares ofrece a los
usuarios una combinación de funcionalidades, entre ellas esta el contador de frecuencias,
voltímetro de corriente alterna y directa, analizador FFT para audio con una tarjeta de adquisición
de audio de poca distorsión. La figura 1.12 muestra al analizador de la empresa Agilent [5].
Fig. 1.12 Analizador de espectros Agilent U8903A.
El analizador de la empresa Audio Control SA3052, mostrado en la figura 1.13, emplea las
últimas tecnologías en microprocesadores para permitir al usuario llevar acabo análisis de audio
adquirido en tiempo real, de una forma más económica, de alrededor de 1100 dólares. Es un
analizador fuerte, confiable, fácil de usar. Es un analizador muy portátil y útil, debido a su batería
19
interno y cargador incluido, la habilidad de controlar una impresora directamente y su estuche
como accesorio incluido. Este instrumento no necesita de una computadora para operar y tiene
características que lo hacen muy útil para el análisis de audio, pero su costo sigue siendo muy
elevado para una institución educativa, $1,359.00 USD [6].
Fig. 1.13 Analizador de espectros Audio Control SA3052.
Hoy en día la industria ha desarrollado poderosos equipos de computo con poder de
procesamiento muy alto, que permite el uso de paquetes de software de análisis de señales en
tiempo real, los cuales pueden procesar y mostrar información espectral de la señal que se está
analizando; todo esto es factible, gracias al desarrollo alcanzado en la velocidad de operación de
los componentes micro electrónicos en las PC’s comunes.
1.2.2. Software de Analizadores de espectros.
Existe software que permite a investigadores e ingenieros el desarrollo de programas destinados
al procesamiento digital de señales, adquisición de datos, economía, inteligencia artificial, lógica
difusa, etcétera. Actualmente es muy común el uso de una herramienta de desarrollo de este tipo
llamada LabVIEW diseñada por la empresa National Instruments, que permite el desarrollo de
programas mediante un lenguaje gráfico, es decir, se utilizan iconos para el desarrollo de nuevos
programas.
20
Los programas desarrollados con esta herramienta son llamados “Instrumentos Virtuales”, debido
a que su apariencia y operación imita a instrumentos fiscos, como son osciloscopios y
multímetros. Todo instrumento virtual creado por esta herramienta de desarrollo usa funciones
que manipulan la entrada desde las interfaces de usuario y otras fuentes y muestran información o
la almacenan en archivos.
Esta herramienta permite a desarrolladores la creación de analizadores de espectro virtuales de
una manera simple, solo usando iconos, el gran problema está en poder darle la funcionalidad
necesaria para hacer práctico el uso de estos programas. Si bien mediante el uso de funciones, ya
incluidas dentro del software de desarrollo, es posible la implementación de algoritmos
computacionales como es la FFT, la adquisición de audio en tiempo real es el gran problema, en
vez de adquirir audio en tiempo real, este es obtenido mediante la lectura de archivos pregrabados
en la computadora o mediante el uso de un número limitado de dispositivos de adquisición de
audio que solo la empresa National Instruments fabrica. De esta manera, si un especialista en
acústica, desea llevar a cabo el análisis de una señal de audio adquirida en tiempo real, tiene
como principal dificultad la adquisición del hardware especifico que el software de desarrollo
reconoce, lo cual hace que el uso de este software de desarrollo no sea práctico.
Un elemento más a considerar para el uso de esta herramienta es el precio, este software de
desarrollo tiene un costo de cerca de $4510 dólares, lo cual incluye el software profesional, que
permite diseñar interfaces de usuario, adquisición de datos, control de instrumentación, funciones
matemáticas y de análisis.
Otro software analizador de espectros es SigView desarrollado por la empresa Signal Lab. Se
trata de un analizador de señales con un amplio rango de utilidades de análisis de espectros FFT,
funciones estadísticas y un sistema de virtualización fácil de usar.
Es distribuido como software de prueba que los analistas pueden descargar una versión
completamente funcional pero si requieren adquirir la licencia, tendrán que pagar cerca de $150
dólares.
El analizador SigView permite a los compradores el uso de una amplia gama de dispositivos para
adquisición de audio compatibles con su software, entre estos, la mayoría de las tarjetas de audio
21
existentes en computadoras personales comunes. El Sigview, del cual se muestra una captura de
pantalla en la figura 1.14, es un analizador muy bueno, pero su costo sigue siendo una
consideración al tratar de usarlo en una institución educativa.
Fig. 1.14 Software analizador de espectros Sigview.
Un analizador más que podemos encontrar en el mercado es el SpectraScope, desarrollado por la
empresa del mismo nombre. La figura 1.15 muestra una captura de pantalla del software
SpectraScope.
Fig. 1.15 Software analizador de espectros SpectraScope.
22
Este analizador ofrece muy buenas prestaciones a los usuarios, entre ellas esta la capacidad de
mostrar 3 modos de análisis, una graficación casi instantánea del espectro de frecuencia de la
señal de entrada resultado del procesamiento FFT, una graficación que muestra el valor máximo
de cada una de las FFTs resultantes y una que muestra el promedio relativo de la señal de audio
adquirida durante la prueba.
Se trata de un analizador de buenas prestaciones y una gama de controles muy útiles para tareas
de análisis a un costo relativamente mas bajo que otras opciones. La empresa SpectraScope
vende su producto a un costo de alrededor de $30 dólares. Muy buen precio, pero al adquirir este
software uno debe considerar que la empresa dejó de dar soporte a sus productos hace algunos
años, lo que significa que sería algo difícil conseguir ayuda para entender el funcionamiento del
sistema y en caso de un funcionamiento no deseado, uno no tiene el código fuente del software
para realizar las correcciones necesarias.
23
CONCLUSIONES
En acústica, un analizador de espectros ha sido ampliamente utilizado en la ciencia del habla,
fonética e investigaciones en audiología. En consecuencia a la llegada de nuevas técnicas de
procesamiento digitales se desarrollaron nuevas formas de analizar fenómenos acústicos.
Los analizadores de espectros modernos se han beneficiado de las mejoras hechas en las
capacidades de las computadoras personales. El contenido de relativa baja frecuencia de las
señales acústicas comunes como son el habla o la música (típicamente entre 0 y 20kHz) puede ser
muestreada por las tarjetas de audio existentes que forman parte de la mayoría de computadores
personales que en este momento se encuentran en el mercado. Dado que no se requiere un
hardware especializado para la adquisición de audio, es posible la implementación de un
analizador de espectros completamente en software.
A diferencia de los analizadores de espectro de frecuencias de radio, existen analizadores para
aplicaciones acústicas basados en software a un costo más bajo, accesible para profesionales
industriales, pero no mucho para instituciones educativas, académicos y estudiantes.
La compra de un software a un precio elevado hace que la adquisición de un analizador de este
tipo sea un sacrificio muy grande, sabiendo que existe software de desarrollo que nuestra
institución ya posee y que con la debida preparación es posible el desarrollo de analizadores de
espectros de muy buenas prestaciones y con cumplimiento a las necesidades practicas de los
usuarios de los laboratorios de acústica especializados. Un ejemplo de esto es el analizador de
espectros de audio que se presenta en esta tesis, desarrollado en el entorno de programación
Matlab®.
El espectro de frecuencias generado por un analizador provee una firma acústica de una señal de
entrada. Una firma acústica del habla humano puede ser caracterizada y utilizada para identificar
a la persona a quien pertenece esta firma. Esto es de interés particular en campos de investigación
judicial y análisis forense. Similarmente, el análisis de una firma acústica de un instrumento
musical puede ser utilizado para la caracterización de diferencias sutiles entre instrumentos de
alta calidad y otros que podrían considerarse mediocres.
24
“INTERFAZ GRÁFICA PARA EL ANÁLISIS EN EL DOMINIO TEMPORAL Y
FRECUENCIA DE SEÑALES DE AUDIO EN TIEMPO REAL”
CAPÍTULO 2
MARCO TEÓRICO
25
“INTERFAZ GRÁFICA PARA EL ANÁLISIS EN EL DOMINIO TEMPORAL Y
FRECUENCIA DE SEÑALES DE AUDIO EN TIEMPO REAL”
MARCO TEÓRICO.
2.1 PROCESAMIENTO DE SEÑALES
El Procesamiento de señales es el procesado, amplificación e interpretación de señales. Las
señales pueden proceder de diversas fuentes. Hay varios tipos de procesamiento de señales,
dependiendo de la naturaleza de las mismas.
Procesamiento digital - para señales digitalizadas. El procesado se hace mediante circuitos
digitales, microprocesadores y ordenadores con márgenes de frecuencia desde 150 kHz
hasta 3 GHz.
Procesamiento analógico - para señales no digitalizadas.
Procesamiento de audio - para señales electrónicas que representan sonidos.
Procesamiento de voz - para analizar señales de voz humana.
Procesamiento de vídeo - para interpretar movimientos en escenas.
Procesamiento de matrices.
2.2 PROCESAMIENTO DIGITAL DE SEÑALES
El Procesamiento Digital de Señales (PDS) es un área de la ingeniería que se dedica al análisis y
procesamiento de señales (audio, voz, imágenes, video) que son discretas. Aunque comúnmente
las señales en la naturaleza nos llegan en forma analógica, también existen casos en que estas son
por su naturaleza digitales, por ejemplo, las edades de un grupo de personas, el estado de una
válvula en el tiempo (abierta/cerrada), etc.
2.2.1. Propósito
¿Por qué habremos de cambiar lo que es natural en nosotros? Si casi todo en la naturaleza se
mueve, se basa y se desarrolla de forma analógica, ¿cuál es la intención de "digitalizar"?
26
Veamos por qué es conveniente. El procesamiento se hace en señales digitales por diferentes
razones:
Una señal digital es más fácil de procesar que una analógica.
Las señales son convertidas a formato discreto (digital) para facilitar su transmisión o
almacenamiento.
Es posible realizar mediante procesamiento digital acciones imposibles de obtener
mediante el procesamiento analógico (por ejemplo, filtros con respuesta de frecuencia
arbitraria).
El procesamiento se hace en forma digital porque éste es usualmente más cómodo de realizar y
más barato de implementar que en el procesamiento analógico. Además las señales digitales
requieren usualmente menos ancho de banda y pueden ser comprimidas. Sin embargo, hay
pérdida (ruido de cuantificación) inherente de información al convertir la información continua
en discreta; y puede haberla si las muestras se toman demasiado espaciadas [9].
2.2.2. Aplicaciones
Una señal digital es más fácil de procesar que una analógica.
Procesamiento Digital de Sonido
Procesamiento Digital de Voz
Procesamiento Digital de Imágenes
Procesamiento Digital de Video
El PDS se utiliza en el procesamiento de música (por ejemplo MP3), de voz (por ejemplo,
reconocimiento de voz) en teléfonos celulares, de imágenes (en la transmisión de imágenes
satelitales) y video (DVDs).
27
2.2.3. Transformadas
Uno de los beneficios principales del PDS es que las transformaciones de señales son más
sencillas de realizar. Una de las más importantes transformadas es la Transformada de Fourier
discreta (TFD). Esta transformada convierte la señal del dominio del tiempo al dominio de la
frecuencia. La TDF permite un análisis más sencillo y eficaz sobre la frecuencia, sobre todo en
aplicaciones de eliminación de ruido y en otros tipos de filtrado.
Otra de las transformadas importantes es la Transformada de Coseno Discreta la cual es similar a
la anterior en cuanto a los cálculos requeridos para obtenerla, pero esta convierte a la señales en
componentes del coseno trigonométrico. Esta transformada es una de las bases del algoritmo de
compresión de imágenes JPEG [10].
2.2.4. Procesadores Digitales De Señales
Algunos modelos de microprocesadores son optimizados para el PDS. Estos procesadores se
llaman Procesadores Digitales de Señales. Estos realizan operaciones para PDS más rápida y
eficientemente.
Los PDS permiten aplicaciones que no podrían realizarse efectivamente con señales analógicas
como, por ejemplo, almacenar una película de cine en un disco compacto (DVD) o canciones en
un aparato portátil (iPod).
2.3 ANÁLISIS DE SEÑALES
Cuando se diseñan los circuitos electrónicos de comunicaciones, con frecuencia se tiene que
analizar y pronosticar el funcionamiento del circuito con base a la distribución de potencia y la
composición de frecuencias de la señal de información. Esto se hace con el método matemático
llamado análisis de señales. Aunque todas las señales en comunicaciones y electrónica no son
ondas senoidales o cosenoidales de una sola frecuencia, muchas de ellas si lo son y las que no las
son se pueden representar con una combinación de funciones de seno y coseno [11].
28
2.3.1. Señales Senoidales
El análisis de señales implica la realización del análisis matemático de frecuencia de longitud de
onda y valor de voltaje de una señal. Las señales eléctricas son variaciones de voltaje, o de
corriente respecto al tiempo, que se pueden representar por una serie de ondas seno o coseno.
La descripción matemática de una onda de voltaje o de corriente con frecuencia única es:
v(t) = Vsen(2πft +θ) o v(t) = Vcos(2πft +θ) (1)
i(t)= Isen(2πft +θ) o i(t)= Icos(2πft +θ) (2)
donde:
v(t) = voltaje de onda senoidal, variable con respecto al tiempo.
i(t)= corriente de onda senoidal, variable con respecto al tiempo.
V= voltaje máximo (volts)
F= frecuencia (hertz)
θ = desplazamiento de fase (radianes)
2πf= w velocidad angular (radianes por segundo)
El uso de una función seno o coseno para representar una señal es completamente arbitrario y
depende de cual se escoge como frecuencia. Sin embargo, se debe observar que sen ө = cos (ө0 –
900 ). Por consiguiente son válidas las siguientes ecuaciones
v(t) = Vsen(2πft +θ) = Vcos(2πft +θ - 90) (3)
v(t)= Vcos(2πft +θ) = Vsen(2πft +θ +90) (4)
Las formulas anteriores son para ondas repetitivas, de una sola frecuencia. A esa forma de onda
se le llama onda periódica, porque se repite con rapidez uniforme, es decir, cada ciclo sucesivo de
la señal tarda exactamente el mismo tiempo y tiene exactamente las mismas variaciones de
amplitud que en cualquier otro ciclo; cada ciclo tiene exactamente la misma forma, una serie de
ondas seno, coseno o cuadradas, son ejemplos de ondas periódicas. Las ondas periódicas se
29
pueden analizar en el dominio del tiempo o en el dominio de la frecuencia. De hecho, con
frecuencia se hace necesario pasar del dominio del tiempo al de la frecuencia y viceversa cuando
se analiza el funcionamiento de un sistema.
El análisis de una señal en el modo temporal con ayuda de un osciloscopio permite conocer parte
de la información contenida en una señal compleja, como es el caso de una señal modulada. En el
modo temporal no se puede conocer las componentes de frecuencia que conforman a la señal
compleja. El analizador de señales nos permite conocer estas componentes pero no resulta un
método de determinación completo y totalmente preciso, porque por ser un método manual puede
hacer que no se detecten ciertas armónicas [11].
2.3.2. Representación en el Dominio del Tiempo
Un osciloscopio normal es un instrumento del dominio del tiempo. La pantalla muestra una
representación de la amplitud de la señal de entrada de la función del tiempo, y se le suele llamar
forma de onda de la señal.
En esencia, una forma de onda de la señal muestra la forma y la magnitud instantánea de la señal
con respecto al tiempo. Pero no necesariamente indica el valor de la frecuencia. Con un
osciloscopio, la desviación vertical es proporcional a la amplitud de la señal total de entrada, y la
deflexión horizontal es la función del tiempo (frecuencia de barrido).
La figura 2.1 muestra la forma de onda de una señal senoidal de frecuencia única de f (hertz) con
amplitud máxima de v volts.
30
Fig.2.1 Representación en el dominio del tiempo (forma de onda de la señal) de una onda
senoidal de frecuencia única [12].
La figura 2.2 muestra la representación en el dominio del tiempo de una señal cuadrada, donde el
eje vertical representa a la amplitud de la señal mientras que el eje horizontal representa el
tiempo.
Fig.2.2 Forma de onda cuadrada [12].
La figura 2.3 muestra la representación en el dominio del tiempo de una señal triangular, donde el
eje vertical representa a la amplitud de la señal mientras que el eje horizontal representa el
tiempo.
31
Fig.2.3 Forma de onda triangular
2.3.3. Representación en el Dominio de la Frecuencia
El analizador de espectros es un instrumento de dominio de la frecuencia. En esencia no se
despliega ninguna forma de onda en la pantalla. En vez de lo anterior se muestra una gráfica de
amplitud contra la frecuencia (la cual se conoce como espectro de frecuencias).
En el analizador de espectro, el eje horizontal representa la frecuencia y el eje vertical representa
la amplitud. En consecuencia, existirá una deflexión vertical para cada frecuencia que esta
presente en la entrada. La forma de onda de entrada se barre a una frecuencia variable, con ayuda
de un filtro de paso banda con Q elevado, cuya frecuencia central esta sincronizada con la
velocidad de barrido horizontal del tubo de rayos catódicos de la pantalla. Cada frecuencia que
está presente en la forma de onda de entrada produce una línea vertical en la pantalla (estas son
las componentes espectrales). La deflexión vertical (altura) de cada línea es proporcional a la
amplitud de la frecuencia que representa.
Una representación en el dominio de la frecuencia de la onda muestra el contenido de todas las
componentes de entrada en un instante específico de tiempo. La figura 2.4. Muestra el espectro
de frecuencias de una señal senoidal de frecuencia única cuya amplitud pico es V volts y la
frecuencia es f hertz.
32
Fig.2.4 Representación en el dominio de la frecuencia (espectro) de una onda senoidal de
frecuencia única [12].
La figura 2.5 Muestra el espectro de frecuencias de una señal cuadrada. Se muestran las
amplitudes máximas y las frecuencias de las primeras cinco armónicas impares.
Fig.2.5 Espectro de frecuencias de la forma de onda cuadrada [12].
La figura 2.6 Muestra el espectro de frecuencias de una señal triangular. Se muestran las
amplitudes máximas y las frecuencias de las primeras cinco armónicas impares.
Fig.2.6 Espectro de frecuencias de la forma de onda triangular [12].
33
La figura 2.7 muestra la representación en el dominio del tiempo de varios tipos de señales
generadas comúnmente en laboratorios de análisis y procesamiento de señales.
Fig.2.7 Representación de gráficas en el domino del tiempo y frecuencia
“a)” Representación en el dominio del tiempo de una señal senoidal.
“b)” Representación en frecuencia de una señal senoidal pura.
“c)” y “d)”. En el espectro de frecuencia, una señal modulada en amplitud se
presenta con la fundamental y sus dos bandas laterales separadas.
“e)” y “f)”Representación en tiempo y del espectro de frecuencias que componen
una onda cuadrada.
“g)” y “h)” Representación de una señal modulada en frecuencia por un tono
sinusoidal simple [12].
34
2.3.4. Ondas periódicas no senoidales.
En esencia, toda onda repetitiva formada por más de una onda senoidal o cosenoidal relacionada
armónicamente, es una onda no senoidal o periódica compleja.
Para analizar una onda periódica compleja es necesario usar una serie matemática inventada en
1826 por el físico matemático francés, el barón Jean Fourier. Esta serie se llama serie de Fourier.
2.3.5. Serie de Fourier.
Esta serie se usa en el análisis de señales para representar las componentes senoidales de una
onda periódica no senoidal, es decir, para representar una señal del dominio del tiempo a una
señal en el dominio de la frecuencia, en términos de una suma de componentes senoidales y
cosenoidales. En general, se puede obtener una serie de Fourier para cualquier función periódica,
en forma de una serie de funciones trigonométricas con la siguiente forma matemática:
f(t)= A0+A1cosα+A2cos2α+A3cos3α+...+Ancosnαº
+B1senβ+B2sen2β+B3sen3β+...+Bnsen nβ donde α=β (5)
La ecuación 5 indica que la forma de onda f(t) comprende una componente de cd (A0), una serie
de funciones cosenoidales en las que cada término sucesivo tiene una frecuencia que es múltiplo
entero de la frecuencia del primer término cosenoidal de la serie, y una serie de funciones
senoidales en la que cada término sucesivo tiene una frecuencia que es un múltiplo entero de la
del primer término senoidal de la serie. No hay restricciones para los valores o los valores
relativos de las amplitudes de los términos seno y coseno. La ecuación 5 se enuncia como sigue
en palabras: Cualquier forma de onda periódica está formada por un componente promedio y una
serie de ondas senoidales y cosenoidales relacionadas armónicamente. Una armónica es un
múltiplo entero de la frecuencia fundamental. La frecuencia fundamental es la primera armónica,
y es igual a la frecuencia (rapidez de repetición) de la forma de onda. El segundo múltiplo de la
fundamental se llama segunda armónica, el tercer múltiplo es la tercera armónica, y así
sucesivamente. La frecuencia fundamental es la mínima necesaria para representar a una forma
de onda. Por consiguiente, la ecuación 5 se puede escribir como sigue:
f(t)=dc+fundamental+2da. armónica+3ra. armónica+...+n-ésima armónica [10].
35
2.4 ANALIZADORES DE ESPECTROS.
Un analizador de espectros es un instrumento de medición capaz de descomponer una señal en las
diversas frecuencias que la constituyen indicando el nivel amplitud de cada una. Si se trata de un
analizador de espectros para audio, este adquiere el audio por medio de un dispositivo,
regularmente es una entrada de audio analógico, y muestra el espectro de frecuencias con las
cuales se puede reconstruir la señal de entrada. Dado que el comportamiento de muchos
materiales acústicos (aislantes y absorbentes) depende de la frecuencia, para conocer el efecto de
tales materiales sobre un ruido dado es preciso conocer cuáles son las frecuencias que contiene y
el nivel de cada una de ellas. También los efectos del ruido sobre el ser humano dependen de la
frecuencia, tanto el riesgo auditivo como la sensación de molestia.
El núcleo que permite tener las capacidades mencionadas a un analizador de espectros es un
procesador computacional y una serie de algoritmos que permiten la adquisición de audio y el
procesamiento de estas señales de entrada. Entre estos algoritmos el de mayor importancia es la
Transformada Rápida de Fourier comúnmente llamada por sus siglas en ingles FFT (Fast Fourier
Transform), es un algoritmo matemático que permite conocer las componentes frecuenciales de
una señal de entrada discreta [12].
2.5 ANTECEDENTES DE LA FFT
A mediados de los años setenta se introdujo un algoritmo, conocido en la actualidad como la
transformada rápida de Fourier o FFT (por sus siglas en ingles), el cual fue descubierto
independientemente por Cooley y Turkey en 1965. Este algoritmo también tiene una larga
historia y puede, de hecho, encontrarse en las notas de Gauss, en “Gauss and the History of the
Fast Fourier Transform”. Lo que hizo tan importante a este moderno descubrimiento fue el hecho
de que la FFT demostró adaptarse perfectamente a la ejecución digital eficiente, lo cual redujo el
tiempo requerido para calcular las transformadas por órdenes de magnitud. Con esta herramienta,
muchas ideas interesantes, pero anteriormente poco prácticas, en las que se utilizaban las series y
transformadas discretas de Fourier, repentinamente fueron practicables, y el desarrollo de las
técnicas de análisis de señales y de sistemas discretos avanzaron a un ritmo acelerado [9].
36
Lo que ha surgido de esta larga historia es un marco de referencia poderoso y coherente para el
análisis de señales y sistemas continuos y discretos, así como un conjunto extraordinariamente
amplio de aplicaciones existentes y potenciales.
La transformada rápida de Fourier es simplemente un algoritmo rápido para la evaluación
numérica de integrales de Fourier desarrollado en los laboratorios de IBM, y su importancia
radica en la rapidez de cálculo de aplicaciones: ecualización y filtrado en equipos de audio/vídeo
en tiempo real, comunicaciones, etc.
Evidentemente hacemos uso del mismo algoritmo en el programa para obtener rápidamente el
espectro de la señal a partir de la señal temporal de entrada, aunque se podría haber hecho a partir
de la integral discreta de Fourier, siendo en este caso necesario mucho más tiempo de cálculo.
La diferencia de velocidad de cálculo entre la tradicional transformada discreta y la FFT aumenta
según el número de muestras a analizar, como se puede apreciar en la gráfica 2.8, que muestra el
número de operaciones necesarias para llevar a cabo el cálculo de cierto número de muestras, se
muestra la complejidad computacional con la que se llevaba a cabo el cálculo de las muestras con
el algoritmo de la Transformada Discreta y la complejidad del algoritmo de la Transformada
Rápida de Fourier. Se nota que mientras una aumenta el número de operaciones necesarias para la
resolución de forma exponencial para la ejecución de la Transformada Discreta, la FFT lo hace de
forma prácticamente lineal
Fig.2.8 Gráfica de DT contra FFT [12].
37
2.6 TRANSFORMADA DISCRETA DE FOURIER
Una de las razones del gran aumento en el uso de métodos de tiempo discreto para el análisis y
síntesis de señales y sistemas fue el desarrollo de herramientas sumamente eficientes para realizar
el análisis de Fourier de secuencias de tiempo discreto. A la cabeza de estos métodos esta una
técnica muy relacionada con el análisis de Fourier de tiempo discreto y que resulta ideal para
usarla en computadora o ponerla en practica en circuitos electrónicos digitales de uso especifico.
Esta técnica es la transformada discreta de Fourier (DFT por sus siglas en ingles) para señales de
duración finita.
Sea x[n] una señal de duración finita; esto es, hay un entero N1 tal que
x[n]=0 fuera del intervalo 0<=n<=N1-1
Además, sea que X(ejw
) denota la transformada de Fourier de x[n]. Podemos construir la señal
periódica x [n ] que sea igual a x [n ] en un periodo. En concreto, sea N>=N1 un entero dado, y
sea x [n ] periódica con periodo N tal que
x [n ]= x [n ] , 0⩽n⩽N− 1
Los coeficientes de la serie de Fourier para x[n]están dados por
ak=1
N∑⟨N ⟩
x e− jk (2PI /N )n
(6)
Seleccionando el intervalo de la sumatoria para que x [n ]= x [n ] , obtenemos
ak=1
n∑n= 0
N− 1
x [n ]e− jk (2PI / N )n
(7)
El conjunto de coeficientes definidos en la ecuación (7) comprenden la DFT de x[n].
Específicamente, la DFT de x[n] se denota comúnmente por X [k ] y se define como
X [k ]= ak=1
n∑n= 0
N− 1
x [n ]e− jk (2PI / N )n
, k= 0,1,. .. , N− 1 (8)
La importancia de la DFT emana de varios hechos. Primero, observe que la señal de duración
finita se puede recuperar a partir de su DFT. En concreto, tenemos
x [k ]= ∑k= 0
N− 1
X [k ]e− jk (2PI / N )n
,n= 0,1,. .. , N− 1 (9)
38
Así, la señal de duración finita puede especificarse como el conjunto finito de valores diferentes
de cero o por el conjunto finito de valores de en su DFT. Además, debido a su cercana relación
con la serie y la transformada de Fourier de tiempo discreto, la DFT hereda algunas de sus
importantes propiedades [9].
2.7 TRANSFORMADA RÁPIDA DE FOURIER.
Hay muchos problemas de importancia práctica en los cuales uno desea calcular la transformada
discreta de Fourier (DFT) de señales de tiempo discreto. A menudo, estas señales son de bastante
larga duración, y en tales casos es muy importante usar procedimientos de cálculo eficientes. Una
de las razones para el incremento significativo en el uso de técnicas computarizadas para el
análisis de señales fue el desarrollo de una técnica muy eficiente conocida como el algoritmo de
la transformada rápida de Fourier (FFT) para el cálculo de la DFT de secuencias de duración
finita. A continuación se desarrolla el principio en el cual se basa la FFT.
Sea x[n] una señal que es 0 fuera del intervalo . Para N>=N1 la DFT del punto N de x[n] esta
dada por
X [k ]=1
N∑k=0
N− 1
x [n ]e− jk (2PI /N )n, k=0,1,...,N-1 (10)
Es conveniente reescribir la ecuación como
X [k ]=1
N∑k=0
N− 1
x [n ]W Nnk
(11)
donde
W N =e− j2PI /N (12)
Una medida útil de la complejidad de este cálculo es el número total de multiplicaciones
complejas requeridas [9].
39
2.8 TIEMPO REAL
El concepto de tiempo real viene del procesamiento digital de señales. En una descripción muy
corta un sistema de tiempo real es aquel capaz de procesar una muestra de señal antes de que
ingrese al sistema la siguiente muestra.
Los primeros sistemas de tiempo real se desarrollaron para la telefonía digital, utilizando
hardware de propósito específico. Con el paso del tiempo y la mejora constante en la velocidad
de los microprocesadores de propósito general, la implementación de sistemas de tiempo real se
ha convertido en un campo de la informática donde se han presentado condiciones y problemas
adicionales a los del primer párrafo enfocado el disco duro de una computadora.
2.9 COMPUTACIÓN EN TIEMPO REAL
La computación en tiempo real o informática en tiempo real está relacionada con los sistemas del
soporte físico (hardware) y la programática (software) que se ven limitados por problemas de
tiempo. Algunos tipos de programas como los empleados para jugar al ajedrez sólo disponen del
tiempo necesario para poder efectuar la siguiente jugada. Los servidores de Internet son otro
ejemplo de programas en los que se trabaja mucho para conseguir que sean cada vez más rápidos,
aunque la falta de rapidez raramente provoca fallos serios.
Se podría hacer una distinción entre aquellos sistemas que sufrirían un problema importante si se
sobrepasan las limitaciones de tiempo (tiempo real inmediato, crítico, activo o tiempo real duro),
y aquellos otros programas que no tendrían graves problemas si se sobrepasan dichas limitaciones
(tiempo real pasivo o tiempo real blando).
Los sistemas en tiempo real duro se encuentran típicamente interactuando a un nivel bajo con el
soporte físico del ordenador en los sistemas integrados. Suelen utilizarse para sistemas de control.
Por ejemplo, un sistema de gestión del motor de un coche es un sistema en tiempo real activo
porque una señal retrasada puede causar un daño o fallo en el motor. Otros ejemplos de sistemas
integrados en tiempo real activos son los sistemas médicos como los marcadores de pasos
artificiales y los controladores de procesos industriales.
40
Los sistemas de tiempo real blando se utilizan normalmente cuando hay un acceso compartido y
se necesitan mantener actualizados un número de sistemas conectados con una situación
cambiante. Un ejemplo lo serían los programas que mantienen y actualizan los planes de vuelo de
las compañías aéreas comerciales. Estos programas pueden funcionar en cuestión de segundos.
No sería posible ofrecer vuelos comerciales modernos si estas operaciones no se pudieran realizar
de manera fiable en tiempo real. Los sistemas de audio y video en directo también son sistemas
en tiempo real pasivos típicos ya que si se sobrepasan los límites de tiempo lo único que puede
pasar es que se empeore la calidad pero el sistema continua trabajado.
Las necesidades de los programas de tiempo real se pueden solucionar con sistemas operativos en
tiempo real, que ofrecen un marco sobre el que construir aplicaciones de programas en tiempo
real.
2.10 UNIDADES DE MEDIDA ACÚSTICA
2.10.1. Decibel
Se denomina decibelio a la unidad relativa empleada en Acústica y Telecomunicación para
expresar la relación entre dos magnitudes, acústicas o eléctricas, o entre la magnitud que se
estudia y una magnitud de referencia.
El decibelio (dB) es una expresión de la relación entre una cantidad variable y una cantidad de
referencia conocida. Hay dos diferentes, relacional y dependiente del uso, las fórmulas usadas
para calcular los decibelios y esta dualidad pueden causar los problemas para los que no
entiendan los dos diversos usos y su relación.
Debido a que los decibelios expresan una relación entre una variable y una referencia sabida, son
útiles para una amplia variedad de mediciones en acústica, física, electrónica y otra las
disciplinas.
El cálculo de decibelios utiliza un logaritmo para permitir representaciones de relaciones muy
grandes o muy pequeñas con un número convenientemente pequeño de elementos (similar a la
notación científica).
41
Un decibelio es algo similar en concepto al por ciento, que es también una expresión de la
relación entre una variable y una cantidad de referencia sabida, pero el por ciento tiene solamente
un fórmula (el X% = X/100), es terminantemente un cociente y tiene solamente una cantidad
variable puesto que su cantidad de referencia es fija en 100. Otra vez similar a los por ciento, el
decibelio también se considera una cantidad sin dimensiones, una cantidad sin ninguna unidad
física y solamente un número puro que expresa una relación.
Se utiliza una escala logarítmica porque la sensibilidad que presenta el oído humano a las
variaciones de intensidad sonora sigue una escala aproximadamente logarítmica, no lineal. Por
ello el belio (B) y su submúltiplo el decibelio (dB), resultan adecuados para valorar la percepción
de los sonidos por un oyente. Se define como la comparación (relación) entre dos sonidos porque
en los estudios sobre acústica fisiológica se vio que un oyente al que se le hace escuchar un solo
sonido no puede dar una indicación fiable de su intensidad, mientras que, si se le hace escuchar
dos sonidos diferentes, es capaz de distinguir la diferencia de intensidad.
Normalmente una diferencia de 3 decibelios, que representa el doble de señal, es la mínima
diferencia apreciable por un oído humano sano.
El sonido más débil que un oído sano puede escuchar o detectar tiene una amplitud de una
veinteava millonésima de un Pascal (20m Pa) # algo así como 5.000.000.000 veces menos que la
presión atmosférica normal. Un cambio de presión de 20mPa es tan pequeño que hace que la
membrana del oído se deflecte una distancia menor que el diámetro de una sola molécula de
hidrógeno. Sorprendentemente, el oído puede tolerar presiones sonoras de hasta un millón de
veces más alta que ésta. Así, si medimos el sonido en Pa, terminaríamos con números muy
grandes y poco manejables. Para evitar esto, se usa otra escala - el decibel o escala dB.
El decibel es una relación matemática del tipo logarítmica donde si aumenta 3 dB un ruido,
significa que aumenta al doble la energía sonora percibida. El umbral de audición está en el 0 dB,
y el umbral de dolor en los 120 dB. Debido a que nuestro oído no responde igual a todas las
frecuencias de un ruido, vale decir, que escuchamos mejor ciertos sonidos que otros dependiendo
de su frecuencia, se definió el decibel A (dBA). Esta es otra unidad, basada en el dB, que es una
42
aproximación de la percepción auditiva del oído humano y se obtiene mediante la utilización de
un filtro incluido en el sonómetro de medición.
La población en general está expuesta a niveles de ruido que oscilan entre los 35 y 85 dBA. Por
debajo de los 45 dBA en un clima de ruido normal, nadie se siente molesto, pero cuando se
alcanzan los 85 nadie deja de estarlo: por eso entre 60 y 65 dBA, para ruido diurno, se suele
situar el umbral donde comienza la molestia. Para tener una idea, podemos establecer que en el
ambiente de una biblioteca se tienen 40 dBA, una conversación en voz alta a un metro de
distancia registra unos 70 dBA, el tráfico de una calle muy agitada sobrepasa fácilmente los 85
dBA al borde de la vereda, y el despegue de un avión a 70 metros de distancia son 120 dBA.
2.10.2. Umbral Auditivo
Llamamos umbrales auditivos a las intensidades mínimas a partir de las cuales el sonido es
apreciable por el oído humano e intensidades máximas a partir de la cual el sonido produce en el
oído sensación de dolor.
La figura 2.9 muestra algunos elementos de nuestro entorno común que son capaces de generar
diferentes niveles de sonido.
43
Fig.2.9 Niveles de Sonidos
2.11 RANGO DINÁMICO
Una característica muy importante de los analizadores de espectro es la capacidad de presentar
señales de niveles altos y bajos en forma simultánea, siendo esta capacidad el Rango Dinámico,
el cual es presentado en decibeles (dB).
La señal compuesta que se inyecta al Analizador, tiene componentes armónicas de diferentes
frecuencias y amplitud, teniendo que amplificar señales fuertes y débiles en forma
simultáneamente. Es decir, para tener una mejor apreciación de las componentes armónicas de
una señal, el instrumento debe poder detectar las armónicas de orden superior que tienen una
amplitud muy pequeña comparada con la amplitud de la fundamental.
En los amplificadores lineales, si pretendemos darle suficiente amplificación para detectar las
señales pequeñas, se pueden saturar las señales fuertes. Lo ideal sería que la ganancia del
amplificador sea variable en función de la amplitud de la señal recibida, de modo de dar mayor
amplificación a las señales débiles que a las fuertes. Esto permitiría representar en la pantalla a
44
las armónicas de orden superior. Esta capacidad de presentar niveles altos y bajos
simultáneamente se llama rango dinámico.
Para conseguir esta ganancia variable, se usan amplificadores logarítmicos y la escala se presenta
en escala logarítmica, con lo cual las mediciones de amplitud se hacen en forma relativa.
Para mejorar la resolución de este instrumento, se tiene dos escalas verticales. Una lineal (LIN) y
otra en escala logarítmica (LOG). Haciendo uso de atenuadores calibrados, se pueden obtener
valores relativos entre las señales, pudiéndose discernir las señales de bajo nivel.
2.12 TARJETAS DE ADQUISICIÓN DE AUDIO
Una tarjeta de sonido o placa de sonido es una tarjeta de expansión para computadoras que
permite la entrada y salida de audio bajo el control de un programa informático.
El uso típico de las tarjetas de sonido es proveer a las aplicaciones multimedia del componente de
audio. Estas aplicaciones multimedia engloban composición y edición de video o audio,
presentaciones multimedia y entretenimiento (videojuegos) o hasta procesamiento y análisis de
señales. Algunos equipos tienen la tarjeta ya integrada, mientras que otros requieren tarjetas de
expansión.
Fig. 2.10 Tarjeta de sonido PCI Sound Blaster Live! Fotografía de David Henry 2005-07-06
45
2.12.1. Historia de las tarjetas de sonido para la arquitectura del IBM PC
Las tarjetas de sonido eran desconocidas para los ordenadores basados en el IBM PC hasta 1988,
siendo el altavoz interno del PC el único medio para producir sonido del que se disponía. El
altavoz estaba limitado a la producción de ondas cuadradas, que generaba sonidos descritos como
"beeps". Algunas compañías, entre las que destacaba Access Software, desarrollaron técnicas
para la reproducción del sonido digital en el altavoz del PC. El audio resultante, aunque
funcional, sufría distorsiones, tenía un volumen bajo y normalmente requería de los recursos
destinados al resto de procesos mientras los sonidos eran reproducidos. Otros modelos de
ordenadores domésticos de los años 80 incluían soporte hardware para la reproducción de sonido
digital y/o síntesis musical, dejando al IBM PC en desventaja cuando aparecieron las aplicaciones
multimedia como la composición de música o los juegos.
Es importante destacar que el diseño inicial y el planteamiento de marketing de las tarjetas de
sonido de la plataforma IBM PC no estaban dirigidas a los juegos, pero sí que se encontraban en
aplicaciones de audio específicas como composición de música o reconocimiento de voz. Esto
llevó al entorno de Sierra y otras compañías en 1988 a cambiar el enfoque de las tarjetas hacia los
videojuegos.
2.12.2. Características Generales
Una tarjeta de sonido típica, incorpora un chip de sonido que por lo general contiene el Conversor
digital-analógico, el cual cumple con la importante función de "traducir" formas de ondas
grabadas o generadas digitalmente en una señal analógica y viceversa. Esta señal es enviada a un
conector (para audífonos) en donde se puede conectar cualquier otro dispositivo como un
amplificador, un altavoz, etc. Para poder grabar y reproducir audio al mismo tiempo con la tarjeta
de sonido debe poseer la característica "full-duplex" para que los dos conversores trabajen de
forma independiente.
Los diseños más avanzados tienen más de un chip de sonido, y tienen la capacidad de separar
entre los sonidos sintetizados (usualmente para la generación de música y efectos especiales en
tiempo real utilizando poca cantidad de información y tiempo del microprocesador y quizá
compatibilidad MIDI) y los sonidos digitales para la reproducción.
46
Esto último se logra con DACs (por sus siglas en inglés Digital-Analog-Conversor o Conversor-
Digital-Analógico), que tienen la capacidad de reproducir múltiples muestras digitales a
diferentes tonos e incluso aplicarles efectos en tiempo real como el filtrado o distorsión.
Algunas veces, la reproducción digital de multicanales puede ser usado para sintetizar música si
es combinado con un banco de instrumentos que por lo general es una pequeña cantidad de
memoria ROM o flash con datos sobre el sonido de distintos instrumentos musicales. Otra forma
de sintetizar música en las PC's es por medio de los "códecs de audio" los cuales son programas
diseñados para esta función pero consumen mucho tiempo de microprocesador.
La mayoría de las tarjetas de sonido también tienen un conector de entrada o "Line In" por el cual
puede entrar cualquier tipo de señal de audio proveniente de otro dispositivo como micrófonos,
casseteras entre otros y luego así la tarjeta de sonido puede digitalizar estas ondas y guardarlas en
el disco duro del computador.
Otro conector externo que tiene una tarjeta de sonido típica es el conector para micrófono. Este
conector está diseñado para recibir una señal proveniente de dispositivos con menor voltaje al
utilizado en el conector de entrada "Line-In".
2.12.3. Conexiones
Casi todas las tarjetas de sonido se han adaptado al estándar PC99 de Microsoft que consiste en
asignarle un color a cada conector externo, de este modo:
Color Función
Rosa Entrada analógica para micrófono.
Azul Entrada analógica "Line-In".
Verde Salida analógica para la señal estéreo principal (altavoces frontales).
Negro Salida analógica para altavoces traseros.
Plateado Salida analógica para altavoces laterales.
Naranja Salida Digital SPDIF (que algunas veces es utilizado como salida análoga
para altavoces centrales).
47
Los conectores más utilizados para las tarjetas de sonido a nivel de usuario son los mini-jack al
ser los más económicos. Con los conectores RCA se consigue mayor calidad ya que utilizan dos
canales independientes, el rojo y el blanco, uno para el canal derecho y otro para el izquierdo. A
nivel profesional se utilizan las entras y salidas S/PDIF, también llamadas salidas ópticas
digitales, que trabajan directamente con sonido digital eliminando las pérdidas de calidad en las
conversiones. Para poder trabajar con dispositivos MIDI se necesita la entrada y salida MIDI.
2.12.4. Muestreo de sonido
Para producir un sonido el altavoz necesita una posición donde golpear, que genera, dependiendo
del lugar golpeado, una vibración del aire diferente que es la que capta el oído humano. Para
determinar esa posición se necesita una codificación. Por lo tanto cuanto mayor número de bits se
tenga, mayor número de posiciones diferentes se es capaz de representar. Por ejemplo, si la
muestra de sonido se codifica con 8 bits se tienen 256 posiciones diferentes donde golpear. Sin
embargo con 16 bits se conseguirían 65536 posiciones. No se suelen necesitar más de 16 bits, a
no ser que se quiera trabajar con un margen de error que impida que la muestra cambie
significativamente.
El muestreo (o comúnmente llamado sampleo) consiste en tomar el valor de la señal eléctrica a
intervalos regulares de tiempo (tasa de muestreo). Para audio de alta calidad suele bastar con
tasas de 40-44 kHz, con 32 kHz se tendría un ancho de banda similar al de la radio FM o una
cinta de cassette. Para reproducir un determinado intervalo de frecuencias se necesita una tasa de
muestreo de poco más del doble (Teorema de muestreo de Nyquist-Shannon). Por ejemplo en los
CDs, que reproducen hasta 22,05 kHz, emplean una tasa de muestreo de 44,1 kHz.
La cuantificación consiste en representar el valor de la señal en binario. Por ejemplo, utilizando
cuantificación lineal, una codificación lineal de 8 bits discriminará entre 256 niveles de señal
equidistantes. También se pueden hacer cuantificaciones no lineales, como es el caso de
cuantificadores logarítmicos como la Ley Mu o la Ley A, que, a modo de ejemplo, aún usando 8
bits funcionan perceptualmente como 10 bits lineales para señales de baja amplitud en promedio,
como la voz humana por ejemplo.
48
2.12.5. Frecuencia de muestreo
Las tarjetas de sonido a nivel de usuario trabajan a una frecuencia de 44.1 KHz, ya que el oído
humano reconoce alrededor de 44.000 sonidos cada segundo. Las tarjetas de sonido profesionales
trabajan desde los 48 KHz hasta los 100 KHz, lo que permite obtener mayor calidad, para luego
hacer modificaciones sin que el sonido resultante varíe.
2.12.6. Canales de sonido y polifonía
Otra característica importante de una tarjeta de sonido es su polifonía. Es el número de distintas
voces o sonidos que pueden ser tocados simultánea e independientemente. El número de canales
se refiere a las distintas salidas eléctricas, que corresponden a la configuración del altavoz, como
por ejemplo 2.0 (estéreo), 2.1 (estéreo y subwoofer), 5.1, etc. En la actualidad se utilizan las
tarjetas de sonido envolvente (surround), principalmente Dolby Digital 8.1 o superior. El número
antes del punto (8) indica el número de canales y altavoces satélites, mientras que el número
después del punto (1) indica la cantidad de subwoofers. En ocasiones los términos voces y
canales se usan indistintamente para indicar el grado de polifonía, no la configuración de los
altavoces.
2.13 FORMATOS DIGITALES DE ARCHIVOS DE AUDIO
El audio digital es la codificación digital de una señal eléctrica que representa una onda sonora.
Consiste en una secuencia de números binarios y se obtiene del muestreo y cuantificación digital
de la señal eléctrica (que en este tema se llama señal analógica, para contraponerla a la señal
digital) posteriormente se puede codificar o comprimir, dando lugar a formatos más compactos
(compresión de audio).
El formato más usado de audio digital PCM lineal es el del CD de audio: 44,1 kHz de tasa de
muestreo y cuantificación lineal de 16 bits (que mide 65536 niveles de señal diferentes).
49
CONCLUSIONES
El presente capítulo provee un entorno fundamental para el entendimiento de los capítulos
subsecuentes, así como elementos relacionados y temas más avanzados que sugieren mayor
estudio. A su vez, se han presentado temas de gran importancia en el análisis y procesamiento de
señales de audio. La gran utilidad de estos temas presentados está en la forma en que cada uno de
estos conceptos han sido puestos en práctica en el desarrollo del analizador de espectros expuesto
en este trabajo.
El entendimiento de estos temas, ha brindado la capacidad de tener certeza en la posibilidad de
desarrollar un analizador de espectros de gran utilidad para el Instituto, teniendo en cuenta el tipo
de computadores en los cuales es posible el desarrollo e implantación, así como de entender
necesidades especificas de los laboratorios que utilizan este tipo de herramientas a lo largo de los
años de su uso.
En el siguiente capítulo se hará uso de diagramas de flujo y de casos de uso que describen el
sistema propuesto para llevar a cabo las tareas de un analizador de espectros capaz de procesar y
mostrar resultados en tiempo real de las señales de audio adquiridas a través de las tarjetas de
audio comunes en computadoras personales comerciales y existentes en laboratorios del instituto.
50
“INTERFAZ GRÁFICA PARA EL ANÁLISIS EN EL DOMINIO TEMPORAL Y
FRECUENCIA DE SEÑALES DE AUDIO EN TIEMPO REAL”
CAPÍTULO 3
DESARROLLO
51
“INTERFAZ GRÁFICA PARA EL ANÁLISIS EN EL DOMINIO TEMPORAL Y
FRECUENCIA DE SEÑALES DE AUDIO EN TIEMPO REAL”
DESARROLLO.
3.1 DESCRIPCIÓN DEL SISTEMA
3.1.1. Diagrama de Flujo y Algoritmo Empleado
El diagrama de flujo mostrado en la figura 3.1 favorecerá la comprensión, describe los pasos del
algoritmo desarrollado, representa el flujo de ejecución de cada proceso involucrado desde la
adquisición de audio hasta la graficación de resultados. A continuación del diagrama se explicará
cada uno de los pasos.
Fig. 3.1 Diagrama de Flujo.
Inicio
Inserción de datos por parte del usuario.
Adquisición de audio.
Adquisición de cierto número de muestras de audio (especificadas por el usuario en el menú puntos a evaluar).
Graficación de las muestras de audio adquiridas en el Dominio del Tiempo.
Cálculo de la FFT con las muestras de audio adquiridas.
Graficación de los Resultados de la FFT en modo logarítmico. Componentes espectrales.
52
3.1.1.1 Inserción de datos por parte del usuario.
Una vez que inicia la ejecución del software, el usuario establece los parámetros de
funcionamiento del analizador. El usuario puede establecer la frecuencia de muestreo con que se
llevará a cabo la adquisición de audio y el número de puntos con los cuales se realizará el
procesamiento de la señal por adquirir.
3.1.1.2 Adquisición de audio.
De la señal analógica insertada a la aplicación se hace una conversión analógico-digital durante
un tiempo de recolección. Esta se lleva a cabo por la tarjeta de adquisición de audio de la
computadora. La información se codifica en muestras de 16 bits. La frecuencia más alta que se
puede codificar depende del tiempo del intervalo de muestreo especificado por el usuario. Los
intervalos de muestreo que se le permite especificar al usuario son los que el hardware de
adquisición de audio común permite, estos son, 8000, 11025, 22050 y 44100 Hertz o muestras
por segundo [13].
3.1.1.3 Adquisición de cierto número de muestras de audio.
Mediante el uso de las interfaces de programación de aplicaciones que provee Matlab® se
desarrolló una aplicación capaz de adquirir audio a través de la tarjeta de audio de la
computadora en que se ejecuta la aplicación. La implementación de dichas librerías nos permite
adquirir un número de muestras de audio específicas y almacenarlas temporalmente para un
procesamiento posterior.
3.1.1.4 Graficación de las muestras de audio adquiridas en el Dominio del Tiempo.
Los valores de las muestras de audio adquiridas en un periodo de tiempo específico pueden ser
graficados en la interfaz de usuario antes de ser procesadas, permitiendo así la graficación en el
dominio del tiempo de la señal de audio adquirida.
53
3.1.1.5 Calculo de la FFT con las muestras de audio adquiridas.
El programa desarrollado calcula los coeficientes de la serie de Fourier por medio del algoritmo
computacional de la Transformada Rápida de Fourier a partir de los vectores de muestreo.
3.1.1.6 Graficación de los resultados de la FFT, componentes espectrales en escala
logarítmica.
Mediante un proceso de anti-transformación, considerando coeficientes de subíndice par y de
subíndice impar, se gráfica el espectro en la interfaz gráfica de usuario. La frecuencia mayor del
espectro que se logra graficar es la mitad de la frecuencia que se muestrea (criterio Nyquist) [11].
El diagrama de Casos de Uso mostrado en la figura 3.2 muestra las posibles acciones que puede
tomar el usuario al interactuar con el analizador de espectros desarrollado.
54
Fig. 3.2 Diagrama UML Casos de Uso.
3.1.2. Interfaz Gráfica.
Un analizador de espectros común tiene como elementos de interacción con el usuario dos
elementos principales, dos gráficas donde se muestra la representación en el dominio del tiempo
y de la frecuencia del audio adquirido respectivamente y una serie de controles que permiten al
usuario cambiar las opciones de adquisición de audio y de visualización de los datos presentados.
El analizador de espectros que fue desarrollado está formado por una interfaz gráfica de usuario
mostrada en la figura numero 3.3.
Inserción de Datos por el Usuario.
Frecuencia de Muestreo. Muestras a Evaluar.
Adquisición de
Audio
Detener la Adquisición
de Audio
Visualización del toda la Señal Audio Adquirido en el
Dominio del Tiempo
Cerrar
Reproducción de Video de la Gráfica de Representacion en
el Dominio del Tiempo
Reproducción de Video de la Gráfica de Representacion en
el Dominio del Tiempo
55
Fig. 3.3 Interfaz inicial.
La interfaz muestra opciones para que el usuario especifique datos del funcionamiento del
sistema, como son la frecuencia de muestreo con que será digitalizado el audio de entrada y el
número de puntos con que será evaluada la transformada rápida de Fourier. En la gráfica superior
se muestra la señal de entrada al sistema, la muestra en su representación en el dominio del
tiempo. La gráfica inferior muestra a la señal resultante en el domino de la frecuencia. Los
botones muestran una serie de opciones que tiene el usuario para controlar la ejecución del
sistema. Se le da al usuario la opción de poner en funcionamiento al sistema, de detenerlo, de
visualizar en una sola gráfica toda la señal de audio adquirida y de reproducir una secuencia de
video de las gráficas presentadas, esto es, tanto en el dominio del tiempo como en el de la
frecuencia.
La adquisición de audio del analizador se lleva a cabo cuando el usuario oprime el botón que dice
“Adquirir”. Previamente, el usuario debe establecer los valores con los que la señal será
procesada, estos son, la Frecuencia de Muestreo y el número de muestras que serán evaluadas por
el algoritmo de la FFT.
Al comenzar la adquisición de audio por la tarjeta de sonido, es mostrada en la parte superior de
la interfaz una gráfica de la señal que está siendo ingresada al sistema en tiempo real. Una vez
que se adquiere la señal, esta es procesada por el algoritmo de la FFT y se muestran las
56
componentes de frecuencia de las cuales está formada en una gráfica que se encuentra en la parte
inferior, la cual también se muestra en tiempo real. La adquisición de la señal de audio sigue
ejecutándose hasta que el usuario oprima el botón que dice “Detener”.
Al detenerse la adquisición de audio, se habilitara el botón “Visualizar”, el cual mostrara a la
señal de audio adquirida durante el tiempo que haya estado en ejecución el sistema. La señal de
audio adquirida durante la ejecución del sistema se muestra en la gráfica superior.
Los botones con las leyendas “Reproducir Tiempo y Reproducir Frecuencia”, llevan a cabo una
presentación de una secuencia de fotogramas de cada gráfica mostrada a lo largo de la ejecución
del programa, la reproducción de los fotogramas se lleva a cabo en la respectiva gráfica
correspondiente, esto es, el botón “Reproducir Tiempo”, lleva a cabo la reproducción de
fotogramas de las gráficas de representación en el dominio del tiempo, mientras que el botón
“Reproducir Frecuencia”, lleva a cabo lo propio con las gráficas de representación en el domino
de la frecuencia.
El botón “Cerrar” detiene la ejecución del programa.
57
CONCLUSIONES
El analizador desarrollado, por transformada rápida de Fourier (FFT), procesa información
adquirida por lotes de muestreo. En primer lugar almacena estos en variables temporales para
manejo interno y graficación de datos en el dominio del tiempo, después toma datos estos en un
buffer, procesa este lote con el algoritmo de transformada discreta y luego gráfica el espectro
resultante.
La utilización de esta técnica de adquisición y de procesamiento de datos puede conllevar a la
existencia de “fugas” de datos no adquiridos. Una serie de razones puede estar ligada a la perdida
de datos, como son, el tiempo de procesamiento que toma la computadora para ejecutar las
instrucciones dadas por el programa desarrollado, la posible inserción de “ruido” en la señal
adquirida al muestreo del audio y al mismo tiempo una pérdida de datos dada en los pequeños
espacios de tiempo tomados para el almacenamiento y manejo de variables internas en el
programa, así como principalmente el número de puntos utilizados para el cálculo de la FFT.
Es debido a estas pequeñas fugas de datos la posibilidad de ver, una vez que sea ejecutado el
programa, resultados no tan precisos como los ideales esperados en los cálculos matemáticos, por
ejemplo que una señal senoidal pura ingresada, se vea en el espectro de frecuencias resultante
como un pico, con un pequeño ancho de banda en vez de mostrarse como una línea vertical de
una única frecuencia. Por lo tanto el espectro resultante es casi exacto, aunque se puede controlar
el ajuste, para que los resultados sean más o menos precisos en la práctica.
58
“INTERFAZ GRÁFICA PARA EL ANÁLISIS EN EL DOMINIO TEMPORAL Y
FRECUENCIA DE SEÑALES DE AUDIO EN TIEMPO REAL”
CAPÍTULO 4
PRUEBAS
59
“INTERFAZ GRÁFICA PARA EL ANÁLISIS EN EL DOMINIO TEMPORAL Y
FRECUENCIA DE SEÑALES DE AUDIO EN TIEMPO REAL”
PRUEBAS.
4.1 PRUEBAS DEL SISTEMA.
En el presente capítulo se ejecuta el programa con elementos experimentales para mostrar al
usuario el sistema en funcionamiento, así como una breve descripción de las funciones del
sistema.
El analizador de espectros se ha ejecutado con estas señales de entrada especificas debido a que
esto nos servirá a establecer un criterio de las características de las señales que el sistema es
capaz de analizar.
Al evaluar al sistema con elementos experimentales lograremos visualizar al sistema entregar
resultados esperados y poder tener una perspectiva de la precisión del sistema.
En base a la teoría del análisis de Fourier sabemos que una señal no senoidal periódica puede ser
generada a partir de una señal senoidal componente promedio y una serie de ondas senoidales y
cosenoidales relacionadas armónicamente. En general, se puede obtener una serie de Fourier para
cualquier función periódica, en forma de una serie de funciones trigonométricas con la siguiente
forma matemática
f(t)= A0+A1cosα+A2cos2α+A3cos3α+...+Ancosnα
+B1senβ+B2sen2β+B3sen3β+...+Bnsen nβ (5)
donde α=β
Siguiendo este principio, es sabido que una señal senoidal periódica está compuesta por una sola
onda senoidal componente, la cual tiene como frecuencia fundamental la misma frecuencia que la
señal senoidal a evaluar por la transformada.
60
Es decir, que si queremos saber el espectro de frecuencias de las cuales está compuesta una señal
senoidal periódica de una frecuencia dada, la respuesta del algoritmo de la FFT será un único
bastón o indicador con una amplitud y frecuencia igual a la señal de entrada.
4.1.1. Señal senoidal.
A continuación se muestra al sistema adquiriendo una señal senoidal de frecuencia y amplitud
especifica, el objetivo es saber si se realizan correctamente los procedimientos de análisis
espectrales y si se muestran bien los resultados.
El sistema se ha ejecutado con las siguientes opciones:
Frecuencia de muestreo = 44.1 Khz.
4096 puntos.
La señal ingresada al sistema es una señal senoidal con una frecuencia de 100 Hz y una amplitud
de 50 mV. Con estos datos será evaluada la transformada rápida de Fourier y serán mostradas los
datos de respuesta el usuario.
El algoritmo que implementa el procesamiento de la señal adquirida y lleva a cabo la
transformada rápida de Fourier basándose en la siguiente la ecuación
X [k ]=1
N∑k=0
N− 1
x [n ]W Nnk
(11)
donde
W N =e− j2PI /N (12)
Una medida útil de la complejidad de este cálculo es el número total de multiplicaciones
complejas requeridas o el número de muestras adquiridas por el programa.
A continuación se muestra la imagen del sistema adquiriendo una señal senoidal con
características especificadas con anterioridad.
61
Fig. 4.1 Señal senoidal de amplitud 50mV y frecuencia de 100hz.
Analizando las gráficas que el sistema muestra podemos saber que la señal de entrada al sistema
está compuesta por una señal armónica de frecuencia fundamental de 100Hz y también muestra
pequeños componentes armónicos de otras frecuencias, esto es debido a que el generador de
señales utilizado para la inserción de la señal de prueba no es muy preciso, generando una señal
con poco ruido que hace que el sistema tenga como resultado un espectro de frecuencia un poco
ruidoso.
En la gráfica inferior de la figura 4.1 se nos muestra una señal con un pico, se trata de el espectro
de frecuencias que conforma a la señal senoidal de entrada, el elemento con mayor amplitud es la
armónica fundamental con una amplitud igual a la señal de entrada al sistema. Este componente
fundamental debiera ser mostrado como un único bastón o línea vertical, pero debido a una
pérdida de datos en la adquisición de audio, y a la utilización de un generador de funciones no
muy preciso, la señal adquirida se muestra como un pico de voltaje, o con un ancho de banda.
62
4.1.2. Señal cuadrada.
Lo que nos dice la teoría de Fourier es que podemos tomar cualquier forma de onda periodica y
dividirla en componentes individuales de onda senoidal o cosenoidal armónicamente
relacionadas. El ejemplo clásico de lo anterior es una onda cuadrada, la cual es una señal
rectangular con semiciclos positivos y negativos de igual duración.
El análisis de Fourier señala que la onda cuadrada consta de una onda senoidal en la frecuencia
fundamental de la onda cuadrada, más un número infinito de armónicas impares; por ejemplo, si
la frecuencia fundamental de la onda cuadrada es de 100Hz, la onda cuadrada puede ser
sintetizada sumando la onda senoidal de 100Hz y ondas senoidales armónicas de 300Hz, 500Hz,
700Hz, 900Hz, etcétera.
Analizaremos la señal cuadrada como una colección de ondas senoidales relacionadas
armónicamente en vez de cómo una onda cuadrada perfecta, y un análisis matemático de Fourier
sobre la onda cuadrada nos confirmará esto. El resultado es la ecuación siguiente, que expresa el
voltaje en función del tiempo.
V(t) = 4V/π [ sen2π( 1/T ) t+1/3 sen2π( 3/T ) t+1/5 sen2π( 5/T ) t+1/7 sen2π( 7/T ) t+. . . ]
Donde el factor 4V/π es un multiplicador para todos los términos y V es el voltaje pico de la señal
cuadrada. El primer término es la onda senoidal fundamental y los términos sucesivos son los
tercera, quinta, séptima, etcétera armónicas.
Ejecutaremos el sistema para analizar una señal cuadrada con las características especificadas en
el ejemplo. Una señal cuadrada con una frecuencia de 100 Hz y una amplitud de 50 mV.
El sistema se ejecuta con los siguientes parámetros:
Frecuencia de muestreo = 8 KHz.
512 puntos.
63
Fig. 4.2 Señal cuadrada de amplitud 50mV y frecuencia de 100hz.
Al analizar la gráfica de componentes espectrales de la figura 4.2, corroboramos que el
analizador de espectros arroja resultados muy cercanos a los teóricos, mostrando picos que
representan las componentes armónicas que podrían sintetizar una señal cuadrada como la que se
está analizando. Siendo una señal de entrada de 100Hz, se muestra una componente fundamental
de 100Hz, seguida de una de 300Hz, 500Hz, 700Hz, 900Hz, 1100Hz, etcétera.
Advirtiendo que los términos también tienen un valor de amplitud. En este caso, la amplitud
también es una función de la armónica; por ejemplo, la tercera armónica tiene un amplitud de 1/3
de la amplitud fundamental, y así de manera sucesiva. Mismo que podemos corroborar con la
gráfica de componentes espectrales de la figura 4.2.
Al igual que el análisis de la señal senoidal con el sistema, la señal cuadrada analizada muestra
resultados con falta de precisión debido a una pérdida de datos en la adquisición de audio, y a la
utilización de un generador de funciones no muy preciso, las señales adquiridas se muestran
como picos de voltaje y con anchos de banda entre ellas.
64
4.1.3. Señal triangular.
Una forma de onda triangular también, al igual que una señal rectangular, es una forma de onda
periódica con semiciclos positivos y negativos de igual duración y podemos dividirla en
componentes individuales de onda senoidal o cosenoidal armónicamente relacionadas.
Como una señal cuadrada, la triangular solo contiene armónicas impares. Sin embargo, las
armónicas en la Serie de Fourier tienden a aproximarse al infinito de una manera mas rápida que
en la señal cuadrada.
Esta Serie de Fourier converge con la señal triangular:
donde es la frecuencia angular.
Notese que el limite superior de la serie es . Esto dice que un número infinito de terminos es
requerido en la serie para representar una señal triangular. La serie no parece ser muy util, sin
embargo lo es por el hecho de que esta converge muy rápido.
El espectro de frecuencias necesarias para representar una señal triangular constará de una onda
senoidal en la frecuencia fundamental de la onda triangular, más un número infinito de armónicas
impares; por ejemplo, si la frecuencia fundamental de la onda triangular es de 100Hz, la onda
puede ser sintetizada sumando la onda senoidal de 100Hz y ondas senoidales armónicas de
300Hz, 500Hz, 700Hz, 900Hz, etcétera.
Es de esperarse que todos los resultados obtenidos sean positivos debido al procedimiento de
obtención del valor absoluto de cada componente, esto es para poder obtener su magnitud en
escala de decibeles.
65
Ejecutaremos el sistema para analizar una señal triangular con las características especificadas en
el ejemplo. Una señal triangular con una frecuencia de 100 Hz y una amplitud de 50 mV.
El sistema se ejecuta con los siguientes parámetros:
Frecuencia de muestreo = 8 KHz.
512 puntos.
Fig. 4.3 Señal triangular de amplitud 50mV y frecuencia de 100hz.
Al analizar la gráfica de componentes espectrales de la figura 4.3, corroboramos que el
analizador de espectros arroja resultados muy cercanos a los teóricos, mostrando picos que
representan las componentes armónicas que podrían sintetizar una señal triangular como la que se
está analizando. Siendo una señal de entrada de 100Hz, se muestra una componente fundamental
de 100Hz, seguida de una de 300Hz, 500Hz, 700Hz, 900Hz, 1100Hz, etcétera, todos los
componentes con valores positivos.
La falta de precisión y perdida de datos tambien es observada en las gráficas resultantes de la
figura 4.3.
66
4.1.4. Dos instrumentos tocando la misma nota.
El objetivo de realizar esta prueba es el responder a una pregunta muy común, ¿por que los
instrumentos suenan distinto?. Con mayor precisión, ¿por qué dos instrumentos suenan distinto
aún cuando están tocando la misma nota?. Mediante el análisis de sus respectivas señales en su
representación en el dominio del tiempo y en el domino de la frecuencia obtendrémos una
explicación clara del porqué los instrumentos suenan distinto.
Ejecutaremos el sistema para analizar las señales producida por dos guitarras acústicas del mismo
tipo pero de diferentes fabricantes tocando la misma nota, la supuesta A(La) a 110Hz., producida
por la quinta cuerda.
El sistema se ejecuta con los siguientes parámetros:
Frecuencia de muestreo = 8 KHz.
512 puntos.
A coninuación las señales adquiridas por medio del analizador de espectros, mostrando las
formas de onda de las distintas señales con sus respectivas representaciones espectrales, dominio
frecuencial.
67
Fig. 4.4 5ta. Cuerda - A (La) - Electroacústica.
Fig. 4.5 5ta. Cuerda - A (La) - Acústica.
La representación espectral nos responde nuestra duda. Se puede visualizar como los ingredientes
espectrales de las señales adquiridas difieren y por cuanto. Es posible entender que las notas
68
producidas no son una simple onda senoidal de una sola frecuencia, no es la A(La) de 110Hz., por
ejemplo, sino una suma de muchas ondas senoidales, cada una con distintas amplitudes.
La compleja onda que llega al analizador y a nuestros oidos es la combinación de muchos
ingredientes. Dos instrumentos suenan diferente debido al conjunto de armonicas que produce y
debido a la fuerza de estas. Cada instrumento, debido a los materiales con los que ha sido
construido y a la calidad de estos produce un conjunto distinto de armonicas.
69
CONCLUSIONES
Las técnicas utilizadas en la realización de este proyecto como son el uso de herramientas de
programación, interfaces gráficas de usuario, algoritmos matemáticos como la Transformada
Rápida de Fourier (FFT), análisis y procesamiento de señales, muestran que es factible obtener
resultados altamente satisfactorios al integrarlas en el diseño de un analizador de espectros de
señales de audio en tiempo real, sin la necesidad de adquirir algún hardware adicional.
La representación espectral ofrece oportunidades para el procesamiento de señales que no sería
tan fácil de hacer o siquiera imaginar en el dominio del tiempo. Es facil imaginar atenuar la
energía de alguna armonica, amplificar algunas otras o eliminar bloques de armonicas,
operaciones que actuando en el dominio del tiempo sería algo muy lejano a ser claro y sencillo
El análisis de resultados nos indica que es muy difícil que un analizador de espectros sea 100%
preciso, esto es debido a las técnicas de adquisición de audio utilizadas, la velocidad de muestreo
y el proceso de cuantización. Una manera de obtener resultados más precisos en la ejecución del
analizador, es al aumentar la frecuencia de muestreo, los niveles de cuantización y el numero de
puntos utilizados para el calculo de la FFT, teniendo como desventaja el incremento en el costo
computacional.
70
“INTERFAZ GRÁFICA PARA EL ANÁLISIS EN EL DOMINIO TEMPORAL Y
FRECUENCIA DE SEÑALES DE AUDIO EN TIEMPO REAL”
CAPÍTULO 5
REFERENCIAS Y
BIBLIOGRAFÍA
71
“INTERFAZ GRÁFICA PARA EL ANÁLISIS EN EL DOMINIO TEMPORAL Y
FRECUENCIA DE SEÑALES DE AUDIO EN TIEMPO REAL”
REFERENCIAS Y BIBLIOGRAFÍA.
[1] Sri Welaratna, "30 years of FFT Analyzers", Revista “Sound and Vibration” (Enero 1997,
ejemplar de 30 aniversario). A historical review of hardware spectrum-analyzer devices.
[2] Joe Deery, The ‘Real’ History of Real-Time Spectrum Analyzers.
A 50-Year Trip Down Memory Lane
AIM & C, Newfoundland, New Jersey.
[3] Exposición de trabajos realizados en Laboratorio de Sistemas Electrónicos e
Instrumentación
LABSEI, Universidad Católica de Valparaiso. Chile.
http://www.profesores.ucv.cl/juanvignolo/labsei/Trabajos/trabajos.htm
[4] Analizadores de espectros. Cambios de paradigmas en las técnicas de medida.
Hameg Instruments.
http://www.hameg.com/4.16.0.html
[5] U8903A Audio Analyzer
Agilent Technologies.
http://goo.gl/mlSzx
[6] Real Time Analyzer SA-3052 SE.
Audio Control Industrial.
http://goo.gl/bkE26
[7] Time-Frequency Analysis of Musical Instruments
Jeremy F. Alm and James S. Walker
Society for Industrial and Applied Mathematics
72
[8] The Fourier Transform and its Applications.
Prof. Brad Osgood
Electrical Engineering Department
Stanford University
[9] Ashok Albardar. PROCESAMIENTO DE SEÑALES ANALOGICAS Y DIGITALES.
Thomson. 2° Edición. México 2002.
[10] Wayne Tomasi. SISTEMAS DE COMUNICACIONES Y ELECTRÓNICAS.
Prentice Hall. 4° Edición. México 2003.
[11] Oppenheim. Willsky. SEÑALES Y SISTEMAS. Pearson Educación. 2° Edición.
México 2004.
[12] Haykin y Van Veen. SEÑALES Y SISTEMAS. Limusa-wiley,2001.
[13] MathWorks
Centro de documentacion.
http://www.mathworks.com/access/helpdesk/help
[14] Gil Rodríguez, M. (2003). INTRODUCCIÓN RÁPIDA A MATLAB Y SIMULINK PARA
CIENCIA E INGENIERÍA. Madrid. Edit. Díaz de Santos.
[15] Hanselman, D., & B. Littlefield. MASTERING MATLAB. Upper Saddle River, NJ: Edit.
Prentice Hall.