anÁlisis de la variabilidad de la frecuencia cardÍaca

167
ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA INTEGRANDO LA SEÑAL DE LA FRECUENCIA RESPIRATORIA JUAN FELIPE RAMÍREZ VILLEGAS ERIC LAM ESPINOSA UNIVERSIDAD AUTÓNOMA DE OCCIDENTE FACULTAD DE INGENIERÍA DEPARTAMENTO DE AUTOMÁTICA Y ELECTRÓNICA PROGRAMA INGENIERÍA BIOMÉDICA SANTIAGO DE CALI 2009

Upload: others

Post on 25-Jun-2022

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

1

ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA INTEGRANDO LA SEÑAL DE LA FRECUENCIA RESPIRATORIA

JUAN FELIPE RAMÍREZ VILLEGAS ERIC LAM ESPINOSA

UNIVERSIDAD AUTÓNOMA DE OCCIDENTE FACULTAD DE INGENIERÍA

DEPARTAMENTO DE AUTOMÁTICA Y ELECTRÓNICA PROGRAMA INGENIERÍA BIOMÉDICA

SANTIAGO DE CALI 2009

Page 2: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

2

ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA INTEGRANDO LA SEÑAL DE LA FRECUENCIA RESPIRATORIA

JUAN FELIPE RAMÍREZ VILLEGAS ERIC LAM ESPINOSA

Trabajo de Grado para optar al título de Ingeniero Biomédico

Director PAULO CÉSAR CALVO ECHEVERRY

M.Sc.

UNIVERSIDAD AUTÓNOMA DE OCCIDENTE FACULTAD DE INGENIERÍA

DEPARTAMENTO DE AUTOMÁTICA Y ELECTRÓNICA PROGRAMA INGENIERÍA BIOMÉDICA

SANTIAGO DE CALI 2009

Page 3: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

3

Nota de aceptación:

Aprobado por el Comité de Grado en Cumplimiento de los requisitos exigidos

Por la Universidad Autónoma de Occidente Para optar al título de Ingeniero Biomédico

JESÚS ALFONSO LÓPEZ SOTELO Jurado

JUAN DIEGO PULGARÍN GIRALDO Jurado

Page 4: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

4

CONTENIDO Pág. RESUMEN 22 INTRODUCCIÓN 24 1. ANTECEDENTES 26 1.1. MÉTODOS ESTADÍSTICOS Y GEOMÉTRICOS UTILIZADOS PARA VALORAR LA VARIABILIDAD DE LA FRECUENCIA CARDIACA (VFC)

27

1.2. PROCESAMIENTO DIGITAL DE SEÑALES APLICADO A LA VFC 28 1.3. SISTEMAS DINÁMICOS NO-LINEALES Y VFC 29 1.4. SISTEMAS INTELIGENTES APLICADOS A LA VFC 30 2. MARCO TEÓRICO 32 2.1. VFC Y SEÑAL ELECTROCARDIOGRÁFICA 32 2.2. ARRITMIA SINO-RESPIRATORIA (RSA) 32 2.3. PROCESAMIENTO DIGITAL DE SEÑALES Y SU APLICACIÓN A LA MEDICINA

34

2.4. MEDIDAS Y ANÁLISIS ESTADÍSTICO DE SERIES DE DATOS EXPERIMENTALES Y SU APLICACIÓN AL ANÁLISIS DE LA VFC

34

2.5. ANÁLISIS DE SEÑALES EN EL DOMINIO DE LA FRECUENCIA 35 2.5.4. Análisis de Señales en el Dominio de la Frecuencia Aplicado a la VFC

35

2.6. ANÁLISIS MUTIRRESOLUCIÓN 36 2.6.1. Transformada Wavelet Discreta y Algoritmo de Mallat 37 2.6.2. Transformada Wavelet Inversa 39

Page 5: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

5

2.6.3. Transformada Wavelet Packet 39 2.6.4. Aplicación de la Transformada Wavelet al Análisis de Señales Biomédicas

40

41 2.7. ANÁLISIS NO-LINEAL 2.7.1. Gráfico de Poincaré (Mapa de Retorno) 41 2.7.2. Medidas de Complejidad 44 2.8. REDES NEURONALES ARTIFICIALES 46 2.8.1. Regla de Propagación 46 2.8.2. Función de Transferencia 46 2.8.3. Aprendizaje de las Redes Neuronales Artificiales 47 2.9. HERRAMIENTAS DE ANÁLISIS ESTADÍSTICO APLICADAS A RECONOCIMIENTO DE PATRONES

47

2.9.1. Análisis de Varianza (One-way ANOVA) 47 3.9.2. Análisis de Componentes Principales (PCA) 48 3.9.3. Kernel PCA (K-PCA) 49 3. METODOLOGÍA 52 3.1. EXTRACCIÓN DE DATOS ELECTROCARDIOGRÁFICOS 52 3.1.1. Aspectos técnicos de la instrumentación utilizada para el registro electrocardiográfico

52

3.1.2. Instrumentación para el registro de frecuencia respiratoria 53 3.2. PREPROCESAMIENTO DE LA SEÑAL DE ECG 55 3.3. ELIMINACIÓN DE OUTLIERS EN LAS SERIES R-R CALCULADAS 58 3.3.1. Perspectiva General sobre dos Métodos Conocidos para la Detección de Outliers 58

Page 6: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

6

3.3.2. Evaluación de Algoritmos para la Detección de Outliers en la Distribución de Intervalos R-R 60 3.4. EFECTO DEL SISTEMA RESPIRATORIO SOBRE LA DINÁMICA DE LA VFC (ERROR INDUCIDO POR LA ARRITMIA SINO-RESPIRATORIA) 64 3.5. MEDIDAS CLÁSICAS PARA EVALUAR LA VFC 66 3.5.1. Mediciones Estadísticas o en el Dominio del Tiempo 66 3.5.2. Mediciones en el Dominio de la Frecuencia o Métodos Espectrales 68 3.6. ANÁLISIS MULTIRRESOLUCIÓN 73 3.7. ANÁLISIS NO-LINEAL 74 3.7.1. Medidas Basadas en el Gráfico de Poincaré 74 3.7.2. Medidas de Complejidad sobre Series R-R 80 3.8. AUTOMATIZACIÓN DEL PRONÓSTICO 83 3.8.1. Perceptrón Multicapa 84 3.8.2. Funciones de Base Radial (RBF, Radial Basis Functions) 89 3.8.3. Máquina de Soporte Vectorial (SVM, Support Vector Machine) 91 4. RESULTADOS Y DISCUSIÓN DE RESULTADOS 96 4.1. OUTLIERS EN LOS ÍNDICES DE VARIABILIDAD CARDÍACA 97 4.2. SUMARIO DE PRUEBAS ESTADÍSTICAS REALIZADAS SOBRE LOS ÍNDICES DE VARIABILIDAD CARDÍACA 98 4.2.1. Análisis de Varianza (One-way ANOVA) 98 4.2.2. Análisis de Componentes Principales (PCA) 98 4.2.3. Prueba para Definir el Valor Pronóstico de cada Índice y Método 99

Page 7: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

7

por Separado 4.3. ANÁLISIS DE ÍNDICES ESTADÍSTICOS 99 4.4. ANÁLISIS DE ÍNDICES ESPECTRALES 104 4.5. ANÁLISIS MULTIRRESOLUCIÓN 110 4.5.1. Evaluación de la Transformada Wavelet Convencional 111 4.5.2. Evaluación Transformada Wavelet Packet 117 4.7. ANÁLISIS DE ÍNDICES NO-LINEALES 127 4.7.1. Análisis de Medidas Basadas en el Gráfico de Poincaré 127 4.7.2. Análisis de Medidas de Complejidad 132 4.8. EVALUACIÓN DEL DESEMPEÑO DE LOS ESQUEMAS DE INTELIGENCIA ARTIFICIAL UTILIZADOS 135 4.9. DESCRIPCIÓN DEL PROGRAMA (APLICACIÓN FINAL) 145 4.9.1. Formato de los Datos de Entrada 147 4.9.2. Opciones de Análisis 147 4.9.3. Pronóstico de Riesgo Cardiovascular 148 4.9.4. Funcionamiento General del Algoritmo 148 5. CONCLUSIONES 150 5.1. MEDICIÓN DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA 150 5.2. MÉTODOS ESTADÍSTICOS O EN EL DOMINIO DEL TIEMPO 151 5.3. MÉTODOS ESPECTRALES O EN EL DOMINIO DE LA FRECUENCIA 151 5.4. MÉTODOS MULTIRRESOLUCIÓN 152

Page 8: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

8

5.5. MÉTODOS NO-LINEALES 152 5.6. ESQUEMAS DE INTELIGENCIA ARTIFICIAL Y ANÁLISIS DE PATRONES 153

6. RECOMENDACIONES 154 6.1. SOBRE LA TOMA DE REGISTROS ELECTROCARDIOGRÁFICOS 154 6.2. DE LOS MÉTODOS DE TOMA DE LA SEÑAL DE LA FRECUENCIA RESPIRATORIA 154 6.3. SOBRE EL USO DE ESQUEMAS DE INTELIGENCIA ARTIFICIAL Y ANÁLISIS DE PATRONES 154 BIBLIOGRAFÍA 155 ANEXOS 166

Page 9: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

9

LISTA DE TABLAS

Pág.

Tabla 1. Lista y detalles para todas las propiedades cualitativas de cada paciente. 54 Tabla 2. Resultados de la descomposición de la señal de ECG para la detección del pico R. 56 Tabla 3. Sensitividad, especificidad y exactitud en cada uno de los experimentos realizados utilizando el método de Grubbs extendido. 61 Tabla 4. Sensitividad, especificidad y exactitud en cada uno de los experimentos realizados utilizando el método de Tukey. 61 Tabla 5. Superestimación – subestimación de los parámetros SD1 y SD2 utilizando las series de datos originales, el método de Tukey y el método de Grubbs extendido. 61 Tabla 6. Sumario de medidas utilizadas en el presente estudio. 83 Tabla 7. Estadísticos de la población completa (Con Riesgo y Sin Riesgo). 96 Tabla 8. Estadísticos de la población diagnosticada con riesgo cardiovascular. 96 Tabla 9. Estadísticos de la población sin riesgo aparente o normal. 96 Tabla 10. Estadísticos de sobre cada uno de los indicadores por tipo de individuo. 99

Page 10: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

10

Tabla 11. Resultados del análisis de varianza (ANOVA) para cada uno de los índices estadísticos tenidos en cuenta en este estudio. 100 Tabla 12. Valor pronóstico asociado a cada índice estadístico. 104 Tabla 13. Resultados del análisis de varianza (ANOVA) para cada índice espectral utilizando el espectro AR. 104 Tabla 14. Resultados del análisis de varianza (ANOVA) para cada índice espectral utilizando el periodograma de Welch. 105 Tabla 15. Valor pronóstico asociado a los índices espectrales tenidos en cuenta utilizando el espectro AR y el periodograma de Welch. 110 Tabla 16. Valor p para la entropía y energía wavelet a distintos niveles de descomposición (coeficientes de detalle – CD, coeficientes de aproximación – CA) 111 Tabla 17. Resultados del análisis de varianza (ANOVA) para las cuatro componentes principales de entropía utilizando la transformada wavelet convencional. 114 Tabla 18. Resultados del análisis de varianza (ANOVA) para las cuatro componentes principales de energía utilizando la transformada wavelet convencional. 116 Tabla 19. Valor pronóstico asociado a las cuatro componentes principales de la entropía, la energía y el método de análisis multirresolución (transformada wavelet) completo (total WT). 116 Tabla 20. Valor pronóstico asociado a las componentes de la entropía, la energía y el método de análisis multirresolución (wavelet convencional) completo (total WT) utilizando el conjunto de 117

Page 11: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

11

características estadísticamente significantes. (*) Componentes de entropía. Tabla 21. Valores de p resultantes del análisis de varianza de los índices de entropía y energía wavelet utilizando la transformada wavelet packet. 120 Tabla 22. Resultados del análisis de varianza (ANOVA) para las cuatro componentes principales de entropía utilizando la transformada wavelet packet. 123 Tabla 23. Resultados del análisis de varianza (ANOVA) para las cuatro componentes principales de energía utilizando la transformada wavelet packet. 124 Tabla 24. Valor pronóstico asociado a las cuatro componentes principales de la entropía, la energía y el método de análisis multirresolución (wavelet packet) completo. 126 Tabla 25. Valor pronóstico asociado a las componentes de la entropía, la energía y el método de análisis multirresolución (wavelet packet) completo (total WP) utilizando el conjunto de características estadísticamente significantes. 126 Tabla 26. Resultados del análisis de varianza (ANOVA) para las medidas no-lineales relacionadas con el ajuste de la elipse. 127 Tabla 27. Resultados del análisis de varianza (ANOVA) para las medidas no-lineales relacionadas con los histogramas extraídos desde el gráfico de Poincaré. 129 Tabla 28. Valor pronóstico asociado a las medidas basadas en el gráfico de Poincaré y para la combinación entre estas. 131

Page 12: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

12

Tabla 29. Resultados del análisis de varianza (ANOVA) para las medidas de complejidad para m=1. 132 Tabla 30. Valores de p para las medidas de complejidad ApEn y SmEn utilizando diferentes valores de m y para un parámetro r constante de 0.1 veces la desviación estándar de los datos de entrada. 132 Tabla 31. Valor pronóstico asociado a las medidas de complejidad SmEn y ApEn y para la combinación entre estas (total) para m=1, m=2 y σ1.0=r . 134 Tabla 32. Valor pronóstico asociado los índices de variabilidad de la frecuencia cardíaca seleccionados por el análisis multivariado de varianza utilizando el Perceptrón Multicapa (MLP) con funciones de transferencia tangente sigmoidal - sigmoidal 139 Tabla 33. Valor pronóstico asociado los índices de variabilidad de la frecuencia cardíaca seleccionados por el análisis multivariado de varianza utilizando el Perceptrón Multicapa (MLP) con funciones de transferencia sigmoidal - lineal 139 Tabla 34. Valor pronóstico asociado a los índices de variabilidad de la frecuencia cardíaca seleccionados por el análisis multivariado de varianza utilizando una red RBF. 139 Tabla 35. Valor pronóstico asociado a los índices de variabilidad de la frecuencia cardíaca seleccionados por el análisis multivariado de varianza utilizando una SVM lineal. 139 Tabla 36. Valor pronóstico asociado a los índices de variabilidad de la frecuencia cardíaca seleccionados por el análisis multivariado de varianza utilizando una K-SVM con kernel polinomial de grado 4. 139 Tabla 37. Valor pronóstico asociado a los índices de variabilidad de la 140

Page 13: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

13

frecuencia cardíaca seleccionados por el análisis multivariado de varianza utilizando una K-SVM con kernel RBF de desviación estándar 3. Tabla 38. Valor pronóstico asociado a todos los índices de variabilidad de la frecuencia cardíaca tenidos en cuenta en este estudio utilizando una SVM lineal 141 Tabla 39. Valor pronóstico asociado a todos los índices de variabilidad de la frecuencia cardíaca tenidos en cuenta en este estudio utilizando una K-SVM con kernel polinomial de grado 4 141 Tabla 40. Valor pronóstico asociado a todos los índices de variabilidad de la frecuencia cardíaca tenidos en cuenta en este estudio utilizando una K-SVM con kernel RBF de desviación estándar 3 141 Tabla 41. Valor pronóstico asociado a los diez mejores índices (en términos de la variabilidad que explican) de variabilidad de la frecuencia cardíaca extraídos con PCA y K-PCA utilizando el Perceptrón Multicapa (MLP). 143 Tabla 42. Valor pronóstico asociado a los diez mejores índices (en términos de la variabilidad que explican) de variabilidad de la frecuencia cardíaca extraídos con PCA y K-PCA utilizando una red RBF. 144 Tabla 43. Valor pronóstico asociado a los diez mejores índices (en términos de la variabilidad que explican) de variabilidad de la frecuencia cardíaca extraídos con PCA y K-PCA utilizando una SVM lineal. 144 Tabla 44. Valor pronóstico asociado a los diez mejores índices (en términos de la variabilidad que explican) de variabilidad de la frecuencia cardíaca extraídos con PCA y K-PCA utilizando una SVM con kernel polinomial grado 4. 144

Page 14: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

14

Tabla 45. Valor pronóstico asociado a los diez mejores índices (en términos de la variabilidad que explican) de variabilidad de la frecuencia cardíaca extraídos con PCA y K-PCA utilizando una SVM con kernel RBF con desviación estándar 3. 145 Tabla 46. Características mostradas por el programa de análisis de variabilidad de la frecuencia cardíaca. 146

Page 15: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

15

LISTA DE FIGURAS

Pág. Figura 1. Árbol de descomposición de la transformada wavelet discreta.

38

Figura 2. Transformada wavelet para un latido electrocardiográfico en 256 escalas: (a) Continua; (b) Discreta

38

Figura 3. (a) Árbol wavelet packet; (b) Forma generalizada del árbol wavelet packet.

40

Figura 4. Gráficos de Poincaré en dos dimensiones con formas regulares: (a) Cometa, (b) Torpedo, (c) Abanico, (d) Compleja

43

Figura 5. Gráficos de Poincaré en tres dimensiones con formas regulares: (a) Cometa, (b) Torpedo, (c) Abanico, (d) Compleja

44

Figura 6. (Arriba) Datos de variabilidad; (Abajo) Curva de densidad de probabilidad

45

Figura 7. Kernels: (a) Polinomial grado 3; (b) Gaussiano 51 Figura 8. Diagrama de bloques del módulo de extracción de características 55 Figura 9. Diagrama de bloques, algoritmo de Pan-Tompkins. 56 Figura 10. Serie R-R estimada utilizando diversas escalas 57

Page 16: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

16

Figura 11. Estimación del espectro AR de la serie R-R de la figura 13 utilizando diversas escalas 57 Figura 12. Ejemplos de generación de latidos ectópicos: (a) Sobremedición de la onda T; (b) Artefactos de movimiento en la señal; (c) Extrasístole en un paciente con riesgo cardiovascular. 59 Figura 13. Efecto de los datos ectópicos sobre la evaluación del gráfico de Poincaré: (a) Utilizando los datos de entrada; (b) Método de Tukey; (c) Método de Grubbs extendido por Rosner. 62 Figura 14. Histogramas para diferentes series R-R. 63 Figura 15. (a) Señal de respiración; (b) Aceleraciones y desaceleraciones del ritmo cardíaco dadas durante espiración e inspiración, respectivamente; (c) y (d) Separación de latidos con base en el ciclo respiratorio y efecto del corte de la señal de ECG sobre el cálculo de la VFC 65 Figura 16. Conversión de la señal en segmentos de longitud L, según el método propuesto por Welch (Welch, P. D., 1967) 69 Figura 17. Periodograma de Welch: (a) De un sujeto sin riesgo cardiovascular; (b) De un sujeto con riesgo cardiovascular alto 71 Figura 18. Espectro AR: (a) De un sujeto sin riesgo cardiovascular; (b) De un sujeto con riesgo cardiovascular alto 72 Figura 19. Gráfico de Poincaré detallando el ajuste de la elipse. 76 Figura 20. Proyecciones para la construcción de histograma: (a) del ancho, (b) de los intervalos R-R, (c) de la longitud. 77

Page 17: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

17

Figura 21. (a) Registro con ajuste de elipse, (b) Histograma de la longitud, (c) Histograma de los intervalos RR, (d) Histograma del ancho 78 Figura 22. Gráfico de Poincaré tres-dimensional de un sujeto sano 80 Figura 23. Arquitectura de la red neuronal artificial MLP. 85 Figura 24. Función de base radial (arquitectura). 89 Figura 25. Ilustración de la idea de un hiperplano óptimo para patrones linealmente separables. 92 Figura 26. Histograma de frecuencias de los valores de los intervalos RR. 97 Figura 27. Análisis de varianza para cada índice estadístico para los dos tipos de individuos tenidos en cuenta en este estudio 102 Figura 28. Análisis de componentes principales realizado a las medidas estadísticas proyectadas en las tres componentes principales para las dos categorías: Pacientes sin riesgo (círculo verde) y pacientes con riesgo (cruz negra) 103 Figura 29. Análisis de varianza (ANOVA) para medidas espectrales utilizando el espectro AR: (a) VLF; (b) LF; (c) HF; (d) LF/HF; (e) NLF; (f) NHF 106 Figura 30. Análisis de varianza (ANOVA) para medidas espectrales utilizando el periodograma de Welch: (a) VLF; (b) LF; (c) HF; (d) LF/HF; (e) NLF; (f) NHF 107 Figura 31. PCA realizado a las medidas espectrales proyectadas en 109

Page 18: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

18

las tres componentes principales para las dos categorías: Pacientes sin riesgo (círculo verde) y pacientes con riesgo (cruz negra) Figura 32. Entropía wavelet en diversas escalas de descomposición para los individuos tenidos en cuenta en este estudio (del 1 al 45 sin riesgo y del 45 en adelante con riesgo cardiovascular). La profundidad de la transformada es m=5. 112 Figura 33. Energía wavelet en diversas escalas de descomposición para los individuos tenidos en cuenta en este estudio (del 1 al 45 sin riesgo y del 45 en adelante con riesgo cardiovascular). La profundidad de la transformada es m=5. 112 Figura 34. PCA sobre la entropía obtenida en múltiples escalas para una profundidad de la transformada de m=5 para las dos categorías: Pacientes sin riesgo (diamante negro) y pacientes con riesgo (cuadrado rojo) 113 Figura 35. PCA sobre la energía obtenida en múltiples escalas para una profundidad de la transformada de m=5 para las dos categorías: Pacientes sin riesgo (diamante negro) y pacientes con riesgo (cuadrado rojo) 114 Figura 36. Análisis de varianza (ANOVA) (99% de la varianza explicada) para la entropía wavelet: (a) Componente principal; (b) Segunda componente principal; (c) Tercera Componente principal; (d) Cuarta componente principal. 115 Figura 37. Análisis de varianza (ANOVA) (99% de la varianza explicada) para la energía wavelet: (a) Componente principal; (b) Segunda componente principal; (c) Tercera Componente principal; (d) Cuarta componente principal. 115 Figura 38. Entropía wavelet en diversas escalas de descomposición para los individuos tenidos en cuenta en este estudio (del 1 al 45 sin riesgo y del 45 en adelante con riesgo cardiovascular). La 119

Page 19: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

19

profundidad de la transformada es m=5. Figura 39. Energía wavelet en diversas escalas de descomposición para los individuos tenidos en cuenta en este estudio (del 1 al 45 sin riesgo y del 45 en adelante con riesgo cardiovascular). La profundidad de la transformada es m=5. 119 Figura 40. Análisis de componentes principales (PCA) sobre la entropía obtenida en múltiples escalas para una profundidad de la transformada de m=5 para las dos categorías: Pacientes sin riesgo (diamante negro) y pacientes con riesgo (cuadrado rojo) 122 Figura 41. Análisis de componentes principales (PCA) sobre la energía obtenida en múltiples escalas para una profundidad de la transformada de m=5 para las dos categorías: Pacientes sin riesgo (diamante negro) y pacientes con riesgo (cuadrado rojo) 123 Figura 42. Análisis de varianza (ANOVA) (92.1% de la varianza explicada) para la entropía wavelet: (a) Componente principal; (b) Segunda componente principal; (c) Tercera Componente principal; (d) Cuarta componente principal. 124 Figura 43. Análisis de varianza (ANOVA) (92.1% de la varianza explicada) para la energía wavelet: (a) Componente principal; (b) Segunda componente principal; (c) Tercera Componente principal; (d) Cuarta componente principal. 125 Figura 44. Análisis de varianza (ANOVA) para medidas basadas en el ajuste de la elipse: (a) SD2; (b) SD1 128 Figura 45. Análisis de varianza para medidas basadas en el histograma: (a) de los intervalos R-R; (b) del ancho; (c) de la longitud 130 Figura 46. PCA realizado a las medidas relacionadas con el gráfico de Poincaré proyectadas en las tres componentes principales para las 131

Page 20: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

20

dos categorías: Pacientes sin riesgo (círculo verde) y pacientes con riesgo (cruz negra) Figura 47. Análisis de varianza para medidas de complejidad: (a) SmEn; (b) ApEn 133 Figura 48. Gráfico de las medidas de complejidad para las dos categorías: Pacientes sin riesgo (círculo verde) y pacientes con riesgo (cruz negra) para m=1 133 Figura 49. ApEn calculada variando el parámetro m: (a) m=2; (b) m=3; (c) m=4; (d) m=5 134 Figura 50. SmEn calculada variando el parámetro m: (a) m=2; (b) m=3; (c) m=4; (d) m=5 135 Figura 51. Performance de la máquina de soporte vectorial: (a) Lineal; (b) con kernel polinomial de orden 4; (c) Con kernel RBF de desviación estándar 3 138 Figura 52. Curva ROC del Perceptrón Multicapa (MLP) obtenida de la clasificación del conjunto de datos de prueba. El área bajo la curva es de 0.9822 140 Figura 53. Curva ROC de la red RBF obtenida de la clasificación del conjunto de datos de prueba. El área bajo la curva es de 0.8800 141 Figura 54. Curva ROC del desempeño de la SVM lineal. El área bajo la curva es de 0.8926 142 Figura 55. Curva ROC del desempeño de la SVM con kernel polinomial grado 4. El área bajo la curva es de 0.8140 142

Page 21: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

21

Figura 56. Curva ROC del desempeño de la SVM con kernel RBF con desviación estándar 3. El área bajo la curva es de 0.8595 143 Figura 57. Interfaz de usuario del programa para análisis de la VFC 146 Figura 58. Funcionamiento general de la aplicación final 149

Page 22: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

22

LISTA DE ANEXOS

Pág. Anexo A. Procedimiento de Prueba: Medición de Variabilidad de la Frecuencia Cardíaca Integrando la Señal de la Frecuencia Respiratoria

155

Anexo B. Formulario de consentimiento informado 161 Anexo C. Procedimiento para el Cálculo de Análisis de Componentes Principales

165

Anexo D. Procedimiento para el Cálculo de Kernel-Análisis de Componentes Principales

167

Page 23: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

23

RESUMEN En este trabajo se realizó el análisis de la variabilidad de la frecuencia cardíaca (VFC) integrando las variaciones inducidas por la dinámica respiratoria como factor de pronóstico de riesgo cardiovascular. Se presentan diferentes tipos de análisis para la serie experimental de VFC, entre ellos se encuentra el análisis estadístico, análisis mediante técnicas espectrales, análisis multirresolución y análisis de la dinámica no-lineal de la señal. Fueron analizados un total de 90 registros electrocardiográficos de 5 min, 45 de ellos pertenecientes a personas sin riesgo cardiovascular y los 45 restantes fueron tomados de personas con una valoración de riesgo cardiovascular media o alta dada previamente. Para evaluar el valor de cada índice extraído por separado se realizaron diversos análisis univariados de varianza (ANOVA), análisis de componentes principales (PCA) y adicionalmente se implementó una prueba estadística desarrollada por el equipo de trabajo con el fin de e determinar el valor pronóstico asociado a cada uno de estos y cada método de análisis completo. Dentro de los métodos de análisis estadístico, se utilizaron los índices: media, desviación estándar, entre otros. Respecto a los métodos espectrales, dos métodos fueron implementados computacionalmente: El periodograma de Welch y el cálculo del espectro autorregresivo (AR), de estos se extrajeron un total de 12 características espectrales. Adicionalmente, dos medidas fueron calculadas: la entropía y la energía y sus versiones en múltiples resoluciones de la señal de VFC, esto constituyó el análisis multirresolución de dicha señal. Finalmente, fueron calculadas 7 medidas no-lineales: 5 de ellas extraídas directamente desde el mapa de retorno de la señal de VFC y 2 de ellas medidas de complejidad denominadas entropía de aproximación (ApEn) y entropía muestral (SmEn). Los análisis estadísticos se mostraron concluyentes respecto a los índices no-lineales y multirresolución respecto a significancia estadística y valor pronóstico, los índices estadísticos y espectrales presentaron significancia estadística baja. Fueron utilizadas, en total, 53 características para la fase de selección; en esta fase se llevó a cabo un análisis multivariado de varianza (MANOVA) con el que el conjunto quedó reducido a las características más relevantes en términos de significancia estadística utilizando un umbral de p<0.0001. A partir de las características seleccionadas por MANOVA, fueron entrenados diversos esquemas de inteligencia artificial, entre ellos, un perceptrón multicapa (MLP), una función de base radial (RBF) y tres aproximaciones sobre las máquinas de soporte vectorial (SVM y K-SVM). Estos esquemas fueron evaluados utilizando el conjunto total de características y utilizando conjuntos reducidos de características utilizando PCA y K-PCA. El MLP demostró tener un mejor desempeño en lo que se refiere a sensitividad (0.9333), especificidad (1.00), predictividad positiva (1.00), predictividad negativa (0.9375) y exactitud (0.9667) que los demás esquemas evaluados, no obstante, las SVM demostraron un desempeño sobresaliente en la identificación.

Page 24: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

24

INTRODUCCIÓN

Al registrar la actividad eléctrica del corazón haciendo uso de un electrocardiógrafo obtenemos una representación con la cual se puede conocer el comportamiento del mismo. En el registro de los impulsos eléctricos obtenidos por el electrocardiógrafo es posible tomar medidas con el fin de realizar un diagnóstico de diversas patologías de acuerdo a unos patrones de comportamiento de la señal obtenida. La variabilidad de la frecuencia cardiaca (VFC) es una de ellas, la cual consiste en la medición de las fluctuaciones en la frecuencia entre intervalos R-R. Esta puede estar asociada a otros eventos fisiológicos, como es el caso de la frecuencia respiratoria la cual tiene una influencia refleja sobre el ritmo cardiaco, no obstante, esta no es causada únicamente por movimientos oscilatorios externos (Bezerianos A. et. al., 1999). En sentido general, la naturaleza de la VFC estriba en comportamientos fisiológicos de dinámica altamente no lineal. Por otra parte, la VFC es un poderoso descriptor y predictor de posibles eventos cardiacos, como: infarto agudo de miocardio (IAM) (Rueda O. et. al., 2007), fibrilación atrial (AF) (Chesnokov Y. V., 2008), entre otros que figuran actualmente en la literatura. En los últimos años, diferentes técnicas avanzadas de procesamiento de señales biomédicas han sido ampliamente exploradas e implementadas en lo que se refiere a la extracción de características e indicadores que permitan obtener información que no se encuentra presente de manera evidente en las mismas y que permita la generación de diagnósticos con mayor exactitud; éste último es, de hecho, el objetivo principal de los sistemas de ayuda diagnóstica por computadora (CAD) que han sido tema de diversas investigaciones y evaluaciones. Los métodos estadísticos así como los análisis espectrales y con mayores visos, el análisis multirresolución, son considerados herramientas poderosas para llevar a cabo dicha tarea. Los sistemas inteligentes como las redes neuronales artificiales, los sistemas difusos y neuro-difusos orientados al desarrollo de nuevas tecnologías médicas, han tenido un despliegue relativamente amplio durante los últimos años en países del primer mundo con el propósito de disminuir la prevalencia de morbi-mortalidad que presentan algunas alteraciones cardíacas. En la actualidad varios métodos han sido adscritos para la medición de variabilidad cardíaca, los más conocidos son los que implementan manipulaciones de las señales en el dominio del tiempo como los métodos estadístico y geométrico y en el dominio de la frecuencia como es el caso del análisis espectral, transformada o serie de Fourier y la descomposición de señales utilizando

Page 25: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

25

wavelets (Belova N. Y. et. al., 2007). Además, se han usado otras técnicas menos referenciadas en la literatura como redes neuronales de agrupamiento no supervisado (Kohonen T., 1982; Bezerianos A. et. al., 1999) usadas para la caracterización de la dinámica la VFC. En este documento se presenta el trabajo que analiza la variabilidad de la frecuencia cardiaca teniendo como consideración el análisis de las variaciones inducidas por la frecuencia respiratoria. En este se implementan y evalúan técnicas de análisis estadístico, espectrales, multirresolución y no-lineales con el fin de caracterizar la variabilidad de la frecuencia cardíaca, a partir de dicho análisis, se llega a la implementación de esquemas de inteligencia artificial con el fin de pronosticar riesgo cardiovascular.

Page 26: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

26

1. ANTECEDENTES Durante los últimos años se ha relacionado la variabilidad de la frecuencia cardíaca (VFC ó HRV) con la ocurrencia de eventos cardíacos específicos. A pesar del desarrollo de nuevas técnicas de procesamiento de señales en adición a terapias y el desarrollo de medidas diagnósticas médicas invasivas y no invasivas, las manifestaciones cardíacas, y de manera especial alteraciones como el infarto agudo de miocardio son la mayor causa de mortalidad (Rueda, O. L. et. al, 2007). La detección de anormalidades en la VFC se ha convertido en una herramienta poderosa para la predicción de morbilidad o mortalidad, no obstante, en una cantidad considerable de ocasiones el valor predictivo positivo de los posibles eventos ha sido bajo. En la literatura han sido reportados numerosos hallazgos respecto a la caracterización de la VFC utilizando aproximaciones geométricas, estadísticas, espectrales, de complejidad, aproximaciones desde el enfoque multi-resolución, y no-lineales (Bezerianos, A. et. al., 1999; Rueda, O. L. et. al, 2007; Belova, N. Y. et. al., 2007; Lopes, P. and White, J., 2006; García-González, M. A., 1998; Montano, N. et. al., 2008; Acharyaa, U. R. et. al, 2003; Mohammadzadeh Asl, B. et. al, 2008; Kuss O. et. al., 2008; Urbanowicza K. et al, 2007; Bilgin, S. et. al., 2008; Malik M. et. al., 1996; Singh D. et. al., 2005; D’Addio G. et. al., 1998; Thong, T., 2007; D’Addio, G. et. al., 1999; Woo, M. A. et. al., 1992; Brennan M. et. al., 2001). La relevancia clínica de la VFC fue apreciada en 1965 cuando Hon y Lee notaron que la distensión fetal estaba precedida por alteraciones en los intervalos R-R antes de que ocurriera un cambio apreciable en el ritmo cardíaco como tal. Sayers, 1970 y algunos otros autores (Sayers B. M., 1973; Penaz J. et. al., 1968; Luczak H. et al., 1973; Hirsh J. A. et al., 1981) descubrieron la existencia de ritmos fisiológicos dentro de la señal de frecuencia cardíaca latido a latido. Durante la década del 70, Ewing et. al., 1985, elaboraron una serie de pruebas de cabecera de diferencias de variabilidad cardíaca de corto término para detectar neuropatía autonómica en pacientes diabéticos. La relación entre riesgo alto de mortalidad y una VFC reducida fue mostrada inicialmente por Wolf et. al., 1977. La VFC ha sido relacionada de manera recurrente en la literatura con: Infarto al miocardio, dada la predominancia de la actividad simpática y la reducción de la actividad parasimpática. La actividad simpática disminuye el umbral de fibrilación y predispone a una fibrilación ventricular (VF). Por otra parte, el grado de arritmia sino-respiratoria muestra una relación lineal con el control cardíaco parasimpático (Rothschild, M. et. al., 1988; Katona, P. G and Jih F.,

Page 27: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

27

1975) y puede ser usado como un factor de pronóstico para el infarto al miocardio. La variabilidad de la frecuencia cardíaca decrece con el padecimiento del infarto. Arritmias cardíacas, usualmente los eventos arrítmicos hacen que la VFC se modifique, originando eventos ectópicos. Los alargamientos o acortamientos bruscos en el intervalo R-R son usualmente debidos a eventos ajenos a la dinámica regulatoria del sistema nervioso autónomo sobre el sistema cardiovascular, e. g., contracciones ventriculares prematuras (PVC), extrasístoles, taquicardia ventricular (VT). Desarrollos recientes (Acharyaa, U. R. et. al., 2003; Mohammadzadeh Asl B. et. al., 2008) han mostrado que con características extraídas de la señal de la VFC es posible detectar eventos de este tipo, utilizando gran variedad de técnicas, e. g., estadísticas, espectrales, no-lineales. En pacientes con falla renal, aunque las funciones autonómicas revelan un daño del sistema nervioso parasimpático, el análisis espectral exhibe una reducción significativa en la potencia espectral en todos los rangos de frecuencia (Rajendra Acharya U. et. al., 2006; Axelrod, S. et. al., 1987). Se han analizado registros de corto término (5-min), obteniendo un aumento de potencia en la banda de baja frecuencia y un decremento en la banda de alta frecuencia. Diabetes, que usualmente causa una disfunción autonómica. La disminución de la variabilidad latido a latido durante la respiración honda, fue reportada por primera vez por Wheeler y Watkins (Wheeler T. and Watkins P. J., 1973). La actividad autonómica cardiaca (parasimpático) se ve disminuida en pacientes diabéticos antes de que se desarrollen síntomas de neuropatía (Pfeifer M. A. et. al., 1982). Además de lo anterior existen factores de riesgo como la edad, la presión arterial, el consumo de drogas, alcohol y tabaco (Rajendra Acharya U. et. al., 2006). 1.1. MÉTODOS ESTADÍSTICOS Y GEOMÉTRICOS UTILIZADOS PARA VALORAR LA VFC Los métodos estadísticos, también conocidos como análisis en el dominio del tiempo de la VFC, fueron los primeros en ser utilizados para la valoración de la VFC. En 1996, el Task Force del ESC/NASPE, publicó algunos estándares sobre variabilidad del ritmo cardíaco proponiendo distintos parámetros en el dominio del tiempo y la frecuencia basados en datos de VFC de corto término (5-min) y largo término (24-h) (Malik M. et. al, 1996; Ísler, Y. and Kuntalp, M., 2007), y relacionó cada parámetro con un determinado uso clínico y con los posibles cambios debido a patologías como el infarto al miocardio, neuropatía diabética, trasplante cardíaco, disfunción del miocardio y tetraplejia (Malik M. et. al, 1996).

Page 28: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

28

De igual manera, en (Rajendra Acharya, U. et. al., 2006; Rueda, O. L. et. al., 2007) se relacionan algunos de los índices más utilizados para la valoración de la VFC y han sido relacionados con la ocurrencia de eventos como: Contracciones ventriculares prematuras (PVCs), Síndrome Sinusal (SSS) y fibrilación atrial, debido a variaciones altas del R-R. Por otra parte, para las variaciones cortas del R-R (i. e., parámetros debidos a una variación baja), los índices estadísticos se relacionan con: Bloqueo completo de corazón (CHB, Complete Heart Block), bloqueo de la rama izquierda (LBBB, Left Bundle Branch Block) y Cardiomiopatía Isquémica (Rajendra Acharya, U. et. al., 2006). Las series de intervalos R-R pueden ser convertidas en patrones geométricos y varias aproximaciones para la valoración de la VFC han sido derivadas de estos (Rueda, O. L. et. al., 2007; Rajendra Acharya, U. et. al., 2006; Farrell T. G. et. al., 1991; Malik M. et. al., 1989). La mayor ventaja de estos métodos está en su relativa insensibilidad a la calidad analítica de la serie R-R, no obstante su mayor desventaja es la necesidad de una cantidad razonable de datos para construir el patrón geométrico; la literatura reporta que deben usarse registros de al menos veinte (20) minutos (pero preferiblemente 24 horas) para asegurar el desempeño de dichos métodos, es por lo anterior que han sido encontrados inadecuados para evaluar cambios en intervalos cortos de la VFC (Rueda, O. L. et. al., 2007). 1.2. PROCESAMIENTO DIGITAL DE SEÑALES APLICADO A LA VFC En 1981, Akselrod et. al. (Akselrod, S. et. al., 1981), introdujeron el análisis de potencia espectral para las fluctuaciones del ritmo cardíaco para evaluar cuantitativamente el control cardiovascular latido a latido (Malik M. et. al., 1996). Estos análisis en el dominio de la frecuencia contribuyeron al entendimiento de los cambios autonómicos que proporcionan las fluctuaciones de los R-R en los registros de frecuencia cardíaca (Pomeranz, M. et. al., 1985; Pagani, M. et. al., 1986). En los estudios más actuales, N. Montano (Montano, N. et. al., 2008), plantea la caracterización de la variabilidad de la frecuencia cardíaca en el dominio de la frecuencia, como una herramienta útil para investigar el vínculo entre el corazón y los cambios autonómicos como factores que propician la dinámica y que pueden ser usados desde una variedad de problemas diagnósticos, de pronóstico y de terapia médica. El análisis espectral de la VFC ha sido de utilidad para el pronóstico de hipertensión (Pal G.K. et. al., 2009). Se ha observado que personas con factores de riesgo como hipertensión, obesidad, resistencia a la insulina y otros, generalmente tienen una actividad simpática alta y se cree que dicha actividad se

Page 29: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

29

presenta mucho antes de la manifestación clínica de la hipertensión. Con base en que los métodos espectrales presentan utilidad en la evaluación de los cambios en el balance simpatovagal, la predicción de la aparición de la hipertensión se ha llevado a cabo en forma precisa. El análisis en el tiempo también ha sido ampliamente implementado para caracterizar la VFC. Kuss (Kuss, O. et. al., 2009), utiliza un estudio de simulación para cuantificar el error estadístico utilizando señales en el dominio de la frecuencia en reemplazo de las señales en dominio del tiempo; de lo que se concluye que los parámetros en el dominio de la frecuencia pueden ser usados pero deben ser interpretados con cuidado tomando en cuenta las debilidades estadísticas en la estimación espectral. El análisis multi-escala utilizando wavelets, representa actualmente una ventaja significativa, pues la característica principal de la VFC estriba en ser estrictamente no-estacionaria (Ravichandran I T. et. al., 2003), y aún cuando a partir de la transformada wavelet discreta (DWT, Discrete Wavelet Transform) los rangos de baja y alta frecuencia requeridos no puedan ser obtenidos, una opción importante es la descomposición mediante wavelet packet (Bilgin, S. et. al., 2008), una forma generalizada de la DWT, que proporciona una aproximación a las bandas de frecuencia requeridas y expone diferentes características asociadas al balance simpato-vagal (SB, Sympathovagal Balance). 1.3. SISTEMAS DINÁMICOS NO-LINEALES Y VFC La variabilidad de la frecuencia cardíaca, por otra parte, también ha sido estudiada como la medida de la aleatoriedad con que ocurren los latidos determinados a través de la medición de los intervalos R-R (Urbanowicza, K., 2007), debido a que la VFC estriba en una dinámica altamente no-lineal que de manera estricta obedece a una inestabilidad de esta misma naturaleza generada por el sistema como tal, los intervalos de tiempo usualmente cambian de un complejo a otro, por lo que intuitivamente podrían ser denominados irregulares. En consecuencia de lo anterior, un enfoque determinístico no-lineal parece ser más apropiado para describir el fenómeno, dado que tiene un comportamiento aparentemente errático. De esta manera, se desarrollan tipos específicos de dinámica no-lineal, i. e., teoría de caos (Lombardi, F., 2000; Denton, T. A. et. al., 1990) y fractales (Theiler, J., 1990; García-González, M. A., 1998), que han sido recientemente aplicados a señales de VFC y electrofisiológicas en general. Inicialmente se asumió que las fluctuaciones caóticas podían explicar la actividad eléctrica cardíaca durante fibrilación atrial o ventricular. Después, se propuso que las fluctuaciones de los latidos cardíacos durante el ritmo sinusal normal podrían ser parcialmente atribuidas al caos determinístico, y que el decremento de este

Page 30: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

30

tipo de variabilidad no-lineal, podría ser observado en diferentes enfermedades cardiovasculares y antes de la fibrilación ventricular (Malik, M. et. al., 1996; Lombardi, F., 2000; Denton T. A. et. al., 1990; Goldberger, A. L., 1996). Evidencia teórica aplicada a la VFC ha mostrado que el comportamiento dinámico de la misma es caótico, esto parece ser confirmado con a estimación de algunas características, e. g., el exponente de Lyapunov más grande (Meiss, J. D., 2007). La reconstrucción de la dinámica de series temporales experimentales (sin el conocimiento de un modelo matemático descrito por ecuaciones diferenciales) utilizando mapas de retorno de una dimensión y orden dados, ha posibilitado el cálculo de todos los exponentes de Lyapunov, i. e., positivos, negativos y cero (Ataei, M. et. al., 2004; Lardjane, S., 2004; Wolf, A. et. al., 1985; Sano, M. and Sawada, Y., 1985; Principe, J. C. and Pei-Chen Lo, 1985; Djamai, L. and Coiault, P., 2002), no obstante, hasta el momento solo se han reportado publicaciones que utilizan el exponente más grande (Rajendra Acharya, U. et. al., 2006). 1.4. SISTEMAS INTELIGENTES APLICADOS A LA VFC En análisis de VFC, los sistemas inteligentes han sido utilizados con fines de diagnóstico, i. e., resolver tareas de clasificación y/o clustering de complejidad alta (Chesnokov, Y. V., 2008; Acharyaa, U. R. et. al., 2003; Mohammadzadeh Asl, B. et. al., 2008; Fukuda, O. et. al., 2001; Mehta, S. S., 2008). Para ello han sido utilizadas de manera preferencial las redes neuronales artificiales y en otros casos los sistemas difusos y neuro-difusos y algoritmos genéticos. Este tipo de algoritmos han sido usados en menor medida en una fase de reducción de dimensionalidad (selección de características) (Ísler, Y. and Kuntalp, M., 2007) o pre-procesamiento de la señal electrocardiográfica (Chawla, M.P.S. et. al., 2008). Por otra parte, Chesnokov (Chesnokov, Y. V., 2008) propone un sistema de análisis de complejidad y espectral de la dinámica de la VFC para la predicción de fibrilación atrial utilizando métodos de inteligencia artificial, en este punto, el análisis espectral, de complejidad y multiescala propuesto sirve a la caracterización de las señales respecto a indicadores de variabilidad cardíaca y los métodos de clasificación implementados son: un perceptrón multicapa (MLP, Multi-Layer Perceptron), un mapa autoorganizado (SOFM, Self-Organizing Feature Map) y una máquina de soporte vectorial (SVM, Support Vector Machine), obteniendo mejores resultados con el primero de estos. Acharya et. al., 2003, por otra parte, propone un algoritmo inteligente para la clasificación de datos de frecuencia cardíaca, dicho algoritmo utiliza un MLP como clasificador y compara con un algoritmo difuso. Las SVM también fueron implementadas con este objetivo.

Page 31: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

31

La variabilidad de la frecuencia cardíaca también está implicada con el diagnóstico o aparición de arritmias cardíacas; Mohammadzadeh et al., 2008, utilizando un conjunto de características extraídas de la señal de VFC, generaron un algoritmo para clasificación de latidos, que comprendía ritmo sinusal normal (NSR), contracciones ventriculares prematuras (PVC), fibrilación atrial (AF), síndrome sinusal (SSS), fibrilación ventricular y el 2º bloqueo de corazón (BII), en dicho estudio fueron utilizadas medidas en el dominio del tiempo y medidas no-lineales en adición a técnicas para la reducción de dimensionalidad (GDA, General Discriminant Analysis) y una SVM para la clasificación final de los datos, obteniendo un desempeño (sensitividad, especificidad, exactitud, valor predictivo positivo) alto en la tarea de clasificación.

Page 32: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

32

2. MARCO TEÓRICO 2.1. VARIABILIDAD DE LA FRECUENCIA CARDÍACA Y SEÑAL ELECTROCARDIOGRÁFICA La actividad eléctrica del corazón ha sido observada desde 1856, cuando dos investigadores hicieron un corte en el final de un nervio muscular de una rana, con la pared del ventrículo izquierdo del corazón expuesta. Ellos descubrieron que la actividad eléctrica del corazón durante el latido generaba un tic muscular a través del nervio. Desde ese estudio, el conocimiento electrofisiológico ha sido alcanzado a través de estudios animales. La frecuencia cardiaca es obtenida a través de una señal de electrocardiografía, y se encuentra sometida a la influencia de varios mecanismos. Las variaciones de la frecuencia cardiaca están bajo el control del sistema nervioso. Los potenciales eléctricos existen a través de las membranas de todas las células del cuerpo. Sin el músculo cardíaco, algunas células, conocidas como células excitables, tienen la habilidad para conducir un potencial de acción, la magnitud varia en diferentes tipos de tejido cardíaco. Los mecanismos internos de la regulación de los latidos cardiacos consisten en varias fibras especializadas. El corazón requiere un estimulo eléctrico para iniciar su acción. El latido normal empieza con la propagación de un impulso eléctrico in el nodo sinoatrial, el marcapasos natural del corazón, el cual esta localizado en la parte superior del atrio derecho. La descarga eléctrica regular desde este nodo inicia usualmente la contracción rítmica del resto del corazón. El impulso se extiende a través del músculo atrial, causando la sístole atrial. Esta contracción es registrada por el nodo atrioventricular, localizado en la parte inferior del atrio, y es transmitido por medio de las fibras de Purkinje a los músculos ventriculares, causando la sístole ventricular. Estas series de contracciones están precedidas por un cambio de carga en voltaje eléctrico (despolarización), la cual puede ser monitoreada en la superficie del cuerpo en la forma de un electrocardiograma, o señal ECG (Lopes P. and White J., 2006). 2.2. ARRITMIA SINO-RESPIRATORIA (RSA) La variabilidad de la frecuencia cardiaca (VFC) se refiere a las fluctuaciones en el ritmo cardiaco y refleja las modulaciones de la función cardiaca y otros sistemas regulatorios fisiológicos (Akselrod et al., 1981). La respiración tiene una influencia importante en la variabilidad de la frecuencia cardiaca. Este fenómeno es denominado Arritmia Sino Respiratoria (RSA), es una fluctuación rítmica en los

Page 33: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

33

intervalos de los latidos caracterizados por un acortamiento y un alargamiento de los intervalos en una relación de fase con la inspiración y espiración respectivamente (Bernston et. al., 1993). El sistema nervioso autónomo es la parte del sistema nervioso que controla extrínsecamente funciones vitales y órganos como el corazón, pulmones, glándulas, entre otros, y se divide en dos partes el sistema nervioso simpático y el sistema nervioso parasimpático. Estos dos sistemas (simpático-parasimpático) trabajan juntos como antagonistas uno del otro constantemente y son los responsables de sintonizar o afinar los mecanismos de regulación de muchas de las funciones fisiológicas. El sistema nervioso simpático actúa como un mecanismo activador para la mayoría de los órganos internos. En este caso también actúa como un estimulador que aumenta la frecuencia cardiaca. Idealmente estos dos sistemas trabajan de manera perfecta y proveen estabilidad a largo término y alta adaptación. Muchos factores internos y externos pueden provocar una interferencia de este balance y algunas veces causan que el sistema simpático incremente su actividad al hacer frente a estos factores, entonces desembocan un mal funcionamiento de este balance o afinación entre estos dos sistemas (Lopes, P. and White J., 2006), dado por la hiperactividad simpática e hipoactividad parasimpática o viceversa, que propician la aparición de irregularidades funcionales, dado que cada uno puede incrementar o disminuir su actividad haciendo que sea difícil volver a funcionar de manera óptima y sincronizada. La variabilidad de la frecuencia cardiaca como indicador puede medir el estado del sistema nervioso autónomo. Cuando se monitorea la respiración en un ambiente controlado tenemos que los intervalos RR tienden a hacerse mas cortos cuando se esta inspirando y luego comienzan a hacerse de nuevo mas anchos cuando se espira. Varias teorías han sido propuestas acerca de esto, según algunos estudios (Piepoli, M. et. al, 1997), la mayoría nacen de la experimentación con animales, la RSA proviene del control dado por las oscilaciones dadas por las frecuencias de disparo de las redes neuronales medulares (oscilador central); la red neuronal medular muestra oscilaciones periódicas en las frecuencias de disparo, incluso cuando todas las entradas aferentes están interrumpidas. Cuando estas oscilaciones son llevadas por estímulos aferentes desde los receptores en los pulmones y pared torácica, puede resultar una oscilación en el ritmo cardíaco denominada arritmia sinusal respiratoria (RSA). Por otra parte, Conforme aumente la edad, la variabilidad de la frecuencia cardiaca disminuye significativamente (Pomeranz et al., 1985). Este cambio en la variabilidad ha sido atribuido a una disminución en el tono cardiaco vagal eferente y también en la disminución de la respuesta β-adrenergica (Molgaard, Sorensen, & Bjerregaard, 1991; O´Brien, O´Hare, & Conrrall, 1986).

Page 34: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

34

2.3. PROCESAMIENTO DIGITAL DE SEÑALES Y SU APLICACIÓN A LA MEDICINA El procesamiento digital de señales (de cualquier dimensión) ha sido ampliamente utilizado para distintos fines y en distintos tipos de tecnologías. A grandes rasgos, se puede decir que con el procesamiento digital se intenta obtener una caracterización de las señales, de tal forma que dicha caracterización pueda apoyar de forma significativa una decisión determinada con base en su comportamiento. Por una parte, muchos diagnósticos erróneos pueden atribuirse a errores humanos, producidos por factores o estímulos externos a un determinado especialista, e. g., cansancio visual por razones fisiológicas. A pesar de las múltiples valoraciones que se pueden hacer sobre riesgo de una patología específica, los errores no se eliminan totalmente. El diagnóstico de anomalías utilizando la computadora y la información contenida en señales, es un desarrollo relativamente antiguo, habiéndose realizado experimentos para la detección de nódulos pulmonares en 1989 (Vilarrasa, 2006). El diagnóstico asistido por computadora (CADs), es la aplicación de técnicas computacionales al problema de la interpretación de las señales en general, estos sistemas están diseñados para ayudar al especialista en tareas de diagnóstico y/o pronóstico de patologías. Para este tipo de fines, el análisis de señales en distintos dominios (tiempo, frecuencia, wavelet) ha sido desarrollado con miras a la extracción de características con un valor pronóstico alto que permitan apoyar las apreciaciones del especialista. 2.4. MEDIDAS Y ANÁLISIS ESTADÍSTICO DE SERIES DE DATOS EXPERIMENTALES Y SU APLICACIÓN AL ANÁLISIS DE LA VFC Los métodos estadísticos o en el dominio del tiempo son los que se usaron primero para analizar la variabilidad de la frecuencia cardiaca debido, principalmente, al conocimiento de las técnicas estadísticas por parte de los médicos frente a otros métodos. Las primeras aplicaciones de los métodos estadísticos se realizaron para cuantificar la respuesta a diversas pruebas o maniobras (García-González, M. A., 1998). La realización del análisis estadístico o mediante los métodos en el dominio del tiempo puede ser razonablemente más sencillo de efectuar, entre las más importantes mediciones tenemos: la media de los intervalos RR que arroja un valor promedio de la distribución total, la desviación estándar que es una medida de dispersión, es decir que da información relevante respecto a la distancia de los datos hasta la media, el pNN50 (proporción de pares R-R adyacentes con una diferencia mayor que 50 milisegundos), el SDSD (desviación estándar de las

Page 35: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

35

diferencias entre intervalos RR adyacentes), el r-MSSD (la raíz cuadrada de la media de la suma de las diferencias al cuadrado entre intervalos R-R adyacentes) y la ACF (función de autocorrelación), entre otros que dan una explicación rápida del comportamiento de los intervalos RR como una distribución. Aunque estos índices son los más fáciles de leer, tienen un valor pronóstico relativamente bajo, por lo que deben utilizarse además, otro tipo de algoritmos a fin de obtener una valoración más completa. 2.5. ANÁLISIS DE SEÑALES EN EL DOMINIO DE LA FRECUENCIA La transformada de Fourier es una de varias herramientas matemáticas usadas en el análisis y diseño de sistemas LTI (Lineales e Invariantes en el Tiempo). Otro de ellos son las series de Fourier. Estas representaciones de señales básicamente implican la descomposición de las señales en términos de componentes sinusoidales (o complejos exponenciales). Con tal descomposición es dicho que son representadas en el dominio de la frecuencia (Yoo Y., 2001). Como ha sido demostrado, muchas de las señales de interés práctico pueden ser descompuestas en una suma de componentes sinusoidales. Para la clase de señales periódicas, dicha descomposición es denominada Series de Fourier. Para la clase de señales con energía finita, la descomposición es llamada la Transformada de Fourier. Estas descomposiciones son extremadamente importantes en el análisis de sistemas LTI porque la respuesta de un sistema LTI a una señal de entrada sinusoidal es una sinusoide de la misma frecuencia pero de diferente amplitud y fase. Además, la propiedad de linealidad de los sistemas LTI implica que la suma lineal de componentes sinusoidales en la entrada produce una similar suma de componentes sinusoidales en la salida, las cuales difieren únicamente en las amplitudes y las fases de las entradas sinusoides. El comportamiento característico de los sistemas LTI hace la descomposición sinusoidal de señales muy importante. Aunque existen muchas otras descomposiciones de señales posibles, solo la clase de señales sinusoidales posee esta propiedad deseable al pasar a través de un sistema LTI (Proakis, J. G. and Manolakis, D. G, 1996). 2.5.1. Análisis de Señales en el Dominio de la Frecuencia Aplicado a la VFC. El uso de los métodos espectrales implica un beneficio en la capacidad de separar la variabilidad de la frecuencia cardiaca debida a la excitación vagal de la producida por la excitación simpática. En los métodos estadísticos sólo hay una aproximación superficial a este objetivo cuando se cuantificaba la variabilidad de la frecuencia cardiaca de un latido a otro. La utilidad de separar ambos fenómenos biológicos que provocan la variabilidad del ritmo cardíaco es mejorar el diagnóstico de neuropatías y el pronóstico de muerte cardíaca súbita. No

Page 36: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

36

obstante, los métodos espectrales presentan varias limitaciones que no siempre son tenidas en cuenta por el investigador. En la caracterización espectral de la variabilidad del ritmo cardíaco se emplean primordialmente dos métodos: La transformada rápida de Fourier (FFT) y la estimación espectral del modelo autorregresivo (AR) que mejor se ajusta a la señal a procesar (método AR). La cuantificación de la variabilidad del ritmo cardíaco a partir de métodos espectrales se efectúa mediante un número limitado de índices, función del número de bandas frecuenciales que se analicen. Una vez establecidas las bandas de interés, se procede a cuantificar de alguna forma la potencia asociada a cada una de ellas. Hay tres maneras diferentes de cuantificar la potencia asociada a cada banda: el cálculo del área bajo la curva de la estimación espectral para la banda de interés, el cálculo de la potencia asociada a los polos del modelo AR que contribuyen a la potencia de la banda de interés a partir del teorema de los residuos y el cálculo de la altura del pico frecuencial más elevado de la banda de interés (García-González, M. A., 1998). 2.6. ANÁLISIS MULTIRRESOLUCIÓN El análisis multiescala (MSA) comprende un conjunto de herramientas que han sido desarrolladas en los últimos años para controlar la escala de observación y representar y estudiar la naturaleza multiescala de problemas asociados a análisis de señales. Entre las técnicas clásicas de MSA el análisis multirresolución es el de mayor utilización en el entorno de procesamiento digital de señales. Esto se debe a su capacidad de partir de una señal inicial a determinada escala de resolución y estudiarla a escalas de resoluciones menos finas. Entre los tipos de bases más conocidas, documentadas y utilizadas se encuentran las wavelets, introducidas inicialmente como análisis multirresolución. Aunque la transformada de Fourier sobre ventanas es un gran avance para el análisis de señales, esta posee una limitación fundamental: Es necesario definir o conocer el tamaño de la ventana a priori, e. g., cuando se desean detectar cambios bruscos en la señal (componentes de alta frecuencia) o una frecuencia de oscilación en un intervalo temporal concreto. La transformada wavelet representa una alternativa a este problema, pues es una técnica de ventaneo con regiones de tamaño variable. Así, se pueden utilizar intervalos grandes para el análisis de bajas frecuencias y regiones pequeñas para el análisis de altas frecuencias (Mallat, S., 1989).

Page 37: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

37

2.6.1. Transformada Wavelet Discreta y Algoritmo de Mallat. Una función wavelet discreta viene descrita como expresa la ecuación 1.

( ) ( )ntt mmnm −= −− 22 2/

, ψψ , (1) donde m, n Є Z y corresponden a la dilatación y traslación de la función, respectivamente. Para aplicar la transformada wavelet a una serie de datos numéricos, se hace necesario implementar una transformada discreta (Kouro, S. y Musalem, R., 2002). Esta idea fue desarrollada por Mallat en 1988 (Mallat, S., 1989), quien diseñó un algoritmo basado en un banco de filtros que permite obtener la transformada wavelet en forma instantánea. Para muchas aplicaciones el algoritmo de Mallat simplifica los procesos de cálculo, que pueden ser llevados a cabo como describen las ecuaciones 2 y 3.

( ) ∑ ++ =k

knmknm tct )(2

12,,1 φφ , (2)

( ) ∑ ++ =k

knmknm tbt )(2

12,,1 φψ , (3)

donde )(tφ es la función de escala y )(tψ es la función wavelet, kc son los coeficientes de escala, kb son los coeficientes wavelet y k es el índice (localización) de los coeficientes de la transformada. Los coeficientes de aproximación y detalle pueden ser formulados como expresan las ecuaciones 4 y 5, respectivamente.

∑∑ −++ ==k

kmnkk

knmknm ScScS ,22,,1 21

21 , (4)

∑∑ −++ ==k

kmnkk

knmknm SbSbT ,22,,1 21

21 . (5)

Las componentes de aproximación y detalle pueden ser obtenidas con la reconstrucción de los coeficientes de aproximación y detalle según las ecuaciones 6 y 7.

)()( ,, tStA nMnMM φ= , (6)

Page 38: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

38

∑−−

=

=12

0,, )()(

mM

nnmnMm tTtD ψ , (7)

donde M es el último nivel de descomposición. La figura 1 ilustra el algoritmo de Mallat de manera más detallada (Mallat, S., 1989) y adicionalmente la figura 2 presenta la diferencia fundamental entre la transformada wavelet continua (para todas las escalas) y la transformada wavelet discreta (para las escalas en potencias de 2), en esta última se puede apreciar que la similitud básica asociada a algunas de las escalas de descomposición se mantiene también en el dominio discreto de la transformada. Figura 1. Árbol de descomposición de la transformada wavelet discreta.

Figura 2. Transformada wavelet para un latido electrocardiográfico normal en 256 escalas: (a) Continua; (b) Discreta

Page 39: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

39

2.6.2. Transformada Wavelet Inversa. Una vez que una señal ha sido pasada al dominio wavelet, es posible recuperarla dado el siguiente teorema: Sea )()( 12 RLRL ∩∈ψ , una wavelet verificando:

+∞<=

=

∫∞

∞−

∞−

Kdww

wii

dssi

)(ˆ)(

1)()(

2

2

ψ

ψ,

(8) entonces,

∫ ∫∞

∞−

∞−

−= 2)(),(1)(a

dadbbsbafK

sf aψψ . (9)

Este teorema indica que es posible reconstruir la señal original f a partir de su descomposición en coeficientes wavelet, siempre y cuando se verifiquen las condiciones (i) y (ii) (Alvarez, L. and Morales, F., 1994). A nivel de aplicaciones es de gran interés tomar un número discreto de valores a, b (como sucede en las aplicaciones computacionales), para poder asegurar que toda la información de la señal se mantiene, lo que también asegura que toda la señal puede ser recuperada de forma exacta a partir de un número discreto de coeficientes. Un caso particular es cuando la familia )(, snmψ forman una base ortonormal, es decir:

⎩⎨⎧ ==

=∫∞

∞− casootronnymmsi

dsss nmnm 0''1

)()( ',', ψψ , (10)

en cuyo caso se asume directamente que la señal original es:

∑∑∞

∞−

∞−

= )(),()( , snmfsf nmψψ , (11)

2.6.3. Transformada Wavelet Packet. La transformada wavelet convencional, opera en el modo ya explicado con antelación, i. e., el cálculo de los coeficientes

Page 40: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

40

de aproximación y detalle en potencias de 2 (según el algoritmo de Mallat) (Mallat, S., 1989) siguiendo el enfoque de descomposición realizado a los coeficientes de aproximación (baja frecuencia) y dejando los de detalle libres (figura 1). Cuando se obtienen los coeficientes de aproximación, estos presentan el comportamiento general de la señal como se aprecia en la serie original, por lo que son susceptibles de ser descompuestos en nuevos componentes de aproximación y detalle y así sucesivamente. La transformada Wavelet Packet se encarga de aplicar la transformada wavelet tanto a los coeficientes de aproximación como a los de detalle, dicha transformada puede verse como un árbol: la raíz del árbol es la serie de datos original, el siguiente nivel corresponde a la transformada wavelet de primer nivel de la señal original, luego, los niveles subsiguientes son construidos de manera recursiva aplicando la transformada wavelet a los coeficientes resultantes de aproximación y detalle (paso bajo y paso alto, respectivamente) produciéndose cuatro nuevos grupos de coeficientes, es decir, para un nivel de descomposición N, habría un total de N2 grupos de coeficientes. El cálculo de la transformada Wavelet Packet es ilustrado por la figura 3. Figura 3. (a) Árbol wavelet packet; (b) Forma generalizada del árbol wavelet packet.

2.6.4. Aplicación de la Transformada Wavelet al Análisis de Señales Biomédicas. El análisis wavelet ha sido ampliamente documentado y representa una ventaja en lo que se refiere al análisis de señales no-estacionarias, facilitando labores relativas a tareas diagnósticas. Los procesos que se realizan varían desde el cálculo de la transformada wavelet para múltiples escalas para ser analizadas

Page 41: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

41

individualmente (Belova N. Y. et. al., 2007) hasta la obtención de descriptores o características intrínsecas de las señales a fin de implementar clasificadores lineales o no-lineales para fines de diagnóstico o pronóstico de enfermedades (Chia-Hung, L. et. al., 2008; Rodríguez, J. L, et. al., 2007; Yu, S. N. and Chen, Y. H., 2007). Dentro de las modalidades más comunes en las que se incluye la transformada wavelet en señales biomédicas están: electroencefalografía, electrocardiografía, mamografía y resonancia magnética, rayos X, entre otros. La transformada wavelet ha sido utilizada gran cantidad de veces en la fase de extracción de características de algunos sistemas de ayuda diagnóstica por computadora (CADs) que tienen que ver con la señal de ECG, e. g., en la detección del pico R y las ondas P, Q, S y T del electrocardiograma (Mahmoodabadi, S. Z. et. al., 2007; Gutiérrez, A. et. al., 2005), que son poderosos descriptores de arritmias cardíacas; con la información extraída utilizando la transformada wavelet, puede construirse un clasificador de tal manera que una vez que se presente un nuevo patrón (dentro de las categorías aprendidas), este converja a la solución correcta (Chia-Hung, L. et. al., 2008; Rodríguez, J. L, et. al., 2007; Yu, S. N. and Chen, Y. H., 2007). Debido a que la señal de VFC es puramente no-estacionaria, esta es susceptible de ser analizada utilizando la transformada wavelet, por lo que esta técnica ha sido referida en varios estudios (Chesnokov, Y. V., 2008; Belova, N. Y. et. al., 2007; Ísler, Y. and Kuntalp, M., 2007). Un enfoque relativamente nuevo en el análisis multi-resolución de la VFC, consiste en calcular la energía y la entropía (Ísler, Y. and Kuntalp, M., 2007) a distintos niveles de descomposición, de tal forma que estos sirvan de descriptores para la clasificación y posterior diagnóstico o pronóstico (según sea el caso) de algunos eventos cardíacos, e. g., falla cardíaca, arritmias, infarto al miocardio, entre otros. Sin embargo, con la transformada wavelet discreta persisten algunos problemas de análisis de la señal de VFC sobre sub-bandas de frecuencia, que se ve solventado con el uso de wavelet packet (Bilgin, S. et. al., 2008), que otorga una aproximación a las bandas de frecuencia requeridas y por tanto, da información relevante sobre el balance simpatovagal. 2.7. ANÁLISIS NO-LINEAL Entre las formas de análisis no-lineal más comunes aplicadas a la VFC son: los mapas de retorno, las medidas de complejidad, caos y fractales. 2.7.1. Gráfico de Poincaré (Mapa de Retorno). El gráfico de Poincaré es una técnica simple y no-lineal en el análisis de la VFC (Singh, D. and Vinod, K., 2005)

Page 42: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

42

(Poincaré plot, en inglés), también conocido como gráfico de Lorentz, que está basado en el análisis de un mapa construido al graficar los intervalos RR en pares: Un intervalo actual contra el intervalo que le precede (Woo, M. A. et. al., 1992). El mapeo de Poincaré es una técnica para caracterizar el comportamiento dinámico de un sistema periódico, como una observación en tiempo discreto de su actividad (Singh, D. and Vinod, K., 2005; D’Addio, G. et. al., 1998; Thong, T., 2007; D’Addio, G. et. al., 1999; Woo, M. A. et. al., 1992; Brennan, M. et. al., 2001; Korpelainen, J. T., 1999; Stein, P. K. et. al., 2005; Brennan, M. et. al., 2002; Lerma, C., 2003; Sayers, B. M., 1973). El gráfico usualmente lleva a encontrar algunas particularidades propias de la estabilidad del sistema; algunos hechos importantes en la evaluación del gráfico de Poincaré son: (1) las variaciones latido a latido, (2) los datos en tiempo continuo no son requeridos, (3) fácil de reproducir y procesar, (4) los gráficos 2D/3D son útiles para determinar información acerca de la dinámica no-lineal de la VFC, y (5) provee la robustez de los métodos geométricos (Singh D. and Vinod K., 2005). Woo, et. al., 1992, identifican cuatro patrones característicos de los gráficos de Poincaré fuertemente relacionados con la forma que presentan los puntos: Cometa, torpedo, abanico y compleja (figura 4, figura 5), donde el patrón usual en individuos saludables es el primero de estos. Evidencia reciente sugiere que el análisis del gráfico de Poincaré en la dinámica de la VFC es incluso más útil que los métodos tradicionales para evaluar el pronóstico de pacientes con diversas enfermedades cardíacas (Brouwer, J. et. al., 1993). El gráfico de Poincaré típicamente aparece como una nube de puntos alongada y orientada a través de una línea conocida como la línea de identidad. La dispersión de puntos perpendiculares a dicha línea reflejan el nivel de variabilidad en el corto término (Short-term variability), en contraposición, la dispersión de puntos a lo largo de la línea de identidad indica el nivel de variabilidad de largo término (Long-term variability) (Brennan, M. et. al., 2001). Matemáticamente, las medidas descritas son derivadas de la desviación estándar de los datos originales transformados. Para caracterizar el gráfico, algunas medidas han sido establecidas, e. g. la conversión del gráfico dos-dimensional en varios gráficos de una dimensión, el ajuste de un elipse teniendo en cuenta la variabilidad de corto y largo término (Brennan, M. et. al., 2001) y la medición del coeficiente de correlación del gráfico (Singh, D. and Vinod, K., 2005; D’Addio, G. et. al., 1998; Thong, T., 2007; D’Addio, G. et. al., 1999; Woo, M. A. et. al., 1992; Brennan, M. et. al., 2001).

Page 43: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

43

Figura 4. Gráficos de Poincaré en dos dimensiones con formas regulares: (a) Cometa, (b) Torpedo, (c) Abanico, (d) Compleja

0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 10.55

0.6

0.65

0.7

0.75

0.8

0.85

0.9

0.95

RR(n)

RR

(n+

1)

0.5 0.6 0.7 0.8 0.9 1 1.1 1.20.5

0.6

0.7

0.8

0.9

1

1.1

1.2

RR(n)

RR

(n+

1)

0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1.1

1.2

1.3

RR(n)

RR

(n+

1)

0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.40.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

2.2

2.4

RR(n)

RR

(n+

1)

(a) (b)

(d)(c) Algunos estudios han relacionado la forma del gráfico de Poincaré con desordenes autonómicos y el pronóstico de falla cardíaca (D’Addio G., 1998; Korpelainen, J. T. et. al., 1999; Stein, P. K. et. al., 2005). La dinámica no-lineal que considera el gráfico de Poincaré como una reconstrucción del espacio de fase de los intervalos RR en dos dimensiones es una proyección del atractor reconstruido que describe la dinámica del sistema cardíaco (Brennan, M. et. al., 2001). 2.7.1.1. Cálculo del Gráfico de Poincaré. La expresión que describe el conjunto de datos de un gráfico de Poincaré viene dada por la ecuación 12, tomando como referencia el instante i, correspondiente al segmento R-Ri.

Page 44: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

44

⎥⎥⎥⎥

⎢⎢⎢⎢

=

+++

+++

+

τ

τ

τ

nini

ii

ii

p

RRRR

RRRRRRRR

RRMM

11 , (12)

donde τ es el orden del gráfico. Figura 5. Gráficos de Poincaré en tres dimensiones con formas regulares: (a) Cometa, (b) Torpedo, (c) Abanico, (d) Compleja

(a) (b)

(d)(c)

0.60.65

0.70.75

0.80.85

0.90.95

1

0.5

0.6

0.7

0.8

0.9

1

1.1

1.20

5

10

15

20

25

RR(n)RR(n+1)

n P

oint

s

0.50.6

0.70.8

0.91

1.11.2

0.5

0.6

0.7

0.8

0.9

1

1.1

1.20

10

20

30

40

50

RR(n)

RR(n+1)

n P

oint

s

0.20.4

0.60.8

11.2

1.41.6

0.40.5

0.60.7

0.80.9

11.1

1.21.3

0

20

40

60

80

100

RR(n)RR(n+1)

n P

oint

s

0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4

0.5

1

1.5

2

2.5

0

5

10

15

20

RR(n)

RR(n+1)

n P

oint

s

2.7.2. Medidas de Complejidad. La probabilidad de que ocurra un evento individual viene definida por la frecuencia del cambio definido como la diferencia temporal entre picos R en una serie de datos de ECG determinada. Cada punto del conjunto de datos R-R tiene un valor asociado con su ocurrencia cuando en un instante de tiempo t, existe un estímulo vagal dado. La figura 6, muestra este comportamiento para una serie de datos de intervalos R-R.

Page 45: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

45

Figura 6. (Arriba) Datos de variabilidad de la frecuencia cardíaca extraídos de un registro electrocardiográfico de 50 minutos; (Abajo) Curva de densidad de probabilidad

0 500 1000 1500 2000 2500 3000 35000.5

0.6

0.7

0.8

0.9

1

1.1

1.2

n

RR

(n)

0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 1 1.050

2

4

6

8

10

12

x 10−3

RR(n)

P(n

)

La curva de densidad de probabilidad refleja la incertidumbre de cada evento. Para analizar la incertidumbre de series R-R, la medida más utilizada es la entropía, aplicada en tareas pronosticas y diagnósticas. De esta forma, la entropía (PE, pattern entropy) puede ser calculada como una variación de la entropía de Shannon, de acuerdo a la ecuación 13.

[ ]∑−=i

ii kPkPS )(log)( , (13)

donde la densidad de probabilidad conjunta aproximada )(kPi viene dada por la ecuación 14.

)()...()()( ττ nkpkpkpkP iiii ++= , (14) i. e., la probabilidad conjunta de un evento dado en el mapa de retorno de dimensión n y orden τ , calculada utilizando el histograma de los intervalos R-R. El índice k, corresponde al índice del intervalo R-R en la secuencia de todos los intervalos. Debido a que la probabilidad conjunta es usada, la entropía se incrementa con el grado de orden de la señal (Zebrowski, J. J. et. al., 1997).

Page 46: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

46

2.8. REDES NEURONALES ARTIFICIALES Las medidas en el dominio del tiempo y la frecuencia requieren que los datos de los intervalos RR sean estacionarios. Los datos no estacionarios se comportan a menudo con cambios abruptos en las variaciones de los intervalos RR en manipulaciones fisiológicas como por ejemplo en ejercicio o en un cambio de postura, y en condiciones patológicas o de riesgo, ataques de pánico, hipertensión. Las técnicas no lineales hacen una gran diferencia sobre el procesamiento de datos ya que mucho de su comportamiento es aperiódico pero sin ser axiomáticamente no aleatorio. 2.8.1. Regla de Propagación. La regla de propagación permite obtener, a partir de las entradas y los pesos, el valor del potencial postsináptico asociado a cada neurona de una capa. La función más común es de tipo lineal (véase Ecuación 15).

∑=j

jiji xwth )( . (15)

La ecuación 15 muestra una suma ponderada de las entradas respecto a los pesos de interconexión correspondientes desde una capa de entrada j a una capa i, y matemáticamente corresponde a un producto punto entre vectores. El peso sináptico en este caso se define como la intensidad de la interacción entre las unidades de cómputo conectadas entre sí, que configura, con otra serie de entradas, su potencial postsináptico. Otra regla de propagación utilizada ampliamente, especialmente en modelos como RBF, SOFM y LVQ (Learning Vector Quantization), es la distancia Euclidiana entre los vectores sinápticos y las entradas (véase Ecuación 16).

( )22 )( ∑ −=j

ijji wxth .

(16) 2.8.2. Función de Transferencia. La función de transferencia de una neurona, representa el estado de activación actual a partir del potencial postsináptico y, en un caso dado, de su estado de activación actual. En muchos de los modelos de redes neuronales artificiales, el estado de activación suele depender únicamente

Page 47: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

47

del potencial postsináptico actual de una neurona dentro del arreglo (Ecuación 17).

( ))()( thfta iii = . (17) La función de activación se suele considerar determinista y en la mayor parte de los modelos es monótonamente creciente. 2.8.3. Aprendizaje de las Redes Neuronales Artificiales. En el contexto de las redes neuronales artificiales el concepto de aprendizaje sostiene la capacidad de la red para modificar sus parámetros libres (usualmente los pesos sinápticos) mediante un algoritmo específico y la interacción con el entorno que la rodea con la finalidad de obtener un comportamiento determinado. El tipo de aprendizaje viene determinado por la forma en la que dichos parámetros son adaptados (Martín del Brío, B. y Sanz Molina, A., 2007). El nivel más convencional (y común) al que se puede llevar el aprendizaje de una red neuronal artificial, es el de modelado de la sinapsis, que consiste en modificar los pesos sinápticos de la red siguiendo una regla de aprendizaje, que usualmente lleva a la optimización de una función de coste, destinada a medir la eficacia de la red en cada ciclo de aprendizaje. La actualización de los pesos sinápticos (Ecuación 18) consiste en sumar una cantidad dada, i. e. la medida del cambio de los pesos, a los pesos actuales de la red.

)()()1( twtwtw ijijij Δ+=+ . (18) El proceso de aprendizaje normalmente es iterativo, produciéndose actualización de los pesos en repetidas ocasiones hasta que la red alcance el desempeño deseado. 2.9. HERRAMIENTAS DE ANÁLISIS ESTADÍSTICO APLICADAS A RECONOCIMIENTO DE PATRONES 2.9.1. Análisis de Varianza (One-way ANOVA). En el análisis de varianza (ANOVA), se tiene una muestra aleatoria de n observaciones de cada k poblaciones normales con igual varianza. Dichas muestras se suponen independientes. Estas suposiciones (varianza común e independencia) son necesarias para hacer una prueba F. Con base en el modelo para cada observación (Rencher, A. C., 2002), se desea comparar la media de las muestras con el fin de determinar si son suficientemente

Page 48: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

48

diferentes para creer que la población puede diferir. La hipótesis puede expresarse como kH μμμ ==== ...210 . Si la hipótesis es cierta, todos los modelos (de cada observación) son de la misma población. Se pueden obtener entonces dos estimaciones de varianza: Una basada en las varianzas de las muestras denotada 2

eS y la otra basada en las medias de las muestras denotada 2

yS . Si 0H es verdad, la varianza estimada a

partir de las medias de las muestras 2yS estima ny

22 σσ = y por tanto

( ) ( ) 222 σσ == nnnSE y para el que la estimación está dada por la ecuación 19.

1

// 2..

2

2

−=∑

k

knynynS i

i

y . (19)

Por otra parte, si 0H es falsa, entonces: ( ) ( )∑ −+=

iiy knnSE 1/222 ασ y en cualquier

caso ( ) 22 σ=eSE . Una vez conocidos los parámetros de estimación de 2σ , su relación forma el estadístico F.

2

2

e

y

SnS

F = , (20)

El estadístico F puede ser visto como una función simple del radio de probabilidad. Cada gráfico que se presenta a partir del análisis de varianza (ANOVA) viene antecedido por una tabla donde se presentan la suma de cuadrados (SS), los grados de libertad (df), los cuadrados medios (MS, SS/df), el valor del estadístico F y el valor de p. Para cada para cada uno de estos gráficos, la mediana (segundo cuartil) esta representada por la línea divisoria de la caja, el extremo inferior representa el valor mínimo y el extremo superior representa a su vez el valor máximo, la parte inferior de la caja por debajo de la mediana representa el primer cuartil mientras que la parte superior por arriba de la mediana representa el tercer cuartil. 3.9.2. Análisis de Componentes Principales (PCA). El análisis de componentes principales (PCA) constituye una manera de identificar patrones en conjuntos de datos, expresando dichos conjuntos de manera que sus similitudes y diferencias

Page 49: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

49

se magnifiquen. En tanto los patrones son difíciles de identificar en series de datos de dimensionalidad alta, donde no es posible tener una representación gráfica, PCA es una herramienta útil para el análisis de estos datos (Rencher, A. C., 2002; Smith, L. I., 2002). El análisis de componentes principales entrega la proyección del conjunto de datos original sobre los vectores característicos de la matriz de covarianza, que constituyen los pesos de cada una de las características sobre del espacio de entrada de acuerdo a su significancia; de esta forma, el conjunto de datos es modificado para la visualizarse o realizar clasificaciones u otros análisis que permitan analizar patrones dentro de los datos de entrada. Para conocer en detalle el algoritmo para calcular PCA, véase el Anexo C. 3.9.3. Kernel PCA (K-PCA). De acuerdo a la teoría estadística de aprendizaje, conocida también como la teoría de Vapnik-Chervonenkis, una de las preguntas más importantes sobre análisis de patrones es: ¿Bajo qué condiciones son buenas las representaciones de alta dimensionalidad? Uno de los conceptos mejor conocidos en la teoría de Vapnik-Chervonenkis es la dimensión VC, que en cierto sentido es un sumario de un solo número de la capacidad de una máquina de aprendizaje. Uno de los resultados es que algunas veces los mapeos que llevan a una dimensionalidad más alta que la dimensión del espacio de entrada otorga un mejor poder de clasificación en un momento dado. Para ilustrar esta situación, considérese un problema de dos clases con datos en el espacio 2-dimensional separables linealmente en forma de anillo si se utiliza, por ejemplo, una superficie de decisión cuadrática o una kernel-máquina de soporte vectorial (K-SVM) si se quiere; con un simple mapeo al espacio 3-dimensional, se resuelve el problema de la separabilidad de los patrones en el espacio de dos dimensiones: ( ) ( )2

22

12121 ,,, xxxxHxxX +→ . (21) entonces el anillo se extiende y los patrones pueden ser separados con un plano de separación. Es posible calcular una serie de productos punto sin mapear específicamente a un espacio de dimensión más elevada. Se emplean productos punto como muestra la ecuación 22. ( ) ( ) ( )',', xxxxk φφ= ,

(22)

Page 50: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

50

que permite calcular el valor del producto punto en H sin tener que calcular el mapa φ (Shawe-Taylor, J. and Cristianini, N., 2004; Schölkopf, B. et. al., 1996). Dado algún algoritmo que pueda ser expresado meramente en términos de productos punto, este método permite construir diferentes versiones no-lineales del mismo. Primero, se necesita recordar que los autovectores cubren el rango de

nxx ,...,1 , de tal modo que:

∑=

==m

j

Tjj vvxx

mCv

1

1 λ . (23)

Entonces:

∑=

=m

j

Tjj vxx

mv

1

, (24)

∑=

=m

jjj xvx

mv

1).(1

λ. (25)

Pero como ( )vx j . es solo un escalar, esto significa que todas las soluciones de v con 0≠λ están en el rango mxx ,...,1 , según la ecuación 26.

∑=

=m

iii xv

1

α , (26)

Para conocer en detalle el algoritmo para calcular K-PCA, véase el Anexo D. 3.9.3.1. Nota sobre Kernels. Para calcular un K-PCA, los kernels más comúnmente utilizados son: El polinomial (ecuación 27), el gaussiano (dado por la ecuación 28) (Schölkopf, B. et. al., 1996). Estos son mostrados en la figura 7.

( )djiji xxxxK 1*),( += , (27) donde d es el grado del kernel.

⎟⎟⎟

⎜⎜⎜

⎛ −−= 2

2

2exp),(

σji

ji

xxxxK , (28)

Page 51: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

51

donde σ controla la región de soporte del kernel. Figura 7. Kernels: (a) Polinomial grado 3; (b) Gaussiano

010

2030

4050

6070

010

2030

4050

60700

0.2

0.4

0.6

0.8

1

XY

K

05

1015

2025

3035

0

10

20

30

400

2

4

6

8

10

12

14

16

18

x 106

XY

K

Page 52: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

52

3. METODOLOGÍA Este trabajo se desarrollo en cinco etapas, estas se describen a continuación: Una primera etapa correspondiente a la revisión literaria, una segunda etapa correspondiente a la obtención de registros electrocardiográficos y de frecuencia respiratoria, la tercera etapa, que corresponde a la generación de la base de datos de VFC (extracción de características y evaluación de métodos de análisis), la cuarta etapa, de identificación del error inducido por la arritmia sino-respiratoria y finalmente, la quinta etapa, correspondiente a la aplicación de esquemas de inteligencia artificial para generación de pronóstico automático. Para cada resultado experimental obtenido, se calculó: Sensitividad (Se), Especificidad (Es), Predictividad Positiva (Pp), Predictividad Negativa (Pn) y Exactitud (Acc) con el fin de medir el desempeño de cada algoritmo utilizado desde el preprocesamiento hasta el valor pronóstico final con base en cuatro parámetros: Verdaderos positivos (Tp), verdaderos negativos (Tn), falsos positivos (Fp) y falsos negativos (Fn). 3.1. REGISTROS ELECTROCARDIOGRÁFICOS Y DE FRECUENCIA RESPIRATORIA Los registros electrocardiográficos utilizados para el análisis de la VFC fueron tomados a dos tipos de pacientes: normales o pacientes con una valoración previa en los cuales no se encontró ninguna alteración cardíaca, y pacientes en riesgo o con valoración de riesgo cardiovascular medio o alto previo a la toma de los registros y con posibles factores de riesgo adicionales, e. g., hipertensión, padecimiento de algún accidente cardiovascular/cerebrovascular, entre otros. El grupo de pacientes considerados normales o sin riesgo fue elegido de acuerdo al tiempo de ejercicio cardiovascular semanal igual o superior a 20 horas. La valoración clínica del grupo de pacientes con riesgo fue obtenida a través de un estudio de riesgo cardiovascular realizado por la coordinación de salud ocupacional de la Universidad Autónoma de Occidente en colaboración con un grupo de médicos de la entidad prestadora de salud Coomeva S.A, a los empleados vinculados a la universidad. El rango de edades de todos los pacientes que participaron en el estudio está entre los 20 y 60 años sin discriminación de género. 3.1.1. Aspectos técnicos de la instrumentación utilizada para el registro electrocardiográfico. Para la toma de las señales electrocardiográficas y de

Page 53: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

53

frecuencia respiratoria fue usado un PowerLab ref. ML865 (ADInstruments). El PowerLab es un sistema de adquisición de datos utilizado en gran variedad de experimentos con humanos y animales. La unidad puede registrar a más de 200000 muestras por segundo y tiene sensibilidades de entrada seleccionables individualmente, adicionalmente cuenta con un bioamplificador incorporado (utilizado para registrar cualquier señal biológica proveniente de un humano u otra fuente) y un procesador interno junto con filtros pasa bajos y pasa altos. El hardware del equipo funciona con el paquete Chart y Scope para la toma y análisis de cualquier registro. El equipo cuenta con dos canales de entrada analógicos no aislados, con un rango de amplificación de mV2± a V10± plena escala en doce pasos en donde la mínima resolución es de Vμ5.312 y la máxima es de nV5.62 con una impedancia de entrada de ΩM1~ . La entrada para bioamplificador cuenta con dos canales diferenciales con tierra común aislada, una impedancia de entrada de ΩM100~ y rangos de amplificación de Vμ20± a mV50± plena escala en once pasos en donde la mínima resolución es de Vμ56.1 y la máxima es de nV625.0 , la resolución del conversor analógico-digital (ADC) es de 16 bits con frecuencias de muestreo de 0.2 Hz a 200 kHz, cuenta con un filtro notch (de banda de rechazo) a 50 ó 60 Hz seleccionado automáticamente, un filtro paso alto de un solo polo a 0.1, 0.3, 1 y 10 Hz con una exactitud de %10± y un filtro pasa bajo de octavo orden con una exactitud frecuencial de %2± ; la resolución del amplificador de salida es de 16 bits (no aislado) y cuenta con rangos de salida de mV200± a

V10± plena escala en seis pasos con una resolución mínima de Vμ5.312 y una resolución máxima de Vμ25.6 . 3.1.2. Instrumentación para el registro de frecuencia respiratoria. Algunos estudios han mostrado las propiedades de algunos métodos para adquirir la señal respiratoria (Faetti, T. et. al., 2008), e. g., utilizando galgas extensiométricas, sensores piezoeléctricos y medidores de flujo de aire, debido a la alta sensitividad del registro de esta señal a artefactos de movimiento; en términos generales, los métodos para la toma de la señal respiratoria utilizando sensores piezoeléctricos otorgan una buena respuesta, pues siguen de manera adecuada la onda respiratoria aunque existan tales artefactos, lo mismo ocurre en la estimación del espectro de Fourier de la señal (Faetti, T. et. al., 2008). Debido a lo anterior, para el registro de actividad respiratoria fue utilizada una banda piezoeléctrica ref. MLT1132/D. Esta banda genera un voltaje cuando hay una carga torácica o circunferencia abdominal debido a la respiración, esta contiene un transductor piezoeléctrico que responde linealmente a cambios en longitud. Los cambios en la circunferencia torácica indican momentos de inhalación y exhalación que pueden ser usados para calcular la frecuencia respiratoria y caracterizar patrones de

Page 54: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

54

respiración. El transductor es un artefacto en estado sólido que no requiere excitación y puede ser conectado directamente a una de las entradas del PowerLab, dicho transductor contiene un sensor localizado entre dos cuerdas elásticas que al estirarlas generan una tensión sobre el piezo-sensor, que genera un voltaje. Cuando no existe ningún cambio en la longitud (como en períodos de no-respiración), la señal retorna a cero. El piezo-sensor tiene una sensitividad de

mmmV /15.4 ± con un rango de salida de 20 mV a 400 mV. Por otra parte, se decidió medir la presión arterial debido a que se establece como requisito para la evaluación cardiovascular y como posible factor de riesgo (Williams, J. S. et. al., 2009), dicha medida fue tomada utilizando un monitor multiparámetro Spacelabs ref. 90309 que permite monitorear los siguientes parámetros: Electrocardiografía, respiración, temperatura, presión no invasiva y oximetría de pulso. Cada uno de los registros electrocardiográficos (90 en total) fue tomado siguiendo un protocolo diseñado por el equipo de trabajo sobre la derivación bipolar frontal (D2) del electrocardiograma (véase anexo A). La duración de cada registro fue de cinco (5) minutos, dado que en el presente trabajo se analiza la variabilidad cardíaca de corto término (short-term heart rate variability). Cada paciente fue informado sobre el procedimiento y firmó un formulario de consentimiento informado (véase Anexo B) con el fin de garantizar la transparencia de la prueba respecto a cada uno de los pacientes en estudio. Adicionalmente se toma la información resumida por la ficha que se muestra en la tabla 1. Tabla 1. Lista y detalles para todas las propiedades cualitativas de cada paciente

Propiedad Cualitativa Rango Edad del paciente Años (entero) Género M/F Peso Kg. (entero) Estatura m (doble) Enfermedades cardiovasculares diagnosticadas

Si/No

Valoración de riesgo dada anteriormente

Sin riesgo / Medio / Alto

Factores de riesgo diagnosticados

Si/No

Page 55: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

55

3.2. PREPROCESAMIENTO DE LA SEÑAL DE ECG Una vez definida la base de datos, fueron extraídos los picos R de la señal electrocardiográfica utilizando el algoritmo de Pan-Tompkins utilizado para obtener una mejor caracterización del complejo QRS y sobretodo, de la onda de interés para encontrar el intervalo RR, en adición al análisis multi-resolución de la señal a una profundidad de 4, i. e., 24 (cuatro componentes de detalle de la señal y uno de aproximación) utilizando la wavelet Haar (Gutiérrez, A. et. al., 2005). El procedimiento utilizado está resumido en la figura 8. Figura 8. Diagrama de bloques del módulo de extracción de características

El algoritmo de Pan-Tompkins implementa un filtro pasabanda (paso bajo y paso alto en serie), para reducir el ruido junto con las señales interferentes fuera de la banda de frecuencias en la que se encuentra el complejo QRS, un derivador que enfatiza las pendientes de la onda R, por último, se hace una estimación de energía con la ventana móvil del QRS más largo sin llegar a la onda T, este proceso es ilustrado en la figura 9.

Page 56: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

56

Figura 9. Diagrama de bloques, algoritmo de Pan-Tompkins.

Para comprobar la efectividad de la profundidad de la descomposición escogida, se midió el desempeño del algoritmo utilizando los coeficientes de detalle desde la primera escala hasta la séptima escala utilizando veinte de los registros de cinco minutos escogidos aleatoriamente (un total de 6120 latidos). Los resultados de este experimento pueden ser observados en la tabla 2. Tabla 2. Resultados de la descomposición de la señal de ECG para la detección del pico R con frecuencia de muestreo de 200 kHz y utilizando la wavelet Haar.

Profundidad FP FN Sensitividad (Se - %)

Exactitud (Acc -%)

1 240 270 96.06 91.98 2 220 0 96.53 96.53 3 50 0 99.19 99.19 4 0 0 100.00 100.00 5 2047 1809 69.67 53.91 6 2500 2758 57.28 38.93 7 3447 3980 38.30 22.37

Por lo anterior se puede asumir que la escala más apropiada para la extracción de características es la escala 42 , dado que presenta una sensitividad y una exactitud de 100.00 % en la detección utilizando señales muestreadas a una frecuencia de 200 kHz utilizando la wavelet Haar. No obstante, debido a las múltiples resoluciones que se manejan para la extracción de los picos R de la señal electrocardiográfica que de modo indirecto afectan también la resolución temporal, se realizó una comparación en la estimación de las secuencias R-R utilizando múltiples resoluciones (incluidas las que presentan gran número de falsos positivos y falsos negativos). Los resultados de este proceso se encuentran en la figura 11, donde se utilizan las primeras cuatro escalas para el cálculo de una serie R-R y un tramo correspondiente a cuarenta (40) muestras de la misma. Es posible apreciar que el comportamiento de la serie R-R es esencialmente el mismo (ignorando los falsos positivos), es decir, las señales se encuentran superpuestas (Figura 10). El mismo efecto se observa en el cálculo del espectro autorregresivo de la serie (Figura 11) para cada una de las escalas de descomposición, especialmente para las escalas 42 22 − , donde para esta serie específica no se aprecian falsos positivos y los componentes frecuenciales que cambian son despreciables, por tanto existirá una variación no significativa en la

Page 57: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

57

estimación de los índices espectrales relacionados con cada una de las bandas de frecuencia de interés. Figura 10. Serie R-R estimada utilizando diversas escalas

5 10 15 20 25 30 35 40

0.65

0.7

0.75

0.8

0.85

0.9

0.95

1

1.05

1.1

n

RR

(n)

21

22

23

24

Figura 11. Estimación del espectro AR de la serie R-R de la figura 10 utilizando diversas escalas

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.50

2

4

6

8

10

12

14

16

x 10−3

Frequency (Hz)

Pow

er (

s2 /Hz)

21

22

23

24

Page 58: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

58

Por otra parte, con esto se comprueba que la resolución más adecuada para la extracción de características es la que utiliza la escala 42 , i. e., la señal diezmada en un factor de cuatro (4). En etapas siguientes de este documento se mostrará que a esta escala la estimación de la serie R-R es adecuada para la extracción de características de la dinámica de la variabilidad de la frecuencia cardíaca, e. g., índices estadísticos, estimación de espectros, análisis multirresolución y técnicas no-lineales para pacientes sin riesgo y con riesgo cardiovascular medio o alto. 3.3. ELIMINACIÓN DE OUTLIERS (EVENTOS PREMATUROS) EN LAS SERIES R-R CALCULADAS 3.3.1. Perspectiva General sobre dos Métodos Conocidos para la Detección de Outliers. Cuando un registro de intervalos R-R es analizado utilizando el gráfico de Poincaré, la mayoría de la información acerca de la dinámica del corazón y la regulación simpatovagal está concentrada en la región de mayor entropía local, i. e., el área alrededor del intervalo con mayor probabilidad. Se ha creído generalmente que los eventos prematuros (outliers) no son relevantes en la evaluación de la regulación simpática, por ello son generalmente suprimidos o interpolados (Ruiz-Gonzalez, Y. y Lorenzo-Ginori, J. V., 2005; Solem K. et. al., 2005; Press, W. H. et. al., 1988). Uno de los problemas con el gráfico de Poincaré está relacionado con dichos outliers de la distribución de los intervalos R-R, que pueden exagerar las desviaciones estándar y muchos de los cálculos y procesamiento realizados a los datos, e. g., el ajuste de la elipse utilizando los índices SD1 y SD2, los cálculos de los histogramas (histograma de los intervalos R-R, del ancho y de la longitud), y las aproximaciones relativamente recientes realizadas sobre el mapa de retorno 3D y la extracción de las curvas de contorno del mismo (Moraes, R. S. et. al., 2000) para cuantificar las características morfológicas del gráfico. En consecuencia, para tratar este tipo de problemas, hay gran cantidad de aproximaciones respecto a la eliminación o reemplazo de latidos; incluso, la estadística da algunos comúnmente usados en la eliminación de datos ectópicos en una variedad de aplicaciones, i. e., el método empírico de Tukey (Hoaglin, D. et. al., 1983) y el método de Grubbs extendido por Rosner (Rosner, B, 1983). 3.3.1.1. Método Empírico de Tukey. El método de Tukey (Hoaglin, D. et. al., 1983) asume que no hay una distribución específica en los datos de entrada. Éste método se basa en la suposición de que una distribución tiene un grupo de valores rodeados por valores atípicos que exageran la base del histograma. Basado en cálculos estadísticos, es posible obtener y separar aquellos datos considerados valiosos de los que no lo son. Las ecuaciones 29 y 30 muestran una perspectiva general del método.

Page 59: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

59

)(* 1311 qqcqL −−= , (29)

)(* 1311 qqcqU −+= , (30) donde 3q y 1q son el tercero (75th) y el primer (25th) cuartil en la distribución, respectivamente; la constante c necesita ser estimada para diferentes distribuciones, usualmente el valor de c es 1.5 ó 3 (Hoaglin, D. et. al., 1983). 3.3.1.2. Método de Grubbs Extendido por Rosner. Si se asume una distribución de una distribución aproximadamente normal, el método de Grubbs se propone encontrar un solo outlier en una distribución, sin embargo, si el outlier es removido de la distribución, el criterio de rechazo actual no puede ser utilizado para encontrar algunos otros outliers, para evitar este problema, Rosner extendió el método de Grubbs para la detección de múltiples outliers de una serie de datos dada (Rosner, B, 1983). Para un límite especificado k, en el número de outliers, el procedimiento es calculado utilizando muestras reducidas de longitud n, n-1, … , n-k+1, respectivamente. Para cada muestra )( in − , la relación dada por la ecuación 31 es calculada.

( )s

xxR

ji

−=

max para ki ...2,1,0= , (31)

Donde x es la media y s es la desviación estándar de la muestra )( in − . De esta forma, los valores críticos de la prueba son determinados especificando α y encontrandoβ y ( )βλ , para calcular la prueba estadística t student para evaluar la presencia de outliers, entonces λ puede ser determinado utilizando la ecuación 32.

( )( )[ ]( )11

)(2 −−+−−

−=

iktiktikiλ para ki ...2,1,0= , (32)

La prueba estadística tiene entonces la siguiente forma: Si todos los )(βλiiR ≤ , entonces no hay outliers en la serie de datos. Si )(βλiiR > , entonces se define

( ){ }βλiiRil >= :max y se declara )1()1()0( ,...,, −lxxx como outliers.

Page 60: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

60

3.3.2. Evaluación de Algoritmos para la Detección de Outliers en la Distribución de Intervalos R-R. Los algoritmos para eliminación de datos ectópicos fueron probados con registros electrocardiográficos que incluían cierta cantidad de artefactos de movimiento generados de manera aleatoria, sobremedición de la onda T dada en la fase de adquisición de la señal y fenómenos eléctricos del corazón no relacionados con la dinámica de la VFC (Figura 12). La toma de dichas señales fue realizada siguiendo el protocolo diseñado por el equipo (véase Anexo A). En las tablas 3 y 4 y la figura 13 se resumen los principales resultados obtenidos a partir de varios experimentos realizados sobre ambos métodos. Adicionalmente, la tabla 5 muestra que tan sobreestimados o subestimados se encuentran los parámetros SD1 y SD2 del ajuste de la elipse sobre el gráfico de Poincaré para cada uno de los casos: los datos de entrada, aplicando el método de Tukey y aplicando el método de Grubbs extendido por Rosner. Figura 12. Ejemplos de generación de latidos ectópicos: (a) Sobremedición de la onda T; (b) Artefactos de movimiento en la señal; (c) Extrasístole en un paciente con riesgo cardiovascular.

Page 61: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

61

Tabla 3. Sensitividad, especificidad y exactitud en cada uno de los experimentos realizados utilizando el método de Grubbs extendido.

Registro (Nº Latidos)

Sensitividad (Se - %)

Especificidad (Sp - %)

Exactitud (Acc - %)

1 (510) 100.00 100.00 100.00 2 (959) 100.00 100.00 100.00 3 (1074) 66.67 99.81 99.81 4 (922) 100.00 100.00 100.00 5 (968) 100.00 100.00 100.00 6 (1076) 100.00 100.00 99.63 7 (990) 21.43 97.78 97.79 8 (1015) 100.00 100.00 100.00 9 (954) 100.00 100.00 100.00 10 (858) 83.33 99.52 99.53

Desempeño General

89.41 99.77 99.75

Tabla 4. Sensitividad, especificidad y exactitud en cada uno de los experimentos realizados utilizando el método de Tukey.

Registro (Nº Latidos)

Sensitividad (Se - %)

Especificidad (Sp - %)

Exactitud (Acc - %)

1 (510) 43.66 91.65 92.16 2 (959) 8.85 89.15 89.26 3 (1074) 2.21 83.46 83.52 4 (922) 0.99 89.15 89.17 5 (968) 2.82 92.87 92.89 6 (1076) 8.43 92.94 92.98 7 (990) 7.89 92.89 92.93 8 (1015) 11.54 88.67 90.15 9 (954) 10.75 89.20 90.20 10 (858) 14.93 86.40 86.71

Desempeño General

11.48 89.93 90.19

Tabla 5. Superestimación – subestimación de los parámetros SD1 y SD2 utilizando las series de datos originales, el método de Tukey y el método de Grubbs extendido.

Registro (Nº Latidos)

Datos de Entrada (%)

Método de Tukey (%)

Método de Grubbs (%)

1 (510) (933.08) - (349.83) (-6.77) - (-29.41) (0.0) – (0.0) 2 (959) (39.53) – (129.85) (1.54) – (0.13) (0.0) – (0.0)

Page 62: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

62

3 (1074) (58.87) – (19.15) (-11.29) – (-24.86) (-0.81) – (-1.47) 4 (922) (10.40) – (12.19) (-20.13) – (-31.46) (0.0) – (0.0) 5 (968) (35.48) – (42.70) (-30.21) – (-12.16) (0.0) – (0.0)

6 (1076) (5.45) – (3.33) (-25.76) – (-15.52) (0.12) – (0.01) 7 (990) (20.71) – (25.99) (-15.75) – (-19.22) (-10.47) – (-12.75)

8 (1015) (15.23) – (12.14) (-10.41) – (-25.37) (0.0) – (0.0) 9 (954) (30.21) – (18.51) (-14.34) – (-21.79) (0.0) – (0.0)

10 (858) (20.58) – (40.17) (-16.69) – (-54.18) (-0.01) – (-0.03) Figura 13. Efecto de los datos ectópicos sobre la evaluación del gráfico de Poincaré: (a) Utilizando los datos de entrada; (b) Método de Tukey; (c) Método de Grubbs extendido por Rosner.

Según Lippman et. al., 1994, la exclusión de segmentos R-R ectópicos para corregir series R-R completas, además de eliminar los datos (quedan menos latidos para realizar una evaluación de la variabilidad de la frecuencia cardíaca) y puede sesgar las evaluaciones si los eventos cardíacos que producen datos

Page 63: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

63

ectópicos están relacionados con cambios en el tono autonómico. No obstante, la importancia de la corrección de datos ectópicos reside en el aumento de componentes frecuenciales en la evaluación de métodos espectrales, en la sobreestimación de parámetros estadísticos, e. g., pNN50, media, desviación estándar, MDARR, r-MSSD, SDSD etc, en el aumento/disminución en las medidas de evaluación no-lineales y por tanto, medidas multirresolución. El método de eliminación de datos ectópicos de la serie R-R, se desempeña de manera más adecuada que la interpolación lineal y cúbica (Press, W. H. et. al, 1988; Lippman et. al., 1994) (reemplazo de datos detectados como ouliers), es decir, se desempeña mejor o igual (para el caso de la interpolación predictiva no-lineal) (Lippman et. al., 1994) que algunos de los métodos más complejos para el reemplazo de datos ectópicos. Figura 14. Histogramas para diferentes series R-R de registros eletrocardiográficos de 50 minutos.

Adicionalmente en este trabajo se propone el uso de métodos estadísticos para la detección de ouliers automática para evitar hacer el trabajo manualmente y que esto mismo lleve a errores posteriores en la detección de los mismos causados por el cansancio visual en la evaluación caso a caso de señales

Page 64: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

64

electrocardiográficas. En este sentido, el método de Grubbs extendido por Rosner obtuvo un desempeño superior al método de Tukey. En algunos casos la distribución de las entradas tiene mucho que ver con el hecho de que en una serie se encuentren o no outliers, i. e., en algunos casos los métodos de detección no son compatibles con la distribución de las entradas y esto lleva a un desempeño pobre en la detección de verdaderos positivos y aumenta vertiginosamente los falsos positivos. En este sentido, puede decirse que la serie R-R tiene una distribución aproximadamente normal debido a que los datos de mayor frecuencia se encuentran en el centro de la distribución y dicha frecuencia disminuye en la medida en que se aleje de este punto produciendo una forma de campana gaussiana, esta idea es sopesada por la figura 14, donde se muestra el histograma de los intervalos R-R para tomas de variabilidad cardíaca de cincuenta minutos (50 min) tomadas de una base de datos el MIT (Iyengar N, et. al, 1996). 3.4. EFECTO DEL SISTEMA RESPIRATORIO SOBRE LA DINÁMICA DE LA VFC (ERROR INDUCIDO POR LA ARRITMIA SINO-RESPIRATORIA) Es importante mencionar el hecho que integrar la señal de frecuencia respiratoria es fundamental en la evaluación del sistema cardiovascular, especialmente para evaluar la dinámica de la VFC, pues el hecho de comparar dos medidas realizadas a frecuencias respiratorias con diferencia sustancial, induce un sesgo amplio sobre el análisis del individuo o conjunto de individuos estudiados. En este sentido, algo improcedente de casi la misma manera es producir cortes sobre la señal de VFC o bien la de ECG con el fin de separar los semi-ciclos respiratorios, i. e., inspiración y espiración, pues de esta manera se están sesgando las aceleraciones y desaceleraciones que se producen sobre la variación del ritmo cardíaco en el cambio del individuo de inspiración a espiración y viceversa (Figura 15), esto produce sobreestimación o subestimación sobre los parámetros calculados sobre la señal, e. g., medidas estadísticas, espectros, entre otros. El procedimiento para la obtención de la frecuencia respiratoria ha sido empleado con frecuencia para evaluar la magnitud de la Arritmia Sino-Respiratoria (RSA), definida como la suma de las estimaciones de densidad espectral de potencia en la banda respiratoria. Algo importante para tener en cuenta es que las variaciones inducidas por la frecuencia respiratoria introducen un cambio considerable en la medición de variabilidad de frecuencia cardiaca, sin embargo al mantener una frecuencia respiratoria constante (es decir, 12 respiraciones/min), y también un volumen corriente (volumen de aire que se introduce en cada respiración) relativamente constante en la capacidad máxima, se elimina el error de medición debido a irregularidades respiratorias en la respiración espontánea, y permite una mayor estabilidad y comparación fiable de la magnitud de la ASR entre los pacientes (Motivala S. J. et al., 1999). El anterior criterio fue utilizado en este trabajo para la medición de la VFC en los diferentes pacientes en estudio, razón

Page 65: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

65

por la cual los registros fueron tomados en reposo y bajo condiciones estrictas sobre el ambiente circundante a los mismos. Figura 15. (a) Señal de respiración; (b) Aceleraciones y desaceleraciones del ritmo cardíaco dadas durante espiración e inspiración, respectivamente; (c) y (d) Separación de latidos con base en el ciclo respiratorio y efecto del corte de la señal de ECG sobre el cálculo de la VFC

(a)

(b)

(c)

(d)

Page 66: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

66

3.5. MEDIDAS CLÁSICAS PARA EVALUAR LA VFC 3.5.1. Mediciones Estadísticas o en el Dominio del Tiempo. A partir de las mediciones directas de los intervalos RR observadas como una distribución a lo largo de todo el periodo de registro t medido en segundos, (histograma de intervalos RR), se calculan los siguientes índices estadísticos básicos: la media y la desviación estándar. Para calcular la media (mean) se suman todos los intervalos RR y se divide entre el número de datos N, este índice entrega el valor medio de todos los intervalos RR (Ecuación 33).

N

nRRx

N

n∑== 1

)(

. (33)

La desviación estándar es un índice estadístico que entrega información relevante acerca de la anchura de la distribución o histograma de intervalos RR obtenido a través de los registros electrocardiográficos, cabe notar que la presencia de artefactos o ruidos asociados a las mediciones presentes en los registros electrocardiográficos hace que la distribución sea más ancha y a su vez hace que aumente su asimetría, por lo tanto, el calculo de la desviación estándar se hace muy sensible a estos artefactos. Se calcula mediante la ecuación 34:

1

))((1

2

−=∑=

N

RRnRRSDNN

N

n

. (34)

Otros indicadores o índices estadísticos que describen la variabilidad de la frecuencia cardiaca son el r-MSSD el cual corresponde a la raíz cuadrada de la media de la suma de los cuadrados de las diferencias entre intervalos RR adyacentes. Se obtiene mediante la ecuación 35.

2

))((1

1

2

−=−∑−

=

N

DARRnDARRMSSDr

N

n . (35)

Page 67: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

67

donde: )()1( nRRnRRDARR −+= Los siguientes índices a calcular son el NN50 count(n) o número de pares de intervalos RR adyacentes mayores de 50 ms durante el intervalo de tiempo seleccionado, y el otro índice el cual da información acerca del nivel de excitación vagal es el pNN50 (%) o porcentaje de NN50 count de todos los intervalos RR, también es necesario decir que este índice es poco sensible a los artefactos de la señal (véase Ecuación 36).

N

nVpNN

N

n∑== 1

)(50

. (36) Donde, V(n) es un vector que contiene todos los intervalos RR mayores o iguales que 50 ms, y N es el número total de intervalos RR de la muestra. El índice MIRR sirve apoyar la limitación del SDNN ignorando la información contenida en las colas o extensiones de la anchura del histograma, y presenta una mayor robustez frente a artefactos. Cuanto mas se limita a las proximidades de la media del histograma se obtiene mayor robustez frente a artefactos pero se pierde información importante y a su vez la correlación existente con el SDNN. El MIRR o margen intercuartil de la secuencia RR se calcula de acuerdo a la ecuación 37.

13 QQMIRR −= . (37) Cálculo del índice MIRR, donde Q1 y Q3 son el cuartil menor y el cuartil mayor respectivamente que se obtienen al calcular la secuencia SRR (Intervalos RR ordenados ascendentemente), y ubicar Q1=SRR(N/4) y Q3=SRR(3N/4). El índice MDARR, se usa para soportar el PNN50 que no dice nada acerca de la variación latido a latido, a causa de que el umbral de 50 ms usado para calcularlo hace que el índice valga cero si no hay en ningún momento un cambio superior a este, y si la variabilidad latido a latido es muy elevada este índice tiende a valer 1, haciendo que se sature. Por lo tanto el MDARR se presenta para solucionar este problema además del ya mencionado r-MSSD, aunque este presenta una ventaja sobre el segundo porque es más robusto a artefactos. Sea la secuencia: ( ) ( ) ( ) { }1,11 −∈∀−+= NnnRRnRRnDARR

Page 68: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

68

El índice MDARR se define como la mediana de las diferencias absolutas de los intervalos R-R, es decir la mediana de la secuencia DARR. Este indicador esta basado en la robustez de los cuartiles frente a artefactos al igual que el MIRR. Se denomina como el valor del segundo cuartil (Q2) de la secuencia. La alta correlación entre los índices MDARR y el pNN50 es debida a que el MDARR es el valor para el cual la mitad de las variabilidades de cada latido del registro están por encima de 50 ms y la otra mitad se encuentran por debajo de este. La mayor ventaja que presenta es que mientras el pNN50 vale cero, el MDARR arroja un valor pequeño diferente de cero, solamente si se cumple la condición de que la variabilidad latido a latido sea superior a la frecuencia de muestreo. Por otro lado si el pNN50 vale 1 el MDARR arroja un valor elevado pero no presenta el efecto de saturación del pNN50 (véase ecuación 38).

( )⎟⎠⎞

⎜⎝⎛ −

=2

1nSDARRMDARR . (38)

3.5.2. Mediciones en el Dominio de la Frecuencia o Métodos Espectrales. En la caracterización espectral de la variabilidad del ritmo cardíaco se emplearon primordialmente dos métodos: El periodograma de Welch (Welch, P. D., 1967) (no-paramétrico) y la estimación espectral del modelo autorregresivo (AR) que mejor se ajusta a la señal a procesar (paramétrico). Aunque los métodos paramétricos para la estimación de la potencia espectral otorgan una mejor resolución frecuencial que los no-paramétricos, en este trabajo fueron evaluados ambos métodos.

En los métodos no-paramétricos, la densidad espectral de potencia (PSD) se estima directamente con la señal de interés. El método más simple para dicha estimación es el periodograma, no obstante, una versión mejorada de este es representada por el método de Welch. Los parámetros del método son estimados de esta forma, de estas estimaciones la PSD es calculada. En términos generales, una manera de estimar la PSD es encontrar la transformada rápida de Fourier (FFT) y calcular la magnitud del resultado al cuadrado, esta estimación es conocida como periodograma como se expresa en las ecuaciones 39 y 40.

LffX

fPs

Lxx

2)()( = , (39)

donde:

Page 69: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

69

( )∑−

=⎟⎟⎠

⎞⎜⎜⎝

⎛ −=

1

0

2expL

j sLL f

ifjjxX π. (40)

No obstante, el método de Welch es una forma mejorada de la estimación de la PSD descrita por la ecuación 39 y la ecuación 40. El método consiste en dividir la señal en varios segmentos (probablemente solapados) de longitud L con un punto de partida de D unidades para cada uno de estos. La figura 16 ilustra la forma en que la señal se convierte en segmentos hasta su longitud final, con el 50% de solapamiento. Figura 16. Conversión de la señal en segmentos de longitud L, según el método propuesto por Welch (Welch, P. D., 1967)

Si se considera una secuencia de datos 10),( −≤≤ Ljjx , como primer segmento, entonces se define las transformadas de Fourier finitas para este segmento y para cada uno de los segmentos subsiguientes. i. e., )(,),(1 nAnA kK de cada una de las secuencias dadas según la ecuación 41.

( ) ( ) ( )∑−

=⎟⎠⎞

⎜⎝⎛ −=

1

1

2exp1 L

jkk L

kijnjWjxL

nA , (41)

con ( ) 2/11−=i , y donde )( jW es la ventana seleccionada. Finalmente, se obtienen los K periodogramas modificados según las ecuación 42 a la ecuación 44.

( ) ( ) 2nAULfI knk = , para Kk ,,2,1 K= , (42)

donde,

Page 70: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

70

Lnfn = , para 2/,,0 Ln K= , (43)

y,

( )∑−

=

=1

0

21 L

jjW

LU . (44)

La densidad de potencia espectral viene dada por la ecuación 45.

( ) ( )∑=

=K

knkn fI

KfP

1

1ˆ . (45)

En los métodos paramétricos, la estimación de los parámetros puede ser realizada resolviendo ecuaciones lineales. En el método autorregresivo (AR), los datos pueden ser modelados como la salida de un filtro discreto causal cuya entrada es ruido blanco. Un método AR de orden p es expresado por la ecuación 46.

( ) ( ) ( ) ( )∑=

+−−=p

k

nwknxkanx1

, (46)

Donde )(ka son los coeficientes recursivos y )(nw es el ruido blanco de varianza igual a 2σ . Un aspecto importante en el uso del método AR es la selección del orden p. Diversos trabajos han sido realizados en la resolución de este problema (Rajendra Acharya, U. et. al., 2006; Broadman, A. et. al, 2002). El orden p=16 para el modelo AR fue tomado en este estudio (Niskanen, J. P. et. al, 2002; Berntson, G. G. et. al., 1997). La potencia espectral de un proceso AR de orden p es descrita por la ecuación 47.

( )( )∑

=⎟⎟⎠

⎞⎜⎜⎝

⎛ −+

=p

k sp

p

sAR

fjkfka

ffP

1

2expˆ1

1ˆπ

ε . (47)

La diferencia entre los métodos que existen para estimar un modelo AR radica en cómo calculan los coeficientes. En este estudio fue utilizado el método de la covarianza, puesto que da una resolución alta para un conjunto de datos pequeño, por lo que la estimación es más exacta; este método está basado en la minimización de la predicción del error hacia delante.

Page 71: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

71

La figura 17 y la figura 18 ilustran el periodograma de Welch y el espectro AR calculado para dos clases de sujetos: sin riesgo cardiovascular y con riesgo cardiovascular alto, en estas es posible apreciar el predominio de frecuencias que se presenta en cada uno de los tipos de individuo respecto a los índices a evaluar en este dominio. Figura 17. Periodograma de Welch: (a) De un sujeto sin riesgo cardiovascular; (b) De un sujeto con riesgo cardiovascular alto

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

0

0.5

1

1.5

2

2.5

3

Frequency (Hz)

Pow

er (

s2 /Hz)

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

0

0.5

1

1.5

2

Frequency (Hz)

Pow

er (

s2 /Hz)

Page 72: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

72

Figura 18. Espectro AR: (a) De un sujeto sin riesgo cardiovascular; (b) De un sujeto con riesgo cardiovascular alto

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.50

0.5

1

1.5

2

Frequency (Hz)

Pow

er (

s2 /Hz)

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.50

0.5

1

1.5

2

2.5

Frequency (Hz)

Pow

er (

s2 /Hz)

3.5.2.1. Índices Utilizados para Evaluar la Variabilidad de la Frecuencia Cardíaca en el Dominio de la Frecuencia. En este trabajo fueron analizadas tres bandas de frecuencia, que contienen la información frecuencial más relevante de la VFC como un proceso estacionario, i. e., [ ]04.00 − Fs, [ ]15.004.0 − Fs y [ ]4.015.0 − Fs, que corresponden a la banda de muy baja frecuencia (VLF), baja frecuencia (LF) y alta frecuencia (HF), respectivamente. La actividad en la banda HF es debida a la excitación vagal, mientras que la asociada a las bandas VLF y LF es debida a la interacción entre los sistemas simpático y parasimpático. Adicionalmente, se calculan los índices de potencia espectral normalizada para las bandas de frecuencia LF y HF.

Page 73: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

73

Los índices extraídos fueron: Potencia total asociada a la banda VLF, potencia total asociada a la banda LF, potencia total asociada a la banda HF, la potencia espectral normalizada asociada a las bandas LF y HF (NLF y NHF, respectivamente), y finalmente, fue calculada la relación LF/HF (%), descrita como un indicador de la interacción entre el sistema simpático y el parasimpático (García-González, M. A., 1998). Los primeros tres índices fueron estimados calculando el área bajo la curva de la estimación espectral para cada banda de interés. 3.6. ANÁLISIS MULTIRRESOLUCIÓN Dentro de las medidas extraídas de la VFC utilizando el enfoque multi-resolución, i. e., análisis temporal-frecuencial utilizando wavelets, dos medidas de análisis han venido desarrollándose vertiginosamente durante los últimos años, dichas medidas sirven para la valoración de la VFC como un sistema no-estacionario dado que el análisis tiempo-frecuencia remueve las no-estacionariedades polinomiales de la señal (Bilgin, S. et. al., 2008) y dado que se calculan en distintas resoluciones para ventanas de tamaño variable. Dichas medidas corresponden a la estimación de la energía y la entropía. Una vez que los coeficientes wavelet son conocidos (calculados utilizando el algoritmo de Mallat) es posible calcular la energía para cada uno de los coeficientes seleccionados como expresan las ecuaciones 48 y 49, de tal forma que la energía total por conjunto de coeficientes de aproximación se calcula según la ecuación 50:

( )2jj AE = , (48) o para los coeficientes de detalle, según la ecuación 55.

( )2jj DE = , (49)

∑=j

jtotal EN

E 1 . (50)

Por otra parte, la entropía wavelet (medida de complejidad) puede ser calculada como la distribución probabilística de los coeficientes o la energía wavelet en valores normalizados como expresa la ecuación 51. De esta forma, puede calcularse la entropía con la ecuación 52, correspondiente a la definición dada por Shannon. En (Ísler, Y. and Kuntalp, M., 2007) se calculan las medidas de entropía

Page 74: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

74

wavelet en múltiples escalas de la señal como única medida multi-resolución para el análisis de variabilidad cardiaca, no obstante, en este documento se mostrará que la energía wavelet por cada conjunto de coeficientes también ostenta un valor pronóstico relativamente alto de riesgo cardiovascular.

total

jj E

Ep = , (51)

∑−=

jjj ppWS )(log2 . (52)

En este estudio se tuvo en cuenta la entropía y energía utilizando dos algoritmos: la transformada Wavelet convencional y la transformada Wavelet Packet; ambos algoritmos fueron analizados bajo los mismos criterios. Para evaluar estos dos algoritmos en la valoración del riesgo cardiovascular, se calculó la transformada wavelet a un nivel 5 (Ísler Y. and Kuntalp M., 2007; Rosso, O. A. et. al, 2001; Blanco, S. et. al., 1998), i. e., cinco conjuntos de coeficientes de detalle de la señal y uno de aproximación (para el caso de la transformada wavelet convencional) y 52 conjuntos de coeficientes de la señal sobre el último nivel de descomposición (para el caso de al transformada wavelet packet). Dado que la dimensionalidad de los datos de entrada es elevada y que se evalúan dos medidas por cada conjunto de coeficientes, la dimensionalidad de los datos de salida fue reducida (cada conjunto de características) utilizando análisis de componentes principales (PCA, Principal Component Analysis) con el fin de determinar cuáles coeficientes de los obtenidos contenían la información más relevante (y por tanto, discriminante) entre las categorías establecidas en los datos de entrada, i. e., pacientes sin riesgo y pacientes con riesgo medio ó alto. Éste algoritmo está explicado en el presente capítulo, donde se habla específicamente de algoritmos para la transformación del espacio de entrada. Adicionalmente se llevó a cabo un análisis de varianza con el objetivo de determinar cuáles de los niveles de descomposición presentaban mayor significancia estadística teniendo en cuenta los grupos de pacientes con el objetivo de elegir las escalas y conjuntos de coeficientes de mayor relevancia y por tanto mayor valor pronóstico asociado. 3.7. ANÁLISIS NO-LINEAL 3.7.1. Medidas Basadas en el Gráfico de Poincaré. Para caracterizar el gráfico de Poincaré matemáticamente, dos métodos fueron aplicados: la técnica de ajuste de elipse y las técnicas del histograma (Brennan, M. et. al., 2001).

Page 75: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

75

3.7.1.1. Técnica de Ajuste de Elipse Un grupo de ejes con orientación hacia la línea de identidad configuran el núcleo de la técnica. Los ejes del gráfico de Poincaré se relacionan a un nuevo grupo de ejes con una rotación de 4/π rad, como muestra la ecuación 53.

⎥⎦

⎤⎢⎣

⎡⎥⎦

⎤⎢⎣

⎡ −=⎥

⎤⎢⎣

+12

1

cossinsincos

i

i

RRRR

xx

θθθθ

. (53)

En el sistema de referencia de los nuevos ejes, la dispersión de los puntos alrededor del eje 1x es medida por su desviación estándar denotada SD1. Esta cantidad mide el ancho de la nube de puntos e indica el nivel de variabilidad de corto término. La longitud de la nube de puntos a lo largo de la línea de identidad indica el nivel de variabilidad de largo término, denotado SD2, i. e., la desviación estándar alrededor del eje 2x . Es posible obtener una elipse rotada cuyo eje principal sea paralelo a la línea de identidad de los datos (Figura 19) utilizando los datos SD2 y SD1 en correspondencia al eje de las abscisas (semieje mayor) y al eje de las ordenadas (semieje menor), respectivamente. La forma específica en la que se muestra la elipse del gráfico de Poincaré, i. e., las medidas de Poincaré SD1 y SD2, conforma un poderoso descriptor de pronóstico de enfermedades cardíacas. Los índices mencionados pueden encontrarse suprimidos en pacientes con accidente cardiovascular/cerebrovascular, por lo que su utilidad se incrementa en la cuantificación de anormalidades en la disfunción autonómica cardiovascular (Stein, P. K. and Reddy, A., 2005). Por otra parte, el análisis del gráfico da información pronóstica de pacientes con falla cardíaca (D’Addio, G. et. al., 1998) y pacientes vulnerables a arritmias (Brouwer, J. et. al., 1996). En particular, una aleatoriedad incrementada de la frecuencia cardíaca de corto término está asociada con estos dos últimos fenómenos. Por otra parte, la reducción de toda la variabilidad de la frecuencia cardíaca parece estar más típicamente relacionado con un accidente cerebrovascular isquémico (Stein, P. K. and Reddy, A., 2005).

Page 76: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

76

Figura 19. Gráfico de Poincaré detallando el ajuste de la elipse.

0.5 0.6 0.7 0.8 0.9 1 1.1 1.20.5

0.6

0.7

0.8

0.9

1

1.1

1.2

RR(n)

RR

(n+

1)

3.7.1.2. Técnicas del Histograma. La aproximación de la elipse es satisfactoria en diversa cantidad de casos, no obstante esta no toma en cuenta el acortamiento que ocurre en intervalos R-R cortos (Singh D. and Vinod K., 2005). La aproximación del histograma utilizada en Brennan M. et. al., 2005, es considerada una novedosa opción en la que se ve de manera más clara la distribución de los datos en rangos de tiempo determinados, entre ellos se encuentran tres tipos de histogramas: el primero, conocido como el histograma del ancho; el segundo, conocido como histograma de los intervalos R-R y por último el tercero conocido como histograma de la longitud (Korpelainen, J. T. et. al., 1999) (véase Figura 20).

Histograma del Ancho (Width Histogram): Es el histograma de los puntos del gráfico de Poincaré proyectados en la dirección de la línea de identidad del gráfico original, i. e., 4/π rad. Matemáticamente corresponde a la distribución del eje

1x (Brennan, M. et. al., 2001). La desviación estándar de dicho histograma es equivalente a SD1, por lo que el mismo entrega información acerca del nivel de variabilidad de corto término. Una vez obtenido el set de datos nuevo (proyección sobre la línea de identidad) se calcula el histograma para cada intervalo rk, según la ecuación 54.

Page 77: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

77

nnrp k

k =)( . (54)

Histograma de los Intervalos R-R (R-R Interval Histogram): Es el histograma de los puntos del gráfico de Poincaré proyectados sobre el eje de las abscisas o sobre el eje de las ordenadas. Es útil para encontrar información general acerca de la variabilidad del ritmo cardíaco, i. e., la media y desviación estándar de los datos de entrada. Histograma de la Longitud (Length Histogram): Se origina al proyectar los puntos del gráfico de Poincaré sobre la dirección perpendicular a la línea de identidad, i. e., 4/π− rad. Matemáticamente corresponde a la distribución del eje 2x y la desviación estándar de dicho histograma es equivalente a SD2, por lo que el mismo entrega información acerca de la variabilidad de largo término. Figura 20. Proyecciones para la construcción de histograma: (a) del ancho, (b) de los intervalos R-R, (c) de la longitud.

(a)

(b)

(c)

La Figura 21 ilustra los tres tipos de histogramas calculados sobre un registro de ECG de cinco minutos.

Page 78: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

78

Figura 21. (a) Registro de VFC de 5 minutos con ajuste de elipse, (b) Histograma de la longitud, (c) Histograma de los intervalos RR, (d) Histograma del ancho

(a) (b)

(c) (d) Además de entregar información sobre la distribución de las entradas, los histogramas son útiles para determinar el rango de la serie R-R, i. e., el ancho total de las distribuciones proyectadas que corresponden a un estimativo de la variabilidad en cada una de las proyecciones de los intervalos R-R. En principio, las personas con variabilidad de la frecuencia cardíaca disminuida tienden a tener anchos reducidos, lo que se establece como una particularidad en los pacientes con riesgo cardiovascular alto o medio. El análisis de histogramas a partir del gráfico de Poincaré es una técnica documentada con anterioridad (Thong, T., 2007; Stein, P. K. and Reddy, A., 2005; Marciano, F. et. al., 1994); esta entrega información de la recurrencia de ciertos eventos en los registros, e. g., variaciones grandes en los intervalos R-R que se describen como latidos ectópicos provenientes de una dinámica no regular, que alteran el cálculo de parámetros, y que, en tanto su ocurrencia se vuelva periódica

Page 79: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

79

alterará de manera significativa la información que posiblemente entregará el gráfico, i. e., SD1 y SD2, fundamentalmente. Las formas complejas en los gráficos de Poincaré, son a menudo causadas por extrasístoles o por sobre-medición de la onda T por el equipo de adquisición (además de riesgo cardiovascular inminente dado por falla cardíaca) (Thong, T., 2007). Se han propuesto métodos diversos con el fin de eliminar las islas de puntos que se generan alrededor del mayor cúmulo de puntos en el gráfico de Poincaré, la mayoría de estos basados en umbrales sobre el histograma de los intervalos R-R. La razón de ser de este tipo de algoritmos es su utilidad para dar información sobre la regulación simpática/simpatovagal en la dinámica del corazón (Thong, T., 2007). Otra fuente de la distribución de los R-R es la arritmia sino-respiratoria (RSA, respiratory sinus arrhythmia), que es la influencia de la respiración en la modulación de los intervalos R-R. El acortamiento de la duración de los intervalos es usualmente más rápido que su incremento, por lo tanto, la arritmia sino-respiratoria aparece por encima de la línea de identidad indicando el rápido decremento del ritmo cardiaco. En apariencia esta característica hace al gráfico de Poincaré útil para la evaluación de la arritmia sino-respiratoria. Una variación del gráfico de Poincaré es la representación de la variabilidad de la frecuencia cardíaca en tres dimensiones (ecuación 55).

⎥⎥⎥⎥

⎢⎢⎢⎢

=

+++++

+++

++

21

321

21

ninini

iii

iii

p

RRRRRR

RRRRRRRRRRRR

RRMMM

, (55)

Hay tres vistas comunes del gráfico de Poincaré de tres dimensiones, siendo cada una, una vista sobre alguno de los ejes. Estas vistas resultan de la proyección en dos dimensiones del la nube de tres dimensiones sobre cada uno de los planos coordenados, i. e., ( )1, +ii RRRR , ( )21 , ++ ii RRRR , ( )2, +ii RRRR (Brennan, M. et. al., 2001), de donde las dos vistas que reportan la mayor cantidad de información son las dos últimas (Figura 22). Lo anterior puede ser generalizado en dimensiones más elevadas, con las proyecciones del gráfico sobre los planos coordenados establecidos.

Page 80: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

80

Figura 22. Gráfico de Poincaré tres-dimensional de un sujeto sano

0.7

0.8

0.9

1

1.10.7

0.80.9

11.1

0.65

0.7

0.75

0.8

0.85

0.9

0.95

1

1.05

1.1

RR(n+1)RR(n)

RR

(n+

2)

0.70.8

0.91

1.1

0.70.8

0.91

1.1

0.65

0.7

0.75

0.8

0.85

0.9

0.95

1

1.05

1.1

RR(n)RR(n+1)

RR

(n+

2)

3.7.2. Medidas de Complejidad sobre Series R-R. Existen diversas aproximaciones al análisis de complejidad de series R-R para estimar ciertas regularidades en las mismas. Las dos medidas de complejidad más utilizadas para series cortas y ruidosas son la entropía aproximada (approximate entropy) y la entropía muestral (sample entropy). Dichas medidas de complejidad asignan un número no-negativo a una serie temporal y cuantifican cómo son de previsibles las fluctuaciones de los valores, i. e., la curva de densidad de probabilidad. Las medidas de complejidad se fundamentan en la medición de la información de una serie experimental, donde hay un valor particular o conjunto de valores de una variable aleatoria X con probabilidad P(X); en tanto P(X=x) tenga un valor grande, tendrá poca información, si por el contrario P(X=x) presenta un valor pequeño cercano a cero, será bastante informativa (el término información es a menudo reemplazado por la “sorpresa” de un evento). Para el caso de la entropía de Shannon, entre más información tenga un conjunto de eventos, mayor será su entropía. Por lo tanto, en principio, una secuencia de datos de variabilidad de la frecuencia cardíaca que contenga una gran cantidad de patrones repetitivos (como es el caso de los individuos con variabilidad cardíaca reducida) tendrá una ApEn reducida, mientras que una menos predecible (más irregular o dispersa, como es el caso de los individuos con una variabilidad de la frecuencia cardíaca alta) tendrá una ApEn aumentada. 3.7.2.1. Entropía Aproximada (ApEn). Para calcular la ApEn de una serie temporal es necesario fijar dos parámetros: una longitud m y una ventana de tolerancia r. ApEn mide al similitud logarítmica de patrones próximos (separados una distancia menor que r) para m observaciones contiguas. De esta forma se considera ( )NrmApEn ,, , donde N es el número de puntos de la serie. Si se tienen

Page 81: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

81

N muestras correspondientes a una serie ( ){ }nx , la ApEn se calcula de la siguiente manera (Abásolo-Baz, D. et. al., 2006): 1) Se crean los vectores )1()...1( +−mNXX , con [ ])1(),...,1(),()( −++= mixixixiX ,

11 +−≤≤ mNi . Estos vectores representan m valores consecutivos de x. 2) Se define la distancia entre )(iX y )( jX según la ecuación 56. [ ] ( ) ( )( )kjxkixjXiXd

mk+−+=

= ,...,1max)(),( , (56)

3) Para un )(iX dado, sea )(iN m el número de ( )ijmNjj ≠+−≤≤ ,11 tales que [ ] rjXiXd ≤)(),( . Entonces, para 11 +−≤≤ mNi , se procede con la ecuación 57.

)1()()(+−

=mN

iNiCm

mr , (57)

donde m

rC mide la frecuencia de patrones similares de longitud m para una tolerancia r . 4) Se calcula el logaritmo natural de cada )(iC m

r y se promedia para i , según la ecuación 58.

( )∑+−

=+−=

1

1

)(ln1

1)(mN

i

mr

m iCmN

rφ , (58)

5) Se aumenta la dimensión a 1+m y se obtiene )(1 iC m

r+ y )(1 rm+φ .

6) Teóricamente, la entropía aproximada se define como dice la ecuación 59.

( ) [ ])()(lim, 1 rrrmApEn mm

N

+

∞→−= φφ . (59)

Como el número de datos de la serie, N, es finito, la ApEn se estima a parir de la ecuación 60.

( ) )()(, 1 rrrmApEn mm +−= φφ . (60) Aunque la elección de m y r es fundamental para el cálculo de la ApEn, no existe ninguna regla para calcular sus valores. Pincus, 1991 y Pincus, 2001, sugiere

Page 82: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

82

emplear los valores 1=m , 2=m y un r fijo entre 0.1 y 0.25 veces la desviación típica de la serie de datos original. 3.7.2.2. Entropía Muestral (SmEn). La entropía muestral se introduce con base en el sesgo presente al calcular la ApEn como resultado de contar el número de vectores separados una distancia menor que r, incluyéndose a sí mismo (Abásolo-Baz, D. et. al., 2006). La SmEn cuantifica la regularidad de una serie temporal con valores mayores asociados a una mayor irregularidad. Para calcular la ),,( NrmSmEn , donde m, r y N son los parámetros referidos anteriormente (dimensión, tolerancia y la longitud total de la serie de datos), se procede de la siguiente manera: 1) Se crean los vectores )1()...1( +−mNXX mm , con

[ ])1(),...,1(),()( −++= mixixixiX m , 11 +−≤≤ mNi y la distancia entre ellos según la ecuación 56. 2) Para un )(iX m dado, se cuenta el número de ( )ijmNjj ≠−≤≤ ,1 , denotado como iB , tal que [ ] rjXiXd mm ≤)(),( , según la ecuación 61.

imi B

mNrB

11)(−−

= , (61)

3) Se define )(rBm según la ecuación 62.

∑−

=−=

mN

i

mi

m rBmN

rB1

)(1)( . (62)

4) Se aumenta la dimensión a 1+m y se repiten los pasos 1) a 4) para determinar

)(rAmi y )(rAm según las ecuaciones 63 y 64.

imi A

mNrA

11)(−−

= , (63)

donde iA es el número de )(1 iX m+ a una distancia menor que r de )(1 jX m+ .

∑−

=−=

mN

i

mi

m rAmN

rA1

)(1)( , (64)

Page 83: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

83

)(rBm es la probabilidad de que dos secuencias coincidan para m puntos, mientras )(rAm es la probabilidad de que coincidan para 1+m puntos. 5) SmEn se define según la ecuación 65.

⎭⎬⎫

⎩⎨⎧

⎥⎦

⎤⎢⎣

⎡−=

∞→ )()(lnlim),(

rBrArmSmEn m

m

N. (65)

Como N es finito, SmEn puede estimarse con la ecuación 66.

⎥⎦

⎤⎢⎣

⎡−=

)()(ln),(

rBrArmSmEn m

m

. (66)

Al igual que con ApEn, los valores empleados en el cálculo de SmEn han sido

1=m , 2=m y un r fijo entre 0.1 y 0.25 veces la desviación típica de la serie de datos original (Pincus, 1991; Pincus, 2001). 3.8. AUTOMATIZACIÓN DEL PRONÓSTICO El sumario de características extraídas de la señal de variabilidad cardíaca se encuentra resumido en la tabla 6. Tabla 6. Sumario de medidas utilizadas en el presente estudio Variable Unds Descripción Medidas en el Dominio del tiempo

Media ms Media de los intervalos R-R SDNN ms Desviación estándar de la serie R-R r-MSSD ms Raíz cuadrada de la suma de las diferencias

al cuadrado entre intervalos adyacentes pNN50 % Proporción de latidos adyacentes cuya

diferencia es mayor que 50 ms MIRR ms Margen intercuartil de la serie R-R MDARR ms Mediana de las diferencias absolutas entre

intervalos R-R adyacentes SDSD ms Desviación estándar de las diferencias entre

intervalos R-R adyacentes Medidas en el Dominio de la Frecuencia

PVLF ms2 Potencia de la banda espectral VLF

Page 84: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

84

PLF ms2 Potencia de la banda espectral LF PHF ms2 Potencia de la banda espectral HF Relación % Relación entre las potencias de la bandas LF

y HF NLF - Potencia normalizada de LF NHF - Potencia normalizada de HF Medidas Multirresolución Etotal - Energía S - Entropía Medidas No-Lineales SD1 ms Desviación estándar 1 del mapa de retorno SD2 ms Desviación estándar 2 del mapa de retorno AnHR - Ancho del histograma de los intervalos R-R AnHL - Ancho del histograma de la longitud AnHW - Ancho del histograma del ancho ApEn - Entropía aproximada SmEn - Entropía muestral 3.8.1. Perceptrón Multicapa. Las redes tipo MLP son altamente implementadas en tareas de clasificación dada su alta capacidad de generalización, i. e., la capacidad que tiene la red de identificar patrones nunca vistos a partir de una serie de ejemplos que con antelación enriquecieron su conocimiento de un espacio de entrada. En la red MLP-BP, el conjunto de patrones de entrada corresponden a configuraciones vectoriales y son en total noventa, i. e. cuarenta y cinco registros de pacientes sanos y cuarenta y cinco registros de pacientes con riesgo medio o alto; estos son mostrados aleatoriamente a la red. La arquitectura general de la red artificial se detalla en la figura 23. La red artificial propuesta, consta de una capa de entrada o sensorial (ya explicada), una capa oculta de 200 unidades, cuya función de transferencia es de tipo sigmoidal (ecuación 67) y una capa de salida que consta de una sola unidad, cuya función de transferencia es lineal, adicionalmente, se muestran los targets u objetivos de la red, asociados al ajuste de los pesos sinápticos de la red en proporción a la diferencia existente entre la salida actual de la red y la salida deseada, con el objetivo de minimizar el error actual de la red. Adicionalmente, una arquitectura con funciones de transferencia tangente sigmoidal (ecuación 68) y sigmoidal (en la primera y segunda capa de cómputo, respectivamente) fue evaluada dado que la salida resultante de la red estará dada

Page 85: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

85

en el intervalo [ ]1,0 , por lo que este tipo de arquitectura es más compatible con problemas de clasificación.

xexf −+=

11)( , (67)

( ) xx

xx

eeeexf−

−−

= . (68)

Figura 23. Arquitectura de la red neuronal artificial MLP

Una característica importante de esta red es la presentación interna del conocimiento que es capaz de organizar en la capa intermedia de las neuronas (unidades de cómputo) para conseguir cualquier correspondencia entre la entrada y la salida de la red. De otra forma, el funcionamiento de la red backpropagation consiste en un aprendizaje de un conjunto predefinido de pares entrada-salida en el que primero se muestra un patrón dado a la red hasta obtener una salida determinada por neurona, que es comparada con la salida objetivo respectiva, dicha diferencia genera una señal de error que es retransmitida hacia las neuronas de la capa oculta (en este caso, la capa 1) recibiendo un porcentaje de error relativo a su contribución a la salida. Luego, con base en dicho error, son actualizados los pesos sinápticos de cada neurona, finalmente el proceso se repite hasta alcanzar el nivel de error deseado.

Page 86: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

86

El algoritmo backpropagation (BP) puede resumirse en los siguientes pasos:

a) Se presenta a la red el patrón μ ( μix ), dicho patrón presenta la

dimensionalidad del conjunto total de características tenidas en cuenta para el aprendizaje de la red.

b) Cálculo de la neta para las unidades de la capa 1, donde el conjunto de pesos sinápticos iniciales así como el conjunto de umbrales iniciales, son distribuidos aleatoriamente sobre el espacio de entrada:

j

N

iijijj xwNeta θσ μμμ +== ∑

=1* . (69)

c) Se calcula la salida, equivalente a evaluar el potencial postsináptico en la función de transferencia de la primera capa de la red neuronal.

( ) ⎟⎠

⎞⎜⎝

⎛+== ∑

=j

N

iijijjjj xwffY θσ μμμμ

1* . (70)

d) Se calcula la neta para las unidades de la capa 2 de manera análoga al

cálculo de la neta para la capa 1.

k

M

jjkjkk YwNeta θβ μμμ +== ∑

=1* . (71)

e) De esta forma se calcula la salida para la capa 2 de manera análoga al

cálculo de la salida para la capa 1.

( ) ⎟⎟⎠

⎞⎜⎜⎝

⎛+== ∑

=k

M

jjkjkjkj YwggZ θβ μμμμ

1* . (72)

f) Determinar el error actual teniendo en cuenta la funcional de error

cuadrático medio elegida como función de coste de la red, dicho error se calcula con base en el conjunto de salidas deseadas (targets) y las salidas de la última capa de cómputo de la red. Nótese que el entrenamiento de la red se lleva a cabo hasta que se llegue a un nivel de error deseado y determinado por el usuario (en la presente aplicación se fijó en 0.0001)

( )∑=

−=L

kkk ZtE

1

2

21 μμ . (73)

g) La actualización de los pesos sinápticos de la capa 2 se realiza utilizando la

ecuación 80.

Page 87: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

87

μkjkjkj wtwtw Δ+=+ )()1( , (74)

donde, kj

kj wEw

∂∂

−=Δ εμ ,

y donde: ( )

∑ ∂

⎥⎦⎤

⎢⎣⎡ −∂

−=Δk kj

kk

kj w

Ztw

2

21 μμ

μ ε

Entonces se tiene que:

( ) ⎟⎟⎠

⎞⎜⎜⎝

∂∂

−−−=Δkj

kkkkj w

ZZtwμ

μμμ ε

( ) μμμμ ε jkkkj YZtw −=Δ

La actualización de los pesos sinápticos de la capa 1 viene dada por:

μjijiji wtwtw Δ+=+ )()1( , (75)

donde, ji

ji wEw

∂∂

−=Δ εμ ,

y donde: ( )( )

( )( )

ji

j

j

j

j

k

k

k

kji wY

YZ

Ze

eE

wE

∂⋅

∂⋅

∂∂⋅

∂∂

⋅∂∂

⋅∂∂

=∂∂ μ

μ

μ

μ

μ

μ

μ

μ

σσ

ββ

.

Entonces, se tiene que:

( )( ) ( )[ ] ( )[ ] μμμμμ σβ ijkjk

kkkji

j xfwgZtwE

''1∑ −−=∂

∂,

por tanto:

( ) ( )[ ] ( )[ ]⎭⎬⎫

⎩⎨⎧

−=Δ ∑ μμμμμμ σβε ijkjk

kkkji xfwgZtw '' .

3.8.1.1. Nota sobre el Algoritmo de Levenberg-Marquardt. El problema para el que el algoritmo de Levenberg-Marquardt da solución es conocido como Minimización por Mínimos Cuadrados No-lineal (Ranganathan, A., 2004;

Page 88: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

88

Levenberg, K., 1944; Marquardt, D., 1963). Esto implica que la función a ser minimizada es de la forma como muestra la ecuación 76.

( ) ( )∑=

=m

jj xrxf

1

2

21 , (76)

donde ( )nxxx ,...,1= es un vector y cada jr es una función desde nR a R . Los jr son referidos como residuales y se asume que nm ≥ . Por simplicidad, f es representada como un vector residual r, definido por:

( ) ( ) ( )( )xrxrxrxr m,...,,)( 21= . Ahora, f puede ser redefinida como expresa la ecuación 77.

( ) ( ) 2

21 xrxf = . (77)

Las derivadas pueden ser escritas utilizando el Jacobiano J de r, definido por la ecuación 78.

( )i

j

xr

xJ∂

∂= , (78)

sabiendo que: mj ≤≤1 , ni ≤≤1 . Para un caso generalizado no-lineal, se tiene que:

( ) ( ) ( )∑=

=∇=∇m

j

Tjj xrxJxrxrxf

1)()( , (79)

( ) ( ) ( ) ( ) ( )∑=

∇+=∇m

jjj

T xrxrxJxJxf1

22 . (80)

La propiedad distintiva de los problemas de mínimos cuadrados es que dado un Jacobiano J, se puede obtener el Hessiano o discriminante ( )xf2∇ si es posible aproximar los jr por funciones lineales ( )(2 xrj∇ es pequeño o los residuales como tales son pequeños). El Hessiano en este caso se convierte en la ecuación 81.

Page 89: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

89

( ) ( ) ( )xJxJxf T=∇ 2 , (81) 3.8.2. Funciones de Base Radial (RBF, Radial Basis Functions). Las funciones de base radial, conocidas por dicho nombre debido a la función de transferencia que presentan en la primera capa, son redes de agrupamiento no supervisado (aunque en un sentido estricto son híbridas) que permiten encontrar k distribuciones dentro del espacio de entrada, donde k corresponde al número de neuronas presente en la capa oculta o número de categorías. En la RBF, el conjunto de neuronas es distribuido aleatoriamente en el espacio de entrada. La arquitectura de este tipo de red puede apreciarse en la Figura 24. Aunque las redes RBF han sido asociadas a tareas de agrupamiento no-supervisado de patrones, estas también han sido ampliamente utilizadas en problemas de clasificación, e incluso, en problemas de decisión binarios no-lineales dada la característica que le da el ser híbrida (Haykin, S., 1999). Por lo anterior, este tipo de red es tomada como un modelo a evaluar en este trabajo, además, este tipo de redes llevan a un costo computacional bajo, dadas las ventajas del algoritmo de aprendizaje que implementa. Figura 24. Función de base radial (arquitectura).

Esta red utiliza el algoritmo de aprendizaje conocido como k-medias (k-means, en inglés) y su algoritmo de aprendizaje es tan sencillo como computacionalmente eficiente. En el entrenamiento de los nodos gaussianos debe determinarse en primer lugar el valor de los centroides por neurona de la capa oculta para realizar el agrupamiento no supervisado. El algoritmo de aprendizaje de la capa oculta puede explicarse en pocos pasos por simplicidad:

Page 90: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

90

a) Generación aleatoria de vectores de pesos sinápticos de las neuronas sobre el espacio de entrada n-dimensional (cada vector de pesos tiene la dimensionalidad de los patrones que ingresan a la red).

b) Se asocia el subconjunto de patrones asociados a las neuronas según la

ecuación 82. Esta ecuación describe el grado de similitud que existe entre un vector sináptico específico y cualquier patrón en el espacio de entrada.

ijij wsS −= min . (82)

c) Se actualizan los pesos sinápticos de la primera capa de la red según la

ecuación 83. Esta expresión es conocida como la media por componente o k-media y describe cómo estadísticamente el conjunto de neuronas de entrada buscan el centro de masa de un conjunto de patrones del espacio de entrada con los cuales encuentra similitud o alta correlación, este conjunto de patrones al final del entrenamiento quedan asociados a las neuronas de entrada, cuyas respuestas tienen forma de campana de Gauss, lo que se denomina cluster.

∑=

=+Ni

jj

i

xN

tw1

ˆ1)1(ˆ . (83)

d) Si:

)(ˆ)1(ˆ twtw ≠+ , debe volverse al paso b, en caso contrario el algoritmo ha terminado.

Para evaluar el desempeño de la red se utiliza un patrón o conjunto de patrones de prueba de tal manera que debido a la competencia existente entre las neuronas de la última capa de la red se establezca una neurona cuyo vector de pesos constituya la mayor correlación con el patrón de prueba. Por lo que la expresión de salida yj de la neurona j (neuronas finales) viene dada por la ecuación 84.

ijii

jij xwxwy *==∑ , (84)

donde hay una sola capa de salida simple con unidades j, conectadas entre ellas todas contra todas y a cada una de ellas le llega una señal o estímulo de entrada xi excitatoria representada por las flechas. Solo una de esas unidades de entrada será denominada ganadora que hará su disparo en un tiempo determinado.

Page 91: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

91

Entonces:

xwxw jj *'* ≥ , para todas las unidades j Definiendo la unidad ganadora de la última capa de la red como j’ con salida igual a uno (1) (suponiendo neuronas binarias). Si los pesos para cada unidad están normalizados (como es el caso), entonces decimos que: ;1|| =jw para todas las j, entonces será equivalente a:

xwxw jj −≤−' , para todas unidades j 3.8.3. Máquina de Soporte Vectorial (SVM, Support Vector Machine). Para ilustrar el objeto de una máquina de soporte vectorial, considérese el conjunto de entrenamiento ( ){ }N

iii dx 1, = donde ix es el patrón de entrada para el i-ésimo ejemplo y id es la respuesta deseada. Para comenzar, supóngase que las clases representadas por el subconjunto 1+=id y 1−=id son linealmente separables. Suponga que 0w y 0b denotan los valores óptimos del vector de pesos sinápticos y el umbral, respectivamente. Consecuentemente el hiperplano óptimo, representando una superficie de decisión lineal, es definido por la ecuación 85.

000 =+ bxwT . (85) La función discriminante es representada por la ecuación 86. ( ) 00 bxwxg T += . (86)

Esta última ecuación da una medida de la distancia de x hasta el hiperplano óptimo (Haykin, S., 1999) que puede expresarse utilizando la ecuación 87.

( )0wxgr = . (87)

Encontrar los parámetros 0w y 0b para el hiperplano óptimo, dado un conjunto de entrenamiento ( ){ }ii dx ,=ℑ suele ser el problema a resolver. Es posible ver con las ecuaciones 88 y 89 que el par ( )00 ,bw .

1100 +=≥+ iiT dparabxw , (88)

Page 92: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

92

1100 −=−≤+ iiT dparabxw . (89)

Los puntos particulares ( )ii dx , para los que la ecuación 80 o la ecuación 81 se satisfagan con la igualdad de signos son llamados vectores de soporte. En términos conceptuales, los vectores de soporte son los datos que se encuentran más próximos a la superficie de decisión y por ello, son los más difíciles de clasificar. La figura 25 ilustra cada una de las ideas revisadas anteriormente utilizando patrones linealmente separables. Figura 25. Ilustración de la idea de un hiperplano óptimo para patrones linealmente separables.

4 4.5 5 5.5 6 6.5 7 7.5 82

2.5

3

3.5

4

4.5

01Support Vectors

3.8.3.1. Hiperplano Óptimo para Patrones No-Separables. En los casos más complicados de análisis de patrones se encuentra el caso de los patrones no-separables. Dado un conjunto de datos de entrenamiento, no es posible construir un hiperplano de separación sin enfrentarse a errores de clasificación. El margen de separación entre las clases se dice suave si un dato ( )ii dx , viola la condición que se presenta en la ecuación 90. ( ) 1+≥+ bxwd i

Ti , Ni ,...,2,1= . (90)

Esta violación puede darse de dos maneras: la primera, cuando un dato ( )ii dx , cae dentro de la región de separación pero en el lado correcto de la superficie de

Page 93: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

93

decisión. La segunda, cuando un dato ( )ii dx , cae en el lado equivocado de la superficie de decisión (Haykin, S., 1999). Debido a este problema se introduce un nuevo conjunto de variables escalares no-negativas { }N

i 1=ξ , en la definición del hiperplano de separación, i. e., la superficie de decisión como muestra la ecuación 91. ( ) ii

Ti bxwd ξ−≥+ 1 , para Ni ,...,2,1= . (91)

Los iξ miden la desviación de un dato de la condición ideal de separabilidad de patrones. Para 10 ≤≤ iξ , los puntos caen dentro de la región de separación pero en el lugar correcto de la superficie de decisión. Para 1>iξ , cae en el lado equivocado del hiperplano de separación. La manera de encontrar el hiperplano de separación para el que el error de clasificación sea mínimo se realiza minimizando la ecuación 92.

( ) ( )∑=

−=N

iiI

1

1ξξφ .

(92) Con respecto al vector de pesos w, sujeto a la restricción dada por la ecuación 88. La función ( )ξI es una función indicador definida por la ecuación 93.

( )⎩⎨⎧

>≤

=0100

ξξ

ξsisi

I . (93)

Para hacer el problema de optimización matemáticamente tratable, se aproxima la función ( )ξφ usando la ecuación 94.

( ) ∑=

=N

ii

!

ξξφ . (94)

Al simplificar el cálculo formulando la función a ser modificada con respecto al vector de pesos w, se obtiene la ecuación 95.

( ) ∑=

+=N

ii

T Cwww12

1, ξξφ , (95)

Page 94: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

94

donde C es un parámetro libre determinado por el usuario. Utilizando el método de los multiplicadores de Lagrange y procediendo de una manera similar al caso para patrones linealmente separables (léase 0=ξ ), es posible formular el problema actual como expresa la ecuación 96.

( ) ∑ ∑∑= = =

−=N

i

N

i

N

jj

Tijijii xxddQ

! 1 121 αααα , (96)

sujeto a las siguientes condiciones:

(a) 01

=∑=

N

iiidα ,

(b) Ci ≤≤ α0 , para Ni ,...,2,1= . Tanto en el caso de patrones linealmente separables como no-separables, el objetivo es maximizar la función ( )αQ , no obstante hay una diferencia significativa entre ambos casos: En el caso para patrones separables la constante 0≥iα es reemplazado por un iα en un rango más acotado Ci ≤≤ α0 (Haykin, S., 1999). Por otra parte, la solución óptima para el vector de pesos es dada por la ecuación 97.

∑=

=sN

iiii xdw

1,00 α , (97)

donde Ns es el número de vectores de soporte. La forma para determinar los valores óptimos de los umbrales viene dada por la ecuación 98.

( )[ ] 01 =+−+ iiT

i bxwd ξα , para Ni ,...,2,1= , (98) y

0≈iiξμ , para Ni ,...,2,1= , (99)

Page 95: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

95

donde iμ son multiplicadores de Lagrange que han sido introducidos para reforzar la no-negatividad de los iξ .

Page 96: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

96

4. RESULTADOS Y DISCUSIÓN DE RESULTADOS A continuación se muestran algunos estadísticos sobre la muestra de pacientes tenida en cuenta para este estudio (tabla 7, tabla 8 y tabla 9). Tabla 7. Estadísticos de la población completa (Con Riesgo y Sin Riesgo).

x Mo s2 s Me Max Min 943.57 1072-

1133 2.6972e+0

04 164.23 1016 1256 642

Tabla 8. Estadísticos de la población diagnosticada con riesgo cardiovascular.

x Mo s2 s Me Max Min 727.43 715.2-

733.5 1.2182e+03 34.90 718 825 642

Tabla 9. Estadísticos de la población sin riesgo aparente o normal

x Mo s2 s Me Max Min 1046.50 1059-1108 6.3562e+03 79.72 1060 1256 764 Al analizar los datos anteriores y analizar el histograma de la frecuencias que se repite cada uno los intervalos RR (IRR) dentro de la muestra estudiada en la figura 26, en general cada una de las distribuciones se comporta como una función normal pero se pueden observar algunas diferencias marcadas en cuanto a la distribución de la variabilidad, como que las variaciones están mas dispersas en la muestra de IRR de personas sin riesgo aparente y una varianza mayor que en la muestra de IRR de personas diagnosticadas clínicamente con riesgo, notando que en esta segunda la distribución las variaciones es mas pequeña y existe un rango muy estrecho de IRR. Respecto a las mediciones de presión, el grupo sin riesgo presentó una presión sistólica promedio de 8.76.114 ± mmHg y una presión diastólica promedio de

7.72.63 ± mmHg. Por otra parte, el grupo de riesgo cardiovascular medio o alto presentó una presión sistólica promedio de 7.114.128 ± mmHg y una presión diastólica promedio de 7.78.82 ± mmHg. Adicionalmente, la frecuencia respiratoria del total de los pacientes tenidos en cuenta en este estudio fue de 1.21.12 ± respiraciones/min.

Page 97: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

97

Figura 26. Histograma de frecuencias de los valores de los intervalos RR, donde se representan en azul los valores de la muestra de personas diagnosticadas con riesgo, y en rojo los valores de la muestra de personas sin riesgo aparente o dentro de los valores típicos.

4.1. OUTLIERS EN LOS ÍNDICES DE VARIABILIDAD CARDÍACA Los outliers dentro de la distribución de un índice de variabilidad cardíaca, son condiciones específicas dentro de la variabilidad de la frecuencia cardíaca en los individuos con o sin riesgo cardiovascular tenidos en cuenta en el estudio. Dentro de las posibles causas de la aparición de este tipo de mediciones están las condiciones de riesgo específicas del paciente, e. g., hipertensión, falla cardíaca, accidente cerebrovascular; de acuerdo a esto, la distribución de los intervalos R-R varía y esto es evidente en la reconstrucción de la dinámica del atractor (mapa de retorno) de la serie R-R y se ve reflejado en el cálculo de índices estadísticos, espectrales, multirresolución y no-lineales. De igual forma, el efecto de los outliers puede ser observado en los gráficos de cada uno de los índices tenidos en cuenta y el efecto que producen estos es la necesidad de producir mapeos a una dimensión más elevada o bien la implementación de superficies de decisión cuadráticas o clasificadores no-lineales que permitan una separación adecuada de las clases. Las condiciones en las que se realizan los registros no se traducen en una causa de aparición de outliers debido a la implementación del protocolo para la medición de variabilidad cardíaca aplicado en este estudio que garantiza una variación mínima (y por tanto, clínicamente poco relevante) en la toma de los registros.

Page 98: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

98

4.2. SUMARIO DE PRUEBAS ESTADÍSTICAS REALIZADAS SOBRE LOS ÍNDICES DE VARIABILIDAD CARDÍACA Cada uno de los índices calculados en la fase de extracción de características fue evaluado por separado. Por otra parte, también fue definido el valor pronóstico asociado a cada uno de los métodos para caracterizar la variabilidad de la frecuencia cardíaca en los dos tipos de pacientes tenidos en cuenta para el presente estudio. Se hicieron tres análisis diferentes:

- Análisis de varianza (one-way ANOVA) - Análisis de componentes principales (PCA) - Prueba para definir el valor pronóstico de cada índice y método por

separado Cada uno de estos será explicado brevemente a continuación. 4.2.1. Análisis de Varianza (ANOVA). Las k muestras o las poblaciones de las que provienen son denominadas grupos: Pacientes sin riesgo y pacientes con riesgo cardiovascular. Para el presente análisis de varianza, se considera estadísticamente significante un valor de p < 0.05. En general, los diagramas de caja resultan apropiados para representar variables que presenten una gran desviación de la distribución normal y resultan de ayuda cuando se dispone de datos en distintos grupos. De acuerdo a esto, los valores mas relevantes se encuentran dentro del cuerpo o caja que es donde se concentra la mayoría de la distribución. También se pueden notar algunos valores atípicos (outliers) de la variable que están tan apartados del cuerpo principal de los datos que bien pueden representar los efectos de causas extrañas, como algún error de medición o registro representados con cruces (+). Su eliminación no se justifica, ya que el propósito del gráfico de caja consiste en brindar un mayor conocimiento de la forma en que se distribuyen los datos. 4.2.2. Análisis de Componentes Principales (PCA). El análisis de componentes principales escoge una dimensionalidad reduciendo la proyección lineal que maximiza la variabilidad de todas las muestras proyectadas. Este algoritmo fue utilizado con el fin de reducir la dimensionalidad de los datos de salida de cada método de análisis de la variabilidad de la frecuencia cardíaca por separado con el fin de comprobar y visualizar si el conjunto de datos reducido presentaba la discriminación estadística significante dada por el análisis de varianza llevado a cabo con antelación.

Page 99: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

99

4.2.3. Prueba para Definir el Valor Pronóstico de cada Índice y Método por Separado. El valor pronóstico de cada índice y método fue calculado de la siguiente manera:

1) Se seleccionan de la muestra total dos grupos: Un grupo grande (60 registros) y un grupo pequeño (30 registros) de observaciones destinados a hacer parte de los conjuntos de patrones y prueba, respectivamente.

2) Del conjunto de validación se extraen rangos entre los que se encuentran los valores típicos de una variable específica.

3) Se asigna un centro de cluster ( )ick para cada variable i calculando la media de los valores de dicha variable.

4) Utilizando el conjunto de datos de prueba se hacen las estimaciones respectivas de sensitividad (Se), especificidad (Sp), valor predictivo positivo (Pp), valor predictivo negativo (Np) y exactitud (Acc).

4.3. ANÁLISIS DE ÍNDICES ESTADÍSTICOS Los resultados arrojados por el análisis de los índices estadísticos se encuentran registrados en la tabla 10 y la tabla 11, y la figura 30 y la figura 31, donde se pueden apreciar los diagramas de caja y el análisis de componentes principales realizado sobre todos los índices tenidos en cuenta. Adicionalmente la tabla 12 entrega información sobre el valor pronóstico asociado a cada índice y al método de análisis completo. Según análisis de varianza (ANOVA) realizado a los índices estadísticos y de acuerdo a la tabla 11, teniendo en cuenta el nivel de significancia de cada indicador estadístico se puede inferir que la mayoría de indicadores no tienen un comportamiento significativamente descriptivo para cada grupo de pacientes Normales ‘N’ y con Riesgo ‘R’, en otras palabras, se dice que en la mayoría de indicadores no existe una diferenciación o correlación significativa entre grupos de pacientes y no se puede descartar la hipótesis nula que afirma que la diferencia de los indicadores fue dada probablemente por el azar y no por la diferenciación entre grupos de pacientes. Pero eso no ocurre para los indicadores de la media y el r-MSSD, pues explican que existe un rechazo de la hipótesis nula que expresa que existe una diferenciación o correlación entre grupos. De todo lo anterior se deduce que los indicadores estadísticos que ofrecen mejores resultados son la Media y el r-MSSD. Tabla 10. Estadísticos de sobre cada uno de los indicadores por tipo de individuo.

C Tipo x s2 Me Max. Min. N 972,44 2.00E+04 858,62 1350 781,39 Media

R 868,04 1.16E+04 853,62 1110 726,45

Page 100: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

100

N 63,66 424,35 61,37 115,31 27,72 SD R 59,46 1960 42,01 183,79 16,36

N 1318,4 1.42E+06 789,25 5251,9 99,37 r-MSSD R 3708,5 5.96E+07 448,21 32992 88,39

N 2,96E+01 407,87 2,46E+01 69,89 3,30E-01 pNN50 R 2,20E+01 607,37 1,26E+01 79,15 0

N 8,50E+01 698,57 77 140 32 MIRR R 8,16E+01 3806,7 61 244 15

N 3,74E+01 414,38 31 84 8 MDARR R 3,70E+01 1099,6 30 138 15

N 3,35E+01 202,5 28,09 72,47 9,97 SDSD R 4,12E+01 2055,9 21,17 181,64 9,4

Tabla 11. Resultados del análisis de varianza (ANOVA) para cada uno de los índices estadísticos tenidos en cuenta en este estudio

C Fuente SS df MS F p Grupos 245203,5 1 245203,5 15,52 0,0002 Error 1390733 88 15803,8 Media

Total 1635936 89 Grupos 396,5 1 396,52 0,33 0,5656 Error 104696,3 88 1189,73 SD

Total 105092,8 89 Grupos 1,28E+08 1 1,28E+08 4,22 4,30E-02 Error 2,65E+09 88 3,04E+07 r-MSSD

Total 2,80E+09 89 Grupos 1,31E+03 1 1306,13 2,57 0,1123 Error 4,47E+04 88 507,62 pNN50

Total 4,60E+04 89 Grupos 2,48E+02 1 248,34 0,11 0,7407 Error 1,98E+05 88 2252,65 MIRR

Total 1,98E+05 89 Grupos 3,80E+00 1 3,803 0,01 0,9437 Error 6,66E+04 88 756,963 MDARR

Total 6,66E+04 89 Grupos 1,35E+03 1 1347,09 1,19 0,2777 Error 9,94E+04 88 1129,2 SDSD

Total 100717 89

Page 101: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

101

Al analizar el gráfico de caja del primer indicador la media o mean (figura 27, a), se puede notar que su distribución es simétrica para ambos tipos con Riesgo (R) o Normales o sin riesgo aparente (N), pero a pesar de esta característica se observa que ambos tipos comparten muchos de los datos, porque muchos de los valores por debajo de la mediana para el tipo N están compartidos con los valores por arriba de la mediana de los tipo R, esto da información evidente de que todos los valores que toma la variable están acumulados en unos pocos puntos haciendo que este indicador poco eficiente para clasificar las variaciones entre intervalos RR. El segundo indicador la desviación estándar (figura 27, b), tiene una distribución geométrica menos extensa que el primer indicador pero se puede ver que comparte las mismas desventajas que la media, lo que hace que este indicador no sea suficientemente confiable para describir variaciones de intervalos RR. El indicador r-MSSD (figura 27, c), expone una asimetría positiva en sus gráficos de caja y la mayoría de los datos están un poco más dispersos después de la mediana, también se encuentran pocos distribuidos y están concentrados en unos pocos puntos y existe una diferencia muy pequeña entre los tipos ‘N’ y ‘R’, pero no se puede entregar un análisis muy minucioso porque muchos de los datos en el tipo ‘R’ son valores atípicos. El indicador MIRR (figura 27, e), es un mejor indicador que los anteriores por no compartir valores entre sus tipos, también se presenta en el tipo ‘N’ una asimetría positiva. El gráfico de caja del SDSD (figura 27, g), presenta una distribución de datos un tanto asimétrica, pero no reparte bien los valores que toma la variable entre los tipos ‘N’ y ‘R’ al igual que la media y lo hace poco confiable como indicador para analizar las variaciones entre intervalos RR. Por último se exponen los indicadores pNN50 y MDARR (figura 27, d y f respectivamente), el pNN50 en contraposición de los ya mencionados presenta buenas características de diferenciación entre los tipos ‘N’ y ‘R’, se observa una distribución geométrica muy dispersa y un tanto asimétrica positivamente debido a los efectos de tendencia a saturación del mismo para valores extremos, efecto corregido en el MDARR gracias a la robustez y resistencia que tienen los cuartiles a artefactos, este indicador hace una buena diferenciación entre tipos distribuyendo todos los valores por encima de la mediana para el tipo ‘N’ y distribuyendo la mayoría de valores por debajo de la mediana para el tipo ‘R’, pero a pesar de esto no se puede dar una apreciación final porque existen muchos valores atípicos en el tipo ‘R’ y una asimetría bastante marcada.

Page 102: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

102

Figura 27. Análisis de varianza para cada índice estadístico para los dos tipos de individuos tenidos en cuenta en este estudio: Normales o sin riesgo (N) y con riesgo (R) cardiovascular: (a) Media; (b) Desviación estándar; (c) r-MSSD; (d) pNN50; (e) MIRR; (f) MDARR; (g) SDSD

N R

20

40

60

80

100

120

140

160

180

Val

ues

N R700

800

900

1000

1100

1200

1300

Val

ues

N R

20

40

60

80

100

120

140

160

180

Val

ues

N R

0

0.5

1

1.5

2

2.5

3

x 104

Val

ues

N R

0

10

20

30

40

50

60

70

80

Val

ues

N R

50

100

150

200

250

Val

ues

N R

20

40

60

80

100

120

140

Val

ues

Page 103: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

103

Cabe destacar que en algunos estudios de gráficos de caja, una dispersión grande indica un conjunto de datos heterogéneos e implica poca utilidad de una medida para describir la distribución, pero este no es el caso ya que los valores que toman las variables con respecto a los intervalos RR analizados no son una medida perfectamente enmarcada dentro de dos estados: con riesgo o sin riesgo, sino porque la naturaleza y las condiciones clínicas de cada paciente son únicas. El comportamiento de las variables se evidencia también en el análisis PCA realizado (Figura 28). Figura 28. PCA realizado a las medidas estadísticas proyectadas en las tres componentes principales para las dos categorías: Pacientes sin riesgo (círculo verde) y pacientes con riesgo (cruz negra)

−0.50

0.51

1.52

2.53

3.5x 10

4

−500

−400

−300

−200

−100

0

100

200

300

−200

−100

0

100

200

3ra

Com

pone

nte

1ra Componente

2da Componente

−1

0

1

2

3

4

x 104

−500−400−300−200−1000100200300−150

−100

−50

0

50

100

150

3ra

Com

pone

nte

2da Componente1ra Componente

Page 104: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

104

Tabla 12. Valor pronóstico asociado a cada índice estadístico C Se Sp Np Pp Acc

Media 0,4118 0,7692 0,50 0,70 0,5667 SD 0,8125 0,6429 0,7222 0,75 0,7333

r-MSSD 0,1875 0,8571 0,6 0,48 0,5 pNN50 0,625 0,5714 0,625 0,5714 0,6 MIRR 0,8125 0,5714 0,6842 0,7273 0,7

MDARR 0,9231 0,2356 0,80 0,48 0,5333 SDSD 0,8235 0,3846 0,625 0,6364 0,6333

Total 0,8824 0,1538 0,50 0,5769 0,5667

4.4. ANÁLISIS DE ÍNDICES ESPECTRALES Las medidas espectrales fueron calculadas de las series R-R extraídas de los registros realizados utilizando el protocolo diseñado por el equipo de trabajo (Anexo A). Los resultados del análisis de varianza (ANOVA) para cada uno de los índices utilizando el espectro AR y el periodograma de Welch se resumen en la tabla 13 y la tabla 14, respectivamente. Consecuentemente, los diagramas de caja relacionados con el análisis de varianza por cada uno de los índices utilizando cada método de estimación espectral por separado se encuentran resumidos por la figura 29 y la figura 30. Tabla 13. Resultados del análisis de varianza (ANOVA) para cada índice espectral utilizando el espectro AR.

C Fuente SS df MS F p Grupos 0,07941 1 0,07941 2,65 0,1074Error 2,64142 88 0,03002 VLF

Total 2,72083 89 Grupos 328,75 1 328,754 9,39 0,0029Error 3082,5 88 35,028 LF

Total 3411,25 89 Grupos 665 1 654,961 1,07 0,3044Error 54002,4 88 613,663 HF

Total 54657,3 89 Grupos 3,3758 1 3,37581 8,63 0,0042Error 34,4418 88 0,39138 LF/HF

Total 37,8176 89 Grupos 0,21848 1 0,21848 7,29 0,0083Error 2,63878 88 0,02999 NLF

Total 2,85725 89

Page 105: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

105

Grupos 0,21848 1 0,21848 7,29 0,0083Error 2,63878 88 0,02999 NHF

Total 2,85725 89 Tabla 14. Resultados del análisis de varianza (ANOVA) para cada índice espectral utilizando el periodograma de Welch.

C Fuente SS df MS F p Grupos 0,6018 1 0,60182 5,23 0,0246Error 10,1194 88 0,11499 VLF

Total 10,7212 89 Grupos 423,76 1 423,757 9,09 0,0034Error 4102,27 88 46,617 LF

Total 4526,02 89 Grupos 796,8 1 796,79 1,26 0,2642Error 55532,8 88 631,056 HF

Total 56329,6 89 Grupos 5,1263 1 5,12631 8,93 0,0036Error 50,5133 88 0,57401 LF/HF

Total 55,6396 89 Grupos 0,21848 1 0,21848 7,29 0,0083Error 2,63878 88 0,02999 NLF

Total 2,85725 89 Grupos 0,21848 1 0,21848 7,29 0,0083Error 2,63878 88 0,02999 NHF

Total 2,85725 89 Según la información resumida en la tabla 13 y la tabla 14, las características que presentan mayor significancia estadística están asociadas a la estimación de la potencia espectral en la banda de baja frecuencia (LF), la relación entre potencias espectrales de las bandas de baja y alta frecuencia (LF/HF) y por último, la potencia espectral en unidades normalizadas relacionada con la banda de baja frecuencia (NLF) y alta frecuencia (NHF), por lo tanto se confirma que los métodos para estimar la potencia espectral por cada banda presentan cierta regularidad. El mismo efecto se aprecia en la figura 32 y la figura 33, se puede notar cómo varían los índices mencionados en las dos categorías estudiadas. Aunque la variación es poca, el periodograma de Welch estima, desde el punto de vista estadístico, las componentes de potencia espectral con una significancia superior al método AR para casi todos los índices tenidos en cuenta. Aunque la señal de variabilidad de la frecuencia cardíaca es relativamente corta, teóricamente, las técnicas no-paramétricas deberían tender a producir resultados en la estimación menos precisos que las técnicas paramétricas, no obstante, esto

Page 106: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

106

no garantiza que la variabilidad entre grupos mostrada en las características espectrales extraídas se comporte de manera deseada o dicho de otra forma, no garantiza que haya significancia estadística. Figura 29. Análisis de varianza (ANOVA) para medidas espectrales utilizando el espectro AR: (a) VLF; (b) LF; (c) HF; (d) LF/HF; (e) NLF; (f) NHF

N R

5

10

15

20

25

30

Val

ues

N R

0

0.5

1

1.5

2

2.5

3

3.5

Val

ues

N R

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Val

ues

N R0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

Val

ues

N R0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Val

ues

N R

10

20

30

40

50

60

70

80

90

100

Val

ues

Page 107: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

107

Figura 30. Análisis de varianza (ANOVA) para medidas espectrales utilizando el periodograma de Welch: (a) VLF; (b) LF; (c) HF; (d) LF/HF; (e) NLF; (f) NHF

N R

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

Val

ues

N R

10

20

30

40

50

60

70

80

90

100

Val

ues

N R

5

10

15

20

25

30

35

Val

ues

N R

0

0.5

1

1.5

2

2.5

3

3.5

4

4.5

Val

ues

N R

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Val

ues

N R0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

Val

ues

Como el valor de p del análisis de varianza ya había sugerido, según los diagramas de caja las mejores características son: la potencia asociada a la banda LF, la razón de potencia LF/HF y las potencias en unidades normalizadas asociadas a las bandas LF y HF. La asimetría del indicador correspondiente a la banda de frecuencias LF, sugiere que existe gran solapamiento entre las categorías debido a que los datos se encuentran condensados en la parte baja (asimetría positiva), lo que deja separados pocos datos para la categoría

Page 108: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

108

correspondiente a los individuos sin riesgo cardiovascular, un efecto similar puede observarse en el índice LF/HF para el que los grupos presentan asimetría positiva y presentan un mayor solapamiento. Los índices NLF y NHF se comportan de manera similar, no obstante, presentan asimetrías contrarias para ambos grupos, este comportamiento se debe al efecto de la normalización sobre ambos parámetros, este efecto, debido a que el solapamiento de los grupos es el mismo, también otorga un valor pronóstico muy aproximado o igual para ambos índices utilizando ambos métodos de estimación espectral (véase tabla 13, tabla 14 y tabla 15). Respecto a los índices restantes (VLF y HF) existe un solapamiento casi total de las dos categorías (figura 29, a, c), lo que ocasiona que su significancia estadística sea baja y que por tanto, la variabilidad entre grupos sea atribuida a efectos de la aleatoriedad sobre los registros, en otras palabras, estas dos características no resultan muy adecuadas como indicadores de riesgo cardiovascular. El análisis utilizando PCA fue realizado sobre todas las características espectrales tenidas en cuenta en este trabajo y es ilustrado en la figura 31. La variabilidad que explican estas tres componentes dentro del modelo es de 99.86%. Es evidente que la proyección de la componente principal no es estadísticamente significante al igual que la tercera; lo contrario se aprecia en la proyección de la segunda componente. Gráficamente, se observa que esta última característica hace que, para algunas de las observaciones, existan variaciones que al parecer no son causa del azar o las condiciones de toma de los registros, en otras palabras, la segunda característica podría tener asociado un valor pronóstico más elevado que las restantes, no obstante, el análisis de componentes principales no fue realizado con el fin de medir el valor pronóstico asociado a la proyección de las componentes, sino con el fin de observar que la discriminación de las características espectrales se mantiene. La tabla 15 presenta los resultados de la evaluación (valor pronóstico) de todos los índices espectrales utilizados y además, de los métodos espectrales completos utilizando la prueba estadística referida al inicio del presente capítulo. Puede notarse la tendencia respecto al valor pronóstico de los índices que los más adecuados son precisamente los que tienen una significancia estadística alta (LF, LF/HF, NLF y NHF). De igual manera, los métodos espectrales muestran un desempeño relativamente bajo desde el índice más general (exactitud) hasta los valores predictivos asociados a las características extraídas; consecuentemente este método lleva a gran cantidad de falsos positivos y falsos negativos en el pronóstico de riesgo por lo que no debe ser tomado como único criterio para esta labor.

Page 109: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

109

La debilidad de las técnicas convencionales para el análisis de la variabilidad cardíaca basadas en la transformada de Fourier es que no son muy compatibles cuando se desea analizar señales no-estacionarias. Figura 31. PCA realizado a las medidas espectrales proyectadas en las tres componentes principales para las dos categorías: Pacientes sin riesgo (círculo verde) y pacientes con riesgo (cruz negra)

−50

0

50

100

−30

−20

−10

0

10

20

−10

0

10

20

3ra

Com

pone

nte

2da Componente

1ra Componente

−500

50100

−30

−20

−10

0

10

20

−10

−5

0

5

10

15

20

3ra

Com

pone

nte

1ra Componente

2da Componente

Page 110: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

110

Tabla 15. Valor pronóstico asociado a los índices espectrales tenidos en cuenta utilizando el espectro AR y el periodograma de Welch

C Se Sp Np Pp Acc Espectro AR

VLF 0,4118 0,7692 0,50 0,70 0,5667LF 0,6471 0,4615 0,50 0,6111 0,5667HF 0,5294 0,6154 0,50 0,6429 0,5667

LF/HF 0,7059 0,3846 0,50 0,60 0,5667NLF 0,7059 0,4615 0,5455 0,6316 0,60 NHF 0,7059 0,4615 0,5455 0,6316 0,60

P. de Welch

VLF 0,4118 0,7692 0,50 0,70 0,5667LF 0,7059 0,4615 0,5455 0,6316 0,60 HF 0,5294 0,3846 0,3846 0,5294 0,4667

LF/HF 0,7647 0,4615 0,60 0,65 0,6333NLF 0,7059 0,4615 0,5455 0,6316 0,60 NHF 0,7059 0,4615 0,5455 0,6316 0,60

Total 0,7059 0,4615 0,5455 0,6316 0,60

4.5. ANÁLISIS MULTIRRESOLUCIÓN Para todos los niveles de descomposición utilizados, las variaciones de la entropía y la energía wavelet, muestran que, para la mayoría de los casos, diferentes niveles de descomposición contienen la información de mayor relevancia de la dinámica de la VFC en pacientes sanos y con riesgo. A continuación se explican e ilustran los principales resultados obtenidos utilizando los algoritmos descritos anteriormente (transformada wavelet discreta y transformada wavelet packet). Todos los análisis fueron realizados utilizando la wavelet Daubechies 4 (db4) (Mahmoodabadi, S. Z. et al., 2005). Cada una de las señales de variabilidad cardíaca fue descompuesta a una profundidad m=5, por lo que habrá un total de cinco conjuntos de coeficientes de detalle y uno de coeficientes aproximación para el caso de la transformada wavelet discreta y un total de 62 conjuntos de coeficientes para el caso de la transformada wavelet packet. La profundidad de la transformada se determinó de forma heurística observando los resultados comparativamente de la descomposición de la señal en diferentes escalas respecto al cálculo de los dos índices tenidos en cuenta y la variabilidad que presentaban cada una de las escalas respecto a dichos indicadores y los grupos de individuos previamente definidos.

Page 111: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

111

4.5.1. Evaluación de la Transformada Wavelet Convencional. La transformada wavelet discreta fue calculada para cada uno de los registros así como los índices de energía y entropía wavelet. La figura 32 y la figura 33, muestran el grado de similitud existente entre las diferentes escalas de descomposición de la señal en relación con los índices calculados, puede notarse de manera intuitiva que la mayoría de ellos parecen no ser estadísticamente significantes, no obstante, el análisis realizado con PCA (figura 34 y figura 35) muestra que ciertas escalas cuentan con un poder discriminante alto. El análisis PCA realizado para las diferentes escalas de descomposición, muestra que el poder discriminativo de las características multirresolución se mantiene, no obstante, según el gráfico (figura 34 y figura 35), la característica que tiene mayor poder discriminativo es la segunda (eje Y) pues con esta se alcanza una mayor separación entre las categorías. Estas dos características de energía y entropía retienen un 87.93% y un 96.07% de la variabilidad de los datos de entrada, respectivamente. Según la tabla 17 y la tabla 18 donde se muestran los resultados del análisis de varianza para las componentes principales de entropía y energía wavelet, las componentes estadísticamente significantes son la tercera y cuarta y la segunda y cuarta, respectivamente; los valores de p sugieren el rechazo de la hipótesis nula, por lo que las diferencias entre grupos con estos indicadores son significativas tanto más que las diferencias dentro de un mismo grupo. Por otra parte, se realizó un análisis de varianza sobre todas las componentes de entropía y energía analizadas (6 en total por cada índice) y se comprobó que las mejores escalas para el primer indicador son las escalas 3, 4 y 5; para el segundo indicador, las escalas 1 y 5 parecen ser las más apropiadas (véase tabla 16). Tabla 16. Valor p para la entropía y energía wavelet a distintos niveles de descomposición (coeficientes de detalle – CD, coeficientes de aproximación – CA)

Coef. p -Energía p - Entropía CD1 (nivel 1) 0.0321 0.2056 CD2 (nivel 2) 0.1989 0.4659 CD3 (nivel 3) 0.2537 0.0078 CD4 (nivel 4) 0.3143 0.0123 CD5 (nivel 5) 0.0151 0.0034 CA5 (nivel 5) 0.9547 0.7486

Page 112: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

112

Figura 32. Entropía wavelet en diversas escalas de descomposición para los individuos tenidos en cuenta en este estudio (del 1 al 45 sin riesgo y del 45 en adelante con riesgo cardiovascular). La profundidad de la transformada es m=5.

1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 60

10

20

30

40

50

60

70

80

90

Escala

N. I

nd.

−4

−3.5

−3

−2.5

−2

−1.5

−1

−0.5

x 107

Figura 33. Energía wavelet en diversas escalas de descomposición para los individuos tenidos en cuenta en este estudio (del 1 al 45 sin riesgo y del 45 en adelante con riesgo cardiovascular). La profundidad de la transformada es m=5.

1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 60

10

20

30

40

50

60

70

80

90

Escala

N. I

nd.

0.5

1

1.5

2

2.5x 10

5

Page 113: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

113

Los diagramas de caja de la figura 36 y la figura 37, pretenden ilustrar el análisis de varianza realizado sobre las componentes principales de entropía y energía wavelet utilizando la transformada wavelet discreta. Nótese que las proyecciones de las escalas en los dos índices (entropía y energía) presentan un solapamiento casi total en la componente principal y además, en tanto tienen asimetrías parecidas, la concentración de los datos hace que con mayores visos no exista significancia estadística para esta componente, un efecto similar se puede notar en las componentes restantes. Figura 34. Análisis de componentes principales (PCA) sobre la entropía obtenida en múltiples escalas para una profundidad de la transformada de m=5 para las dos categorías: Pacientes sin riesgo (diamante negro) y pacientes con riesgo (cuadrado rojo)

−8 −6 −4 −2 0 2 4 6

x 106

−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

x 107

1era Comp. de Entropía

2da

Com

p. d

e E

ntro

pía

Page 114: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

114

Figura 35. Análisis de componentes principales (PCA) sobre la energía obtenida en múltiples escalas para una profundidad de la transformada de m=5 para las dos categorías: Pacientes sin riesgo (diamante negro) y pacientes con riesgo (cuadrado rojo)

−5 −4 −3 −2 −1 0 1 2 3 4 5

x 104

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

2.5

3

x 104

1era Comp. de Energía

2da

Com

p. d

e E

nerg

ía

Tabla 17. Resultados del análisis de varianza (ANOVA) para las cuatro componentes principales de entropía utilizando la transformada wavelet convencional.

C Fuente SS df MS F p Grupos 7,50E+10 1 7,50E+10 0 0,9756Error 7,03E+15 88 7,98E+13 1

Total 7,03E+15 89 Grupos 6,24E+13 1 6,24E+13 2,02 0,1593Error 2,72E+15 88 3,10E+13 2

Total 2,79E+15 89 Grupos 1,11E+14 1 1,11E+14 12,49 0,0007Error 7,85E+14 88 8,92E+12 3

Total 8,97E+14 89 Grupos 2,34E+13 1 2,34E+13 7,99 0,0058Error 2,57E+14 88 2,92E+12 4

Total 2,81E+14 89

Page 115: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

115

Figura 36. Análisis de varianza (ANOVA) (99% de la varianza explicada) para la entropía wavelet: (a) Componente principal; (b) Segunda componente principal; (c) Tercera Componente principal; (d) Cuarta componente principal.

N R

−3.5

−3

−2.5

−2

−1.5

−1

−0.5

0

0.5

x 107

Val

ues

N R

−3.5

−3

−2.5

−2

−1.5

−1

−0.5

0

0.5

1

1.5

x 107

Val

ues

N R

−6

−4

−2

0

2

4

6

x 106

Val

ues

N R

−1

−0.5

0

0.5

1

1.5

x 107

Val

ues

Figura 37. Análisis de varianza (ANOVA) (99% de la varianza explicada) para la energía wavelet: (a) Componente principal; (b) Segunda componente principal; (c) Tercera Componente principal; (d) Cuarta componente principal.

N R

−5000

0

5000

10000

15000

Val

ues

N R

−5

0

5

10

15

20

x 104

Val

ues

N R

−2

0

2

4

6

8

x 104

Val

ues

N R−2

−1

0

1

2

3

4

5

x 104

Val

ues

Page 116: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

116

Tabla 18. Resultados del análisis de varianza (ANOVA) para las cuatro componentes principales de energía utilizando la transformada wavelet convencional.

C Fuente SS df MS F p Grupos 6,07E+07 1 6,07E+07 0,02 0,8757Error 2,17E+11 88 2,46E+09 1

Total 2,17E+11 89 Grupos 1,53E+09 1 1,53E+09 6,79 0,0108Error 1,98E+10 88 2,26E+08 2

Total 2,14E+10 89 Grupos 1,65E+08 1 1,65E+08 1,85 0,1776Error 7,86E+09 88 8,93E+07 3

Total 8,02E+09 89 Grupos 1,01E+08 1 1,01E+08 9,84 0,0023Error 9,07E+08 88 1,03E+07 4

Total 1,01E+09 89 Los resultados del valor pronóstico de cada uno de los índices son ilustrados en la tabla 19 y la tabla 20. La entropía wavelet tiende a producir mejores resultados en el pronóstico que la energía wavelet, adicionalmente la combinación de los dos índices en múltiples escalas produce un valor pronóstico relativamente bajo, esto puede ser debido a que hay pocos datos disponibles de los dos índices (pocas escalas) para analizar, teniendo en cuenta que son sólo seis datos para cada uno de estos y que en realidad pocos de ellos son estadísticamente significantes. Por otra parte, la no estacionariedad de la transformada wavelet permite analizar la señal de variabilidad de la frecuencia cardíaca de forma que los índices extraídos de las diferentes escalas tengan un mayor poder discriminativo que utilizando otros métodos de análisis, e. g., los métodos espectrales. Un punto importante para resaltar, es la pérdida del valor clínico de las señales y los índices que puedan extraerse de estas con la implementación de la transformada wavelet con el fin de aumentar el valor pronóstico o la significancia estadística que producen las características que puedan extraerse de los conjuntos de coeficientes. Tabla 19. Valor pronóstico asociado a las cuatro componentes principales de la entropía, la energía y el método de análisis multirresolución (transformada wavelet) completo (total WT)

C Se Sp Np Pp Acc Entropía W

1 0,2353 0,9231 0,4800 0,8000 0,5333 2 0,1176 0,7692 0,4000 0,4000 0,4000 3 0,5000 0,3750 0,4615 0,4118 0,4333 4 0,7857 0,4375 0,7000 0,5500 0,6000

Page 117: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

117

Total 0,1765 0,9231 0,4615 0,7500 0,5000

Energía W 1 0,1429 0,6250 0,4545 0,2500 0,4000 2 0,3571 0,7500 0,5714 0,5556 0,5667 3 0,5000 0,3750 0,4615 0,4118 0,4333 4 0,7857 0,4375 0,7000 0,5500 0,6000

Total 0,1429 0,6875 0,4783 0,2857 0,4333 Total WT 0,2857 0,8125 0,5652 0,5714 0,5667

Tabla 20. Valor pronóstico asociado a las componentes de la entropía, la energía y el método de análisis multirresolución (wavelet convencional) completo (total WT) utilizando el conjunto de características estadísticamente significantes. (*) Componentes de entropía.

C Se Sp Np Pp Acc 1* 0.8750 0.4286 0.7500 0.6364 0.6667 2* 0.7500 0.2857 0.5000 0.5455 0.5333 3* 0.8750 0.2857 0.6667 0.5833 0.6000 4 0.1875 0.8571 0.4800 0.6000 0.5000 5 0.6875 0.3571 0.5000 0.5500 0.5333

Total WT 0.8125 0.4286 0.6667 0.6190 0.6333 4.5.2. Evaluación Transformada Wavelet Packet. Hay un problema importante en el sentido de que los rangos de frecuencia requeridos para los componentes altos y bajos no pueden ser obtenidos utilizando la transformada wavelet convencional. Frecuencias de muestreo diferentes no resuelven dicho problema. Las variaciones de energía entre cada grado de descomposición utilizando la transformada wavelet convencional, no suelen ser tan discriminantes que si se realiza un análisis utilizando la DWT para todas las componentes que se obtienen de la señal, este mismo comportamiento se observa, por ejemplo, utilizando la entropía wavelet como descriptor de la señal en cada nivel. Asimismo, el solapamiento debido a la estimación de frecuencias entre pacientes con riesgo medio o alto y sin riesgo cardiovascular, puede ser apreciado tomando las primeras escalas de descomposición, e incluso, se extiende hasta las últimas escalas. Otro punto importante en el cálculo de la transformada wavelet es la elección de “la mejor base” o del “mejor árbol” del conjunto total de todos los conjuntos de coeficientes (Coifman R. R. and Wickerhauser M. V, 1998; Wickerhauser M. V., 1994; Coifman R. R. and Wickerhauser M. V., 1992). Aunque aún es un problema

Page 118: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

118

abierto, Wickerhauser M. V., 1994, introduce un método que ajusta una serie de rectángulos congruentes a la señal de modo tal que las variaciones sutiles se concentren. Se puede proceder de manera que, a intervalos pequeños de la señal, sean determinados los coeficientes de expansión de los mismos y los coeficientes de la unión. Ahora, se pueden escoger la expansión para la que el número de coeficientes necesarios para capturar el 99% de la energía sea la más pequeña. O bien, se puede escoger la expansión para la que los costos sean mínimos, e. g., costo de información, costo de error y así sucesivamente. En este trabajo, el criterio tomado para descartar la información redundante obtenida con la transformada wavelet packet fue el análisis de componentes principales llevado a cabo en esta sección como también el análisis multivariado de varianza (MANOVA). Aunque para gran parte de las aplicaciones la transformada wavelet packet resulta ser una herramienta poderosa, es necesario discutir sobre su utilidad real dadas las redundancias establecidas por la descomposición de los coeficientes de detalle (además de la descomposición de los de aproximación), si bien wavelet packet estima de mejor manera las sub-bandas frecuenciales en series de VFC (según lo que ha reportado la literatura recientemente), es necesario eliminar la información innecesaria o que se repite con las descomposiciones completas de cada conjunto de coeficientes en niveles sucesivos, dado esto, es posible hacer una reconstrucción o síntesis de la señal a partir de otros conjuntos de coeficientes que no entrega la transformada wavelet convencional, e incluso, una vez seleccionado el mejor árbol, analizar o tomar los coeficientes (o coeficiente) estadísticamente más relevantes por nivel. En contraposición a lo que resulta de aplicar la transformada wavelet discreta (DWT) en múltiples niveles de descomposición, la transformada wavelet packet deja más datos disponibles para ser analizados debido al cálculo de la transformada wavelet a todos los coeficientes resultantes de la descomposición de la señal, i. e., tanto coeficientes de aproximación como coeficientes de detalle, esto contribuye a una mejor estimación de las componentes temporo-frecuenciales de la señal de variabilidad de la frecuencia cardíaca. La figura 38 y la figura 39, muestran la entropía y la energía wavelet para las diferentes escalas de descomposición (62 en total, teniendo en cuenta un nivel de descomposición m=5), en este gráfico se puede notar qué tan significativas pueden llegar a ser las diferencias entre grupos (denotados N, del 1 al 45 y R, del 46 al 90) en consonancia con el análisis de varianza realizado sobre cada una de las escalas tenidas en cuenta.

Page 119: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

119

Figura 38. Entropía wavelet en diversas escalas de descomposición para los individuos tenidos en cuenta en este estudio (del 1 al 45 sin riesgo y del 45 en adelante con riesgo cardiovascular). La profundidad de la transformada es m=5.

10 20 30 40 50 60

10

20

30

40

50

60

70

80

90

Escala

N. I

nd.

−3

−2.5

−2

−1.5

−1

−0.5

0x 10

7

Figura 39. Energía wavelet en diversas escalas de descomposición para los individuos tenidos en cuenta en este estudio (del 1 al 45 sin riesgo y del 45 en adelante con riesgo cardiovascular). La profundidad de la transformada es m=5.

10 20 30 40 50 60

10

20

30

40

50

60

70

80

90

Escala

N. I

nd.

0.5

1

1.5

2

2.5x 10

5

Page 120: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

120

Tabla 21. Valores de p resultantes del análisis de varianza de los índices de entropía y energía wavelet utilizando la transformada wavelet packet: En negro, coeficientes del primer nivel m=1; en naranja, coeficientes del segundo nivel m=2; en azul, coeficientes del tercer nivel m=3; en verde, coeficientes del cuarto nivel m=4; en magenta, coeficientes del quinto nivel m=5. (*) Coeficientes estadísticamente significativos para la entropía o la energía wavelet.

Nº. Coef. p -Energía p - Entropía 1* 0.0399 0.7883 2* 0.2056 0.0321 3* 0.0046 0.1101 4 0.4659 0.1989 5* 0.4655 0.0430 6* 0.1545 0.0321 7* 0.0174 0.1609 8* 0.0078 0.2537 9 0.3838 0.2822 10 0.4863 0.1707 11* 0.2332 0.0517 12* 0.6173 0.0578 13 0.4808 0.1549 14* 0.0550 0.0111 15 0.0746 0.2933 16* 0.0123 0.3143 17* 0.0101 0.6273 18* 0.0096 0.0687 19 0.2465 0.2979 20 0.3912 0.2801 21 0.5356 0.1981 22 0.1885 0.1094 23* 0.1046 0.0307 24 0.4356 0.0874 25 0.4653 0.0509 26 0.5776 0.1662 27 0.3331 0.1513 28 0.2201 0.1533 29* 0.0973 0.0176 30* 0.0587 0.0172 31 0.7486 0.9547 32* 0.0034 0.0151 33* 0.0240 0.7363

Page 121: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

121

34 0.0712 0.3148 35 0.0896 0.9272 36 0.0596 0.2494 37* 0.0290 0.2114 38* 0.0089 0.0256 39 0.3254 0.6331 40 0.2768 0.2513 41 0.2800 0.2004 42 0.5481 0.5133 43 0.6762 0.3223 44 0.2677 0.1185 45 0.1336 0.1087 46 0.4441 0.1530 47* 0.0660 0.0243 48* 0.1030 0.0381 49 0.4163 0.1026 50 0.2202 0.0828 51 0.3551 0.0526 52 0.1695 0.0795 53 0.3091 0.2072 54 0.5884 0.1600 55 0.3803 0.1911 56 0.2411 0.1450 57 0.1792 0.1297 58 0.3972 0.1881 59* 0.1768 0.0298 60* 0.0453 0.0352 61* 0.0898 0.0292 62* 0.1658 0.0476

La tabla 21 resume los resultados del análisis de varianza para cada una de los índices extraídos directamente desde los conjuntos de coeficientes de la transformada wavelet packet, puede notarse que hay información relevante que no se encuentra presente en el análisis multirresolución realizado con la transformada wavelet convencional, dicha información en algunos casos presenta mayor significancia estadística, puede observarse también que a medida que se entra en niveles de descomposición elevados, tienden a producirse menos coeficientes que arrojan indicadores estadísticamente significativos. Adicionalmente las proyecciones de las componentes entregadas por el análisis PCA demuestran que la transformada wavelet packet resulta ser más útil debido a que el solapamiento entre las categorías es menor (figura 40, figura 41, figura 42 y figura 43), esto es

Page 122: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

122

debido a la incidencia de la cantidad de información relevante disponible y susceptible de ser analizada proveniente del cálculo de la transformada wavelet packet. Un efecto común entre las transformadas wavelet y wavelet packet, es la poca significancia de la componente principal resultante del análisis de componentes principales, donde la segunda componente es la que contempla la mayor significancia estadística al ostentar el poder discriminativo que lleva a diferenciar las categorías tenidas en cuenta en el presente estudio. La tabla 22 y la tabla 23 y la figura 42 y la figura 43 resumen los resultados del análisis de varianza (ANOVA) para las cuatro componentes principales de entropía y energía, respectivamente. Nótese que las componentes estadísticamente significativas presentan mayor significancia que las analizadas previamente utilizando la transformada wavelet discreta. Aunque estas componentes representan meramente las proyecciones de las entropías y energías calculadas, puede notarse que el poder discriminativo de estas se mantiene (véase figura 43 y figura 44). Según la tabla 22 y la tabla 23, las componentes de mayor significancia son la segunda y la tercera tanto para la entropía como para la energía, puede notarse según los diagramas de caja que el solapamiento entre categorías es menor y que en algunos casos, dado que la asimetría de los datos es contraria, existe una mayor cantidad de datos que se pueden ver separados linealmente entre dichas categorías. Figura 40. Análisis de componentes principales (PCA) sobre la entropía obtenida en múltiples escalas para una profundidad de la transformada de m=5 para las dos categorías: pacientes sin riesgo (diamante negro) y pacientes con riesgo (cuadrado rojo)

−8 −6 −4 −2 0 2 4 6 8 10

x 106

−12

−10

−8

−6

−4

−2

0

2

4

6

8

x 106

1era Comp. de Entropía

2da

Com

pone

nte

de E

ntro

pía

Page 123: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

123

Figura 41. Análisis de componentes principales (PCA) sobre la energía obtenida en múltiples escalas para una profundidad de la transformada de m=5 para las dos categorías: pacientes sin riesgo (diamante negro) y pacientes con riesgo (cuadrado rojo)

−5 −4 −3 −2 −1 0 1 2 3

x 104

−5

−4

−3

−2

−1

0

1

2

3

4x 10

4

1era Comp. de Energía

2da

Com

pone

nte

de E

nerg

ía

Tabla 22. Resultados del análisis de varianza (ANOVA) para las cuatro componentes principales de entropía utilizando la transformada wavelet packet.

C Fuente SS df MS F p Grupos 7,08E+14 1 7,08E+14 2,02 0,1585Error 1,70E+16 88 1,93E+14 1

Total 1,77E+16 89 Grupos 5,81E+10 1 5,80E+10 8,24 0,0051Error 6,39E+14 88 7,26E+12 2

Total 6,39E+14 89 Grupos 4,66E+14 1 4,66E+14 6,00 0,0163Error 4,18E+15 88 4,74E+13 3

Total 4,64E+15 89 Grupos 9,10E+12 1 9,10E+12 1,31 0.256 Error 4,16E+14 88 4,72E+12 4

Total 4,25E+14 89

Page 124: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

124

Figura 42. Análisis de varianza (ANOVA) (92.1% de la varianza explicada) para la entropía wavelet: (a) Componente principal; (b) Segunda componente principal; (c) Tercera Componente principal; (d) Cuarta componente principal.

N R

−10

−8

−6

−4

−2

0

2

4

6

x 106

Val

ues

N R

−5

−4

−3

−2

−1

0

1

x 107

Val

ues

N R

−4

−3

−2

−1

0

1

2

x 107

Val

ues

N R

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

2.5

3

x 106

Val

ues

Tabla 23. Resultados del análisis de varianza (ANOVA) para las cuatro componentes principales de energía utilizando la transformada wavelet packet.

C Fuente SS df MS F p Grupos 6,79E+06 1 6,79E+06 0,11 0,7389Error 2,70E+11 88 3,08E+09 1

Total 2,71E+11 89 Grupos 6,07E+09 1 6,07E+09 5,04 0,0273Error 1,15E+11 88 1,31E+09 2

Total 1,21E+11 89 Grupos 1,95E+09 1 1,95E+09 6,37 0,0134Error 2,49E+10 88 2,83E+08

3 Total 2,68E+10 89 Grupos 9,76E+07 1 9,76E+07 0,28 0,5984Error 1,20E+10 88 1,36E+08 4

Total 1,21E+10 89

Page 125: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

125

Figura 43. Análisis de varianza (ANOVA) (92.1% de la varianza explicada) para la energía wavelet: (a) Componente principal; (b) Segunda componente principal; (c) Tercera Componente principal; (d) Cuarta componente principal.

N R

−4

−2

0

2

4

6x 10

4

Val

ues

N R

−5

0

5

10

15

20

25x 10

4

Val

ues

N R

−1

−0.5

0

0.5

1

1.5

2x 10

5

Val

ues

N R

−8

−6

−4

−2

0

2

4

6

x 104

Val

ues

La tabla 24 y la tabla 25 presentan los resultados del valor pronóstico asociado a cada una de estas características, puede notarse que estos son más elevados que los expuestos por la transformada wavelet convencional y adicionalmente, la información que no está presente en la transformada wavelet convencional, produce un valor pronóstico relativamente elevado tanto para la entropía como para la energía, contribuyendo con el desempeño final del algoritmo. Respecto al valor pronóstico que otorgan las componentes que explican la variabilidad del conjunto de datos respecto a estos dos índices, está el hecho de que también presentan valores pronósticos más elevados que los analizados previamente con al transformada wavelet convencional. Tanto los análisis de varianza, de componentes principales y la prueba para determinar el pronóstico concuerdan con la superioridad de la transformada wavelet packet, de este modo, este último método será implementado dentro de los esquemas de inteligencia artificial

Page 126: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

126

destinados a pronosticar de manera automática la condición de riesgo o no riesgo cardiovascular.

Tabla 24. Valor pronóstico asociado a las cuatro componentes principales de la entropía, la energía y el método de análisis multirresolución (wavelet packet) completo (total WP)

C Se Sp Np Pp Acc Entropía W

1 0,8824 0,4615 0,75 0,6818 0,7 2 0,1765 0,9231 0,4615 0,75 0,5 3 0,2353 0,8462 0,4583 0,6667 0,5 4 0,6471 0,6154 0,5714 0,6875 0,6333

Total 0,8824 0,5385 0,7778 0,7143 0,7333 Energía W

1 0,8824 0,2308 0,6 0,6 0,6 2 0,1465 0,6156 0,3636 0,375 0,3667 3 0,5882 0,6154 0,5333 0,6667 0,6 4 0,7647 0,2308 0,4286 0,5652 0,5333

Total 0,8824 0,3846 0,7143 0,6522 0,6667 Total WP 0,9333 0,2667 0,8 0,56 0,6

Tabla 25. Valor pronóstico asociado a las componentes de la entropía, la energía y el método de análisis multirresolución (wavelet packet) completo (total WP) utilizando el conjunto de características estadísticamente significantes. (*) Componentes de entropía.

C Se Sp Np Pp Acc 1* 0.250 0.000 0.000 0.222 0.133 2* 0.688 0.857 0.706 0.846 0.767 3* 0.688 0.786 0.688 0.786 0.733 4* 0.750 0.929 0.765 0.923 0.833 5* 0.625 0.786 0.647 0.769 0.700 6* 0.750 0.857 0.750 0.857 0.800 7* 0.188 0.214 0.188 0.214 0.200 8* 0.750 0.714 0.714 0.750 0.733 9* 0.250 0.214 0.200 0.267 0.233 10* 0.188 0.286 0.235 0.231 0.233 11* 0.313 0.143 0.154 0.294 0.233 12* 0.313 0.786 0.500 0.625 0.533 13 0.250 0.786 0.478 0.571 0.500

Page 127: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

127

14 0.250 0.786 0.478 0.571 0.500 15 0.250 0.714 0.455 0.500 0.467 16 0.313 0.857 0.522 0.714 0.567 17 0.188 0.857 0.480 0.600 0.500 18 0.375 0.786 0.524 0.667 0.567 19 0.250 1.000 0.538 1.000 0.600 20 0.625 0.714 0.625 0.714 0.667 21 0.750 0.786 0.733 0.800 0.767 22 0.313 0.857 0.522 0.714 0.567 23 0.188 0.929 0.500 0.750 0.533 24 0.375 0.714 0.500 0.600 0.533 25 0.375 0.857 0.545 0.750 0.600 26 0.375 0.929 0.565 0.857 0.633 27 0.250 0.857 0.500 0.667 0.533

Total WP 0.6875 0.8571 0.7059 0.8462 0.7667 4.7. ANÁLISIS DE ÍNDICES NO-LINEALES Las medidas no-lineales fueron evaluadas en dos grandes grupos: las medidas basadas en el gráfico de Poincaré (mapa de retorno) y las medidas de complejidad variando los parámetros de control de las mismas. Esto, con el objeto de hacer énfasis en el valor pronóstico de ambos métodos, el primero, como método subyacente a la dinámica caótica de las series R-R y el segundo, como método no-lineal basado en la probabilidad de ocurrencia de eventos específicos dentro de la serie R-R. 4.7.1. Análisis de Medidas Basadas en el Gráfico de Poincaré. La tabla 26 ilustra los resultados del análisis de varianza llevado a cabo sobre las medidas SD1 y SD2 producto del ajuste de la elipse sobre el gráfico de Poincaré. Ambas medidas resultan ser estadísticamente no-significativas, no obstante, SD2 parece ser una medida más adecuada por cuanto ostenta el peso más elevado respecto a la variabilidad de ambas medidas. Tabla 26. Resultados del análisis de varianza (ANOVA) para las medidas no-lineales relacionadas con el ajuste de la elipse

C Fuente SS df MS F p Grupos 9,32E+02 1 9,32E+02 0,76 0,3867Error 1,08E+05 88 1,23E+03 SD1

Total 1,09E+05 89 Grupos 2,60E+03 1 2,60E+03 1,93 0,168 Error 1,18E+05 88 1,34E+03 SD2

Total 1,21E+05 89

Page 128: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

128

Figura 44. Análisis de varianza (ANOVA) para medidas basadas en el ajuste de la elipse: (a) SD2; (b) SD1

N R

20

40

60

80

100

120

140

160

180

Val

ues

N R

20

40

60

80

100

120

140

160

180

Val

ues

Acordando a los diagramas de caja (figura 44), las asimetrías de cada uno de los índices sobre cada categoría son similares, esto produce que exista un solapamiento entre las categorías alto, por lo que el valor pronóstico debe ser un poco menos elevado que si tuvieran asimetrías contrarias, esto indica que la concentración de datos para ambas categorías se encuentra en la parte baja del gráfico, esto llevará a una cantidad razonable de falsos negativos y falsos positivos, una muestra de esto es lo que ocurre al determinar el valor pronóstico de los índices dichos. Por otra parte, es evidente la superioridad del índice SD2, debido a que presenta el menor solapamiento de acuerdo al diagrama de caja que ilustra su comportamiento (Figura 44, a). Por otra parte, la tabla 27 y la figura 45, presentan los resultados el análisis de varianza para las medidas no-lineales relacionadas con los histogramas extraídos directamente desde el gráfico de Poincaré. Es posible notar que las tres medidas tenidas en cuenta son estadísticamente significantes, por lo que son indicadores útiles en la valoración de riesgo o no-riesgo cardiovascular. Esta tendencia se hace evidente con mayores visos en los diagramas de caja correspondientes a

Page 129: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

129

cada indicador, de los cuales, los que retienen la mayoría de la variabilidad son los correspondientes a las medidas relacionadas con los histogramas de los intervalos R-R y de la longitud, donde los datos cuentan con una menor dispersión debido a que la mayoría de los pacientes con riesgo cardiovascular presentan histogramas estrechos, los outliers de la distribución corresponden a las medidas de aquellos individuos cuya forma predominante del gráfico de Poincaré es el abanico (fan) o compleja (complex). Tabla 27. Resultados del análisis de varianza (ANOVA) para las medidas no-lineales relacionadas con los histogramas extraídos desde el gráfico de Poincaré

C Fuente SS df MS F p Grupos 1,99E+04 1 1,99E+04 22,26 8,91E-06Error 7,86E+04 88 8,94E+02 AnHR

Total 9,85E+04 89 Grupos 5,63E+03 1 5,63E+03 7,64 0,007 Error 6,49E+04 88 7,38E+02 AnHW

Total 7,05E+04 89 Grupos 4,41E+04 1 4,41E+04 23,34 5,71E-06Error 1,66E+05 88 1,89E+03 AnHL

Total 2,11E+05 89 Consecuentemente, la figura 46, ilustra el análisis de componentes principales realizado sobre las cinco componentes no-lineales basadas en el gráfico de Poincaré, estas las tres componentes representadas en el plano 3 dimensional retienen un 99.50% de la varianza del conjunto de datos original. En este gráfico se observa el poder discriminativo de las características que según los resultados del análisis de varianza (tabla 26 y tabla 27) son bastante adecuadas en relación con el objetivo inicialmente propuesto, este comportamiento hace que la mayoría de los datos entre categorías se encuentren separados mucho más que los datos intra-categorías. Otro efecto que se puede observar es que los individuos sanos tienden a presentar una variabilidad cardíaca mucho más dispersa dentro del grupo, esto implica una variabilidad intra-grupos dada por las condiciones clínicas de cada paciente, no obstante, dicha variabilidad no es clínicamente relevante y además, dichos datos son considerados al interior de al distribución y no como ourliers para la mayoría de los casos.

Page 130: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

130

Figura 45. Análisis de varianza para medidas basadas en el histograma: (a) de los intervalos R-R; (b) del ancho; (c) de la longitud

N R

20

40

60

80

100

120

140

160

180

200

220

Val

ues

N R

20

40

60

80

100

120

140

Val

ues

N R0

50

100

150V

alue

s

La tabla 28, ilustra el valor pronóstico calculado sobre cada uno de los índices no-lineales tenidos en cuenta y sobre el método de las medidas basadas en el gráfico de Poincaré completo. Es posible notar que el valor pronóstico de los índices no-lineales basados en el gráfico de Poincaré son superiores a los reportados por los métodos estadísticos, espectrales y en un caso dado, multirresolución. La cantidad de falsos positivos y falsos negativos que presentan estos índices es relativamente baja, este hecho es sopesado por la significancia estadística que presenta cada uno de estos. La prueba estadística para determinar el valor pronóstico de cada uno de los índices fue ejecutada en múltiples oportunidades obteniendo resultados similares a los reportados, esto sugiere una separación adecuada de las categorías dada por dichos índices.

Page 131: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

131

Figura 46. PCA realizado a las medidas relacionadas con el gráfico de Poincaré proyectadas en las tres componentes principales para las dos categorías: Pacientes sin riesgo (círculo verde) y pacientes con riesgo (cruz negra)

−100

−50

0

50

100

150

200

250−100

−500 50

100150

−40

−20

0

20

40

3ra

Com

pone

nte

2da Componente

1ra Componente

−100

−50

0

50

100

150

200

250

−100−50

050

100150

−40

−20

0

20

40

3ra

Com

pone

nte

2da Componente

1ra Componente

Tabla 28. Valor pronóstico asociado a las medidas basadas en el gráfico de Poincaré y para la combinación entre estas.

C Se Sp Np Pp Acc AnHR 0,8235 0,4615 0,6667 0,6667 0,6667 AnHW 0,7647 0,4515 0,6000 0,6500 0,6333 AnHL 0,8235 0,6154 0,7273 0,7368 0,7333 SD1 0,2353 0,5385 0,3500 0,4000 0,3667 SD2 0,8235 0,6923 0,7500 0,7778 0,7667 Total 0,9412 0,5385 0,8750 0,7273 0,7667

Page 132: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

132

4.7.2. Análisis de Medidas de Complejidad. Las medidas de complejidad fueron calculadas directamente de las series R-R, con el parámetro r constante e igual a 0.1 veces la desviación estándar de los datos de entrada. La tabla 29, ilustra los resultados del análisis de varianza llevado a cabo sobre estas dos medidas de complejidad, de acuerdo a este, el índice SmEn (entropía muestral) presenta una significancia estadística mayor que el índice ApEn (entropía aproximada), que para el presente ajuste de los parámetros libres de su cálculo, no presente significancia, esto es corroborado por el diagrama de caja correspondiente a estas medidas (figura 47) y por el gráfico de las mismas (figura 48). Consecuentemente, la tabla 30 presenta los valores de p para diferentes valores enteros de m, puede notarse que la significancia estadística del índice ApEn mejora sustancialmente si se varía este parámetro, no obstante, la significancia del índice SmEn disminuye, este efecto, es debido a la cantidad de puntos que se encuentran dentro del radio r para cada uno de los puntos de la serie, en tanto es más complicado encontrar vecinos cercanos para mapas de retorno de dimensión elevada, e. g., cuando esta vale 5 o incluso 4 la tarea de encontrar en registros de duración reducida (5 min.) pares de puntos que cumplan con esta condición sin contar auto-asociaciones (self couplings) que automáticamente llevan a por lo menos una asociación, hace que se produzcan indeterminaciones o saturaciones en los índices. Tabla 29. Resultados del análisis de varianza (ANOVA) para las medidas de complejidad para m=1.

C Fuente SS df MS F p Grupos 3,75E+00 1 3,75E+00 19,24 3,18E-05 Error 1,71E+01 88 1,95E-01 SmEn

Total 2,09E+01 89 Grupos 1,41E+00 1 1,41E+00 2,39 0,1261 Error 5,19E+01 88 5,90E-01 ApEn

Total 5,33E+01 89 Tabla 30. Valores de p para las medidas de complejidad ApEn y SmEn utilizando diferentes valores de m y para un parámetro r constate de 0.1 veces la desviación estándar de los datos de entrada

m p - ApEn p - SmEn 1 0,1261 3,18E-05 2 1.64E-10 0.0002 3 0.9395 6.027E-06 4 1.23E-06 0.5005 5 6.22E-05 0.0190

Page 133: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

133

Figura 47. Análisis de varianza para medidas de complejidad: (a) SmEn; (b) ApEn

N R

1

1.5

2

2.5

3

Val

ues

N R

−1.5

−1

−0.5

0

0.5

1

1.5

2

Val

ues

Figura 48. Gráfico de las medidas de complejidad para las dos categorías: Pacientes sin riesgo (círculo verde) y pacientes con riesgo (cruz negra) para m=1

Page 134: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

134

Adicionalmente en la tabla 31, se presenta el valor pronóstico asociado a los índices ApEn y SmEn. Se determinó de forma heurística que los mejores resultados en la clasificación se obtenían con m=1, m=2 y σ1.0=r de modo que estos fueron utilizados para definir el valor pronóstico de las medidas de complejidad. De igual manera, la figura 49 y la figura 50 ilustran los diagramas de caja resultantes del análisis de varianza realizado sobre las medidas de complejidad variando el parámetro m; como los valores de p ya lo habían evidenciado, la significancia del índice ApEn se torna mayor para algunos de los valores, no obstante, para el índice SmEn la significancia estadística se muestra reducida en la mayoría de los casos, especialmente para el caso en que m=4, este efecto se debe a lo anteriormente explicado sobre estas dos medidas. Tabla 31. Valor pronóstico asociado a las medidas de complejidad SmEn y ApEn y para la combinación entre estas (total) para m=1, m=2 y σ1.0=r

C Se Sp Np Pp Acc SmEn 0,7692 0,8235 0,8235 0,7692 0,80 ApEn 0,2727 0,6842 0,619 0,3333 0,5333

Total 0,7692 1,00 0,85 1,00 0,90

Figura 49. ApEn calculada variando el parámetro m: (a) m=2; (b) m=3; (c) m=4; (d) m=5

N R

−1.2

−1

−0.8

−0.6

−0.4

−0.2

0

Val

ues

N R−2.5

−2

−1.5

−1

−0.5

0

Val

ues

N R

−3.5

−3

−2.5

−2

−1.5

−1

−0.5

0

0.5

1

Val

ues

N R

−1.6

−1.4

−1.2

−1

−0.8

−0.6

−0.4

−0.2

0

Val

ues

Page 135: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

135

Figura 50. SmEn calculada variando el parámetro m: (a) m=2; (b) m=3; (c) m=4; (d) m=5

N R

0

0.5

1

1.5

2

2.5

3

3.5

4

Val

ues

N R

1

1.5

2

2.5

3

3.5

Val

ues

N R

0

0.5

1

1.5

2

2.5

Val

ues

N R

0

0.5

1

1.5

2

2.5

Val

ues

4.8. EVALUACIÓN DEL DESEMPEÑO DE LOS ESQUEMAS DE INTELIGENCIA ARTIFICIAL UTILIZADOS Cada uno de los esquemas de inteligencia artificial utilizados en este trabajo fue evaluado por separado utilizando un total de 53 características extraídas directamente de la señal de variabilidad de la frecuencia cardíaca, i. e., el compendio total de las 7 medidas estadísticas, 6 medidas espectrales, 33 medidas multirresolución (componentes de entropía y energía) y 7 medidas no-lineales. Dado que la alta dimensionalidad es inadecuada en el entrenamiento de los esquemas de inteligencia artificial, además, un porcentaje alto de la variabilidad del modelo puede estar retenido en las características de mayor significancia estadística o más discriminantes, debido a esto dichos esquemas fueron evaluados utilizando análisis de componentes principales (PCA) y kernel-análisis de componentes principales (K-PCA), con estos últimos fueron elegidas las 15 características más importantes en términos de variabilidad del conjunto de datos completos. Tanto PCA como K-PCA han sido ampliamente documentados y están relacionados con la reducción de la dimensionalidad del espacio de entrada, dado que en muchos casos la alta dimensionalidad se torna inadecuada,

Page 136: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

136

adicionalmente, este último está relacionado con un mapeo no-lineal del espacio de entrada con el fin de generar proyecciones de las características en el espacio kernel, su mayor desventaja es que requiere encontrar los vectores propios de una matriz NxN, por lo que es usual que se usen aproximaciones para términos prácticos. Adicionalmente, debido a que el análisis PCA provee proyecciones de las componentes ortogonales, más no las componentes como tal, fue implementado un análisis multivariado de varianza (MANOVA) con el fin de obtener las componentes de mayor significancia utilizando un umbral para p establecido de forma heurística (p < 0.0001). El desempeño de cada uno de los esquemas mencionados se midió utilizando los índices: Sensitividad (Se), especificidad (Sp), valor predictivo positivo (Pp), valor predictivo negativo (Np) y exactitud (Acc) dados en el intervalo [0,1]; estos índices son ilustrados por la ecuación 100 a la ecuación 104, donde Tp corresponde a los verdaderos positivos, Fp a los falsos positivos, Tn a los verdaderos negativos y Fn a los falsos negativos.

FnTpTpSe+

= , (100)

FpTnTnSp+

= , (101)

FpTpTpPp+

= , (102)

FnTnTnNp+

= , (103)

FnTnFpTpFnTpAcc

++++

= , (104)

Además de lo anterior, los algoritmos se evaluaron utilizando la curva ROC (Receiver Operating Characteristic) calculada para cada uno de los métodos mencionados, que pretende graficar la tasa de verdaderos positivos (Sensitividad) contra la tasa de falsos positivos (1 – Especificidad) para diferentes puntos en una prueba de diagnóstico, para calcular la curva hace falta comparar las respuestas deseadas contra las respuestas dadas por el algoritmo en la clasificación. Una curva ROC demuestra diferentes aspectos: Muestra la relación entre la sensitividad y la especificidad en el modelo dado, es una medida del desempeño del modelo teniendo en cuenta la inclinación que presenta la curva, muestra la

Page 137: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

137

exactitud del algoritmo dada por el área bajo la curva, i. e., la probabilidad de que ante una entrada cualquiera la respuesta del algoritmo sea la correcta (Freking, A. et. al., 1999). De acuerdo al área bajo la curva ROC, el algoritmo se dice: [0.9, 1.0] de desempeño excelente, [0.80, 0.90] de desempeño bueno, [0.70, 0.80] de desempeño regular, [0.60, 0.70] de mal desempeño y [0.5, 0.6] de desempeño fallido. Para cada una de las pruebas realizadas se escogieron aleatoriamente los individuos que iban a servir de patrones (un total de 60) y los individuos de prueba (un total de 30). Con los experimentos realizados utilizando el compendio total de características, y como puede ser supuesto, el perceptrón multicapa (MLP) presentó sobreentrenamiento, por lo que el grado de generalización alcanzado no fue adecuado, obteniendo una curva ROC (Receiver Operating Characteristic) con un área de 0.63; un efecto similar presentó la función de base radial (RBF) y el mapa autoorganizado (por esta razón no se presentan los resultados de estos tres métodos utilizando el compendio total de características). Por otra parte, las máquinas de soporte vectorial (SVM) presentaron un desempeño superior con esta condición, esto es evidenciado por la tabla 37 a la tabla 39 y la figura 58 a la figura 60. Para evaluar cada uno de los esquemas de inteligencia artificial fue seguido el método de validación cruzada (cross validation), que en este caso pretende generar los índices para la validación de N observaciones seleccionando aleatoriamente una cantidad determinada de estas para entrenar el esquema de inteligencia artificial y la cantidad restante para probar el resultado del aprendizaje. En la presente aplicación se seleccionó aproximadamente un 66% del conjunto de observaciones total para el entrenamiento y el 33% restante (aproximadamente) se destinó como conjunto de prueba. La máquina de soporte vectorial (SVM) fue evaluada de tres formas: Utilizando una función lineal, utilizando un kernel polinomial de grado 4 y utilizando un kernel RBF con desviación estándar 3 (estos ya habían sido descritos en el capítulo anterior cuando se refirió la técnica del K-PCA). El objetivo principal del uso concreto de una K-SVM, reside en el hecho que las clases no son linealmente separables, esto establece la necesidad de generar un mapeo no-lineal de las entradas desde un espacio N-dimensional a uno M-dimensional donde M > N, donde las clases pueden ser linealmente separables y clasificables utilizando un hiperplano de separación. Matemáticamente, la variación entre una SVM y una K-SVM, se ve evidenciada en la necesidad de expresar las expresiones matemáticas en términos de productos punto entre vectores de características (ecuación 105) y éstos en términos del kernel k evaluado para los patrones de entrada; de esto se pueden obtener las funciones de decisión de forma general (ecuación 106) y el término a maximizar (ecuación 107) sujeto a las restricciones ya discutidas en el

Page 138: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

138

capítulo anterior y un valor de C por defecto equivalente a la unidad. La figura 51 ilustra el desempeño de una K-SVM utilizando diversos kernels. ( ) ( )'', xxxxk ⋅= , (105)

( ) ( ) ⎟⎠

⎞⎜⎝

⎛+⋅= ∑

=

m

iiii bxxkysignxf

1

,α , (106)

( ) ( )ji

m

jijiji

m

ii xxkyyW ,

21

1,1×−= ∑∑

==

αααα , (107)

Figura 51. Desempeño de la máquina de soporte vectorial: (a) Lineal; (b) con kernel polinomial de orden 4; (c) Con kernel RBF de desviación estándar 3

−1.5 −1 −0.5 0 0.5 1 1.5 2 2.5 3 3.5−1

−0.5

0

0.5

1

1.5

2

2.5

3

3.5

0 (training)0 (classified)1 (training)1 (classified)Support Vectors

−1.5 −1 −0.5 0 0.5 1 1.5 2 2.5 3 3.5−1

−0.5

0

0.5

1

1.5

2

2.5

3

3.5

0 (training)0 (classified)1 (training)1 (classified)Support Vectors

−1.5 −1 −0.5 0 0.5 1 1.5 2 2.5 3 3.5−1

−0.5

0

0.5

1

1.5

2

2.5

3

3.5

0 (training)0 (classified)1 (training)1 (classified)Support Vectors

Los resultados de la clasificación de los esquemas de inteligencia artificial utilizando las características elegidas por el análisis multivariado de varianza (MANOVA) se presentan en la tabla 32 a la tabla 37. Puede notarse que el

Page 139: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

139

desempeño del perceptrón multicapa es superior a los demás esquemas utilizados, esto también se evidencia en la curva ROC (figura 52) producto de la clasificación del conjunto de datos de prueba, asimismo, la curva ROC de la función de base radial teniendo en cuenta estos criterios es ilustrada por la figura 53. Tabla 32. Valor pronóstico asociado los índices de variabilidad de la frecuencia cardíaca seleccionados por MANOVA utilizando el Perceptrón Multicapa (MLP) con funciones de transferencia tangente sigmoidal - sigmoidal

Se Sp Np Pp Acc Conjunto de Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000

Conjunto de Prueba 0.9333 1.0000 0.9375 1.0000 0.9667 Tabla 33. Valor pronóstico asociado los índices de variabilidad de la frecuencia cardíaca seleccionados por MANOVA utilizando el Perceptrón Multicapa (MLP) con funciones de transferencia sigmoidal - lineal

Se Sp Np Pp Acc Conjunto de Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000

Conjunto de Prueba 0.7879 0.6667 0.7586 0.7027 0.7400 Tabla 34. Valor pronóstico asociado a los índices de variabilidad de la frecuencia cardíaca seleccionados por MANOVA utilizando una red RBF

Se Sp Np Pp Acc Conjunto de Entrenamiento 0.9667 1.0000 0.9677 1.0000 0.9833

Conjunto de Prueba 0.8571 0.9333 0.8750 0.9231 0.8966 Tabla 35. Valor pronóstico asociado a los índices de variabilidad de la frecuencia cardíaca seleccionados por MANOVA utilizando una SVM lineal

Se Sp Np Pp Acc Conjunto de Entrenamiento 0.7188 0.7500 0.7000 0.7667 0.7333

Conjunto de Prueba 0.7273 0.7273 0.7273 0.7273 0.7273 Tabla 36. Valor pronóstico asociado a los índices de variabilidad de la frecuencia cardíaca seleccionados por MANOVA utilizando una K-SVM con kernel polinomial de grado 4

Se Sp Np Pp Acc Conjunto de Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000

Conjunto de Prueba 0.8409 0.7045 0.8158 0.7400 0.8000

Page 140: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

140

Tabla 37. Valor pronóstico asociado a los índices de variabilidad de la frecuencia cardíaca seleccionados por MANOVA utilizando una K-SVM con kernel RBF de desviación estándar 3

Se Sp Np Pp Acc Conjunto de Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000

Conjunto de Prueba 0.7424 0.7879 0.7536 0.7778 0.7652 El desempeño de las SVM utilizadas con el total de características tenidas en cuenta en este estudio. Los resultados muestran un aumento sustancial en el número de individuos clasificados correctamente dentro del grupo de prueba, dichos resultados se registran en la tabla 38 a la tabla 40 y en la figura 54 a la figura 56; nótese que el área bajo las curvas ROC correspondientes a las tres máquinas de soporte vectorial se encuentra en el rango [0.8, 0.9]. También puede observarse la tendencia, en contraposición a los resultados anteriores, la SVM lineal presenta un mejor desempeño que las K-SVM usando kernel polinomial y tipo RBF, respectivamente. Figura 52. Curva ROC del Perceptrón Multicapa (MLP) obtenida de la clasificación del conjunto de datos de prueba. El área bajo la curva es de 0.9822

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

FP

TP

Page 141: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

141

Figura 53. Curva ROC de la red RBF obtenida de la clasificación del conjunto de datos de prueba. El área bajo la curva es de 0.8800

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

FP

TP

Tabla 38. Valor pronóstico asociado a todos los índices de variabilidad de la frecuencia cardíaca tenidos en cuenta en este estudio utilizando una SVM lineal

Se Sp Np Pp Acc Conjunto de

Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000Conjunto de Prueba 0.8636 0.9091 0.8696 0.9048 0.8864

Tabla 39. Valor pronóstico asociado a todos los índices de variabilidad de la frecuencia cardíaca tenidos en cuenta en este estudio utilizando una K-SVM con kernel polinomial de grado 4

Se Sp Np Pp Acc Conjunto de

Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000Conjunto de Prueba 0.7955 0.8636 0.8537 0.8085 0.8295

Tabla 40. Valor pronóstico asociado a todos los índices de variabilidad de la frecuencia cardíaca tenidos en cuenta en este estudio utilizando una K-SVM con kernel RBF de desviación estándar 3

Se Sp Np Pp Acc Conjunto de

Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000Conjunto de Prueba 0.7727 0.8788 0.8644 0.7945 0.8258

Page 142: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

142

Figura 54. Curva ROC del desempeño de la SVM lineal. El área bajo la curva es de 0.8926

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

FP

TP

Figura 55. Curva ROC del desempeño de la SVM con kernel polinomial grado 4. El área bajo la curva es de 0.8140

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

FP

TP

Page 143: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

143

Figura 56. Curva ROC del desempeño de la SVM con kernel RBF con desviación estándar 3. El área bajo la curva es de 0.8595

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

FP

TP

En adición a lo anterior, cada uno de los esquemas de inteligencia artificial fue probado utilizando las técnicas de reducción de dimensionalidad PCA y K-PCA, eligiendo las 15 componentes que explican el mayor porcentaje de variabilidad dentro del conjunto de datos (para las 15 características, un total de 94% de la varianza del conjunto de datos explicada). Los resultados de lo anterior se resumen en la tabla 41 a la tabla 45, según estos resultados, la proyección de las componentes utilizando PCA produce resultados más precisos que la proyección dada por K-PCA excepto para el perceptrón multicapa. Para la mayoría de los esquemas a excepción de la RBF las áreas bajo la curva ROC se encuentra en el intervalo [0.8, 0.9] o [0.9, 1.0], como fue el caso de la SVM con kernel polinomial de grado 4 utilizando PCA.

Tabla 41. Valor pronóstico asociado a los diez mejores índices (en términos de la variabilidad que explican) de variabilidad de la frecuencia cardíaca extraídos con PCA y K-PCA utilizando el Perceptrón Multicapa (MLP). El kernel utilizado fue de tipo RBF (gaussiano) con desviación estándar 4. Las áreas de las curvas ROC fueron 0.7111 y 0.8444

Se Sp Np Pp Acc Conjunto de

Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000 PCA Conjunto de Prueba 0.7333 0.7333 0.7333 0.7333 0.7333

Conjunto de Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000

K-PCA Conjunto de Prueba 0.8000 0.8000 0.8000 0.8000 0.8000

Page 144: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

144

Tabla 42. Valor pronóstico asociado a los diez mejores índices (en términos de la variabilidad que explican) de variabilidad de la frecuencia cardíaca extraídos con PCA y K-PCA utilizando una red RBF. El kernel utilizado fue de tipo RBF (gaussiano) con desviación estándar 4. Las áreas de las curvas ROC fueron 0.7822 y 0.7467

Se Sp Np Pp Acc Conjunto de

Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000 PCA Conjunto de Prueba 0.1333 1.0000 0.5357 1.0000 0.5667

Conjunto de Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000

K-PCA Conjunto de Prueba 0.0667 1.0000 0.5172 1.0000 0.5333 Tabla 43. Valor pronóstico asociado a los diez mejores índices (en términos de la variabilidad que explican) de variabilidad de la frecuencia cardíaca extraídos con PCA y K-PCA utilizando una SVM lineal. El kernel utilizado fue de tipo RBF (gaussiano) con desviación estándar 4. Las áreas de las curvas ROC fueron 0.9100 y 0.7128

Se Sp Np Pp Acc Conjunto de

Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000 PCA Conjunto de Prueba 0.7273 1.0000 0.7857 1.0000 0.8636

Conjunto de Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000

K-PCA Conjunto de Prueba 0.7273 0.7273 0.7273 0.7273 0.7273

Tabla 44. Valor pronóstico asociado a los diez mejores índices (en términos de la variabilidad que explican) de variabilidad de la frecuencia cardíaca extraídos con PCA y K-PCA utilizando una SVM con kernel polinomial grado 4. El kernel utilizado fue de tipo RBF (gaussiano) con desviación estándar 4. Las áreas de las curvas ROC fueron 0.8000 y 0.7583

Se Sp Np Pp Acc Conjunto de

Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000 PCA Conjunto de Prueba 0.7045 1.0000 0.7719 1.0000 0.8523

Conjunto de Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000

K-PCA Conjunto de Prueba 0.7045 0.8182 0.7347 0.7949 0.7614

Page 145: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

145

Tabla 45. Valor pronóstico asociado a los diez mejores índices (en términos de la variabilidad que explican) de variabilidad de la frecuencia cardíaca extraídos con PCA y K-PCA utilizando una SVM con kernel RBF con desviación estándar 3. El kernel utilizado fue de tipo RBF (gaussiano) con desviación estándar 4. Las áreas de las curvas ROC fueron 0.8700 y 0.7583

Se Sp Np Pp Acc Conjunto de

Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000 PCA Conjunto de Prueba 0.7273 1.0000 0.7857 1.0000 0.8636

Conjunto de Entrenamiento 1.0000 1.0000 1.0000 1.0000 1.0000

K-PCA Conjunto de Prueba 0.6970 0.8182 0.7297 0.7931 0.7576 4.9. DESCRIPCIÓN DEL PROGRAMA (APLICACIÓN FINAL) El programa está desarrollado en MatLabTM ver. 7.6.0. El programa fue migrado a una aplicación de lenguaje C utilizando el compilador de MatLab (Matlab Compiler) y el compilador Borland C-Builder. El programa calcula, además de las medidas clásicas para evaluar la VFC (medidas en el dominio del tiempo y la frecuencia), las medidas multirresolución (entropía y energía) y no-lineales (basadas en el gráfico de Poincaré, entropía aproximada y entropía muestral). Las medidas reportadas por el programa se resumen en la tabla 46. El programa desarrollado opera con una interfaz gráfica de usuario que consiste de una sola ventana principal. Esta se encuentra dividida en tres segmentos: el primero, para la visualización de los datos de entrada, el segundo, donde se encuentran los parámetros para la inicialización de los algoritmos y finalmente un módulo de visualización destinado a la ilustración de resultados para análisis por parte del especialista. La Interfaz de usuario de la aplicación generada es ilustrada en la figura 57. Hay dos menús de usuario (Archivo y Ayuda) y adicionalmente dos barras de herramientas (una para manipulación de la interfaz y una adicional de ayuda, abrir y salir). El menú archivo incluye los comandos básicos de Abrir y Salir. El módulo de visualización de resultados es para observar los parámetros calculados, espectros, histogramas y mapas de retorno, este contiene seis botones, de donde se pueden escoger las diferentes modalidades de análisis (estadístico, espectral, multirresolución y no-lineal), además de todo lo anterior, el botón de pronóstico entrega una valoración automática de riesgo del paciente que está siendo objeto de análisis.

Page 146: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

146

Figura 57. Interfaz de usuario del programa para análisis de la VFC

Tabla 46. Características mostradas por el programa de análisis de variabilidad de la frecuencia cardíaca Variable Unds Descripción Media ms Media de los intervalos R-R SDNN ms Desviación estándar de la serie R-R r-MSSD ms Raíz cuadrada de la suma de las diferencias

al cuadrado entre intervalos adyacentes pNN50 % Proporción de latidos adyacentes cuya

diferencia es mayor que 50 ms MIRR ms Margen intercuartil de la serie R-R MDARR ms Mediana de las diferencias absolutas entre

Page 147: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

147

intervalos R-R adyacentes SDSD ms Desviación estándar de las diferencias entre

intervalos R-R adyacentes PVLF ms2 Potencia de la banda espectral VLF PLF ms2 Potencia de la banda espectral LF PHF ms2 Potencia de la banda espectral HF Relación % Relación entre las potencias de la bandas LF

y HF NLF - Potencia normalizada de LF NHF - Potencia normalizada de HF Pico de frecuencia (visualización)

Hz Pico de frecuencia para cada una de las bandas de interés dadas por el usuario

Etotal - Energía wavelet sobre todas las escalas de análisis

S - Entropía wavelet sobre todas las escalas de análisis

SD1 ms Desviación estándar 1 del mapa de retorno SD2 ms Desviación estándar 2 del mapa de retorno AnHR - Ancho del histograma de los intervalos R-R AnHL - Ancho del histograma de la longitud AnHW - Ancho del histograma del ancho SHR (visualización) - Coeficiente de asimetría del histograma de

los intervalos R-R SHL (visualización) - Coeficiente de asimetría del histograma de la

longitud SHW (visualización) - Coeficiente de asimetría del histograma del

ancho ApEn - Entropía aproximada SmEn - Entropía muestral De acuerdo a la tabla 45, las variables que sirven únicamente para la visualización (que no entran en el esquema de clasificación dado a partir de la red neuronal) son: Los picos de frecuencia de las bandas de análisis espectral y los coeficientes de asimetría de los histogramas de los intervalos R-R, del ancho y de la longitud. 4.9.1. Formato de los Datos de Entrada. Para lograr el resultado deseado en la carga y procesamiento de los datos de entrada, el formato en que deben ser cargados es *.mat, dicho archivo debe tener las siguientes propiedades: Una primera columna que contenga el eje de tiempo de la serie de electrocardiográfica, una segunda columna con el registro de la actividad respiratoria del individuo y una tercera con la serie electrocardiográfica propiamente dicha.

Page 148: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

148

4.9.2. Opciones de Análisis. Dentro de las opciones de análisis de la aplicación se presentan: 4.9.2.1. Análisis Estadístico. El análisis estadístico, donde se muestra cada uno de los índices de variabilidad de la frecuencia cardíaca en el dominio del tiempo, expuestos y explicados en este documento. 4.9.2.2. Análisis en el Dominio de la Frecuencia. El análisis espectral, donde se muestra tanto el periodograma de Welch como el espectro AR y los índices VLF, LF, HF, LF/HF, NLF, NHF y además los picos frecuenciales más altos por cada una de las bandas de interés en Hertz, dichas bandas de interés pueden ser modificadas por el usuario y utilizan los rangos por defecto expuestos en el capítulo 3 de este documento. El algoritmo implementa una interpolación cúbica sobre la serie R-R a un valor por defecto de 2 Hz y un detrending factor (o factor de eliminación de la tendencia de los datos de VFC) por defecto de 100 utilizando un algoritmo basado en la aproximación desarrollada por Tarvainen, M. P. et al., 2002. 4.9.2.3. Análisis Multirresolución. El análisis multirresolución, donde se muestra la descomposición de la señal de VFC en múltiples escalas utilizando la transformada wavelet packet dependiendo del parámetro libre m (profundidad de la transformada) y adicionalmente los valores de entropía y energía asociados a cada uno de los coeficientes, tanto de aproximación como de detalle, según la elección del usuario. El tipo de wavelet es un parámetro no seleccionable por el usuario, siempre se utiliza la wavelet db4 para la descomposición. 4.9.2.4. Análisis No-lineal. El análisis no-lineal, donde se da al usuario la opción de reconstruir la dinámica del atractor de la VFC para un orden del gráfico 1=τ y visualizar el ajuste de la elipse sobre el mapa de retorno generado bajo estas condiciones. Asimismo, se entregan los tres histogramas: de los intervalos R-R, del ancho y de la longitud y algunas propiedades de estos como el ancho de la distribución, asimetrías etc. 4.9.3. Pronóstico de Riesgo Cardiovascular. La aplicación entrega la valoración de riesgo cardiovascular utilizando una red neuronal artificial previamente entrenada con patrones de entrada de dos clases: Pacientes sin riesgo cardiovascular y pacientes con riesgo cardiovascular; de esta manera, cada una de las características extraídas del registro de entrada, se muestran a la red neuronal entrenada y de esta se obtiene una salida según la cual se determina el riesgo o no-riesgo presente en paciente.

Page 149: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

149

4.9.4. Funcionamiento General del Algoritmo. El funcionamiento general del algoritmo es ilustrado por la figura 58.

Figura 58. Flujograma de la aplicación final

Page 150: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

150

5. CONCLUSIONES 5.1. MEDICIÓN DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA Con la lectura de este documento se puede comprobar que la medición de la variabilidad de la frecuencia cardíaca resulta ser un método bastante asequible en términos de lo sencillo que puede resultar y que además, cuenta con un valor pronóstico potencial de riesgo elevado. Asimismo, aunque los métodos de análisis reproducidos en este trabajo permiten dar una estimación general de características intrínsecas de la serie experimental de VFC, la estimación de dichos parámetros se ve afectada de manera directa por las condiciones de toma de los registros, e. g., los estímulos provenientes del exterior respecto al paciente en estudio, la hora de toma de los datos, labores efectuadas por el paciente antes de la toma del registro, la frecuencia respiratoria del paciente en la toma de datos etc.; por esta razón, la implementación de protocolos para la realización de mediciones es un elemento relevante en la toma de cualquier biopotencial. Un punto importante a destacar es la importancia de la arritmia sino-respiratoria como un fenómeno que describe la influencia de la respiración sobre la variabilidad de la frecuencia cardíaca como producto de regulaciones del sistema nervioso autónomo (SNA, ANS), y su efecto sobre los registros realizados y la dinámica de la VFC en sí misma, con base en lo cual se debe garantizar un patrón de frecuencia respiratoria estable para el conjunto de todos los pacientes de la muestra con fines de realizar comparaciones tanto al interior de una misma clase como entre clases de pacientes. Asimismo, se ha estudiado el efecto que producen los outliers sobre la distribución de intervalos R-R en la sobreestimación o subestimación de parámetros estadísticos, espectrales y no-lineales, así como algunos métodos desde la estadística para removerlos automáticamente de una serie experimental dada. Se mostró también que algunas veces los métodos para remover outliers no son compatibles con determinados tipos de distribuciones, por lo que su desempeño se aprecia deficiente. En general, la inclusión de los outliers en las series R-R, hubiese llevado a un gran número de falsos positivos y falsos negativos dada la sobreestimación de los parámetros referidos anteriormente, además, al verse afectados los histogramas, la probabilidad de ocurrencia de los eventos cambiará por tanto, la probabilidad conjunta de todos los eventos, esto entregaría valores erróneos de entropía y energía y también valores erróneos sobre las medidas de complejidad estudiadas en este trabajo. Se evaluaron diversas escalas wavelet para la extracción de características de la señal electrocardiográfica y la subestimación o sobreestimación sobre la señal de VFC que producen los cambios de resolución en la señal electrocardiográfica, con esto se determinó que cada una de las escalas utilizadas funciona de una forma

Page 151: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

151

adecuada y que los cambios en resolución afectan en muy poca medida la estimación de diferentes índices extraídos de la señal de la VFC. Asimismo, se determinó que la escala ideal para la descomposición es 42 a una frecuencia de muestreo de 200 kHz y utilizando la wavelet Haar, pues además de que es una escala que presenta una resolución adecuada, la tasa de falsos positivos en la detección de los picos R de la señal de ECG es muy baja o nula. 5.2. MÉTODOS ESTADÍSTICOS O EN EL DOMINIO DEL TIEMPO En general, los métodos estadísticos, aunque representan una relativa facilidad de interpretación, presentan un valor pronóstico bajo. Se estudiaron las propiedades de ayuda al pronóstico de cada uno de los índices y se midió estadísticamente. Asimismo, se determinó cuales de los índices eran los más adecuados para hacer una valoración de riesgo cardiovascular. Específicamente los índices MIRR, pNN50, SDSD y SDNN, presentaron mejor desempeño que todos los demás considerados en este estudio. De igual manera se estudió acerca de cuales de los índices son más inmunes a artefactos presentes en la serie R-R, dentro de los cuales el MIRR se encontró bastante robusto, así como el pNN50, éste último índice presenta problemas de saturación para bajas y altas variabilidades de la frecuencia cardíaca latido a latido. Otros índices como el MDARR, son de gran utilidad cuando se desea conocer el nivel de excitación vagal de los individuos en estudio. 5.3. MÉTODOS ESPECTRALES O EN EL DOMINIO DE LA FRECUENCIA Se han visto las ventajas y limitaciones que representan los métodos espectrales. De acuerdo con la literatura consultada, los métodos autorregresivos deberían llevar a mejores resultados, dada la naturaleza de la señal de variabilidad del ritmo cardíaco, no obstante, el periodograma de Welch resultó ostentar un mejor desempeño respecto al pronóstico de riesgo cardiovascular. Por otra parte, se determinaron los parámetros libres de cada modelo que presentaban el mejor desempeño, tales como el orden del modelo autorregresivo, el solapamiento en el cálculo del periodograma de Welch etc. Se determinó el por qué los métodos espectrales no presentan un valor pronóstico elevado dada la estacionariedad y la linealidad de los mismos, un hecho importante que apoya esta tesis es que estadísticamente, muchos de los índices espectrales resultaban ser poco significantes, y aquellos que presentaban alguna significancia pasaban el umbral por muy poco.

Page 152: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

152

5.4. MÉTODOS MULTIRRESOLUCIÓN En el documento se discutió sobre dos métodos multirresolución sobre la base de la transformada wavelet: La transformada wavelet convencional y la transformada wavelet packet. Los resultados de las estimaciones temporo-frecuenciales realizadas sobre las señales de VFC fueron concluyentes, y según lo mostrado por los diferentes análisis estadísticos realizados, de la transformada wavelet packet se obtienen las mejores características de la señal (respecto a significancia estadística), esto no solo fue evidenciado en los análisis de varianza (ANOVA) sino también en los análisis de componentes principales (PCA) y el la prueba para definir el valor pronóstico del método como tal. En este documento se discutió que un punto importante es calcular la mejor base para la descomposición wavelet utilizando algoritmos presentes en la literatura, no obstante, para este trabajo, dicha base fue determinada de manera heurística, acordando a la significancia estadística de las características extraídas a partir de los diferentes conjuntos de coeficientes producto de la descomposición. Asimismo, se determinó un conjunto de 33 características de entropía y energía wavelet provenientes del cálculo de la transformada wavelet packet contra un conjunto de solo 3 características calculadas utilizando la transformada wavelet convencional a una misma profundidad de la transformada; esto mostró que la información relevante que se puede obtener utilizando la transformada wavelet packet es mayor y estadísticamente más relevante; como consecuencia de esto, el valor pronóstico asociado a las características dadas utilizando la transformada wavelet packet fue más elevado. 5.5. MÉTODOS NO-LINEALES Los métodos no-lineales resultaron ser los más robustos en lo que se refiere a valor pronóstico, especialmente, las medidas de complejidad de entropía aproximada (ApEn) y entropía muestral (SmEn) y las medias asociadas a los histogramas de los intervalos R-R, del ancho y de la longitud resultantes del mapa de retorno. Por otra parte, los índices SD1 y SD2, resultaron no ser estadísticamente significantes, por ello, deben evaluarse otro tipo de técnicas con el mapa de retorno, tales como los mapas de retorno tridimensionales y la extracción de características variantes a la escala a partir de estos. Otro punto importante, reside en el hecho de producir características estadísticamente significantes; según los análisis realizados, los métodos lineales son inadecuados para evaluar la variabilidad de la frecuencia cardíaca, esta necesidad al parecer es solventada por los métodos no-lineales, aunque algunos de los métodos no-lineales conocidos no fueron abarcados por este documento.

Page 153: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

153

Algunos de los procedimientos utilizados para calcular las medidas no-lineales son comúnmente implementadas para hallar aquellas que tienen que ver con dinámica caótica, como es el caso del cálculo del espectro de Lyapunov, donde se hace uso de un mapa de retorno equivalente a la reconstrucción de la dinámica del atractor del sistema que se está evaluando. Dado que la serie temporal de variabilidad de la frecuencia cardíaca es la respuesta de un sistema dinámico altamente no-lineal y altamente sensitivo a las condiciones iniciales, su mapa de retorno resulta ser la reconstrucción de su dinámica. Al calcular el espectro de Lyapunov, según la literatura, se obtienen exponentes positivos, esto parece confirmar el comportamiento caótico de la dinámica de regulación cardiovascular. 5.6. ESQUEMAS DE INTELIGENCIA ARTIFICIAL Y ANÁLISIS DE PATRONES Dentro de los esquemas de inteligencia artificial utilizados en este trabajo, el perceptrón multicapa (MLP) presentó el mejor desempeño respecto a todos los demás esquemas en todas las modalidades de selección de características (MANOVA, PCA y K-PCA), esto se debe a la gran capacidad de generalización del MLP en diversos problemas de clasificación. Las máquinas de soporte vectorial (SVM) presentaron un desempeño superior sobre el esquema restante (función de base radial, RBF) y en algunos casos puntuales (PCA, K-PCA), un desempeño superior al mostrado por el MLP. El área bajo cada una de las curvas ROC extraídas de cada uno de los registros de variabilidad de la frecuencia cardíaca muestra dos hechos importantes: Como primera medida, que las características elegidas para la implementación de los esquemas de inteligencia artificial resultan ser muy adecuadas para el pronóstico de riesgo cardiovascular; y como segunda medida, que en orden a llegar a desempeños más altos que los presentados es necesaria la consideración de algunos otros métodos, entre estos se encuentran otras medidas derivadas de la dinámica no-lineal de la VFC subyacentes a la teoría de caos (exponentes de Lyapunov, específicamente) y fractales (cálculo de la dimensión fractal, exponente de Hurst). Dichos temas constituyen una perspectiva futura a la realización del presente trabajo. De igual forma, existen algunos otros esquemas de inteligencia artificial que no fueron incluidos en este trabajo, tal es el caso de los algoritmos difusos o neuro-difusos y dentro del marco de las redes neuronales algunos otros métodos conocidos como los mapas autoorganizados (SOFM) (Kohonen, T., 1982), Growing Neural Gas (GNG) (Holmström, J., 2002), redes bayesianas, redes probabilísticas. Estos esquemas pueden ser estudiados en etapas siguientes a la realización de este trabajo.

Page 154: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

154

6. RECOMENDACIONES

6.1. SOBRE LA TOMA DE REGISTROS ELECTROCARDIOGRÁFICOS Además de las recomendaciones dadas en el protocolo, se recomienda generar un ambiente cómodo para los pacientes durante la adquisición de las señales, e. g., la disposición de los latiguillos para la toma del registro, las condiciones y la locación de la camilla, el ruido exterior o el método utilizado para producir una estabilización de los signos vitales del paciente. 6.2. DE LOS MÉTODOS DE TOMA DE LA SEÑAL DE LA FRECUENCIA RESPIRATORIA Se debe recordar que el método utilizado no es el único existente. La medición de frecuencia respiratoria por bioimpedancia con frecuencia entrega mejores resultados que la implementación de sensores piezoelectricos, en los que se debe contar con el posible error humano en el posicionamiento de la banda respiratoria sobre el tórax del paciente (véase Anexo A). 6.3. SOBRE EL USO DE ESQUEMAS DE INTELIGENCIA ARTIFICIAL Y ANÁLISIS DE PATRONES Es importante tener en cuenta que antes de construir el conjunto total de los patrones para entrenar una red neuronal artificial, es necesario llevar a cabo una adecuada selección de las características utilizando o bien, métodos que transformen el espacio de entrada y reduzcan la dimensionalidad o métodos estadísticos multivariados para la selección de las mejores características del modelo implementado.

Page 155: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

Anexo A. Procedimiento de Prueba: Medición de Variabilidad de la Frecuencia Cardíaca Integrando la Señal de la Frecuencia Respiratoria

Recomendaciones Preliminares. Con el fin de que las pruebas sean lo menos afectadas por estímulos externos, se deben tomar las siguientes medidas:

• No haber ingerido alimentos, por lo menos, durante 2 horas previas a la prueba.

• No haber ingerido bebidas estimulantes (con cafeína, guaraná, etc.) ni sustancias psicoactivas el día que se va a realizar la prueba.

• No haber realizado actividad física intensa el día que se va a realizar la prueba.

• No haber fumado cigarrillo, por lo menos, durante 2 horas previas a la prueba.

1. EQUIPO REQUERIDO Computador con software Chart Ver. 5.0 o mayor. PowerLab (con bioamplificador) referencia ML865 (ADInstruments) Cable aislado de cinco derivaciones para el bioamplificador y latiguillos (Cable paciente) Tres electrodos adhesivos desechables o electrodos tipo placa. Gel para electrodos Banda para registro de actividad respiratoria ref. MLT1132/D Monitor multiparámetro Space Lab 90309 Camilla Metro 2. PROCEDIMIENTO PARA LA PRUEBA 2.1. PREPARACIÓN Y POSICIONAMIENTO DEL PACIENTE PARA LAS PRUEBAS

El cuarto donde serán realizadas las mediciones debe de ser un ambiente libre de ruidos, debe de ser confortable y una temperatura adecuada (no superior a los 25ºC y no inferior a los 18ºC)

Objetos como camisetas/camisas que cubran totalmente el torso, así como cadenas, relojes u objetos diferentes a los equipos de medición deben ser removidos del paciente (especialmente de brazos y tobillos) con el fin de generar los registros de la manera más fácil posible para el especialista. A continuación el paciente debe permanecer en posición supina durante un periodo aproximado de

155

Page 156: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

diez (10) minutos sobre la camilla en la que se realizarán las mediciones para que estas sean lo menos afectadas posible por estímulos foráneos. Una vez logrado esto, se proceden a realizar las mediciones en de los puntos (2.2 y 2.3). 2.2. MEDICIÓN DE PRESIÓN SANGUÍNEA La presión sanguínea está implicada en cualquier situación que requiera la evaluación del sistema cardiovascular y es, de hecho, uno de los factores que afecta la variabilidad del ritmo cardíaco El equipamiento esencial para la medición de presión incluye un estetoscopio y un espigmomanómetro. Para este caso será utilizado un Monitor multípara metro Spacelabs 90309 que cuenta con un modulo para la toma de presión no invasiva (NIBP). Antes de usar el equipo se recomienda realizar un test de prueba para garantizar las condiciones óptimas del sistema. 2.2.1. Posicionamiento del Paciente. El correcto posicionamiento del paciente es esencial para una medida exacta de la presión. La espalda del paciente y las piernas deben estar apoyadas y descruzadas, los pies deben descansar sobre una superficie firme, e. g., el suelo. Por otra parte, el brazo sobre el que se realizará la medición debe estar sin ropa hasta el hombro. Si para esta parte de la prueba el paciente cuenta con ropa en el torso por razones personales, es necesario que la prenda de vestir tenga mangas holgadas o no tenga mangas para generar la menor interferencia posible en el flujo de la sangre o respecto al posicionamiento del brazalete. El brazo debe estar soportado y al nivel del corazón. El monitor debe estar posicionado hacia el frente del paciente y el especialista encargado de realizar la medición. 2.2.2 Medición del Brazo. Para que el brazalete no resulte subestimando o sobreestimando la medida de la presión sanguínea, la selección de una talla adecuada requiere la evaluación de la circunferencia del brazo del paciente en el punto medio de la parte superior del brazo. La mitad de la distancia entre el acromion y el olécranon determina el punto medio del brazo (Figura 1).

156

Page 157: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

Figura 1. Medición de la distancia entre el acromion y el olécranon

Fuente: WILLIAMS, J. S., BROWN, S. M. and CONLIN, P. R. Blood-pressure Measurement. In: N Engl J Med. Vol. 360, 2009; p. e6.

2.2.3 Posicionamiento y Ajuste del Brazalete. Usualmente, los brazaletes están marcados con indicadores perpendiculares y paralelos en forma de línea (línea de índice y línea de rango) para facilitar su ajuste. Una vez que el brazalete ha sido puesto alrededor del brazo, la línea de índice (perpendicular a la longitud del brazalete) debe caer dentro de los límites de la línea de rango y el punto medio del bladder (usualmente indicado por el fabricante) debe estar sobre la arteria braquial. Finalmente el brazalete debe quedar ajustado, pero debe quedar un espacio de dos dedos bajo el mismo (Figura 2). Figura 2. Posicionamiento y ajuste del brazalete

Fuente: WILLIAMS, J. S., BROWN, S. M. and CONLIN, P. R. Blood-pressure Measurement. In: N Engl J Med. Vol. 360, 2009; p. e6. 2.3. REGISTRO DE ELECTROCARDIOGRAFÍA Y RESPIRACIÓN Lo primero que debe hacer es conectar el cable de paciente en el espacio requerido (bioamplificador, entradas 3 y 4), a continuación conecte las derivaciones de tierra, canal 1 negativo y canal 1 positivo en el cable de paciente (figura 3). Es conveniente que las zonas donde van a ser puestos los electrodos sean limpiadas adecuadamente y posteriormente aplicarse gel.

157

Page 158: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

Si los registros van a realizarse utilizando electrodos tipo pinza (placa), se debe aplicar crema para electrodos en una cantidad pequeña, una vez que se ha hecho esto, se procede a conectar los electrodos a la derivación (figura 3); por el contrario, si los electrodos son desechables estos deben ser adheridos al paciente y a continuación conectados a la derivación (figura 3). La banda para la medición de la frecuencia respiratoria MLT1132/D debe ser conectada en el canal 1 ó 2 (input 1 / Input 2) del PowerLab (Figura 3) a fin de adquirir la señal, una vez realizado esto, se debe proceder a ponerla alrededor del paciente como se explica más adelante (2.3.3). Antes de dar inicio a la toma del registro se debe comprobar el correcto funcionamiento del equipo y su respectivo software. Figura 3. Configuración del equipo para la toma del registro de ECG

2.3.1 Posicionamiento de los Electrodos. Sitúe el electrodo positivo sobre la muñeca izquierda y el negativo sobre la muñeca derecha y el electrodo de referencia sobre la pierna izquierda (figura 2). Si hasta este punto la señal no es la adecuada para los propósitos de la prueba, debe revisar lo que se ha dicho anteriormente en este protocolo. 2.3.2 Posicionamiento de la Banda de Respiración. La banda de respiración contiene un sensor situado entre dos fibras elásticas que al estirarse producen una tensión en el piezo-sensor, que genera un voltaje. Cuando no se establece tensión o cambios en la longitud, como en periodos de no respiración, la señal retorna a cero. La banda piezoeléctrica debe estar puesta alrededor del cuerpo al nivel de la máxima expansión producida por la respiración, i. e., la región que se encuentra

158

Page 159: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

bajo las areolas en el pecho (en posición supina); el sensor debe estar situado en el punto medio del pecho. La extensión de velcro permite el ajuste de la talla de cada paciente, en la máxima inspiración la banda debe estar estirada casi hasta su máxima extensión, pues esto permite registrar los cambios respiratorios con un máximo de sensitividad y linealidad; debe haber un espacio de cuatro dedos bajo la misma. 2.3.3 Software Chart ver. 5.0 (recomendaciones y modo de uso). Inicie el software Chart de la manera habitual. En tanto no se tenga el archivo con la configuración de canales adecuada, un nuevo archivo debe ser creado para una nueva configuración de canales o uno prediseñado debe ser abierto para ser modificado. Una vez haya realizado una de estas dos actividades, vaya al menú de configuración y a continuación elija la opción de Configuración de Canales, en dicho menú aparecerán las entradas del equipo (Figura 4), mantenga la configuración por defecto si lo desea. Observe los rangos de voltaje de los canales y configúrenlos según la sensibilidad de los sensores (banda piezoeléctrica, rango de 10 mV; señal de ECG, rango de 1 mV) con los que va a realizar las medidas. Si desea obtener una señal poco ruidosa, en el cuadro de diálogo de configuración de entrada de voltaje configure un filtro de banda de paso (0.3-20 Hz, u otro según su criterio), véase figura 5. Compruebe que aquello que configuró tuvo el efecto deseado en la adquisición, de lo contrario, vuelva a configurar el experimento. Figura 4. Distribución de canales y entradas (software)

159

Page 160: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

Figura 5. Configuración de entradas (software).

160

Page 161: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

Anexo B. Formulario de consentimiento informado FORMULARIO DE CONSENTIMIENTO INFORMADO

TÍTULO: Análisis de la variabilidad de la frecuencia cardíaca integrando la señal de la frecuencia respiratoria. INVESTIGADORES: Juan Felipe Ramírez Villegas, Eric Lam Espinosa DIRECCIÓN: Laboratorio de Biomecánica, Departamento de Automática y Electrónica, Facultad de Ingenierías, Universidad Autónoma de Occidente, Cali-Valle.

INTRODUCCIÓN Los investigadores que conducen esta investigación han determinado que Ud. reúne los requisitos principales para participar en el estudio. La siguiente información describe el estudio y su función como participante en el estudio. El médico o un miembro del personal explicará los procedimientos y contestará cualquier pregunta que tenga acerca de este Formulario de Consentimiento Informado y / o del estudio. Por favor, lea detenidamente este documento y no dude en consultar al investigador sobre cualquier pregunta que tenga acerca del estudio y/o la información provista a continuación. No pueden asegurarse ni garantizarse los resultados del estudio.

OBJETIVO DEL ESTUDIO En este estudio se analizará la variabilidad de la frecuencia cardiaca teniendo como consideración el análisis de las variaciones inducidas por la frecuencia respiratoria mediante técnicas convencionales y de inteligencia computacional.

DESCRIPCIÓN DEL ESTUDIO Y PROCEDIMIENTOS Este es un estudio observacional descriptivo en personas que pueden presentar o no riesgo de algún accidente cardiovascular, las cuales se encuentran divididas en dos grupos, personas con riesgo o que ya hallan sido diagnosticadas con alguna patología relacionada al sistema cardiovascular y el otro grupo de personas sin riesgo aparente, al cual pertenecen personas que realizan actividad física intensa o deportistas. En este estudio participarán aproximadamente 30 personas en total. Luego de haber sido asignado a participar en el estudio, Ud. será citado de acuerdo a su disposición para realizarle algunas pruebas de diagnostico y medición de signos vitales, las cuales son medición de la presión arterial y frecuencia cardiaca, toma de registros electrocardiográficos y frecuencia respiratoria. Se le pedirá que provea información acerca de su historia clínica, incluso enfermedades pasadas y crónicas, enfermedades actuales, síntomas relacionados al sistema cardiovascular previos, tratamiento y medicaciones previas y actuales. La duración del procedimiento es de 50 minutos. Una vez se tenga el resultado de las pruebas les será informado personal o telefónicamente.

161

Page 162: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

RIESGOS Y MOLESTIAS La participación en este estudio para la recolección de registros electrocardiográficos, presión arterial y frecuencia respiratoria, en general no implica riesgos, porque todas las mediciones no son invasivas. Sin embargo, se le explicarán las molestias y riesgos razonables y previsibles de la participación en este estudio, que tendrán que ver con la disposición de la persona implicada.

ALTERNATIVAS No es obligatorio que Ud. participe en este estudio para recolección de registros electrocardiográficos, presión arterial y frecuencia respiratoria para estudiar el indicador de la variabilidad cardiaca.

POSIBLES BENEFICIOS PARA LOS PARTICIPANTES Los posibles beneficios de su participación en este estudio, le han sido explicados y podrían incluir la identificación o evaluación del posible riesgo cardiovascular y será informado acerca de los posibles resultados del uso del indicador de variabilidad de la frecuencia cardiaca, Ud. podrá beneficiarse de la información que recibirá a lo largo del estudio. Su participación en esta investigación proporcionará información acerca del uso de la variabilidad de la frecuencia cardiaca como indicador de riesgo cardiovascular en la Universidad Autónoma de Occidente de Cali, Colombia, y esos resultados podrían beneficiar a otros.

COSTOS

La participación en este estudio así como los procedimientos y los controles, no representará ningún costo significativo para el participante.

CONFIDENCIALIDAD Los registros de su participación en este estudio se mantendrán confidenciales en la medida permitida por las leyes locales, estatales y federales. Los investigadores, representantes del patrocinador, las autoridades regulatorias y los Comités de Investigación, podrán inspeccionar y tendrán acceso a los datos confidenciales que lo identifican a Ud. por su nombre. Dada la necesidad de entregar información a estos organismos, no puede garantizarse una absoluta confidencialidad. Ud. no será identificado en ninguna publicación de los datos. Al firmar este formulario de consentimiento, Ud. autoriza a los realizadores del estudio a revelar sus registros médicos relacionados con el estudio a las personas e instituciones arriba mencionados.

A QUIÉN DIRIGIR LAS PREGUNTAS RELATIVAS A ESTE ESTUDIO Ud. tiene el derecho de hacer preguntas con respecto a este estudio en cualquier momento y le pedimos que lo haga. Los encargados del estudio serán informados acerca de toda nueva información relativa a su seguridad. Si tiene alguna pregunta relativa a este estudio o si presenta un daño o enfermedad

162

Page 163: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

relacionado con la investigación, contacte al médico Wilfredo Agredo coordinador del laboratorio de Biomecánica de la Universidad Autónoma de Occidente PBX: 318-8000 Ext. 11385.

PARTICIPACIÓN VOLUNTARIA Y DERECHO DE NEGARSE O RETIRARSE Su participación en este estudio es voluntaria. Ud. podrá negarse a participar o podrá descontinuar su participación en cualquier momento durante el estudio, sin penalidad ni pérdida de beneficios.

DESCONTINUACIÓN DE SU PARTICIPACIÓN Su participación en el estudio podrá ser descontinuada por los investigadores, el médico del estudio, el patrocinador, u otro organismo gubernamental sin su consentimiento si Ud. deja de reunir los criterios para continuar en el estudio, si no cumple con las instrucciones del estudio que se le indicaron cuando a su cuidado o con los requerimientos del estudio, si sufre un daño relacionado con el estudio, o por cualquier otro motivo.

DECLARACIÓN DE CONSENTIMIENTO INFORMADO Yo, ________________________________________________, identificado con la cédula No. ____________________de ______________ he comprendido toda la información que se me suministró acerca de mi participación en este estudio. He tenido la oportunidad de comentar dicha información y hacer preguntas. Todas ellas han sido respondidas a mi satisfacción. Acepto de plena voluntad mi participación en este estudio. Recibiré una copia firmada de ésta declaración de consentimiento informado. La decisión de aceptar mi participación en este estudio de investigación no anula ninguno de sus derechos en el caso de negligencia u otra responsabilidad legal de las personas involucradas en este estudio. Autorizo a que se revelen mis registros médicos al patrocinador (incluso sus contratistas o representantes) y otros organismos gubernamentales, y el Comité de Ética e Investigación. __________________________________ ___________________________ Firma del paciente Fecha/hora de firma ________________________________________________ Nombre del paciente (en imprenta)

163

Page 164: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

__________________________________ _______________________ Firma de la persona que obtiene el consentimiento Fecha/hora de firma ________________________________________________ Nombre de la persona que obtiene el consentimiento (en imprenta) ___________________________________ ___________________________ Firma del Testigo Fecha/hora de firma _________________________________________________ Nombre del Testigo (en imprenta)

164

Page 165: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

Anexo C. Procedimiento para el Cálculo de Análisis de Componentes Principales

El análisis de componentes principales puede calcularse de la siguiente manera: 1) Una vez que se tienen los datos de entrada:

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

=

nmmm

n

n

nm

xxx

xxxxxx

X

,2,1,

,22,21,2

,12,11,1

,

L

MOMM

L

L

,

donde m representa las observaciones y n el conjunto de variables (características). 2) Se procede a hacer realizar una versión ajustada de los datos, sustrayendo la media a cada una de las dimensiones (variables) de los datos de entrada según la ecuación 1.

jmjmjma xxX ,:1,:1),:1(, −= , nj ≤≤∀1 . (1) Este cálculo supone que la media de los datos es ahora cero. 3) Calcular la matriz de covarianza del conjunto de datos resultante según las ecuaciones 2 a 4.

( )( )jijiji ccC dim,dimcov, ,, == , (2)

⎥⎥⎥⎥

⎢⎢⎢⎢

=

),cov(),cov(),cov(

),cov(),cov(),cov(),cov(),cov(),cov(

nnynxn

nxyyxynxyxxx

C

L

OMM

K

K

. (3)

Nótese que , donde: { } nnC x=dim

( )( )

1),cov(

−−=∑

m

yyxxyx i

ii

. (4)

165

Page 166: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

4) Calcular los autovectores y autovalores de la matriz de covarianza. En tanto la matriz de covarianza es cuadrada, es posible calcular los autovectores y autovalores para dicha matriz. La importancia de dichos parámetros reside en los pesos que presentan respecto a la variabilidad que representa cada variable dentro del modelo que se evalúa, de tal forma que se obtiene la información básica más importante del conjunto de datos de entrada (Rencher, A. C., 2002). El procedimiento para calcular los autovectores y autovalores no se discutirá en el documento. 5) Escoger las componentes para formar el vector de características. Una vez que se obtienen los autovectores y autovalores de la matriz de covarianza, el siguiente paso es ordenar los autovectores de acuerdo a un orden fijo en los autovalores, i. e., de mayor a menor; esto otorga las componentes en orden de significancia. Si se dejan algunas componentes por fuera, la pérdida de información será inevitable, no obstante, las primeras componentes del modelo pueden explicar gran porcentaje de la variabilidad de un modelo, por lo que dicha pérdida de información no sería demasiado relevante.

[ nv VVVVF ,...,,, 321= ] , (5) donde son los autovectores ordenados de la matriz de covarianza. nVVVV ,...,,, 321

6) Obtener el nuevo conjunto de datos con base en las características escogidas calculando los autovectores y autovalores del conjunto de datos de origen, según la ecuación 6.

avD XFF *= . (6)

166

Page 167: ANÁLISIS DE LA VARIABILIDAD DE LA FRECUENCIA CARDÍACA

Anexo D. Procedimiento para el Cálculo de Kernel-Análisis de Componentes Principales

Dado un conjunto de datos (como el descrito en el procedimiento para calcular un PCA estándar) el cálculo del K-PCA puede resumirse en los siguientes pasos: 1) Sustraer la media de cada una de las dimensiones (variables) de los datos de entrada según la ecuación 27. 2) Escoger un kernel apropiado ( ).,.k 3) Calcular la matriz (matriz de Gram): NxN [ ] ( )[ ]jiij xxkK ,= . (1) 4) Calcular la matriz de Gram modificada:

⎟⎠⎞

⎜⎝⎛ −⎟

⎠⎞

⎜⎝⎛ −=

NIK

NIK NxN

TNxN 11~ , (2)

donde es una matriz NxN para la que todas sus entradas valen uno. NxN1 5) Diagonalizar la matriz K~ para obtener sus autovalores nλ y autovectores . nV

6) Normalizar los autovectores n

nn

VV

λ⇐

7) Organizar los autovectores siguiendo el orden de los autovalores, desde el más grande al más pequeño. 8) Proyectar los puntos del conjunto de datos sobre los autovectores.

( )

( ) ⎟⎟⎟

⎜⎜⎜

⎛−

⎥⎥⎥

⎢⎢⎢

⎡⎟⎠⎞

⎜⎝⎛ −=

NK

xxk

xxk

NIVy Nx

N

NxNT 11 1

,

,1

M , (3)

donde es una matriz Nx1 para la que todas sus entradas valen uno. 11Nx

167