tipificaciÓn de espigas epilÉpticas

30
TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS Proyecto de Grado Ingeniería de sistemas y computación Autor: Juan Sebastián Vaca Tibocha Asesores: Ph.D. María Del Pilar Villamil Giraldo Ph.D. John Calvo Martínez Ph.D. Andrés Darío Moreno Barbosa 03 DE JUNIO DEL 2020 UNIVERSIDAD DE LOS ANDES Departamento de Ingeniería de Sistemas

Upload: others

Post on 18-Jul-2022

10 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

Proyecto de Grado Ingeniería de sistemas y computación

Autor:

Juan Sebastián Vaca Tibocha

Asesores:

Ph.D. María Del Pilar Villamil Giraldo Ph.D. John Calvo Martínez

Ph.D. Andrés Darío Moreno Barbosa

03 DE JUNIO DEL 2020 UNIVERSIDAD DE LOS ANDES

Departamento de Ingeniería de Sistemas

Page 2: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

1

0 RESUMEN

La epilepsia es una enfermedad que afecta a personas alrededor del mundo, esta se debe a una descarga eléctrica en el cerebro que puede ser evidenciada en los electroencefalogramas por la presencia de picos llamados espigas epilépticas. Las formas de onda de los picos varían enormemente entre los pacientes con epilepsia y también para el mismo paciente a lo largo del tiempo. La falta de una definición de tipos de espigas epilépticas dificulta la labor a los profesionales en medicina debido a que la identificación de los grupos que un paciente posee conlleva un gasto de recursos y uso del tiempo elevados. En este proyecto se describieron las espigas de un grupo de pacientes por medio de variables numéricas que median el comportamiento de cada una de ellas. A partir de los anterior se identificaron 4 tipos de espigas diferentes.

Page 3: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

2

Contenido

0 Resumen ............................................................................................................ 1

1 Introducción ........................................................................................................ 3

1.1 Marco teórico ........................................................................................ 4

2 Descripción general ............................................................................................ 8

2.1 Objetivos ............................................................................................... 8

2.2 Antecedentes ........................................................................................ 8

2.3 Identificación del problema y de su importancia ................................... 10

3 Diseño y especificaciones ................................................................................. 11

3.1 Definición del problema ....................................................................... 11

3.2 Especificaciones ................................................................................. 11

3.3 Restricciones ...................................................................................... 11

4 Diseño e implementación .................................................................................. 12

4.1 Búsqueda y Recolección de datos ....................................................... 12

4.2 Exploración y Procesamiento de los datos .......................................... 13

4.3 Identificar Espigas y puntos característicos ......................................... 14

4.4. Definir variables y calcular sus valores ................................................ 15

5 Validación ......................................................................................................... 23

5.1 Métodos .............................................................................................. 23

5.2 Validación de resultados ..................................................................... 23

6 Conclusiones .................................................................................................... 28

6.1 Discusión ............................................................................................ 28

6.2 Trabajo futuro ...................................................................................... 28

7 Referencias ....................................................................................................... 29

Page 4: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

3

1 INTRODUCCIÓN

Los picos epilépticos se caracterizan por nunca ser iguales y variar entre los pacientes con epilepsia y también para el mismo paciente a lo largo del tiempo. Adicionalmente, muchos aspectos de estas son inciertos. A raíz de lo anterior, la ingeniería ha desarrollado un particular interés en contribuir a la neurofisiología en el estudio de estos fenómenos usando técnicas como machine learning para clasificar y predecir estos eventos. El no poseer una definición de tipos de espigas epilépticas dificulta la labor a los profesionales en medicina de identificar patrones en los electroencefalogramas que ayudarían a la caracterización de las crisis epilépticas, contribuyendo con la calidad de vida de los pacientes que sufren esta enfermedad.

La motivación para este proyecto surgió de aportar al estudio de las espigas epilépticas y de desarrollar una nueva metodología para la tipificación de estas por medio de sus características. Esto lleva a definir puntos clave dentro de la señal de una espiga obteniendo los datos necesarios para tipificar los grupos de espigas al hacer uso de la tarea de minería de datos de segmentación.

A partir de todo lo anterior, el presente documento se estructuró en seis capítulos: el primero, conformado por una introducción a la enfermedad (epilepsia) y a los elementos necesarios para contextualizar y desarrollar el proyecto; el segundo capítulo, presenta el estado del arte de las metodologías implementadas en el campo a investigar y los respectivos resultados que estas mostraron, se plantea la hipótesis que el proyecto va a responder y se define el objetivo general y los objetivos específicos; el tercer capítulo, describe el diseño de una solución donde se plantean los requerimientos funcionales y no funcionales y las debidas restricciones a tener en cuenta en el proyecto. En el cuarto capítulo, se describe el proceso de implementación del proyecto y se discuten los resultados obtenidos; en el quinto capítulo, se realizan las respectivas validaciones de los resultados, y la solución que permita responder a la hipótesis planteada en el capítulo dos. Finalmente, en el capítulo seis se presentan las conclusiones y objetivos logrados en el desarrollo del proyecto y los futuros trabajos que puedan surgir a partir de los hallazgos realizados en el mismo.

Page 5: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

4

1.1 Marco teórico

1.1.1 Epilepsia

La epilepsia es definida medicamente como una enfermedad cerebral que afecta a personas alrededor del mundo sin importar sus condiciones demográficas. Se caracteriza por la presencia de convulsiones generadas por descargas eléctricas excesivas de grupos de células cerebrales que pueden producirse en diferentes partes del cerebro. Según la Organización Mundial de la Salud (OMS) (2019): “Las convulsiones pueden ir desde episodios muy breves de ausencia o de contracciones musculares hasta convulsiones prolongadas y graves. Su frecuencia también puede variar desde menos de una al año hasta varias al día”.

Los síntomas de la enfermedad varían según el tipo de convulsión que un paciente presente, dentro de los más comunes se encuentran: pérdida del conocimiento y control de esfínteres, pérdida del control del cuerpo lo que causa contracciones de las extremidades y pérdida de las funciones cognitivas y la generación de síntomas psíquicos. Usualmente, las personas diagnosticadas con epilepsia tienden a tener el mismo tipo de ataque, lo que hace que los síntomas sean similares entre un ataque y otro.

Las convulsiones se clasifican en dos grandes grupos, focales o generalizadas, dependiendo de cómo comienza la actividad cerebral anormal. Las convulsiones focales se caracterizan porque la actividad cerebral anormal comienza en una zona específica del cerebro, mientras que las generalizadas se caracterizan porque la actividad anormal se presenta en todas las áreas del cerebro (Mayo Clinic, 2020). Por lo general los tratamientos que abarcan medicamentos y en algunas ocasiones cirugías permiten controlar las convulsiones en los pacientes epilépticos. Sin embargo, existen casos en que los tratamientos con medicamentos deben ser realizados de por vida, pues las convulsiones no desaparecen nunca.

1.1.2 Electroencefalograma

El electroencefalograma (EEG) es una de las pruebas médicas usadas para detectar anormalidades en las ondas cerebrales o evaluar la actividad eléctrica en el cerebro. Un EEG es una de las principales pruebas de diagnóstico para la epilepsia y puede también desempeñar un papel en el diagnóstico de otros trastornos cerebrales.

Page 6: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

5

Ilustración 1 (Siuly S., Li Y., Zhang Y. (2016) Electroencephalogram (EEG) and Its Background. [Figura]. Recuperado de: EEG Signal Analysis and Classification. Health Information Science. Springer, Cham)

El procedimiento de la prueba se describe de la siguiente manera:

La prueba se basa en la colocación de una serie de electrodos en puntos estratégicos de la cabeza, fijándose a un pequeño casco de tela previamente colocado sobre el cuero cabelludo del paciente o sujeto de estudios. El registro empleado mide una diferencia de voltaje entre dos electrodos, siendo éstos colocados en pares para poder realizar mediciones. Mimenza (“s.f”)

Los electrodos se encargan de detectar las ondas del cerebro y la máquina que realiza el

EEG se encarga de amplificar estas señales encontradas y plasmarlas de manera física en una hoja de señales impresa o de manera digital directamente en un computador.

Page 7: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

6

Ilustración 2 Sistema 10-20 (Novo-Olivas C., Guitiérrez, L., Bribiesca J. (2010). [Figura]. Sistema Internacional 10-

20 para la colocación de los electrodos extracraneales. Recuperado de Mapeo Electroencefalográfico y Neurofeedback.)

A partir de la anterior imagen, se puede observar que por lo general la ubicación de los electrodos en la cabeza se encuentra estandarizada por el sistema 10-20, que indica que los electrodos deben estar separados entre el 10% y el 20% entre sí en relación con los puntos craneométricos. Estos puntos se identifican como: Nasión, el espacio entre frente y nariz; Inion, que marca el espacio entre la protuberancia occipital; y finalmente, el Punto Preauricular. Adicionalmente los electrodos son categorizados por áreas cerebrales y valores numéricos.

De igual forma, en la imagen se pueden establecer las áreas cerebrales, las cuales son:

• Frontal(F)

• Central (C)

• Temporal(T)

• Parietal(T)

• Occipital(O)

Respecto a los valores numéricos que reciben los electrodos, aquellos que posean números impares pertenecen al hemisferio izquierdo y aquellos que poseen números pares pertenecen al hemisferio derecho; los que se encuentren sobre la línea media o mejor conocida como línea cero estarán etiquetados con la letra “z” (Alda, A., & Torreblanca,

N. 2020).

1.1.3 Espigas Epilépticas

Las espigas son eventos morfológicamente definidos que pueden ser observados en los EEG de pacientes predispuestos a ataques epilépticos. Se estima que tienen una duración entre 30 y 250 milisegundos aproximadamente, y son generados por las

Page 8: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

7

descargas sincrónicas de un grupo de neuronas en una región del cerebro. Las espigas epilépticas están altamente correlacionadas con las convulsiones, su presencia se utiliza para apoyar el diagnóstico de la epilepsia. Por lo general las espigas son caracterizadas por variables como amplitud, duración, nitidez y el contexto en el que suceden. A continuación, se presenta un ejemplo de una espiga epiléptica:

Ilustración 3 Espiga (Adjouadi, M., Cabrerizo, M., Ayala, M., Sánchez, D., Yaylali, I., Jayakar, P., & Barreto, A. (2005). Simulated Spike and its Morphological Features. [Figura]. Recuperado de Detection of interictal spikes and artifactual data

through orthogonal transformations. Journal of clinical neurophysiology: official publication of the American

Electroencephalographic Society, 22 1, 53-64.)

Se estima que aproximadamente el 2% de la población que no tiene antecedentes epilépticos puede presentar espigas en sus exámenes (Northeast regional epilepsy group, 2018), lo que conllevaría a realizar más estudios para descartar la enfermedad en estos casos. Actualmente los estudios en neurofisiología se centran en la investigación de las espigas epilépticas debido a que muchos aspectos y significados de estas son aún inciertos.

Page 9: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

8

2 DESCRIPCIÓN GENERAL

2.1 Objetivos

El proyecto tiene por objetivo global identificar y tipificar los tipos de espigas que se producen en los diferentes estados de la actividad epileptiforme.

A partir del anterior, se desglosan objetivos más específicos, que tendrán diferentes

alcances:

• Determinar la presencia de espigas epilépticas en la señal de un electroencefalograma.

• Definir variables que permitan abstraer datos respecto al comportamiento de una espiga epiléptica.

• Identificar y señalar segmentos clave de una espiga para la abstracción de los datos.

• Desarrollar un modelo de tipificación a partir de los datos obtenidos haciendo uso de las variables definidas.

• Validar si los grupos de espigas encontrados dentro de un grupo de pacientes son semejantes a los de un paciente en específico.

2.2 Antecedentes

La tipificación de las señales eléctricas o espigas es uno de los mayores problemas de análisis de datos a resolver en la neurofisiología, una de sus causas responde a la variedad de formas y tipos entre un paciente y otro. Está claro que la precisión y la transformación de los datos en cada uno de los pasos del proceso de tipificación va a tener influencia sobre los resultados y análisis del modelo de clasificación. Por lo anterior, gran variedad de métodos han sido puestos en práctica con diferentes hipótesis y alcance, lo que ha permitido el avance e implementación de nuevas y mejores prácticas.

A partir del estudio del estado del arte se puede concluir que diferentes campos profesionales han demostrado interés en la resolución de este problema, como lo son la medicina e ingenierías de diferentes especializaciones entre ellas biomédica, electrónica y de computación. A continuación, se presentan algunos de los estudios realizados:

2.2.1 Novel Classification Method of Spikes Morphology in EEG Signal Using Machine Learning

En este documento investigativo (O. Khouma, I. Diop, P. A. Fall, M. L. Ndiaye, S. M. Farssi, A. M. Oussamatou, B. Diouf, 2019) se propone un nuevo método de clasificación morfológico de las señales eléctricas o espigas epilépticas encontradas en los EGG. Este método se basa en el uso de máquinas de soporte de vectorial (SVM).

Este es un método de clasificación supervisado que usa funciones del núcleo y se describe como una técnica útil para usar en datos que no cuenten con una distribución

Page 10: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

9

conocida como es el caso de las señales EGG. Esta técnica se aplicó para poder determinar las características morfológicas de los diferentes picos en las señales de los EGG.

Dentro del método se usaron funciones del núcleo de tipo lineal, polinomial, radial y sigmoidal para realizar estudios experimentales. Es así como fueron definidas 6 tipos de espigas morfológicamente diferentes a partir de los cuales se realizó la clasificación, obteniendo como resultado que a partir de la identificación de ciertos tipos de espigas en un paciente se podrían predecir una proporción de los tipos de espigas en futuros ataques epilépticos. Para el estudio fueron usados 36 archivos de formato .dat de pacientes epilépticos, no se mencionan cuántos pacientes ni las condiciones demográficas de estos.

2.2.2 Spike pattern recognition by supervised classification in low dimensional embedding space

Este artículo investigativo (J. Thomas, J. Jin, J. Dauwels, S. S. Cash and M. B. Westover, 2016) presenta un método de aprendizaje automático para la detección de descargas epileptiformes (picos). En primer lugar, detecta patrones de espigas a partir de la comparación con un modelo y luego verifica el resultado obtenido usando espigas reales y detecciones falsas. En segundo lugar, clasifica las espigas haciendo uso de máquinas de soporte vectorial y los resultados de esta clasificación automática son luego comparados con anotaciones manuales realizadas por expertos, para determinar la viabilidad del uso de este método para así realizar una clasificación y evaluación automatizada de EEG. Las variables usadas para la clasificación de las espigas fueron la amplitud y la distancia de cada una de estas. Como resultado se obtuvo un software que determina si una espiga es clasificable o no como una espiga. El estudio fue realizado a partir de electroencefalogramas de pacientes que sufren de epilepsia, sin describir las condiciones demográficas de la población.

2.2.3 CLÚSTERING OF INTERICTAL SPIKES BY DYNAMIC TIME WARPING AND AFFINITY PROPAGATION

En este artículo (J. Thomas, J. Jin, J. Dauwels, S. S. Cash and M. B. Westover, 2016) el objetivo era desarrollar una clasificación de las espigas epilépticas para obtener grupos que permitieran hacer el proceso de detección de estas de una manera más automatizada, usando grupos característicos ya definidos. Para lo anterior, se usaron algoritmos de agrupación sobre una base de datos de espigas de 12 pacientes.

La medida de similitud usada para los algoritmos de agrupación fue la distancia euclidiana y la deformación dinámica en el tiempo. Los algoritmos usados fueron k-medias y la propagación de afinidad, estos se compararon en función del error cuadrático, y las medidas de similitud definidas previamente se evaluaron en función del número de grupos de espigas obtenidos en cada uno.

En este proyecto fue usada la distancia de punta a punta y la duración total para describir las espigas encontradas en la señal del EGG. En conclusión, encontraron 4 grupos de espigas que describían el comportamiento de estas. Los datos utilizados en el estudio pertenecen a 12 pacientes epilépticos tratados en el hospital general de Massachussets en Boston. Respecto a las condiciones demográficas de la población no hay información relevante.

Page 11: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

10

A partir de los anteriores antecedes, se puede concluir que a pesar de existir una variedad de trabajos que buscan realizar una segmentación de las espigas epilépticas, ninguno se ha centrado en la tipificación de las mismas pues su enfoque va más relacionado a la clasificación. El artículo CLÚSTERING OF INTERICTAL SPIKES BY DYNAMIC TIME WARPING

AND AFFINITY PROPAGATION se asemeja un poco a lo que se busca realizar en este proyecto con la diferencia que el objetivo de este era determinar cuál algoritmo de segmentación era más preciso, mientras que en este proyecto se busca tipificar los grupos de espigas epilépticas.

2.3 Identificación del problema y de su importancia

La epilepsia a menudo es asociada con la presencia de picos en los electroencefalogramas (EEG). Las formas de onda de los picos varían enormemente entre los pacientes con epilepsia y también para el mismo paciente a lo largo del tiempo.

La falta de una definición de tipos de espigas dificulta la labor a los profesionales en medicina debido a que la identificación de los grupos que un paciente posee conlleva un gasto de recursos y uso del tiempo elevados. Validar si los grupos encontrados en diferentes pacientes tienen similitudes podría dar paso a la creación de una tipificación de grupos de espigas epilépticas. A partir de esta validación se podrían determinar características y patrones generales que poseen las personas con cuadros epilépticos, así como la identificación de características y patrones únicos de pacientes con la enfermedad.

La metodología que va a ser usada en el proyecto es semejante a la mencionada en el artículo CLÚSTERING OF INTERICTAL SPIKES BY DYNAMIC TIME WARPING AND AFFINITY PROPAGATION puesto que se identificarán medidas de similitud que permitan implementar una segmentación para validar la hipótesis propuesta.

Page 12: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

11

3 DISEÑO Y ESPECIFICACIONES

3.1 Definición del problema

El problema general está constituido por dos fases, la primera, busca identificar puntos clave de una espiga dentro de la señal para poder obtener los datos necesarios que permitan tipificar los grupos de espigas haciendo uso de la tarea de minería de datos de segmentación. En la segunda fase, a partir de los tipos de espigas identificadas para un grupo de pacientes se pretende validar que los grupos de un paciente en específico sean clasificables dentro de los grupos identificados en el grupo general haciendo uso de la métrica a definir en el desarrollo del proyecto.

3.2 Especificaciones

3.2.1 Requerimientos funcionales

• A partir de la señal de un electroencefalograma se debe identificar la presencia de espigas epilépticas.

• A partir de la señal de un electroencefalograma se debe identificar los puntos característicos definidos de las espigas identificadas.

• A partir de los puntos característicos de una espiga se debe calcular el valor de las

variables definidas para cada una de las espigas.

• A partir de los resultados de los cálculos de las variables se debe realizar un procesamiento de los datos para eliminar valores atípicos que intervengan en el comportamiento de los datos.

• A partir de los resultados de los cálculos de las variables se debe realizar una

tipificación y análisis de los grupos de espigas encontrados.

3.2.2 Requerimientos No funcionales

• El tamaño de los datos ingresados no debería ser un problema al momento de

ejecutar el software.

• Se espera que el software sea de fácil uso para que los usuarios que nunca lo han manejado puedan usarlo.

• Se espera que la eficiencia de uso del software sea mayor a medida que se aprende del funcionamiento de este.

3.3 Restricciones

Page 13: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

12

• Herramientas de software para la lectura de los electroencefalogramas limitadas a Matlab.

• Fuentes de datos con archivos de distintos formatos EDF, DAT, TXT.

4 DISEÑO E IMPLEMENTACIÓN

Para diseñar la solución se valoraron diferentes factores que iban a intervenir a lo largo del proceso. Para la tipificación se optó por usar un algoritmo de aprendizaje no supervisado k-medias que agrupa los elementos en k grupos usando las características de estos. Respecto a las herramientas de software se escogió Matlab para el procesamiento y cálculo de las variables de las espigas. Por otro lado, se usó Jupyter Notebook para realizar los análisis estadísticos y la tipificación de los datos. El diseño del proyecto se puede describir en los siguientes pasos:

1. Búsqueda de los datos que van a ser utilizados en el proyecto.

2. Exploración y procesamiento de los datos.

3. Identificación de las espigas y sus puntos característicos.

4. Definición de las variables y cálculo de los valores de estas para cada una de las espigas.

5. Procesamiento y análisis de los datos.

6. Tipificación de las espigas.

7. Validación de los resultados.

4.1 Búsqueda y Recolección de datos

La fuente de datos usada para el desarrollo de este proyecto es la base de datos CHB-MIT Scalp EEG Database del Children’s Hospital Boston, la cual contiene grabaciones de electroencefalogramas de pacientes pediátricos que sufren de epilepsia. Estas grabaciones fueron tomadas en la realización de un estudio médico sobre la caracterización de la epilepsia y para esto fueron retirados los medicamentos anticonvulsivos a cada uno de los pacientes. Fue publicada el 9 de junio del año 2010 y se encuentra en Physionet, un repositorio de archivos médicos de investigación que son compartidos de manera gratuita. Actualmente es administrada por el departamento de fisiología computacional del Massachussets institute of technology (MIT).

La base de datos cuenta con registros de 5 hombres y 17 mujeres con edades entre los 1,5 y 22 años. Por cada uno de los pacientes hay entre 9 y 42 archivos EDF continuos de un solo paciente, que se encuentran enumerados consecutivamente y se estima que hay una pérdida de datos de aproximadamente 10 segundos entre un archivo y el otro. Hay un total de 664 archivos EDF.

En general, cada uno de los archivos pertenecientes a un paciente tiene la grabación

correspondiente a una hora de señales de EEG que en algunos pacientes específicos son de dos y cuatro horas. Cada archivo contiene 23 señales de EEG que representan cada

Page 14: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

13

una un canal del sistema internacional 10-20 posiciones y nomenclatura de electrodos EEG. Todas las señales de los archivos se grabaron a 256 muestras por segundo con una resolución de 16 bits.

4.2 Exploración y Procesamiento de los datos

Como el proyecto tiene un enfoque a nivel general y no individual, a partir de los datos de varios de los pacientes se construyó un archivo general en el que se procesaron los datos en conjunto para obtener resultados generales y no individuales de cada paciente. Para la exploración de los datos se utilizó la librería de MATLAB EDFRead encargada de la lectura de los archivos EDF encontrados en la base de datos. Posterior a la lectura, los archivos fueron convertidos a un archivo de formato CSV que cuenta con 23 columnas donde cada una representa un canal del sistema internacional 10-20 posiciones. Por último, se generó un script encargado de cargar los valores correspondientes a un canal del archivo CSV y se realizó una visualización de las señales eléctricas, como se muestra en la ilustración 4 que tiene como ejes las muestras en el tiempo(x) y Microvoltios(y).

Ilustración 4 señal

Para el procesamiento de los datos de los electroencefalogramas el objetivo era reducir el impacto de valores atípicos causados por el ruido de fondo, que hace referencia a valores anormales causados por razones externas al comportamiento cerebral. Para esto se aplicó el filtro Savitzky-Golay encargado de disminuir la potencia de la señal. Lo anterior se puede apreciar en la ilustración 5 donde el color rojo identifica a la señal bajo la influencia del filtro y el color azul representa la señal inicial.

Page 15: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

14

Ilustración 5 Filtro de la señal

4.3 Identificar Espigas y puntos característicos

Para la identificación de las espigas y la definición de sus puntos característicos se hizo uso del toolbox Signal Analyzer de Matlab, el cual está especializado en el

tratamiento y análisis de señales por medio de las diferentes funcionalidades que ofrece.

En esta ocasión se hizo uso de la función findPeaks para identificar los picos presentes

en la señal, a los cuales se les denotó con la sigla A (Altura), y adicionalmente se definieron dos puntos I y F que indican el inicio y el fin de una espiga. Se garantizó que por cada espiga detectada se identificaran sus respectivos puntos de inicio y fin. En la ilustración 6 es posible visualizar la identificación de los puntos en la señal:

Page 16: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

15

Ilustración 6 identificación de Espigas

4.4. Definir variables y calcular sus valores

Usando los puntos característicos de una espiga definidos en la fase anterior y, se plantearon 4 variables que describen el comportamiento de una espiga y que pueden ser calculadas haciendo uso de los puntos mencionados. Estas variables serán los factores de similitud que van a ser usados para realizar la clasificación de los datos. A continuación, se describen:

• Rise time: el tiempo que transcurre desde el inicio de la espiga en el punto I hasta el pico de la espiga el punto A.

• Fall Time: el tiempo que transcurre desde el pico de la espiga en el punto A hasta el fin de la espiga el punto F.

• Rise Level: la ganancia en microvoltios que hay desde el inicio de la espiga en el punto I hasta el pico de la espiga el punto A.

• Fall level: la pérdida en microvoltios que hay desde el pico de la espiga en el punto A hasta el fin de la espiga el punto F.

Las variables fueron seleccionadas a partir de lo mencionado en el capítulo 1, donde se describe que la mejor forma de estudiar una espiga es mediante la duración y potencia de esta. La ilustración 7 es una representación visual de las variables descritas en una espiga.

Page 17: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

16

Ilustración 7 Variables de una espiga

Después de realizar el cálculo de las variables, los valores obtenidos fueron exportados en un archivo CSV conformado por 4 columnas donde cada una representa una variable y las filas hacen referencia al total de espigas identificadas inicialmente.

4.5 Procesamiento y análisis de los datos

El archivo CSV con los datos en la sección anterior fue importado a la herramienta Jupyter notebook. Se efectuó un procesamiento de los datos para eliminar valores atípicos que entorpecieran los resultados de los análisis que van a ser realizados. Estos fueron eliminados empleando un diagrama de cajas que usa el rango intercuartílico para determinar si un dato es catalogado o no como atípico. Esta sección está compuesta de varios subprocesos como se puede apreciar en la ilustración 7.

Page 18: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

17

Ilustración 8 Mapa conceptual procesamiento y análisis de los datos

4.5.1 Normalización de los datos

Previo a usar un algoritmo de segmentación los datos de entrada deberían estar normalizados para evitar mayor influencia de una variable sobre otra al momento de realizar las agrupaciones. En este caso se usó la siguiente fórmula para que los datos estuvieran dentro de un rango de 0 y 1:

Ecuación 1 Normalización estándar

4.5.2 Selección de K

Según lo planteado en el diseño, el algoritmo seleccionado para la realización de la tipificación es k-medias, por esto el primer paso fue determinar el número de k o grupos en los que los datos iban a ser agrupados. El método del codo de forma conjunta con el coeficiente de la silueta fue la métrica elegida para determinar el valor de k, se calculó el valor de esta para los casos en que k tomaba el valor de 3, 4 y 5. Los resultados obtenidos fueron los siguientes:

• Para n clústers = 3, el valor promedio de la silueta es: 0.312.

• Para n clústers = 4, el valor promedio de la silueta es: 0.326.

Page 19: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

18

• Para n clústers = 5, el valor promedio de la silueta es: 0.325.

Un valor cercano a 1 en la silueta indica un buen agrupamiento mientras que un valor cercano a -1 indica mal agrupamiento, y un valor cercano a 0 es inconcluso para el agrupamiento de los datos. Teniendo en cuenta lo anterior y evaluando los valores de silueta obtenidos en los 3 casos tomados en cuenta, se puede concluir que matemáticamente el número de k o clústers que mejor agrupa los datos es 4 pues cuenta con el valor promedio de la silueta más alto. Aunque su valor es bajo, ya que está por debajo de 0.5. Los resultados del método del codo fueron los siguientes:

Ilustración 10 Método del codo

Donde se puede apreciar que el punto de quiebre o el codo se da cuando el valor corresponde a 4.

4.5.3 Descripción de los clústers

A continuación, se presenta la forma de las espigas de cada uno de los clústers identificados:

Ilustración 10 Espigas de los clústers

Page 20: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

19

Como se puede observar en la imagen anterior, cada uno de los clústers tiene una forma de espiga promedio diferente a los demás.

A partir de la clasificación de los datos en 4 grupos se realizó un análisis para describir el comportamiento y cómo fue conformado cada uno de estos clústers. El análisis de comportamiento paralelo que se puede visualizar en la ilustración 8, describe los valores promedios de las variables en cada grupo conformado.

Ilustración 11 Comportamiento paralelo

Para el caso de la variable fallLevel los objetos agrupados en los clústers 0, 1 y 2 cuentan con un valor promedio de aproximadamente 0,3 mientras que para el clúster 3 el valor promedio es de 0,65.

Para el caso de la variable fallTime los objetos agrupados en los clústers 1, 2 y 3 cuentan con un valor promedio de aproximadamente 0,8 mientras que para el clúster 0 el valor promedio es de 0,3.

Para el caso de la variable riseLevel los objetos agrupados en los clústers 0, 1 y 2 cuentan con un valor promedio entre 0,25 y 0,4 mientras que para el clúster 3 el valor promedio es de 0,7.

Para el caso de la variable riseTime los valores promedios de los objetos agrupados en cada clústers se encuentran más dispersos que en las otras variables. En el clúster 0 el valor promedio es de 0,35 aproximadamente, en el clúster 1 es de 0,15, en el clúster 2 es de 0,8 y en el clúster 3 es de 0,6.

4.5.4 Visualización de los Clústers

Para poder visualizar como se agruparon los datos, se realizó un análisis PCA buscando factores subyacentes tal que estos fueran menor al número de variables y que lograran explicar aproximadamente lo mismo que las 4 variables originales. Para esto se verificó el porcentaje de varianza explicada, pues este da una idea de cuántos componentes principales se necesitan para explicar la mayor cantidad de información presente en el set original.

Page 21: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

20

Ilustración 12 Varianza recogida

A partir de la ilustración 9, se decide utilizar 3 componentes principales pues la proporción de varianza explicada es del 96%. A continuación, se presenta en primer lugar el gráfico de 2 componentes principales como visualización exploratoria ya que la proporción de varianza explicada en este caso es de 75% y posteriormente el gráfico de los 3 componentes principales:

Ilustración 13 PCA dos componentes

Page 22: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

21

Ilustración 14 PCA 3 componentes

4.6 Tipificación de las espigas

Para el proceso de tipificación se propuso una métrica definida por el rango intercuartílico de los datos de cada variable de la siguiente manera:

• x < Q1 = Bajo

• Q1 ≤ x ≤ Q3 = Moderado

• x > Q3 = Alto

Posteriormente se calcularon los cuartiles de cada una de las variables para poder generar la tabla 1 donde se pueden observar las reglas usadas para la tipificación de los grupos.

General riseTime fallTime riseLevel fallLevel

Bajo x<0.18 x<0.54 x<0.24 x<0.18

Moderado 0.18<x<0.81 0.54<x<0.96 0.24<x<0.55 0.18<x<0.53

Alto x>0.81 x>0.96 x>0.55 x>0.53

Tabla 1 Reglas de Tipificación

Page 23: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

22

Haciendo uso de las reglas se efectuó la tipificación de los 4 clústers. El orden de las variables en cada uno de los clústers indica cuales son las que mejor caracterizan ese clúster.

• Clúster 0: – fallTime: Bajo, - riseTime: Moderado, – fallLevel: Moderado, – riseLevel: Moderado.

• Clúster 1: – riseTime: Bajo, – riseLevel: Moderado,

– fallTime: Moderado, – fallLevel: Moderado.

• Clúster 2: – riseTime: Moderado, – fallTime: Moderado, – riseLevel: Moderado, – fallLevel: Moderado.

• Clúster 3: – fallLevel: Alto, – riseLevel: Alto, – riseTime: Moderado, – fallTime: Moderado,

El clúster 0 está conformado por las espigas que poseen un fallTime bajo con respecto al resto de espigas en el dataset. Sin embargo, los valores del riseTime, fallLevel y riseLevel son moderados con respecto a los valores de otras espigas en el dataset.

El clúster 1 está conformado por las espigas que poseen un riseTime bajo con respecto al resto de espigas en el dataset. Sin embargo, los valores del riseLevel, fallTime y fallLevel son moderados con respecto a los valores de otras espigas en el dataset.

El clúster 2 está conformado por las espigas en las que riseTime, fallTime, fallLevel y riseLevel son moderados con respecto a los valores de otras espigas en el dataset.

El clúster 3 está conformado por las espigas que poseen un fallLevel y riseLevel alto con respecto al resto de espigas en el dataset. Sin embargo, los valores del riseTime y fallTime son moderados con respecto a los valores de otras espigas en el dataset.

La tabla 2 presenta un consolidado de los valores que toman las variables en cada uno de los tipos de espigas:

GENERAL Tipo 1 Tipo 2 Tipo 3 Tipo 4

riseTime Moderado Bajo Moderado Moderado

fallTime Bajo Moderado Moderado Moderado

riseLevel Moderado Moderado Moderado Alto

fallLevel Moderado Moderado Moderado Alto

Tabla 2 Tipos de espigas

Page 24: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

23

5 VALIDACIÓN

5.1 Métodos

La validación de los resultados se llevó a cabo con el fin de verificar si el objetivo del proyecto fue desarrollado en su totalidad y para constatar que la metodología usada en el desarrollo del proyecto haya sido la adecuada.

Para validar la hipótesis de que los grupos encontrados en diferentes pacientes pueden tener similitudes y dar paso a la creación de una tipificación de grupos de espigas epilépticas determinando características y patrones generales y específicos de pacientes con epilepsia. Se propuso un método de verificación donde a partir de las métricas definidas para la tipificación que se realizó se tipificarían los grupos de espigas encontrados en pacientes de manera individual para verificar si los grupos encontrados en este paciente pertenecen o no a los encontrados en el análisis general.

Para realizar la validación se ejecutó el siguiente procedimiento de manera individual para cada uno de los 3 pacientes con los que se hicieron las comparaciones de validación:

1. Realizar el procesamiento, identificación y clasificación de las espigas encontradas en los pacientes.

2. Realizar una exploración visual frente a los grupos encontrados en el análisis general vs los grupos encontrados en cada uno de los análisis individuales.

3. Tipificar los grupos obtenidos en los análisis individuales usando la métrica definida para la tipificación general.

4. Verificar si los tipos de espigas de los análisis pertenecen a los tipos de espigas identificadas a nivel general.

5.2 Validación de resultados

Después de realizar el procesamiento, identificación y clasificación de los datos se procede a realizar una comparación exploratoria del comportamiento de los clústers del análisis general vs los clústers de los análisis individuales graficando las espigas promedio de cada uno. Las líneas punteadas representan los clústers de los pacientes mientras que las continuas hacen referencia a los generales.

Page 25: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

24

Ilustración 15 Paciente 1 vs General

Ilustración 16 Paciente 2 vs General

Ilustración 17 Paciente 3 vs General

En los 3 gráficos se pueden observar ciertas diferencias y similitudes entre los comportamientos de los clústers de los pacientes vs los generales. Inicialmente se podría

Page 26: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

25

suponer que algunos grupos identificados en los pacientes pertenezcan a los tipos de espigas definidos en el capítulo 4. Para verificar esta suposición se aplicaron las reglas de tipificación definidas en la sección 4.5 sobre los clústers de cada uno de los pacientes obteniendo los siguientes resultados:

Paciente 1

• Clúster 0: – riseTime: Moderado, – fallTime: Moderado,

– riseLevel: Moderado, – fallLevel: Moderado.

• Clúster 1: – riseTime: Moderado, – fallTime: Moderado, – riseLevel: Alto, – fallLevel: Alto.

• Clúster 2: – riseTime: Moderado, – fallTime: Bajo, – riseLevel: Moderado, – fallLevel: Moderado.

• Clúster 3: – riseTime: Alto, – fallTime: Moderado, – riseLevel: Moderado, – fallLevel: Moderado.

Paciente 2

• Clúster 0: – riseTime: Moderado, – fallTime: Bajo,

– riseLevel: Alto, – fallLevel: Alto.

• Clúster 1: – riseTime: Moderado, – fallTime: Moderado, – riseLevel: Moderado, – fallLevel: Moderado.

• Clúster 2: – riseTime: Moderado, – fallTime: Moderado, – riseLevel: Moderado, – fallLevel: Moderado.

• Clúster 3: – riseTime: Moderado, – fallTime: Bajo, – riseLevel: Moderado, – fallLevel: Moderado.

Paciente 3

• Clúster 0: – riseTime: Moderado, – fallTime: Bajo,

– riseLevel: Moderado, – fallLevel: Moderado.

• Clúster 1: – riseTime: Moderado, – fallTime: Moderado, – riseLevel: Moderado, – fallLevel: Moderado.

• Clúster 2: – riseTime: Moderado, – fallTime: Moderado, – riseLevel: Alto, – fallLevel: Alto.

• Clúster 3: – riseTime: Alto, – fallTime: Moderado, – riseLevel: Alto, – fallLevel: Alto.

A partir de estos resultados se procedió a tipificar a los grupos de los individuos en los 4

tipos de espigas definidos en la segmentación general, a cada uno se le asigno un color de la siguiente manera:

• Tipo 1 – Rojo

Page 27: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

26

• Tipo 2 – Verde

• Tipo 3 – Azul

• Tipo 4 - Amarillo

• Tipo nuevo – Negro

General Paciente 1 Paciente 2 Paciente 3

Tipo 1:

riseTime: Moderado fallTime: Bajo riseLevel: Moderado fallLevel: Moderado

Tipo 2:

riseTime: Bajo fallTime: Moderado riseLevel: Moderado fallLevel: Moderado

Tipo 3:

riseTime: Moderado fallTime: Moderado riseLevel: Moderado fallLevel: Moderado

Tipo 4:

riseTime: Moderado fallTime: Moderado riseLevel: Alto fallLevel: Alto

Grupo:

riseTime: Moderado fallTime: Moderado riseLevel: Moderado fallLevel: Moderado

Grupo:

riseTime: Moderado fallTime: Moderado riseLevel: Alto fallLevel: Alto

Grupo:

riseTime: Moderado fallTime: Bajo riseLevel: Moderado fallLevel: Moderado

Grupo:

riseTime: Alto fallTime: Bajo riseLevel: Moderado fallLevel: Moderado

Grupo:

riseTime: Moderado fallTime: Bajo riseLevel: Alto fallLevel: Alto

Grupo:

riseTime: Moderado fallTime: Moderado riseLevel: Moderado fallLevel: Moderado

Grupo:

riseTime: Moderado fallTime: Moderado riseLevel: Moderado fallLevel: Moderado

Grupo:

riseTime: Moderado fallTime: Bajo riseLevel: Moderado fallLevel: Moderado

Grupo:

riseTime: Moderado fallTime: Bajo riseLevel: Moderado fallLevel: Moderado

Grupo:

riseTime: Moderado fallTime: Moderado riseLevel: Moderado fallLevel: Moderado

Grupo:

riseTime: Moderado fallTime: Moderado riseLevel: Alto fallLevel: Alto

Grupo:

riseTime: Alto fallTime: Moderado riseLevel: Alto fallLevel: Alto

Tabla 3

Por medio de estos colores se van a relacionar los grupos de los análisis individuales a los tipos de espigas encontrados en la sección 4.5.

Paciente 1

En el caso de los resultados del paciente 1, tres de los cuatro grupos fueron tipificados de la siguiente manera: se encontraron grupos pertenecientes al tipo 1, 3 y 4. Adicionalmente se identificó un grupo que pertenece a un nuevo tipo de espiga.

Page 28: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

27

Paciente 2

En el caso de los resultados del paciente 2, tres de los cuatro grupos fueron tipificados de la siguiente manera: se encontraron grupos pertenecientes al tipo 1 y 3. Adicionalmente se identificó un grupo que pertenece a un nuevo tipo de espiga.

Paciente 3

En el caso de los resultados del paciente 3, tres de los cuatro grupos fueron tipificados de la siguiente manera: se encontraron grupos pertenecientes al tipo 1, 3 y 4. Adicionalmente se identificó un grupo que pertenece a un nuevo tipo de espiga.

Respecto a los resultados obtenidos en la validación, de los grupos encontrados en los 3 pacientes el 75% de estos pertenecen a los tipos definidos en el análisis general. El 25% restante indican la presencia de nuevos tipos de espigas. La implementación y los resultados obtenidos en el proyecto son válidos pues se identifican tipos de espigas epilépticas similares en distintos pacientes, igual que el hecho de identificar tipos que son únicos de estos pacientes.

Page 29: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

28

6 CONCLUSIONES

6.1 Discusión

Con el desarrollo del proyecto se pudo generar una tipificación de grupos comunes de espigas epilépticas en un segmento de pacientes, donde a partir del comportamiento de estas se pudieron definir 4 tipos. Adicionalmente, se validó la existencia de tipos de espigas que son características de un paciente y no son identificables en otros pacientes de la población.

Así mismo, se determinó que el tiempo total que demora una espiga y la variación de potencia de esta son variables que pueden ser usadas para la descripción y caracterización de estos eventos, sumadas el hecho de que sirven como factores de similitud para realizar segmentaciones de estos eventos. Adicionalmente, se diseñó un modelo de tipificación que usa los cuartiles de las variables para determinar el tipo de un grupo de espigas.

Por último, se logró implementar el diseño y la metodología propuestas al inicio del

proyecto, verificando que la implementación de los algoritmos y los análisis cumplieran con los requerimientos descritos en la sección 3. Este proyecto corroboró que la tipificación de las espigas puede ayudar en el diagnóstico de pacientes de una manera mucho más rápida y en el ahorro de recursos médicos.

6.2 Trabajo futuro

A partir de los resultados obtenidos se plantea como trabajo futuro realizar iteraciones sobre el algoritmo desarrollado donde se incluyan los datos de nuevos pacientes que sean ingresados al estudio. Esto con el propósito de identificar nuevos grupos o modificar los que se obtuvieron inicialmente pues como los resultados lo indicaron, un 25% de los grupos de cada paciente no se pueden tipificar bajo el esquema general. Adicionalmente se propone variar las condiciones demográficas de los pacientes, para validar si hay tipos de espigas característicos de poblaciones específicas.

Page 30: TIPIFICACIÓN DE ESPIGAS EPILÉPTICAS

29

7 REFERENCIAS

• Adjouadi, M., Cabrerizo, M., Ayala, M., Sanchez, D., Yaylali, I., Jayakar, P., & Barreto, A. (2005). Detection of interictal spikes and artifactual data through orthogonal transformations. Journal of clinical neurophysiology: official publication of the American Electroencephalographic Society, 22 1, 53-64.

• Alda, A., & Torreblanca, N. (2020, Abril 30). Colocación de electrodos EEG en un

Layout Fijo vs. Variable Recuperado de https://www.bitbrain.com/es/blog/colocacion-electrodos-eeg

• Electroencefálograma de rutina. (s.f.). Recuperado Junio 1, 2020, de

https://www.epilepsia.net/informacion-sobre-epilepsia/informacion-sobre-epilepsia/electroencefalograma-de-rutina/

• Epilepsy. (2020, mayo 5). Recuperado Junio 1, 2020, de https://www.mayoclinic.org/diseases-conditions/epilepsy/symptoms-causes/syc-20350093

• Khouma, O., Diop, I., Fall, P.A., Ndiaye, M., Farssi, S.M., Oussamatou, A.M., & Diouf, B. (2019). Novel Classification Method of Spikes Morphology in EEG Signal Using Machine Learning. Procedia Computer Science, 148, 70-79.

• Mimenza, O. C., Barcelona, Psicología Clínica por la Universidad de Barcelona, & Educación Secundaria. (2020). Electroencefalograma (EEG): ¿qué es y cómo se usa? Recuperado Junio 3, 2020, de https://psicologiaymente.com/neurociencias/electroencefalograma

• Novo-Olivas, Carlos & Guitiérrez, Leticia & Bribiesca, José. (2010). Mapeo Electroencefalográfico y Neurofeedback.

• OMS, Organización mundial de la salud. (2018). Epilepsia. Recuperado mayo 25, 2020 de http://www. who.int/news-room/fact-sheets/detail/epilepsy.

• Siuly S., Li Y., Zhang Y. (2016) Electroencephalogram (EEG) and Its Background. In: EEG Signal Analysis and Classification. Health Information Science. Springer, Cham

• Thomas, J., Jin, J., Dauwels, J., Cash, S. S., & Westover, M. B. (2016). Clústering of interictal spikes by dynamic time warping and affinity propagation. 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). doi: 10.1109/icassp.2016.7471775

• Zacharaki, E. I., Mporas, I., Garganis, K., & Megalooikonomou, V. (2016). Spike pattern recognition by supervised classification in low dimensional embedding space. Brain informatics, 3(2), 73–83. https://doi.org/10.1007/s40708-016-0044-4