Table Of ContentUniversidade Federal do Rio Grande do Norte
Centro de Cieˆncias Exatas e da Terra
Departamento de Informa´tica e Matema´tica Aplicada
Programa de Po´s Graduac¸a˜o em Sistemas e
Computac¸a˜o
Utiliza¸c˜ao de T´ecnicas de Aprendizado de
M´aquina para Predi¸c˜ao de Crises Epil´eticas
Kelyson Nunes dos Santos
Natal/RN
Julho de 2016
Kelyson Nunes dos Santos
Disserta¸ca˜odeMestradoapresentadaaoPro-
grama de P´os-Graduac¸˜ao em Sistemas e
Computa¸ca˜o, vinculado ao Departamento de
Informa´tica e Matema´tica Aplicada do Cen-
tro de Ciˆencias Exatas e da Terra da Univer-
sidade Federal do Rio Grande do Norte como
requisito parcial para a obten¸ca˜o do grau de
mestre em Sistemas e Computa¸ca˜o.
Orientador
Prof. Dr. Augusto Jos´e Venaˆncio Neto
Universidade Federal do Rio Grande do Norte – UFRN
Departamento de Informa´tica e Matema´tica Aplicada – DIMAp
Natal/RN
Julho de 2016
Catalogação da Publicação na Fonte. UFRN / SISBI / Biblioteca Setorial
Especializada do Centro de Ciências Exatas e da Terra – CCET.
Santos, Kelyson Nunes dos.
Utilização de técnicas de aprendizado de máquina para predição de crises
epiléticas / Kelyson Nunes dos Santos. – Natal, RN, 2016.
73 f. : il.
Orientador: Augusto José Venâncio Neto.
Coorientador: Renan Cipriano Moioli.
Dissertação (mestrado) – Universidade Federal do Rio Grande do Norte. Centro
de Ciências Exatas e da Terra. Departamento de Informática e Matemática Aplicada.
Programa de Pós-Graduação em Sistemas e Computação.
1. Computação – Dissertação. 2. Predição de eventos – Dissertação. 3. Predição
de crises epiléticas – Dissertação. 4. Epilepsia – Dissertação. 5. Comitês de
classificadores – Dissertação. I. Venâncio Neto, Augusto José. II. Moioli, Renan
Cipriano. III. Título.
RN/UF/BSE-CCET CDU 004(043.3)
Disserta¸ca˜o de Mestrado sob o t´ıtulo Utiliza¸c˜ao de T´ecnicas de Aprendizado de M´aquina
para Predi¸c˜ao de crises Epil´eticas apresentada por Kelyson Nunes dos Santos e aceita pelo
Programa de P´os-Graduac¸˜ao em Sistemas e Computa¸ca˜o, vinculado ao Departamento de
Informa´tica e Matem´atica Aplicada do Centro de Ciˆencias Exatas e da Terra da Univer-
sidade Federal do Rio Grande do Norte, sendo aprovada por todos os membros da banca
examinadora abaixo especificada:
Prof. Dr. Augusto Jos´e Venaˆncio Neto
Orientador
Departamento de Inform´atica e Matem´atica Aplicada
Universidade Federal do Rio Grande do Norte
Dr. Renan Cipriano Moioli
Co-orientador
Instituto Internacional de Neurociˆencias Edmond e Lily Safra
(IIN-ELS)
Instituto Santos Dumont (ISD)
Prof. Dr. Benjamin Ren´e Callejas Bedregal
Examinador Interno
Departamento de Inform´atica e Matem´atica Aplicada
Universidade Federal do Rio Grande do Norte
Dr. Fabr´ıcio Lima Brasil
Examinador Externo
Instituto Internacional de Neurociˆencias Edmond e Lily Safra
(IIN-ELS)
Instituto Santos Dumont (ISD)
Natal-RN, 28 de julho de 2016.
Por que vocˆe est´a assim t˜ao triste, ´o minha alma?
Por que est´a assim t˜ao perturbada dentro de mim?
Ponha a sua esperan¸ca em Deus!
Pois ainda o louvarei; ele ´e o meu Salvador e o meu Deus.
Salmo 42:11
(B´ıblia Sagrada)
Aos meus pais, os maiores incentivadores.
Aos meus irma˜os, suportes incondicionais.
Aos meus amigos,
de perto e de longe,
de hoje ou de ontem.
A Tobby, meu primeiro grande ca˜o-panheiro.
Agradecimentos
Agradecer ´e uma pr´atica que tem sido perdida em um mundo ta˜o ego´ısta e vazio
que tem se apresentado a no´s. Mas desde cedo aprendi, em casa, que devemos agradecer
por todas as coisas, as que achamos boas e tamb´em pelas ruins. Depois de mais velho,
aprendi que esse ensino vem da B´ıblia (1Tessalonicenses 5:18). E por isso escrevo com
tanto carinho e dedicac¸˜ao essa parte do trabalho.
Os meus pais, Jos´e Carlos e Jos´elia, foram meus primeiros professores e os que por
mais tempo se dedicaram a essa tarefa (´ardua, devo dizer, ainda mais me conhecendo):
at´e agora, ja´ sa˜o 27 anos e espero que se estendam por muitos outros. Eles sonharam
com a conclusa˜o deste trabalho at´e mais do que eu, talvez, e sabem as oportunidades que
ele pode abrir, quer pessoais, quer profissionais, quer acadˆemicas. Sem du´vida eles foram
(e ainda sa˜o!) os maiores incentivadores durante toda a minha trajeto´ria acadˆemica. A
vocˆes, painho e mainha, eu agrade¸co por todos os minuto e segundos investidos em mim,
seja trabalhando, me ensinando ou mesmo orando para a Deus por mim.
Os meus irma˜os e familiares pro´ximos (cunhadas tamb´em s˜ao fam´ılia!) tamb´em unem
suas vozes a essa torcida. As conversas sobre metodologia de pesquisa, m´etodos es-
tat´ısticos e valida¸ca˜o de resulestados sempre foram parte de uma fam´ılia de estudantes
que, acredito eu, nunca vai perder esse status, mesmo que na˜o estejamos matriculados em
algum curso regular. Obrigado, Karlyson e Kivyson, duas das pessoas mais inteligentes e
estudiosasqueconhe¸co, portodososmomentosquevocˆesmeajudaramemeincentivaram
a n˜ao desistir (e vocˆes sabem que n˜ao foram poucos).
Na˜o ta˜o distantes da minha fam´ılia sangu´ınea sa˜o os meus amigos que me ajudam a
manter a sanidade neste mundo. Agrade¸co o carinho e motiva¸ca˜o de cada um, seja ao me
animar ou mesmo mangando de mim por eu n˜ao estar presente. Sou muito grato a Deus
pela vida de cada um de vocˆes e pela compreensa˜o da ausˆencia que, infelizmente, se deu
por longos momentos.
Em especial, eu gostaria de agradecer aos amigos mais pr´oximos, que me suportaram
em ora¸ca˜o e em reclama¸ca˜o, al´em de me dar broncas quando eu n˜ao rendia o necessa´rio.
Obrigado, Leonardo, Samuel, Ang´elica, Isabela, Fernanda, Stephanie, Daniel, Yan, Ro-
drigo, Luanna, Gustavo, Natha´lia, Jeane, Kalina, Eduarda, Eva, Mitomari, Nayara, Tami-
res, Mar´ılia, Edmilson, Andressa, Nathalie, Tha´ıs Burity e tantos outros que, at´e mesmo
sem saber, contribu´ıram para que esse trabalho fosse conclu´ıdo, com palavras de aˆnimo
ou mesmo emprestando o ouvido para ouvir minhas lamenta¸co˜es.
Deixar registrada minha gratida˜o a Raphaela ainda ´e muito pouco, que revisou meu
trabalho mais de uma vez e ofereceu contribui¸co˜es valios´ıssimas para as constru¸co˜es tex-
tuais. S´o posso pedir que Deus te aben¸coe ainda mais e fa¸ca seu caminho brilhante!
Agrade¸co bastante a todos que contribu´ıram para a minha forma¸ca˜o acadˆemica, em
especial ao professor Augusto, que aceitou o desafio de orientar um aluno com pouca
experiˆencia em pesquisa que queria aprender mais sobre o assunto, al´em de desbravar
a ´area de e-Health. Obrigado pela paciˆencia e preocupa¸ca˜o, al´em da ajuda no que foi
poss´ıvel.
Tamb´em ´e necess´ario agradecer aos professores do Instituto Santos Dumont, princi-
palmente ao Renan e ao Fabr´ıcio, excelentes orientadores e pessoas brilhantes que direci-
onaram este trabalho. Sa˜o os melhores co-orientadores que eu poderia ter tido.
Os meus colegas de pesquisa, mesmo que em outras linhas, tamb´em merecem minha
gratida˜o: Fl´avio, Hugo, Douglas, Max e demais, muito obrigado pelas conversas proveito-
sas que muito me ajudaram. Queria conseguir, algum dia, retribuir de alguma forma. E
tamb´emosamigosquefiznoInstitutodeNeurociˆencia, Camila, Maur´ıcio, Kellyn, J´essica,
Ivany, Daniel, Edith e todos os demais que tanto me guiaram nesse mundo maravilhoso
que ´e o c´erebro humano. Agrade¸co demais!
Aos colegas de trabalho tamb´em tenho muito a agradecer. O incentivo e apoio nos
momentos dif´ıceis devem ser ressaltados, bem como o companheirismo no dia-a-dia. Obri-
ˆ
gado, Rharon, Davi, Angelo, Raphael, Felipe, Jorcyane, Rodrigo, Ju´lio, Dona Ana, Jonas,
Jorge, Vicente e todos que tem torcido por mim, desde quando iniciei no IFPB, em Picu´ı,
como Rosa, Rubevaˆnia, Rudjane, Em´ılia, Emeline, Morgana, Kelly e Yane. Gostaria de
destacar o aux´ılio de Alexandre, coordenador do setor de redes, que montou o ambiente
para a execu¸c˜ao dos experimentos e foi de grande ajuda para diminuir o desespero deste
candidato a pesquisador.
A todos gostaria de agradecer pelo cuidado e pedir desculpas pelos momentos de
ausˆencia e mau humor que esse trabalho tamb´em me gerou, devido a`s preocupa¸co˜es por
querer fazer tudo da melhor forma poss´ıvel e nem sempre conseguir.
E, finalmente, tenho que agradecer `aquele que cria e mant´em a vida, principal objeto
de estudo desse trabalho; aquele que sustenta todas as coisas pela palavra do Seu poder;
em quem no´s vivemos, nos movemos e existimos; aquele que nos criou e preparou com
cuidado cada momento da nossa vida; que me deu a Salva¸ca˜o eterna e incondicional
atrav´es do sacrif´ıcio perfeito do Seu u´nico filho, Jesus, o Cristo.
Deus, meu principal agradecimento ´e Seu, que me fortaleceu durante todo esse traba-
lho e n˜ao me faz surtar com todas as dificuldades que essa vida traz. S´o com vocˆe que a
vida faz sentido. Muito obrigado.
Autor: Kelyson Nunes dos Santos
Orientador: Dr. Augusto Venaˆncio Neto
Co-orientador: Dr. Renan Cipriano Moioli
Resumo
A predic¸˜ao de eventos a partir de dados neurofisiolo´gicos possui muitas varia´veis que de-
vem ser analisadas em diferentes momentos, desde a aquisic¸˜ao e registro de dados at´e
o p´os-processamento dos mesmos. Assim, a escolha do algoritmo que ir´a processar es-
ses dados ´e uma etapa muito importante, pois o tempo de processamento e a acura´cia
do resultado sa˜o fatores determinantes para uma ferramenta de aux´ılio de diagno´stico.
A tarefa de classifica¸ca˜o e predic¸˜ao tamb´em auxilia no entendimento das intera¸c˜oes re-
alizadas pelas redes de c´elulas cerebrais. Este trabalho utiliza t´ecnicas de Aprendizado
de Ma´quina Supervisionado com diferentes caracter´ısticas para analisar seu impacto na
tarefa de predi¸c˜ao de crises epil´eticas a partir de dados neurofisiolo´gicos em cachorros e
propo˜e o uso de comitˆes de classificadores de forma a otimizar o desempenho da tarefa de
predi¸ca˜o atrav´es do uso de t´ecnicas de baixo custo computacional. Os dados de EEG em
cachorros com epilepsia foram pr´e-processados atrav´es da transformada de Fourier e ape-
nas as frequˆencias significantes foram analisadas (de 1 a 30Hz). Foi aplicado um redutor
de dimensionalidade e os dados foram submetidos `as t´ecnicas de aprendizado de m´aquina
supervisionado. Dois cena´rios foram avaliados: o primeiro utiliza os dados brutos obti-
dos na transformada de Fourier, enquanto que o segundo realiza uma transforma¸ca˜o nos
dados. A avaliac¸˜ao dos experimentos ocorreu atrav´es da m´etrica de ´area sobre a curva.
Os melhores resultados conseguidos foram, para o cen´ario A (a) um comitˆe heterogˆeneo
formado por um KNN, uma ´arvore de decisa˜o e um classificador bayesiano, pontuando em
0.703 e (b) uma configura¸ca˜o de ´arvore de decis˜ao com o valor de 0.687, enquanto para o
cena´rio B obtiveram a melhor avalia¸ca˜o (a) uma configurac¸˜ao de a´rvore de decis˜ao, com o
valor 0.620 e (b) um comitˆe heterogˆeneo composto por um KNN, uma ´arvore de decis˜ao
e um classificador bayesiano alcanc¸ando o valor 0.612 de avalia¸ca˜o.
Palavras-chave: predi¸c˜ao de eventos, predi¸ca˜o de crises epil´eticas, epilepsia, comitˆes de
classificadores.
Author: Kelyson Nunes dos Santos
Advisor: Augusto Venaˆncio Neto, Ph.D.
Co-advisor: Renan Cipriano Moioli, Ph.D.
Abstract
Eventpredictionfromneurophysiologicaldatahasmanyvariableswhichmustbeanalyzed
in different moments, since data acquisition and registry to its post-processing. Hence,
choosingthealgorithmthatwillprocessthesedataisaveryimportantstep, forprocessing
timeandaccuracyofresultsaredeterminantfactorsforadiagnosisauxiliarytool. Tasksof
classification and prediction also help in understanding brain cell’s networks interactions.
This work uses Supervised Machine Learning techniques with different features to analyze
theirimpactonthetaskofepilepticseizurepredictionfromcanineneurophysiologicaldata
and purposes using of ensembles to optimize the performance of event prediction task
through computational low-cost techniques. Epileptic dogs’ EEG data were preprocessed
throug Fourier transform and only significant frequencies were considered (1 to 30Hz).
It was applied a dimensionality reductor and then data was submitted to supervised
machine learning techniques. Two scenarios were evaluated: first used raw data resulted
from Fourier transform, as the second one transform these data. Algorithms evaluation
was made through area under ROC curve (AUC) measure. Best results were to scenario A
(a) an heterogeneous ensemble formed by a KNN, a decision tree and a bayesian classifier,
scoring 0.7074 and (b) an example of decision tree evaluated in 0.687, and, for scenario B,
bestresultswere(a)asetupofdecisiontreewhichobtained0.620and(b)anheterogeneous
ensemble composed by a KNN, a decision tree and a bayesian classifier, scoring 0.612.
Keywords: event prediction, seizure prediction, epilepsy, ensembles.
Description:para Prediç˜ao de crises Epiléticas apresentada por Kelyson Nunes dos Santos e aceita pelo. Programa de Pós-Graduaç˜ao em Sistemas e