The present treatise concerns the development and performance analysis of a Classi- ficator for the identification of K-Complexes (KC), particular signal patterns appreciable within polysomnography (electroencephalograms recorded during sleep). The data used come from the Montreal Archive of Sleep Studies (MASS), a vast archive containing 19 EEGs of patients during approximately 8 hours of sleep each. The analysis is mainly based on Topological Data Analysis (TDA), used to obtain persistence diagrams by means of Lower Star Filtration (LSF) and Sliding Window Embedding (SWE) of the signal. The features used by the classifier were extracted from the persistence diagrams and other signal properties described in the literature. Considering that the number of KCs is significantly lower than non-KCs, it was necessary to create a balanced dataset to train the classifier. For this purpose, we adopted two strategies: generation of synthetic KCs and the use of the SMOTE algorithm to create synthetic features. The project was carried out in collaboration with Dr Giorgio Capaccetta, a student at the University of Turin, with whom I developed a strong partnership. The end result consists of the creation of an R package, which contains all the analysis code and can be used in the medical field for the recognition of K complexes by means of machine learning techniques.
Il presente trattato riguarda lo sviluppo e l’analisi delle prestazioni di un Classi- ficatore, per l’identificazione dei Complessi K (KC), particolari pattern di segnale apprezzabili all’ interno di una polisonnografia (elettroencefalogrammi registrati du- rante il sonno). I dati utilizzati provengono dal Montreal Archive of Sleep Studies (MASS), un vasto archivio che contiene 19 EEG di pazienti durante circa 8 ore di sonno ciascuno. L’analisi si basa principalmente sulla Topological Data Analysis (TDA), utilizzata per ottenere diagrammi di persistenza attraverso la Lower Star Filtration (LSF) e lo Sliding Window Embedding (SWE) del segnale. Le caratteristiche (Features) utilizzate dal classificatore sono state estratte dai diagrammi di persistenza e da altre proprietà del segnale descritte in letteratura. Considerando che il numero di KC è significativamente inferiore rispetto ai non KC, è stato necessario creare un dataset bilanciato per addestrare il classificatore. Per questo scopo, abbiamo adottato due strategie: generazione di KC sintetici e l’uso dell’ algoritmo SMOTE per la creazione di caratteristiche sintetiche. Il progetto è stato realizzato in collaborazione con il dottor Giorgio Capaccetta, studente dell’Università degli Studi di Torino, con il quale ho sviluppato una solida collaborazione. Il risultato finale consiste nella creazione di un pacchetto R, che contiene tutto il codice dell’analisi e può essere utilizzato in ambito medico per il riconoscimento dei complessi K attraverso tecniche di machine learning.
Un nuovo algoritmo di machine learning per la classificazione di complessi K: analisi delle prestazioni e selezione dei parametri liberi
GIANNONE, MARCO
2023/2024
Abstract
Il presente trattato riguarda lo sviluppo e l’analisi delle prestazioni di un Classi- ficatore, per l’identificazione dei Complessi K (KC), particolari pattern di segnale apprezzabili all’ interno di una polisonnografia (elettroencefalogrammi registrati du- rante il sonno). I dati utilizzati provengono dal Montreal Archive of Sleep Studies (MASS), un vasto archivio che contiene 19 EEG di pazienti durante circa 8 ore di sonno ciascuno. L’analisi si basa principalmente sulla Topological Data Analysis (TDA), utilizzata per ottenere diagrammi di persistenza attraverso la Lower Star Filtration (LSF) e lo Sliding Window Embedding (SWE) del segnale. Le caratteristiche (Features) utilizzate dal classificatore sono state estratte dai diagrammi di persistenza e da altre proprietà del segnale descritte in letteratura. Considerando che il numero di KC è significativamente inferiore rispetto ai non KC, è stato necessario creare un dataset bilanciato per addestrare il classificatore. Per questo scopo, abbiamo adottato due strategie: generazione di KC sintetici e l’uso dell’ algoritmo SMOTE per la creazione di caratteristiche sintetiche. Il progetto è stato realizzato in collaborazione con il dottor Giorgio Capaccetta, studente dell’Università degli Studi di Torino, con il quale ho sviluppato una solida collaborazione. Il risultato finale consiste nella creazione di un pacchetto R, che contiene tutto il codice dell’analisi e può essere utilizzato in ambito medico per il riconoscimento dei complessi K attraverso tecniche di machine learning.File | Dimensione | Formato | |
---|---|---|---|
Marco Giannone_tesi_triennale_diunito.pdf
non disponibili
Dimensione
3.8 MB
Formato
Adobe PDF
|
3.8 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/5082