With the development of artificial intelligence and deep learning, the most advanced branch of Machine Learning, we are witnessing a rapid development of optimization algorithms as well as those related to convolutional neural networks (CNN). CNNs have achieved an important role in several fields, such as in medical images classification for diagnostic or detection purposes. Using them in a real-life scenario, in clinical and research settings, saves processing time and storage space. In this thesis we will present the intuitions and ideas that inspired the creation of neural networks, a brief historical digression, the analysis and the probability underlying convolutional neural networks. Afterwards will be displayed the regularization techniques to avoid the overfitting problem, the gradient-based optimization algorithms used in deep learning and their implementations on the Python programming language, the backpropagation, as well as some useful algorithms and techniques such as early stopping and dropout. We will also use an example of CNN architecture, built with Python, using the previously introduced algorithms, for the classification of MRI images of the brain. This CNN can be useful for diagnosing and recognizing of Alzheimer's disease level, the most common form of neurodegenerative dementia in the elderly. The used images are part of a dataset that can be downloaded online from the kaggle.com website. Finally, the obtained results will be commented and a network model with satisfying performance for medical field purposes will be obtained through some strategies to improve the classification performance.
Con lo sviluppo dell’intelligenza artificiale e del deep learning, ramo più avanzato del Machine Learning, si sta assistendo a un rapido sviluppo degli algoritmi di ottimizzazione nonché di quelli legati alle reti neurali convoluzionali (CNN). Le CNN hanno raggiunto un ruolo importante in diversi ambiti, come nella classificazione di immagini mediche per scopi diagnostici o di rilevamento. Il loro utilizzo in uno scenario di vita reale, in ambito clinico e di ricerca, permette di risparmiare tempo di elaborazione e spazio di archiviazione. In questa tesi si presenteranno le intuizioni e le idee che hanno ispirato la creazione delle reti neurali, una breve digressione storica, l’analisi e la probabilità che sta alla base delle reti neurali convoluzionali. In seguito verranno esposte le tecniche di regolarizzazione per evitare il problema dell’overfitting, gli algoritmi di ottimizzazione gradient-based utilizzati nell’ambito del deep learning e le loro implementazioni sul linguaggio di programmazione Python, la backpropagation, nonché alcuni algoritmi e tecniche utili per la classificazione come l’early stopping e il dropout. Si utilizzerà inoltre, un esempio di architettura di CNN, costruita con Python, che si avvale delle tecniche precedentemente introdotte, per la classificazione di immagini di risonanze magnetiche al cervello. Questa CNN può essere utile per effettuare la diagnosi e il riconoscimento del livello di malattia del morbo di Alzheimer, la forma più comune di demenza neurodegenerativa in età senile. Le immagini utilizzate fanno parte di un dataset scaricabile online dal sito kaggle.com. Verranno infine commentati i risultati ottenuti e attraverso alcune strategie per migliorare le performance di classificazione si otterrà un modello di rete con prestazioni soddisfacenti per gli scopi previsti dall’ambito medico.
Classificazione di MRI tramite reti neurali convoluzionali con algoritmi di ottimizzazione gradient-based
DI STOLFO, ANTONIO
2021/2022
Abstract
Con lo sviluppo dell’intelligenza artificiale e del deep learning, ramo più avanzato del Machine Learning, si sta assistendo a un rapido sviluppo degli algoritmi di ottimizzazione nonché di quelli legati alle reti neurali convoluzionali (CNN). Le CNN hanno raggiunto un ruolo importante in diversi ambiti, come nella classificazione di immagini mediche per scopi diagnostici o di rilevamento. Il loro utilizzo in uno scenario di vita reale, in ambito clinico e di ricerca, permette di risparmiare tempo di elaborazione e spazio di archiviazione. In questa tesi si presenteranno le intuizioni e le idee che hanno ispirato la creazione delle reti neurali, una breve digressione storica, l’analisi e la probabilità che sta alla base delle reti neurali convoluzionali. In seguito verranno esposte le tecniche di regolarizzazione per evitare il problema dell’overfitting, gli algoritmi di ottimizzazione gradient-based utilizzati nell’ambito del deep learning e le loro implementazioni sul linguaggio di programmazione Python, la backpropagation, nonché alcuni algoritmi e tecniche utili per la classificazione come l’early stopping e il dropout. Si utilizzerà inoltre, un esempio di architettura di CNN, costruita con Python, che si avvale delle tecniche precedentemente introdotte, per la classificazione di immagini di risonanze magnetiche al cervello. Questa CNN può essere utile per effettuare la diagnosi e il riconoscimento del livello di malattia del morbo di Alzheimer, la forma più comune di demenza neurodegenerativa in età senile. Le immagini utilizzate fanno parte di un dataset scaricabile online dal sito kaggle.com. Verranno infine commentati i risultati ottenuti e attraverso alcune strategie per migliorare le performance di classificazione si otterrà un modello di rete con prestazioni soddisfacenti per gli scopi previsti dall’ambito medico.File | Dimensione | Formato | |
---|---|---|---|
859201_tesidistolfo.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
16.01 MB
Formato
Adobe PDF
|
16.01 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/67848