Background and objective: Lung cancer, and in particular non-small cell lung cancer (NSCLC), is one of the most widespread in the world and has one of the worst prognosis. In the approach to the advanced stage of the disease, a molecular and genetic characterization is essential, obtainable only through endoscopic biopsy or eco- or Tc-guided, in order to propose the best possible treatment through the administration of molecular target drugs, whose extraordinary efficacy is strictly dependent on the careful selection of patients. These procedures are, however, burdened by a high invasiveness and the onset of complications. Radiomics and Radiogenomics, two branches of radiology recently developed, aim to assist in the identification and classification of diseases (tumor and non-tumor) through the analysis of information extracted from radiological images, so as to reduce the number of biopsies and indicate the best site in which to perform them. The purpose of this thesis is to verify the accuracy of an algorithm based on Artificial Intelligence (AI) capable, through deep learning with convolutive neural networks (CNN), to automatically identify and segment NSCLC lesions in stage IV in CT scans of patients (segmentation), also managing to describe the mutational state as oncogen-addicted or not (classification), also performing processes of self-correction and learning that improve the efficiency without requiring human intervention. Methods: from April 2017 to December 2018 were selected 73 patients with stage IV disease and who had undergone genomic analysis (NGS), whose anamnestic and radiological characteristics have been collected. Subsequently, the selected tumor lesions were segmented and then subjected to computer analysis at the Department of Computer Science at the University of Turin, and analyzed by the deep learning algorithm. The CNN was able, through the identification and computer analysis of radiological features, to identify patterns that led to the automatic recognition of tumor lesions and the characterization in oncogen-addicted and non-addicted. Results: Of the 73 patients analyzed 93.1% was segmented by the algorithm in an accurate way compared to the segmentation performed by radiologists. It was possible to automatically identify the state of oncogene-addicted and non-addicted with a degree of accuracy of 82%, a sensitivity of 84% and a specificity of 76%. Conclusions: We believe that the result obtained by our study in the realization of an algorithm capable of automatically segmenting the lesions is extremely satisfactory and above all innovative, because, limited to our knowledge, there are no similar previous literature. As for the segmentation phase, the result is equally satisfactory. The main limitations of our study concern the sample size and the ability of CNN to classify only as addicted and not the segmented lesions, In the continuation of the study it will be essential to increase the sample size, so that the algorithm increases its learning capacity and accuracy.
Background e obbiettivo: il tumore del polmone, ed in particolare quello non a piccole cellule (NSCLC) è uno dei più diffusi al mondo e con la prognosi peggiore. Nell'approccio alla malattia in stadio avanzato risulta fondamentale una caratterizzazione molecolare e genetica, ottenibile solamente tramite esame bioptico endoscopico oppure eco- o Tc-guidato, al fine di proporre il miglior trattamento possibile tramite la somministrazione di farmaci a bersaglio molecolare, la cui straordinaria efficacia è strettamente dipendente dall'accurata selezione dei pazienti. Queste procedure sono tuttavia gravate da un'alta invasività e dall'insorgenza di complicanze. La Radiomica e la Radiogenomica, due branche della radiologia di recente sviluppo, si prefiggono lo scopo di coadiuvare l'identificazione e classificazione delle patologie (tumorali e non) tramite l'analisi di informazioni estratte dalle immagini radiologiche, in modo da ridurre il numero di biopsie e indicare la sede migliore in cui effettuarle. Lo scopo di questa tesi è verificare l'accuratezza di un algoritmo basato su Intelligenza artificiale (AI) capace, tramite il deep learning con reti neurali convolutive (CNN), di identificare e segmentare automaticamente le lesioni NSCLC in stadio IV presenti nelle TC dei pazienti (segmentazione), riuscendo inoltre a descriverne lo stato mutazionale come oncogene-addicted o no (classificazione), effettuando anche dei processi di autocorrezione e apprendimento che ne migliorino l'efficienza senza richiedere l'intervento umano. Metodi: da Aprile 2017 a Dicembre 2018 sono stati selezionati 73 pazienti con stadio IV di malattia e che fossero stati sottoposti ad analisi genomica (NGS), di cui sono state raccolte le caratteristiche anamnestiche e radiologiche. Successivamente le lesioni tumorali selezionate sono state segmentate e successivamente sottoposte ad analisi informatica presso il Dipartimento d'informatica dell'università di Torino, e analizzati dell'algoritmo di deep learning. Il CNN ha potuto, tramite l'individuazione e analisi informatica di features radiologiche, identificare dei pattern che hanno portato al riconoscimento automatico delle lesioni tumorali e alla caratterizzazione in oncogene-addicted e non addicted. Risultati: Dei 73 pazienti analizzati il 93,1% è stato segmentato dall'algoritmo in maniera accurata rispetto alla segmentazione effettuata dai radiologi. È stato possibile identificare automaticamente lo stato di oncogene-addiction e non addiction con un grado di accuratezza dell'82%, una sensibilità dell'84% e una specificità del 76%. Conclusioni: Riteniamo che il risultato ottenuto dal nostro studio nella realizzazione di un algoritmo capace di segmentare automaticamente le lesioni sia estremamente soddisfacente e soprattutto innovativo, in quanto non esistono in letteratura precedenti simili. Per quanto riguarda la fase di segmentazione il risultato è altrettanto soddisfacente. I principali limiti del nostro studio riguardano la numerosità campionaria e la capacità del CNN di classificare unicamente come addicted e non le lesioni segmentate, Nella continuazione dello studio sarà fondamentale aumentare la numerosità campionaria, cosicché l'algoritmo aumenti la sua capacità d'apprendimento e l'accuratezza.
Tumore del polmone non a piccole cellule in stadio IV: correlazione tra analisi radiomica delle immagini TC e stato mutazionale
PERINO, MARCO
2019/2020
Abstract
Background e obbiettivo: il tumore del polmone, ed in particolare quello non a piccole cellule (NSCLC) è uno dei più diffusi al mondo e con la prognosi peggiore. Nell'approccio alla malattia in stadio avanzato risulta fondamentale una caratterizzazione molecolare e genetica, ottenibile solamente tramite esame bioptico endoscopico oppure eco- o Tc-guidato, al fine di proporre il miglior trattamento possibile tramite la somministrazione di farmaci a bersaglio molecolare, la cui straordinaria efficacia è strettamente dipendente dall'accurata selezione dei pazienti. Queste procedure sono tuttavia gravate da un'alta invasività e dall'insorgenza di complicanze. La Radiomica e la Radiogenomica, due branche della radiologia di recente sviluppo, si prefiggono lo scopo di coadiuvare l'identificazione e classificazione delle patologie (tumorali e non) tramite l'analisi di informazioni estratte dalle immagini radiologiche, in modo da ridurre il numero di biopsie e indicare la sede migliore in cui effettuarle. Lo scopo di questa tesi è verificare l'accuratezza di un algoritmo basato su Intelligenza artificiale (AI) capace, tramite il deep learning con reti neurali convolutive (CNN), di identificare e segmentare automaticamente le lesioni NSCLC in stadio IV presenti nelle TC dei pazienti (segmentazione), riuscendo inoltre a descriverne lo stato mutazionale come oncogene-addicted o no (classificazione), effettuando anche dei processi di autocorrezione e apprendimento che ne migliorino l'efficienza senza richiedere l'intervento umano. Metodi: da Aprile 2017 a Dicembre 2018 sono stati selezionati 73 pazienti con stadio IV di malattia e che fossero stati sottoposti ad analisi genomica (NGS), di cui sono state raccolte le caratteristiche anamnestiche e radiologiche. Successivamente le lesioni tumorali selezionate sono state segmentate e successivamente sottoposte ad analisi informatica presso il Dipartimento d'informatica dell'università di Torino, e analizzati dell'algoritmo di deep learning. Il CNN ha potuto, tramite l'individuazione e analisi informatica di features radiologiche, identificare dei pattern che hanno portato al riconoscimento automatico delle lesioni tumorali e alla caratterizzazione in oncogene-addicted e non addicted. Risultati: Dei 73 pazienti analizzati il 93,1% è stato segmentato dall'algoritmo in maniera accurata rispetto alla segmentazione effettuata dai radiologi. È stato possibile identificare automaticamente lo stato di oncogene-addiction e non addiction con un grado di accuratezza dell'82%, una sensibilità dell'84% e una specificità del 76%. Conclusioni: Riteniamo che il risultato ottenuto dal nostro studio nella realizzazione di un algoritmo capace di segmentare automaticamente le lesioni sia estremamente soddisfacente e soprattutto innovativo, in quanto non esistono in letteratura precedenti simili. Per quanto riguarda la fase di segmentazione il risultato è altrettanto soddisfacente. I principali limiti del nostro studio riguardano la numerosità campionaria e la capacità del CNN di classificare unicamente come addicted e non le lesioni segmentate, Nella continuazione dello studio sarà fondamentale aumentare la numerosità campionaria, cosicché l'algoritmo aumenti la sua capacità d'apprendimento e l'accuratezza.File | Dimensione | Formato | |
---|---|---|---|
793461_tesiperinomarco.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
2.18 MB
Formato
Adobe PDF
|
2.18 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/129839