Background: Dementia is among the leading causes of death and disability in the world, representing an important socioeconomic burden. Due to population aging it is expected that its prevalence will be tripled in 2050, urging the development of preventive and curative interventions. Alzheimer’s disease is the main cause of dementia. Despite the recent innovations regarding AD disease modifying drugs, the diagnostic tests needed to reach an etiological diagnosis are still expensive and invasive, making it difficult to systematically perform them on anybody who displays onset symptoms, in order to plan an appropriate therapy. Objective: The objective of this exploratory study is to evaluate the potential use in clinical practice of a machine learning system, developed by Politecnico di Torino, capable of distinguishing cognitively impaired patients from healthy subjects, based on their emotional facial response. Methods: 12 cognitively healthy subjects and 16 patients with neurocognitive disorders were recruited from “SSD Malattia di Alzheimer/demenze correlate” and “Centro di Ricerca Clinica Cefalee, Dipartimento di Neuroscienze Rita Levi Montalcini”. The 28 subjects were recorded while watching a multimodal emotional elicitation video (which used visual and auditory stimuli). 27 over 28 recordings complied with the technical standards and were processed in order to be analyzed by a neural network system (CNN), whose purpose is to extract the values of valence and arousal, the two features of the dimensional model of affect. The time sequences of valence and arousal were processed in order to build one feature vector for each subject. Those vectors were then elaborated by the classification algorithm K-Nearest Neighbors to distinguish the cognitively impaired patients from the healthy subjects. The system’s accuracy has been established using the nested cross-validation technique. Results: The classification algorithm K-Nearest Neighbors achieved an estimated accuracy of 74,4% (with a standard deviation of 5,15), which means that, based on the experiment, it is able to give a correct diagnosis 74.4% of the time. Conclusions: The results of this experiment highlights the potential use of facial expressions, codified by the dimensional model of affect, to identify the cognitively impaired patients. Moreover, it represents a baseline which can be further developed and improved to achieve a more sophisticated system. Although the promising results of this explorative study, its restricted numerosity doesn't allow us to establish if this model is applicable to a real world scenario. In order to confirm the system’s performance in a real world scenario it should be tested in a larger study, which could validate the algorithm’s accuracy with an independent test-set rather than with an internal validation method (nested cross-validation). Furthermore, a larger study will enable the possibility of exploring different objectives, such as analyzing facial mimicry differences between AD patients and other causes of dementias, in order to promptly identify high risk AD patients and further assess them with the gold standard examinations (lumbar puncture and amyloid-PET) to reach an etiological diagnosis. This would allow us to commence swiftly the appropriate therapy.

Presupposti: Le demenze sono tra le cause principali di morte e disabilità, costituendo un notevole peso socioeconomico. A causa dell'invecchiamento della popolazione, ci si aspetta che la loro prevalenza possa triplicare per il 2050, rendendo di fondamentale importanza lo sviluppo di interventi preventivi e curativi. La principale causa di demenza è la malattia di Alzheimer. Nonostante i recenti sviluppi nella ricerca di farmaci disease-modifying per questa malattia, gli esami utilizzati per raggiungere una diagnosi eziologica sono invasivi e costosi, rendendone difficile l’applicazione sistematica a chiunque presenti i sintomi iniziali, per poter accedere alle terapie. Obiettivi: L’obiettivo di questo studio esplorativo è valutare le potenzialità dell’applicazione alla pratica clinica di un sistema di machine learning sviluppato dal Politecnico di Torino per distinguere i pazienti affetti da disturbo neurocognitivo dai soggetti sani, sulla base delle differenti reazioni emotive facciali. Metodi: Sono stati reclutati 12 soggetti cognitivamente sani e 16 pazienti affetti da disturbi neurocognitivi a diversa eziologia, afferenti alla SSD Malattia di Alzheimer/demenze correlate e Centro di Ricerca Clinica Cefalee, Dipartimento di Neuroscienze “Rita Levi Montalcini”. I 28 soggetti reclutati sono stati registrati mentre guardavano un video di elicitazione emozionale multimodale, visiva e uditiva. 27 delle 28 registrazioni sono state ritenute adeguate e processate per essere sottoposte ad un sistema di reti neurali (CNN) in grado di estrarre i valori di valenza e arousal, i due parametri del modello dimensionale dell'affetto. Le sequenze temporali di valenza e arousal di pazienti e controlli sono state processate per costruire i vettori rappresentativi di ogni paziente. Questi vettori sono stati elaborati da un algoritmo di classificazione K-Nearest Neighbors per distinguere i casi dai controlli. L’accuratezza della classificazione è stata valutata mediante la tecnica di nested cross-validation. Risultati: L’algoritmo di classificazione K-Nearest Neighbors ha un accuratezza stimata del 74,4% (con una deviazione standard di 5,15), ovvero è previsto, sulla base dell’esperimento effettuato, che formuli una diagnosi corretta nel 74,4% dei casi. Conclusioni: i risultati di questo studio evidenziano i potenziali vantaggi dell’utilizzo delle espressioni facciali, codificate tramite il modello dimensionale dell’affetto, per identificare i pazienti affetti da disturbo neurocognitivo e getta le fondamenta per lo sviluppo in futuro di un sistema più sofisticato e accurato. Nonostante i buoni risultati dello studio esplorativo, la numerosità limitata non ci permette di stabilire con sicurezza quanto queste osservazioni possano estendersi ad un utilizzo nel mondo reale del modello sviluppato. L’applicazione di questo modello a un campione più ampio di soggetti ci permetterebbe di validarne l’accuratezza non solo tramite tecniche di validazione interna (nested cross-validation) ma anche tramite test set indipendenti che simulano meglio l’applicazione a scenari reali. Uno studio più grande ci permetterebbe inoltre di esplorare ulteriori obiettivi, come analizzare le differenze della mimica facciale nei pazienti con AD rispetto ai soggetti con altre forme di demenza, identificando precocemente pazienti ad alto rischio di AD da indirizzare verso gli esami gold-standard per la diagnosi eziologica (puntura lombare e amyloid-PET) e iniziare precocemente una terapia appropriata.

Videonalisi delle espressioni facciali mediante algoritmi di intelligenza artificiale nei pazienti affetti da disturbo neurocognitivo: uno studio esplorativo

FUCALE, STEFANO
2022/2023

Abstract

Presupposti: Le demenze sono tra le cause principali di morte e disabilità, costituendo un notevole peso socioeconomico. A causa dell'invecchiamento della popolazione, ci si aspetta che la loro prevalenza possa triplicare per il 2050, rendendo di fondamentale importanza lo sviluppo di interventi preventivi e curativi. La principale causa di demenza è la malattia di Alzheimer. Nonostante i recenti sviluppi nella ricerca di farmaci disease-modifying per questa malattia, gli esami utilizzati per raggiungere una diagnosi eziologica sono invasivi e costosi, rendendone difficile l’applicazione sistematica a chiunque presenti i sintomi iniziali, per poter accedere alle terapie. Obiettivi: L’obiettivo di questo studio esplorativo è valutare le potenzialità dell’applicazione alla pratica clinica di un sistema di machine learning sviluppato dal Politecnico di Torino per distinguere i pazienti affetti da disturbo neurocognitivo dai soggetti sani, sulla base delle differenti reazioni emotive facciali. Metodi: Sono stati reclutati 12 soggetti cognitivamente sani e 16 pazienti affetti da disturbi neurocognitivi a diversa eziologia, afferenti alla SSD Malattia di Alzheimer/demenze correlate e Centro di Ricerca Clinica Cefalee, Dipartimento di Neuroscienze “Rita Levi Montalcini”. I 28 soggetti reclutati sono stati registrati mentre guardavano un video di elicitazione emozionale multimodale, visiva e uditiva. 27 delle 28 registrazioni sono state ritenute adeguate e processate per essere sottoposte ad un sistema di reti neurali (CNN) in grado di estrarre i valori di valenza e arousal, i due parametri del modello dimensionale dell'affetto. Le sequenze temporali di valenza e arousal di pazienti e controlli sono state processate per costruire i vettori rappresentativi di ogni paziente. Questi vettori sono stati elaborati da un algoritmo di classificazione K-Nearest Neighbors per distinguere i casi dai controlli. L’accuratezza della classificazione è stata valutata mediante la tecnica di nested cross-validation. Risultati: L’algoritmo di classificazione K-Nearest Neighbors ha un accuratezza stimata del 74,4% (con una deviazione standard di 5,15), ovvero è previsto, sulla base dell’esperimento effettuato, che formuli una diagnosi corretta nel 74,4% dei casi. Conclusioni: i risultati di questo studio evidenziano i potenziali vantaggi dell’utilizzo delle espressioni facciali, codificate tramite il modello dimensionale dell’affetto, per identificare i pazienti affetti da disturbo neurocognitivo e getta le fondamenta per lo sviluppo in futuro di un sistema più sofisticato e accurato. Nonostante i buoni risultati dello studio esplorativo, la numerosità limitata non ci permette di stabilire con sicurezza quanto queste osservazioni possano estendersi ad un utilizzo nel mondo reale del modello sviluppato. L’applicazione di questo modello a un campione più ampio di soggetti ci permetterebbe di validarne l’accuratezza non solo tramite tecniche di validazione interna (nested cross-validation) ma anche tramite test set indipendenti che simulano meglio l’applicazione a scenari reali. Uno studio più grande ci permetterebbe inoltre di esplorare ulteriori obiettivi, come analizzare le differenze della mimica facciale nei pazienti con AD rispetto ai soggetti con altre forme di demenza, identificando precocemente pazienti ad alto rischio di AD da indirizzare verso gli esami gold-standard per la diagnosi eziologica (puntura lombare e amyloid-PET) e iniziare precocemente una terapia appropriata.
Videoanalysis of Facial expressions using artificial intelligence algorithms in patients with neurocognitive disorder: an exploratory study
Background: Dementia is among the leading causes of death and disability in the world, representing an important socioeconomic burden. Due to population aging it is expected that its prevalence will be tripled in 2050, urging the development of preventive and curative interventions. Alzheimer’s disease is the main cause of dementia. Despite the recent innovations regarding AD disease modifying drugs, the diagnostic tests needed to reach an etiological diagnosis are still expensive and invasive, making it difficult to systematically perform them on anybody who displays onset symptoms, in order to plan an appropriate therapy. Objective: The objective of this exploratory study is to evaluate the potential use in clinical practice of a machine learning system, developed by Politecnico di Torino, capable of distinguishing cognitively impaired patients from healthy subjects, based on their emotional facial response. Methods: 12 cognitively healthy subjects and 16 patients with neurocognitive disorders were recruited from “SSD Malattia di Alzheimer/demenze correlate” and “Centro di Ricerca Clinica Cefalee, Dipartimento di Neuroscienze Rita Levi Montalcini”. The 28 subjects were recorded while watching a multimodal emotional elicitation video (which used visual and auditory stimuli). 27 over 28 recordings complied with the technical standards and were processed in order to be analyzed by a neural network system (CNN), whose purpose is to extract the values of valence and arousal, the two features of the dimensional model of affect. The time sequences of valence and arousal were processed in order to build one feature vector for each subject. Those vectors were then elaborated by the classification algorithm K-Nearest Neighbors to distinguish the cognitively impaired patients from the healthy subjects. The system’s accuracy has been established using the nested cross-validation technique. Results: The classification algorithm K-Nearest Neighbors achieved an estimated accuracy of 74,4% (with a standard deviation of 5,15), which means that, based on the experiment, it is able to give a correct diagnosis 74.4% of the time. Conclusions: The results of this experiment highlights the potential use of facial expressions, codified by the dimensional model of affect, to identify the cognitively impaired patients. Moreover, it represents a baseline which can be further developed and improved to achieve a more sophisticated system. Although the promising results of this explorative study, its restricted numerosity doesn't allow us to establish if this model is applicable to a real world scenario. In order to confirm the system’s performance in a real world scenario it should be tested in a larger study, which could validate the algorithm’s accuracy with an independent test-set rather than with an internal validation method (nested cross-validation). Furthermore, a larger study will enable the possibility of exploring different objectives, such as analyzing facial mimicry differences between AD patients and other causes of dementias, in order to promptly identify high risk AD patients and further assess them with the gold standard examinations (lumbar puncture and amyloid-PET) to reach an etiological diagnosis. This would allow us to commence swiftly the appropriate therapy.
RICHIARDI, LORENZO
IMPORT TESI SOLO SU ESSE3 DAL 2018
File in questo prodotto:
File Dimensione Formato  
Tesidef.pdf

non disponibili

Dimensione 14.69 MB
Formato Adobe PDF
14.69 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/1192