Modern electrophysiological techniques allows to record the electrical extra-cellular potential from the cerebral cortex simultaneously from 100 or more electrodes. This makes possible to reconstruct the electrical impulses ("spike trains") of tens or hundreds of neurons in parallel. Such massively parallel data led to the development of several statistical methods for detection and evaluation of higher-order correlation, that are supposed to play a fundamental role in network processing and coding in the brain. There exist a number of statistical methods that are able to detect and identify different correlation structures in such massively parallel data. The goal of this work is to compare some of these methods by applying them to the same (simulated) data of known ground truth. The results obtained by application on the same data designed with different correlation structures enlighten different aspects of correlation structures which are often difficult to relate to each other. In this thesis we consider two methods: the CuBic method (Staude et al. 2009) and SPADE (Torre et al. 2013). The first is designed to extract a lower bound of exisiting higher-order correlations, the other extracts synchrony patterns occurring significantly. We propose a general approach for testing and comparing the different analysis tools. The integration of the results from the different methods is fundamental for a better interpretation of the correlation structure underlying the analyzed data. We proceeded by presenting a framework to model and simulate generic correlated spike trains. Then we applied the two methods to such simulated data and critically interpreted the results. We showed that the integrated information from the results of the two methods allow to identify the actual correlation structure in most of the simulated datasets. We propose the use of simulated datasets as a general procedure to test and calibrate statistical analyses. Eventually we focused on parameters the generative model for which a direct comparison of the different methods' result is not possible. We analyzed in detail the performance of the methods for this particular parameter settings for large number of realizations of simulated data.

Moderne tecniche elettrofisiologiche permettono di registrare il potenziale elettrico extracellulare della corteccia cerebrale tramite 100 o più elettrodi simultaneamente e, così facendo, di ricostruire le serie temporali di impulsi elettrici ("spike trains") di decine o centinaia di neuroni in parallelo. Conseguentemente sono stati sviluppati diversi metodi per l'analisi delle correlazioni multidimensionali in tali dati, ritenute un aspetto importante dei meccanismi di codifica dell'informazione nella corteccia cerebrale. Questi metodi sono stati pensati per rivelare diverse strutture di correlazione possibilmente presenti nei dati. I risultati ottenuti sugli stessi dati da metodi diversi mettono in luce aspetti diversi delle correlazioni presenti, e risultano spesso difficili da relazionare. L'obiettivo di questa tesi é comparare alcuni di questi metodi applicandoli agli stessi data (simulati) dei quali si conosce la vera struttura di correlazione. In particolare abbiamo considerato due di questi metodi:the CuBic method and SPADE(Staude et al. 2009 e Torre et al. 2013) . Il primo é construito per stimare dai dati il minimo ordine di correlazione, il secondo per estrarre patterns di sincronia che occorrono significativamente. A tal fine abbiamo dapprima generalizzato un modello statistico di spike trains correlati, che permette di generare dati simulati con differenti strutture di correlazione. Abbiamo quindi applicato i due metodi sopra citati a questi dati e interpretato i risultati ottenuti. Mostriamo come integrando le informazioni ottenute da metodi differenti possiamo identificare l'esatta struttura di correlazione nella maggior parte dei dataset simulati. Infine abbiamo approfondito i casi in cui la scelta dei parametri dei modelli rende i risultati delle analisi non comparabili. Per questi parametri abbiamo analizzato in dettaglio la performance dei singoli metodi su un grande numero di realizzazioni dei dati.

Analisi comparativa delle correlazioni in processi di punto multi-dimensionali: applicazioni alle neuroscienze

QUAGLIO, PIETRO
2014/2015

Abstract

Moderne tecniche elettrofisiologiche permettono di registrare il potenziale elettrico extracellulare della corteccia cerebrale tramite 100 o più elettrodi simultaneamente e, così facendo, di ricostruire le serie temporali di impulsi elettrici ("spike trains") di decine o centinaia di neuroni in parallelo. Conseguentemente sono stati sviluppati diversi metodi per l'analisi delle correlazioni multidimensionali in tali dati, ritenute un aspetto importante dei meccanismi di codifica dell'informazione nella corteccia cerebrale. Questi metodi sono stati pensati per rivelare diverse strutture di correlazione possibilmente presenti nei dati. I risultati ottenuti sugli stessi dati da metodi diversi mettono in luce aspetti diversi delle correlazioni presenti, e risultano spesso difficili da relazionare. L'obiettivo di questa tesi é comparare alcuni di questi metodi applicandoli agli stessi data (simulati) dei quali si conosce la vera struttura di correlazione. In particolare abbiamo considerato due di questi metodi:the CuBic method and SPADE(Staude et al. 2009 e Torre et al. 2013) . Il primo é construito per stimare dai dati il minimo ordine di correlazione, il secondo per estrarre patterns di sincronia che occorrono significativamente. A tal fine abbiamo dapprima generalizzato un modello statistico di spike trains correlati, che permette di generare dati simulati con differenti strutture di correlazione. Abbiamo quindi applicato i due metodi sopra citati a questi dati e interpretato i risultati ottenuti. Mostriamo come integrando le informazioni ottenute da metodi differenti possiamo identificare l'esatta struttura di correlazione nella maggior parte dei dataset simulati. Infine abbiamo approfondito i casi in cui la scelta dei parametri dei modelli rende i risultati delle analisi non comparabili. Per questi parametri abbiamo analizzato in dettaglio la performance dei singoli metodi su un grande numero di realizzazioni dei dati.
ENG
Modern electrophysiological techniques allows to record the electrical extra-cellular potential from the cerebral cortex simultaneously from 100 or more electrodes. This makes possible to reconstruct the electrical impulses ("spike trains") of tens or hundreds of neurons in parallel. Such massively parallel data led to the development of several statistical methods for detection and evaluation of higher-order correlation, that are supposed to play a fundamental role in network processing and coding in the brain. There exist a number of statistical methods that are able to detect and identify different correlation structures in such massively parallel data. The goal of this work is to compare some of these methods by applying them to the same (simulated) data of known ground truth. The results obtained by application on the same data designed with different correlation structures enlighten different aspects of correlation structures which are often difficult to relate to each other. In this thesis we consider two methods: the CuBic method (Staude et al. 2009) and SPADE (Torre et al. 2013). The first is designed to extract a lower bound of exisiting higher-order correlations, the other extracts synchrony patterns occurring significantly. We propose a general approach for testing and comparing the different analysis tools. The integration of the results from the different methods is fundamental for a better interpretation of the correlation structure underlying the analyzed data. We proceeded by presenting a framework to model and simulate generic correlated spike trains. Then we applied the two methods to such simulated data and critically interpreted the results. We showed that the integrated information from the results of the two methods allow to identify the actual correlation structure in most of the simulated datasets. We propose the use of simulated datasets as a general procedure to test and calibrate statistical analyses. Eventually we focused on parameters the generative model for which a direct comparison of the different methods' result is not possible. We analyzed in detail the performance of the methods for this particular parameter settings for large number of realizations of simulated data.
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
727740_thesis_pietroquaglio.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 1.61 MB
Formato Adobe PDF
1.61 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/158141