In this dissertation we wanted to explore signal theory and processing, focusing on speech signals in the last chapter. Even though signal processing is considered to be an applicative subject, mostly treated by engineers, as a matter of fact, it is based on mathematical foundations. Furthermore, it is one of the most direct application areas for Fourier and time-frequency analysis. We chose not to focus on all of the computational aspects and algorithms (such as the Fast Fourier Transform) and neither on problems concerning the construction of physical systems and filters for speech processing. At the contrary, we looked at this topic from a mathematical point of view, considering the main properties for signals and studying the tools to analyze them. Moreover, we used MATLAB to produce all of the graphics and in the last chapter we used it to record the voice to be analyzed, too. The first part of the paper deals with general signal theory. After presenting some preliminary concepts, we introduced analog and digital filters, along with linear systems and filters, which are described by the impulse response and the transfer function of the signal. Concerning analog signals, we also talked about some application for signal broadcasting, such as amplitude modulation and multiplexing. On the other hand, we described the z-transform for all digital signals and the Discrete Fourier Transform for finite ones. Then, we linked these two types of signals through the concept of sampling. We introduced the Nyquist theorem for sampled analog signal reconstruction and we analyzed the aliasing effect that appears when exact reconstruction from the sampled signal is not possible. Finally, we discussed discrete stochastic signals. We took into consideration only wide-sense stationary signals, that can be described by their mean and autocovariance. We also talked about the concept of spectral density and finally we introduced the white noise signal, which would result very useful in the last chapter. The second part of the dissertation, which corresponds to the last chapter, is focused on speech signal. The idea was to talk about speech production and phonemes in order to introduce a simplified mathematical model for voice, consisting of an excitation signal and an articulation process. We described these two phases - considering only two kinds of excitation signals, one for voiced and the other one for unvoiced speech (that is, basically, a white noise signal). Then, we presented a procedure in order to estimate the articulation parameters of the model, using linear regression. Finally, we analyzed a recorded speech signal using various short-time analysis operators, such as the short-time energy, zero-crossing rate, autocorrelation function and Fourier transform (along with its magnitude, the spectrogram) and we made some observations on how to use them in order to extract the excitation parameters of the model.

In questo elaborato abbiamo volute esplorare la teoria dei segnali, focalizzandoci, nell'ultimo capitolo, sul segnale vocale. Nonostante l'elaborazione dei segnali sia considerata un argomento di carattere applicativo, trattato principalmente dagli ingegneri, di fatto si basa su fondamenti matematici. Inoltre rappresenta una delle più dirette aree di applicazione per l'analisi tempo-frequenza e di Fourier. Abbiamo deciso di non concentrarci sugli aspetti computazionali e algoritmici (come la Fast Fourier Transform) e nemmeno sui problemi che riguardano la costruzione fisica di sistemi e filtri per l'analisi del segnale vocale. Al contrario, abbiamo deciso di affrontare questo argomento dal punto di vista matematico, considerando le proprietà dei segnali e studiando gli strumenti utili ad analizzarli. Inoltre, abbiamo utilizzato MATLAB per produrre tutti i grafici e nell'ultimo capitolo lo abbiamo utilizzato anche per registrare la voce da analizzare. La prima parte dell'elaborato tratta della teoria dei segnali in generale. Dopo aver presentato alcuni risultati preliminari, abbiamo introdotto i segnali analogici e digitali, con i sistemi lineari e i filtri, che sono descritti tramite la risposta all'impulso e la funzione di trasferimento del segnale. Per quanto riguarda i segnali analogici, abbiamo anche parlato di alcune applicazioni alla trasmissione di segnali, come la modulazione d'ampiezza e la multiplazione. D'altro canto, abbiamo descritto la trasformata zeta per un generico segnale digitale e la Discrete Fourier Transform per i segnali finiti. Successivamente, abbiamo messo in relazione questi due tipi di segnali tramite il concetto di campionamento. Abbiamo introdotto il teorema di Nyquist per la ricostruzione di segnali analogici campionati e abbiamo analizzato gli effetti di aliasing che si creano quando non è possibile una perfetta ricostruzione a partire dal segnale campionato. Infine, abbiamo trattato i segnali discreti stocastici. Abbiamo preso in considerazione solo i segnali stazionari in senso largo, che possono essere descritti tramite la loro media e autocovarianza. Abbiamo anche parlato del concetto di spettro di potenza e infine abbiamo introdotto il rumore bianco, segnale che risulterà molto utile nell'ultimo capitolo. La seconda parte della dissertazione, che corrisponde all'ultimo capitolo, è focalizzata sul segnale vocale. L'idea era quella di parlare del processo di produzione vocale e dei fonemi, in modo da introdurre un modello matematico semplificato per la voce, che consiste in un segnale d'eccitazione e un processo di articolazione del suono. Abbiamo descritto queste due fasi – considerando solo due tipi di segnale d'eccitazione, uno per i suoni sonori e l'altro per i suoni sordi (il quale è, essenzialmente, un rumore bianco). Poi abbiamo presentato un procedimento per stimare i parametri d'articolazione del modello, utilizzando la regressione lineare. Infine abbiamo analizzato un segnale vocale registrato, utilizzando diversi operatori di analisi short-time, come per esempio la short-time energy, zero-crossing rate, autocorrelation function, e Fourier transform (e anche il suo modulo, lo spettrogramma) e abbiamo fatto varie osservazioni su come utilizzare tali operatori per estrarre i parametri di eccitazione del modello.

Analisi del segnale e applicazioni al segnale acustico.

GAMBA, EMANUELE
2019/2020

Abstract

In questo elaborato abbiamo volute esplorare la teoria dei segnali, focalizzandoci, nell'ultimo capitolo, sul segnale vocale. Nonostante l'elaborazione dei segnali sia considerata un argomento di carattere applicativo, trattato principalmente dagli ingegneri, di fatto si basa su fondamenti matematici. Inoltre rappresenta una delle più dirette aree di applicazione per l'analisi tempo-frequenza e di Fourier. Abbiamo deciso di non concentrarci sugli aspetti computazionali e algoritmici (come la Fast Fourier Transform) e nemmeno sui problemi che riguardano la costruzione fisica di sistemi e filtri per l'analisi del segnale vocale. Al contrario, abbiamo deciso di affrontare questo argomento dal punto di vista matematico, considerando le proprietà dei segnali e studiando gli strumenti utili ad analizzarli. Inoltre, abbiamo utilizzato MATLAB per produrre tutti i grafici e nell'ultimo capitolo lo abbiamo utilizzato anche per registrare la voce da analizzare. La prima parte dell'elaborato tratta della teoria dei segnali in generale. Dopo aver presentato alcuni risultati preliminari, abbiamo introdotto i segnali analogici e digitali, con i sistemi lineari e i filtri, che sono descritti tramite la risposta all'impulso e la funzione di trasferimento del segnale. Per quanto riguarda i segnali analogici, abbiamo anche parlato di alcune applicazioni alla trasmissione di segnali, come la modulazione d'ampiezza e la multiplazione. D'altro canto, abbiamo descritto la trasformata zeta per un generico segnale digitale e la Discrete Fourier Transform per i segnali finiti. Successivamente, abbiamo messo in relazione questi due tipi di segnali tramite il concetto di campionamento. Abbiamo introdotto il teorema di Nyquist per la ricostruzione di segnali analogici campionati e abbiamo analizzato gli effetti di aliasing che si creano quando non è possibile una perfetta ricostruzione a partire dal segnale campionato. Infine, abbiamo trattato i segnali discreti stocastici. Abbiamo preso in considerazione solo i segnali stazionari in senso largo, che possono essere descritti tramite la loro media e autocovarianza. Abbiamo anche parlato del concetto di spettro di potenza e infine abbiamo introdotto il rumore bianco, segnale che risulterà molto utile nell'ultimo capitolo. La seconda parte della dissertazione, che corrisponde all'ultimo capitolo, è focalizzata sul segnale vocale. L'idea era quella di parlare del processo di produzione vocale e dei fonemi, in modo da introdurre un modello matematico semplificato per la voce, che consiste in un segnale d'eccitazione e un processo di articolazione del suono. Abbiamo descritto queste due fasi – considerando solo due tipi di segnale d'eccitazione, uno per i suoni sonori e l'altro per i suoni sordi (il quale è, essenzialmente, un rumore bianco). Poi abbiamo presentato un procedimento per stimare i parametri d'articolazione del modello, utilizzando la regressione lineare. Infine abbiamo analizzato un segnale vocale registrato, utilizzando diversi operatori di analisi short-time, come per esempio la short-time energy, zero-crossing rate, autocorrelation function, e Fourier transform (e anche il suo modulo, lo spettrogramma) e abbiamo fatto varie osservazioni su come utilizzare tali operatori per estrarre i parametri di eccitazione del modello.
ENG
In this dissertation we wanted to explore signal theory and processing, focusing on speech signals in the last chapter. Even though signal processing is considered to be an applicative subject, mostly treated by engineers, as a matter of fact, it is based on mathematical foundations. Furthermore, it is one of the most direct application areas for Fourier and time-frequency analysis. We chose not to focus on all of the computational aspects and algorithms (such as the Fast Fourier Transform) and neither on problems concerning the construction of physical systems and filters for speech processing. At the contrary, we looked at this topic from a mathematical point of view, considering the main properties for signals and studying the tools to analyze them. Moreover, we used MATLAB to produce all of the graphics and in the last chapter we used it to record the voice to be analyzed, too. The first part of the paper deals with general signal theory. After presenting some preliminary concepts, we introduced analog and digital filters, along with linear systems and filters, which are described by the impulse response and the transfer function of the signal. Concerning analog signals, we also talked about some application for signal broadcasting, such as amplitude modulation and multiplexing. On the other hand, we described the z-transform for all digital signals and the Discrete Fourier Transform for finite ones. Then, we linked these two types of signals through the concept of sampling. We introduced the Nyquist theorem for sampled analog signal reconstruction and we analyzed the aliasing effect that appears when exact reconstruction from the sampled signal is not possible. Finally, we discussed discrete stochastic signals. We took into consideration only wide-sense stationary signals, that can be described by their mean and autocovariance. We also talked about the concept of spectral density and finally we introduced the white noise signal, which would result very useful in the last chapter. The second part of the dissertation, which corresponds to the last chapter, is focused on speech signal. The idea was to talk about speech production and phonemes in order to introduce a simplified mathematical model for voice, consisting of an excitation signal and an articulation process. We described these two phases - considering only two kinds of excitation signals, one for voiced and the other one for unvoiced speech (that is, basically, a white noise signal). Then, we presented a procedure in order to estimate the articulation parameters of the model, using linear regression. Finally, we analyzed a recorded speech signal using various short-time analysis operators, such as the short-time energy, zero-crossing rate, autocorrelation function and Fourier transform (along with its magnitude, the spectrogram) and we made some observations on how to use them in order to extract the excitation parameters of the model.
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
803560_signalprocessingandspeech.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 3.36 MB
Formato Adobe PDF
3.36 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/155531