In recent years, the concepts of machine learning and deep learning have become increasingly important, alongside WITH the theme of artificial intelligence linked to the creation of systems that perform tasks usually in need expleted by human intelligence. Machines become able to carry out various activities thanks to the rules and algorithms that are reset, making various approaches part of this machine learning including the ones allowing the machines to learn data without explicit programming. Dynamism is the main element considering that there are many data inserted in the machines and quickly learned, proceeding to the modification and improvement of predictions every time you receive information about what you are processing. Machine learning algorithms, thanks to learning, become able to reduce errors, while increasing the veracity of their predictions. In addition to this, deep learning includes computational models and algorithms similar to the architecture of biological neural networks found within the brain. In this sense, in recent years, models have become increasingly accurate regarding the storage of huge amounts of data that is accessed during the training procedure; this is possible thanks to the fact that technologies have become increasingly performing. As a result, patterns and information are obtained that allow you to quickly have automatic indications and suggestions with which to reach the expected future conditions. These are the starting points of this work, which will be divided into three chapters. The first of these will be the concept of machine learning, considering the functioning of supervised learning and artificial calculation systems, also taking into account the calculation of function and issues such as generalization and approximation. The second chapter will focus on deep learning techniques and approximation tools; some attention will be paid to multi-layerED architectures and neural networks and then to the technique of decreasing stochastic gradient, as well as networks of production and the way sequential data are processed. Finally, in the third and final chapter, the analysis of local to global support vector machines (LGSVMS) will be carried out, examining the methodology and eligibility cases, concluding with the analysis of complexity and numerical experiments.

Negli ultimi anni, i concetti di machine learning e deep learning hanno acquisito sempre più importanza, a?ancandosi al tema dell’intelligenza artificiale legata alla creazione di sistemi che svolgono compiti aventi solitamente bisogno dell’intelligenza umana. Le macchine diventano capaci di svolgere le varie attività grazie alle regole e agli algoritmi che vengono reimpostati, facendo rientrare in ciò il machine learning comprensivo dei vari approcci che consentono alle macchine di imparare dei dati senza un’esplicita programmazione. La dinamicità è l’elemento principale considerando che sono tanti i dati che vengono inseriti nelle macchine e che vengono rapidamente appresi, procedendo alla modifica e al miglioramento delle predizioni ogni qualvolta si ricevono delle informazioni su ciò che si sta elaborando. Gli algoritmi di machine learning, proprio grazie all’apprendimento, diventano capaci di ridurre gli errori, aumentando nel contempo la veridicità delle loro previsioni. Vi è poi il deep learning che comprende modelli e algoritmi computazionali che sono simili all’architettura delle reti neurali biologiche che si trovano all’interno del cervello. In tal senso, negli ultimi anni i modelli sono divenuti sempre più accurati in merito alla memorizzazione di enormi quantità di dati a cui si fa accesso durante la procedura di training grazie al fatto che le tecnologie sono divenute sempre più performanti. Di conseguenza, si ricavano pattern e informazioni che consentono rapidamente di avere delle indicazioni e dei suggerimenti automatici con cui giungere alle condizioni future previste. Questi sono i punti di partenza del presente lavoro, il quale sarà suddiviso in quattro capitoli. Nel primo di questi si tratterà del concetto di Machine Learning (ML), considerando il funzionamento dell’apprendimento supervisionato e i sistemi di calcolo artificiale, tenendo conto anche del calcolo della funzione e di questioni quali la generalizzazione e l’approssimazione. Il secondo capitolo sarà incentrato sulle tecniche di Deep Learning (DL) e sugli strumenti di approssimazione utilizzati; una certa attenzione sarà posta alle architetture multi-strato e alle reti neurali e quindi alla tecnica del gradiente stocastico decrescente, nonché alle reti di convoluzione e alla modalità di elaborazione dei dati sequenziali. Nel terzo capitolo verrà trattato l’algoritmo Support Vector Machine (SVM) e ci si focalizzerà sulla sua struttura che potrà essere lineare o non lineare, con tutti i vantaggi e gli svantaggi che esso comporta. Infine, nel quarto e ultimo capitolo si attuerà l’analisi del Local to Global Support Vector Machine (LGSVMS), esaminandone la motodologia e i casi di ammissibilità, concludendo con l’analisi della complessità e con gli esperimenti numerici.

Dall'approccio globale al locale delle Support Vectore Machine: teoria e applicazioni

GUTTILLA, GIULIA
2020/2021

Abstract

Negli ultimi anni, i concetti di machine learning e deep learning hanno acquisito sempre più importanza, a?ancandosi al tema dell’intelligenza artificiale legata alla creazione di sistemi che svolgono compiti aventi solitamente bisogno dell’intelligenza umana. Le macchine diventano capaci di svolgere le varie attività grazie alle regole e agli algoritmi che vengono reimpostati, facendo rientrare in ciò il machine learning comprensivo dei vari approcci che consentono alle macchine di imparare dei dati senza un’esplicita programmazione. La dinamicità è l’elemento principale considerando che sono tanti i dati che vengono inseriti nelle macchine e che vengono rapidamente appresi, procedendo alla modifica e al miglioramento delle predizioni ogni qualvolta si ricevono delle informazioni su ciò che si sta elaborando. Gli algoritmi di machine learning, proprio grazie all’apprendimento, diventano capaci di ridurre gli errori, aumentando nel contempo la veridicità delle loro previsioni. Vi è poi il deep learning che comprende modelli e algoritmi computazionali che sono simili all’architettura delle reti neurali biologiche che si trovano all’interno del cervello. In tal senso, negli ultimi anni i modelli sono divenuti sempre più accurati in merito alla memorizzazione di enormi quantità di dati a cui si fa accesso durante la procedura di training grazie al fatto che le tecnologie sono divenute sempre più performanti. Di conseguenza, si ricavano pattern e informazioni che consentono rapidamente di avere delle indicazioni e dei suggerimenti automatici con cui giungere alle condizioni future previste. Questi sono i punti di partenza del presente lavoro, il quale sarà suddiviso in quattro capitoli. Nel primo di questi si tratterà del concetto di Machine Learning (ML), considerando il funzionamento dell’apprendimento supervisionato e i sistemi di calcolo artificiale, tenendo conto anche del calcolo della funzione e di questioni quali la generalizzazione e l’approssimazione. Il secondo capitolo sarà incentrato sulle tecniche di Deep Learning (DL) e sugli strumenti di approssimazione utilizzati; una certa attenzione sarà posta alle architetture multi-strato e alle reti neurali e quindi alla tecnica del gradiente stocastico decrescente, nonché alle reti di convoluzione e alla modalità di elaborazione dei dati sequenziali. Nel terzo capitolo verrà trattato l’algoritmo Support Vector Machine (SVM) e ci si focalizzerà sulla sua struttura che potrà essere lineare o non lineare, con tutti i vantaggi e gli svantaggi che esso comporta. Infine, nel quarto e ultimo capitolo si attuerà l’analisi del Local to Global Support Vector Machine (LGSVMS), esaminandone la motodologia e i casi di ammissibilità, concludendo con l’analisi della complessità e con gli esperimenti numerici.
ITA
In recent years, the concepts of machine learning and deep learning have become increasingly important, alongside WITH the theme of artificial intelligence linked to the creation of systems that perform tasks usually in need expleted by human intelligence. Machines become able to carry out various activities thanks to the rules and algorithms that are reset, making various approaches part of this machine learning including the ones allowing the machines to learn data without explicit programming. Dynamism is the main element considering that there are many data inserted in the machines and quickly learned, proceeding to the modification and improvement of predictions every time you receive information about what you are processing. Machine learning algorithms, thanks to learning, become able to reduce errors, while increasing the veracity of their predictions. In addition to this, deep learning includes computational models and algorithms similar to the architecture of biological neural networks found within the brain. In this sense, in recent years, models have become increasingly accurate regarding the storage of huge amounts of data that is accessed during the training procedure; this is possible thanks to the fact that technologies have become increasingly performing. As a result, patterns and information are obtained that allow you to quickly have automatic indications and suggestions with which to reach the expected future conditions. These are the starting points of this work, which will be divided into three chapters. The first of these will be the concept of machine learning, considering the functioning of supervised learning and artificial calculation systems, also taking into account the calculation of function and issues such as generalization and approximation. The second chapter will focus on deep learning techniques and approximation tools; some attention will be paid to multi-layerED architectures and neural networks and then to the technique of decreasing stochastic gradient, as well as networks of production and the way sequential data are processed. Finally, in the third and final chapter, the analysis of local to global support vector machines (LGSVMS) will be carried out, examining the methodology and eligibility cases, concluding with the analysis of complexity and numerical experiments.
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
747814_tesidefinitiva.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 916.28 kB
Formato Adobe PDF
916.28 kB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/156358