The thesis I presented aims to compare different data encoding techniques to determine which are the most effective in data preprocessing. This study was applied to the "AI Leap" project, an initiative aimed at facilitating children's understanding of Artificial Intelligence and Machine Learning. After introducing the purpose of the research, the fundamental theoretical concepts of neural networks are presented, analyzing their functioning and the main learning techniques. These theoretical foundations provide the necessary context for understanding the methodological choices made in the development of the project.The study continues with an analysis of the problem, followed by the generation of the dataset and its analysis to identify potential issues and resolve them. To improve data quality and make the models more robust, data augmentation strategies are implemented, allowing for greater generalization ability and better adaptation to the transformed information.Subsequently, neural network models are developed according to the one-vs-all paradigm, where each model is designed to recognize one category compared to the other two. The various encoding techniques applied to each model are then illustrated, evaluating how well they interpret the information transformed by encoding and what impact the different codings have on the overall performance.The results contribute to the emerging field of AI education, providing useful insights for improving data preprocessing methodologies and optimizing learning in neural network models.
La tesi da me presentata mira a confrontare diverse tecniche di codifica delle informazioni per determinare quali siano le più efficaci nel preprocessing dei dati.Questo studio è stato applicato al progetto “AI Leap”, un’iniziativa volta a facilitare la comprensione dell’Intelligenza Artificiale e dell’apprendimento automatico nei bambini. Dopo aver introdotto lo scopo della ricerca, vengono presentate le nozioni teoriche fondamentali sulle reti neurali, analizzandone il funzionamento e le principali tecniche di apprendimento. Queste basi teoriche forniscono il contesto necessario per comprendere le scelte metodologiche adottate nello sviluppo del progetto. Lo studio prosegue con l’analisi del problema, seguita dalla generazione del dataset e dalla sua analisi per individuare eventuali criticità e risolverle. Per migliorare la qualità dei dati e rendere i modelli più robusti, vengono implementate strategie di data augmentation, che consentono una maggiore capacità di generalizzazione e un migliore adattamento alle informazioni trasformate.Successivamente, vengono sviluppati modelli di reti neurali secondo il paradigma one-vs-all, in cui ciascun modello è progettato per riconoscere una sola categoria rispetto alle altre due. Vengono poi illustrate le diverse tecniche di codifica applicate a ogni modello, valutando in che misura essi riescano a interpretare correttamente le informazioni trasformate dall’encoding e quale sia l’impatto delle varie codifiche sulle prestazioni complessive.I risultati ottenuti contribuiscono all’area emergente dell’educazione all’IA, offrendo spunti utili per il miglioramento delle metodologie di preprocessing dei dati e per l’ottimizzazione dell’apprendimento nei modelli di reti neurali.
Studio comparativo di tecniche di codifica per dati categorici nell'addestramento di reti neurali: un'analisi applicata al progetto AI-LEAP
ROBUSTELLI, LUCA
2023/2024
Abstract
La tesi da me presentata mira a confrontare diverse tecniche di codifica delle informazioni per determinare quali siano le più efficaci nel preprocessing dei dati.Questo studio è stato applicato al progetto “AI Leap”, un’iniziativa volta a facilitare la comprensione dell’Intelligenza Artificiale e dell’apprendimento automatico nei bambini. Dopo aver introdotto lo scopo della ricerca, vengono presentate le nozioni teoriche fondamentali sulle reti neurali, analizzandone il funzionamento e le principali tecniche di apprendimento. Queste basi teoriche forniscono il contesto necessario per comprendere le scelte metodologiche adottate nello sviluppo del progetto. Lo studio prosegue con l’analisi del problema, seguita dalla generazione del dataset e dalla sua analisi per individuare eventuali criticità e risolverle. Per migliorare la qualità dei dati e rendere i modelli più robusti, vengono implementate strategie di data augmentation, che consentono una maggiore capacità di generalizzazione e un migliore adattamento alle informazioni trasformate.Successivamente, vengono sviluppati modelli di reti neurali secondo il paradigma one-vs-all, in cui ciascun modello è progettato per riconoscere una sola categoria rispetto alle altre due. Vengono poi illustrate le diverse tecniche di codifica applicate a ogni modello, valutando in che misura essi riescano a interpretare correttamente le informazioni trasformate dall’encoding e quale sia l’impatto delle varie codifiche sulle prestazioni complessive.I risultati ottenuti contribuiscono all’area emergente dell’educazione all’IA, offrendo spunti utili per il miglioramento delle metodologie di preprocessing dei dati e per l’ottimizzazione dell’apprendimento nei modelli di reti neurali.File | Dimensione | Formato | |
---|---|---|---|
TESI_Luca_Robustelli_890348.pdf
non disponibili
Dimensione
1.1 MB
Formato
Adobe PDF
|
1.1 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/164159