The main goal of this thesis is to evaluate the performance of a neural network (DNN) equipped with early-exit mechanisms, in order to identify the advantages and limitations of this approach. The results obtained will serve as the basis for future research aimed at deploying this architecture in a distributed computing context, leveraging the scalability offered by edge computing. Such a distribution will make it possible to optimize both computational resources and processing times, facilitating a faster inferential process at the expense of accuracy, in application contexts where response speed is more important, inevitably sacrificing the network’s accuracy.
Lo scopo principale di questa tesi `e valutare le prestazioni di una rete neurale (DNN) dotata di meccanismi di early exit, al fine di individuare i vantaggi e le limitazioni di tale approccio. I risultati ottenuti serviranno come base per una futura ricerca orientata alla distribuzione di questa architettura in un contesto di calcolo distribuito, sfruttando la scalabilit`a offerta dal edge computing. Tale distribuzione consentir`a di ottimizzare sia le risorse computazionali sia i tempi di elaborazione, favorendo un processo inferenziale pi`u veloce a discapito della accuratezza in contesti applicativi in cui `e pi`u importante la velocit`a della risposta, sacrificando inevitabilmente la accuracy della rete.
Implementazione di una Deep Neural Network con Early Exit
SACCU, RICCARDO COSTANTINO
2023/2024
Abstract
Lo scopo principale di questa tesi `e valutare le prestazioni di una rete neurale (DNN) dotata di meccanismi di early exit, al fine di individuare i vantaggi e le limitazioni di tale approccio. I risultati ottenuti serviranno come base per una futura ricerca orientata alla distribuzione di questa architettura in un contesto di calcolo distribuito, sfruttando la scalabilit`a offerta dal edge computing. Tale distribuzione consentir`a di ottimizzare sia le risorse computazionali sia i tempi di elaborazione, favorendo un processo inferenziale pi`u veloce a discapito della accuratezza in contesti applicativi in cui `e pi`u importante la velocit`a della risposta, sacrificando inevitabilmente la accuracy della rete.File | Dimensione | Formato | |
---|---|---|---|
ProgettoTesi-12.pdf
non disponibili
Dimensione
2.46 MB
Formato
Adobe PDF
|
2.46 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/164014