Lo stage è dedicato allo studio di algoritmi per la valutazione di query di skyline, focalizzandosi sull'analisi delle prestazioni di diversi approcci su dataset eterogenei. Lo skyline, introdotto come soluzione per identificare i punti di interesse in spazi multidimensionali, ha diverse applicazioni nell'ambito del recupero delle informazioni e del filtraggio delle query. L'analisi è stata condotta su quattro dataset distinti: Crypto, Netflix, Supermarket e University dopo avere accertato il funzionamento delle implementazioni degli algoritmi su due dataset di esempio. Sono stati valutati parametri chiave come il tempo di esecuzione, il numero di record nello skyline e la complessità computazionale. I risultati indicano che non esiste un unico algoritmo che eccelle su tutti i tipi di dati, ma alcuni modelli, come BNL, D&C e ULP2, si distinguono per le prestazioni in termini di tempo. Sono state identificate direzioni future per ottimizzare gli algoritmi esistenti e esplorare nuove tecniche di analisi dati. Infine, si sottolinea l'importanza di valutare le prestazioni degli algoritmi non solo in base alla complessità asintotica, ma anche in base al tempo effettivo di esecuzione e alla struttura dei dati su dataset reali.
Analisi di algoritmi per la valutazione di query di skyline
MANCINO, SIMONE
2023/2024
Abstract
Lo stage è dedicato allo studio di algoritmi per la valutazione di query di skyline, focalizzandosi sull'analisi delle prestazioni di diversi approcci su dataset eterogenei. Lo skyline, introdotto come soluzione per identificare i punti di interesse in spazi multidimensionali, ha diverse applicazioni nell'ambito del recupero delle informazioni e del filtraggio delle query. L'analisi è stata condotta su quattro dataset distinti: Crypto, Netflix, Supermarket e University dopo avere accertato il funzionamento delle implementazioni degli algoritmi su due dataset di esempio. Sono stati valutati parametri chiave come il tempo di esecuzione, il numero di record nello skyline e la complessità computazionale. I risultati indicano che non esiste un unico algoritmo che eccelle su tutti i tipi di dati, ma alcuni modelli, come BNL, D&C e ULP2, si distinguono per le prestazioni in termini di tempo. Sono state identificate direzioni future per ottimizzare gli algoritmi esistenti e esplorare nuove tecniche di analisi dati. Infine, si sottolinea l'importanza di valutare le prestazioni degli algoritmi non solo in base alla complessità asintotica, ma anche in base al tempo effettivo di esecuzione e alla struttura dei dati su dataset reali.File | Dimensione | Formato | |
---|---|---|---|
883609_tesi.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
1.16 MB
Formato
Adobe PDF
|
1.16 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/111672