Durante l'attività di sviluppo di un sistema software si delineano gli obiettivi e le funzionalità che devono caratterizzare il sistema. In particolare, si realizza un documento, in linguaggio naturale, noto come documento di specifica (SRS) nella quale si descrivono i requisiti (funzionalità) del sistema. L'identificazione di tali requisiti è un'attività che richiede tempo e concentrazione ed è, per questo, soggetta ad errori. Molti ricercatori hanno suggerito di automatizzare il processo di estrazione dei requisiti, ma vista l'eterogeneità dei documenti SRS, è stato sempre un lavoro difficile da realizzare. In questo lavoro, eseguiamo degli esperimenti in ambito NLP, che hanno lo scopo di verificare quanto sia possibile, con le tecnologie attuali, realizzare uno strumento di estrazione dei requisiti completamente automatico. Ciò avviente attraverso la seguente pipeline: (i) estrazione di frasi dal documento di specifica; (ii) applicazione di tecniche di word embedding (Doc2Vec e BERT) sulle frasi estratte; (iii) addestramento di classificatori come SVM, KNN e BERT con l'aggiunta di un classificatore lineare. Abbiamo realizzato, tramite annotazione manuale, tre tipologie di dataset da due set di documenti, uno fornito dall'azienda Teoresi S.p.A, un altro open source fornito da Ferrari et Al. (PURE datasets). L’utilità di questa estrazione si inserisce in un contesto di supporto al testing, così che i requisiti funzionali, automaticamente estratti possano essere testati in maniera diretta con l’ausilio di strumenti ad hoc, facendo risparmiare tempo e risorse ai vari ingegneri.

Estrazione automatica dei requisiti da un documento non strutturato

DE SIMONE, DARIO
2021/2022

Abstract

Durante l'attività di sviluppo di un sistema software si delineano gli obiettivi e le funzionalità che devono caratterizzare il sistema. In particolare, si realizza un documento, in linguaggio naturale, noto come documento di specifica (SRS) nella quale si descrivono i requisiti (funzionalità) del sistema. L'identificazione di tali requisiti è un'attività che richiede tempo e concentrazione ed è, per questo, soggetta ad errori. Molti ricercatori hanno suggerito di automatizzare il processo di estrazione dei requisiti, ma vista l'eterogeneità dei documenti SRS, è stato sempre un lavoro difficile da realizzare. In questo lavoro, eseguiamo degli esperimenti in ambito NLP, che hanno lo scopo di verificare quanto sia possibile, con le tecnologie attuali, realizzare uno strumento di estrazione dei requisiti completamente automatico. Ciò avviente attraverso la seguente pipeline: (i) estrazione di frasi dal documento di specifica; (ii) applicazione di tecniche di word embedding (Doc2Vec e BERT) sulle frasi estratte; (iii) addestramento di classificatori come SVM, KNN e BERT con l'aggiunta di un classificatore lineare. Abbiamo realizzato, tramite annotazione manuale, tre tipologie di dataset da due set di documenti, uno fornito dall'azienda Teoresi S.p.A, un altro open source fornito da Ferrari et Al. (PURE datasets). L’utilità di questa estrazione si inserisce in un contesto di supporto al testing, così che i requisiti funzionali, automaticamente estratti possano essere testati in maniera diretta con l’ausilio di strumenti ad hoc, facendo risparmiare tempo e risorse ai vari ingegneri.
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
932692_tesi_dario_de_simone.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 1.62 MB
Formato Adobe PDF
1.62 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/53748