Con l’avanzamento significativo degli Large Language Model (LLM) negli ultimi anni, è emersa la necessità di esplorare le loro potenzialità nell’esecuzione di compiti complessi come il penetration testing. Per questo motivo,in questo studio, sono stati sviluppati dei benchmark per valutare le loro capacità nel campo della cybersecurity. Nello speicifico, ci concentreremo in particolare su GPT-4o, uno dei LLM più avanzati attualmente disponibili. I benchmark mirano a testare la capacità di GPT-4o nel rilevare e sfruttare vulnerabilità comuni come Path Trasveral,SQL injection,Cross site scripting(XSS) e Remote command execution(RCE) fornendo così una visione dettagliata delle prestazioni degli LLM in scenari realistici di sicurezza informatica.

AI e pentretion testing: Valutazione delle prestazioni dell'AI nelle rilevazione di vulnerabilità in Web app simulate

ROBUSTELLI, DAVIDE
2023/2024

Abstract

Con l’avanzamento significativo degli Large Language Model (LLM) negli ultimi anni, è emersa la necessità di esplorare le loro potenzialità nell’esecuzione di compiti complessi come il penetration testing. Per questo motivo,in questo studio, sono stati sviluppati dei benchmark per valutare le loro capacità nel campo della cybersecurity. Nello speicifico, ci concentreremo in particolare su GPT-4o, uno dei LLM più avanzati attualmente disponibili. I benchmark mirano a testare la capacità di GPT-4o nel rilevare e sfruttare vulnerabilità comuni come Path Trasveral,SQL injection,Cross site scripting(XSS) e Remote command execution(RCE) fornendo così una visione dettagliata delle prestazioni degli LLM in scenari realistici di sicurezza informatica.
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
890664_tesi___davide_robustelli.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 2.75 MB
Formato Adobe PDF
2.75 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/161028