Con l’avanzamento significativo degli Large Language Model (LLM) negli ultimi anni, è emersa la necessità di esplorare le loro potenzialità nell’esecuzione di compiti complessi come il penetration testing. Per questo motivo,in questo studio, sono stati sviluppati dei benchmark per valutare le loro capacità nel campo della cybersecurity. Nello speicifico, ci concentreremo in particolare su GPT-4o, uno dei LLM più avanzati attualmente disponibili. I benchmark mirano a testare la capacità di GPT-4o nel rilevare e sfruttare vulnerabilità comuni come Path Trasveral,SQL injection,Cross site scripting(XSS) e Remote command execution(RCE) fornendo così una visione dettagliata delle prestazioni degli LLM in scenari realistici di sicurezza informatica.
AI e pentretion testing: Valutazione delle prestazioni dell'AI nelle rilevazione di vulnerabilità in Web app simulate
ROBUSTELLI, DAVIDE
2023/2024
Abstract
Con l’avanzamento significativo degli Large Language Model (LLM) negli ultimi anni, è emersa la necessità di esplorare le loro potenzialità nell’esecuzione di compiti complessi come il penetration testing. Per questo motivo,in questo studio, sono stati sviluppati dei benchmark per valutare le loro capacità nel campo della cybersecurity. Nello speicifico, ci concentreremo in particolare su GPT-4o, uno dei LLM più avanzati attualmente disponibili. I benchmark mirano a testare la capacità di GPT-4o nel rilevare e sfruttare vulnerabilità comuni come Path Trasveral,SQL injection,Cross site scripting(XSS) e Remote command execution(RCE) fornendo così una visione dettagliata delle prestazioni degli LLM in scenari realistici di sicurezza informatica.File | Dimensione | Formato | |
---|---|---|---|
890664_tesi___davide_robustelli.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
2.75 MB
Formato
Adobe PDF
|
2.75 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/161028