Enterprises are increasingly integrating generative AI technologies into private clouds and local infrastructures, leveraging their capabilities for automation, decision-making, and data processing. However, this expansion, especially when systems interact with corporate documents, introduces significant security challenges, particularly regarding unauthorized access to sensitive corporate data. Traditional Role-Based Access Control (RBAC) mechanisms, which rely on deterministic filters and static classification, often struggle when applied to generative AI and Large Language Models, which can produce unintended outputs due to both classification errors and the model’s tendency to respond even when context is missing or the prompt is truncated (either accidentally or as a result of exploitation by malicious actors). In such cases, the model may lose system instructions or context and generate incoherent responses or replies based on internal knowledge, potentially leading to unexpected or unauthorized disclosures. This leads to vulnerabilities in data access control.  This thesis proposes a novel AI-based filtering system to enhance traditional RBAC approaches in Retrieval-Augmented Generation (RAG) frameworks. By incorporating an AI-driven filter chain, our method dynamically filters user queries and retrieved documents to refine access control in real-time. Implemented using Nvidia’s NeMo Guardrails framework, our system introduces multi-tiered security layers, including input and output validation, role-aware retrieval, and fact-checking, ensuring that AI-generated responses align strictly with user’s role permissions.  Experimental results demonstrate an 85% accuracy rate and an 89% F1 score in filtering queries while maintaining response coherence. Comparisons with the baseline approach showed that the AI-driven filtering system achieved a near-equivalent performance level while offering greater flexibility and adaptability. This work marks a significant advancement in the field, laying a solid foundation for future improvements in secure and dynamic enterprise AI applications.
Le imprese stanno integrando sempre più le tecnologie di intelligenza artificiale generativa nei cloud privati e nelle infrastrutture locali, sfruttandone le capacità per l'automazione, il processo decisionale e l'elaborazione dei dati. Tuttavia, questa espansione, soprattutto quando i sistemi interagiscono con documenti aziendali, introduce sfide significative in termini di sicurezza, in particolare per quanto riguarda l’accesso non autorizzato a dati aziendali sensibili. I meccanismi tradizionali di Controllo degli Accessi Basato sui Ruoli (RBAC), che si basano su filtri deterministici e classificazioni statiche, spesso si rivelano inadeguati quando applicati all’intelligenza artificiale generativa e ai modelli di linguaggio di grandi dimensioni (LLM), i quali possono produrre output indesiderati a causa di errori di classificazione e della tendenza del modello a rispondere anche in assenza di contesto o quando il prompt è troncato (sia accidentalmente sia a causa di un attacco da parte di attori malevoli). In tali casi, il modello potrebbe perdere istruzioni di sistema o contesto, generando risposte incoerenti o basate su conoscenze interne, con il rischio di rivelazioni inaspettate o non autorizzate. Questo comporta vulnerabilità nel controllo dell’accesso ai dati. Questa tesi propone un nuovo sistema di filtraggio basato sull'intelligenza artificiale per migliorare gli approcci RBAC tradizionali nei framework di Recupero-Augmentato dalla Generazione (RAG). Integrando una catena di filtri basata sull’IA, il nostro metodo filtra dinamicamente le query degli utenti e i documenti recuperati per affinare il controllo degli accessi in tempo reale. Implementato utilizzando il framework NeMo Guardrails di Nvidia, il nostro sistema introduce livelli di sicurezza multi-tier, tra cui validazione degli input e output, recupero consapevole del ruolo e fact-checking, garantendo che le risposte generate dall’IA siano strettamente allineate ai permessi di ruolo dell’utente. I risultati sperimentali dimostrano un tasso di accuratezza dell’85% e un F1-score dell’89% nel filtraggio delle query, mantenendo la coerenza delle risposte. I confronti con l'approccio di riferimento hanno mostrato che il sistema di filtraggio basato sull'IA ha raggiunto un livello di prestazioni quasi equivalente, offrendo al contempo maggiore flessibilità e adattabilità. Questo lavoro rappresenta un progresso significativo nel settore, gettando solide basi per futuri miglioramenti nelle applicazioni aziendali di IA sicure e dinamiche.
Protezione delle Applicazioni di IA: Un Nuovo Approccio di Filtraggio per il RBAC
LORENZO, MICHELE
2023/2024
Abstract
Le imprese stanno integrando sempre più le tecnologie di intelligenza artificiale generativa nei cloud privati e nelle infrastrutture locali, sfruttandone le capacità per l'automazione, il processo decisionale e l'elaborazione dei dati. Tuttavia, questa espansione, soprattutto quando i sistemi interagiscono con documenti aziendali, introduce sfide significative in termini di sicurezza, in particolare per quanto riguarda l’accesso non autorizzato a dati aziendali sensibili. I meccanismi tradizionali di Controllo degli Accessi Basato sui Ruoli (RBAC), che si basano su filtri deterministici e classificazioni statiche, spesso si rivelano inadeguati quando applicati all’intelligenza artificiale generativa e ai modelli di linguaggio di grandi dimensioni (LLM), i quali possono produrre output indesiderati a causa di errori di classificazione e della tendenza del modello a rispondere anche in assenza di contesto o quando il prompt è troncato (sia accidentalmente sia a causa di un attacco da parte di attori malevoli). In tali casi, il modello potrebbe perdere istruzioni di sistema o contesto, generando risposte incoerenti o basate su conoscenze interne, con il rischio di rivelazioni inaspettate o non autorizzate. Questo comporta vulnerabilità nel controllo dell’accesso ai dati. Questa tesi propone un nuovo sistema di filtraggio basato sull'intelligenza artificiale per migliorare gli approcci RBAC tradizionali nei framework di Recupero-Augmentato dalla Generazione (RAG). Integrando una catena di filtri basata sull’IA, il nostro metodo filtra dinamicamente le query degli utenti e i documenti recuperati per affinare il controllo degli accessi in tempo reale. Implementato utilizzando il framework NeMo Guardrails di Nvidia, il nostro sistema introduce livelli di sicurezza multi-tier, tra cui validazione degli input e output, recupero consapevole del ruolo e fact-checking, garantendo che le risposte generate dall’IA siano strettamente allineate ai permessi di ruolo dell’utente. I risultati sperimentali dimostrano un tasso di accuratezza dell’85% e un F1-score dell’89% nel filtraggio delle query, mantenendo la coerenza delle risposte. I confronti con l'approccio di riferimento hanno mostrato che il sistema di filtraggio basato sull'IA ha raggiunto un livello di prestazioni quasi equivalente, offrendo al contempo maggiore flessibilità e adattabilità. Questo lavoro rappresenta un progresso significativo nel settore, gettando solide basi per futuri miglioramenti nelle applicazioni aziendali di IA sicure e dinamiche.File | Dimensione | Formato | |
---|---|---|---|
LORENZO_Michele.pdf
non disponibili
Dimensione
4.17 MB
Formato
Adobe PDF
|
4.17 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/164325