The digitization of administrative procedures is producing a quantity of data that requires renewal regarding the supervisory techniques and detection of possible illegal acts. The management of public procurement has also been digitized in all European countries and not only independently and flanked by different approaches to detect anomalies, corruption and conflicts of interest. In Italy, the authority capable of combating illegal acts in public order is the National Anti-Corruption Authority better known as ANAC. The objective of this thesis is the analysis of the data held by ANAC regarding public tenders involving contracting authorities and successful economic operators. Advanced techniques and methods were applied, first for the processing of big data and then for their analysis. Using graph theory, the NoSQL Neo4j database was adopted for processing so as to consider contracting authorities and economic operators as nodes forming part of the graph of tender and award relations between entities. The analysis focused mainly on the centrality of the nodes and on the detection of dense communities up to the classification of them in terms of the field of belonging, for example health, and the type of object of the tender (works, services and supplies). The results were further exported to Gephi and processed for an exhaustive and targeted representation to the interested entities. As regards the relationship between public administrations and economic operators that wins contracts, a model of probabilistic distribution of the edges that connect one node with others was built. Future developments could be aimed at detecting illegal acts by combining studies of big data graphs with studies using neural networks.

La digitalizzazione delle procedure amministrative sta producendo una quantità di dati tale da richiedere un rinnovamento riguardo le tecniche di vigilanza e rilevazioni di possibili atti illeciti. La gestione degli appalti pubblici è stata anch'essa digitalizzata in tutti i Paesi europei e non solo in maniera indipendente ed affiancata da diversi approcci di rilevamento di anomalie, corruzione e conflitti d'interesse. In Italia l'autorità atta a contrastare atti illeciti in ordine pubblico è l'Autorità Nazionale Anticorruzione meglio nota come ANAC. L’obiettivo di questa tesi è l'analisi dei dati in possesso dell'ANAC riguardo i bandi pubblici che coinvolgono amministrazioni e aziende aggiudicatarie. Sono state applicate tecniche e metodi avanzati, prima per l'elaborazione dei big data e poi per la loro analisi. Utilizzando la teoria dei grafi, per l’elaborazione è stato adottato il database NoSQL Neo4j così da considerare amministrazioni e aggiudicatari come dei nodi facenti parte del grafo di relazioni di bando e aggiudicazione tra le entità. L'analisi si è concentrata principalmente sulla centralità dei nodi e sul rilevamento di comunità dense fino alla classificazione di esse in termini di campo d'appartenenza, ad esempio sanitario, e tipologia dell'oggetto del bando (lavori, servizi e forniture). I risultati sono stati ulteriormente esportati in Gephi ed elaborati per una rappresentazione esaustiva e mirata alle entità interessate. A proposito dei legami tra le pubbliche amministrazioni e gli operatori economici che si aggiudicano le gare di appalto, è stato costruito un modello di distribuzione probabilistica del numero di archi di collegamento di un nodo con gli altri. Sviluppi futuri potrebbero essere rivolti alla rilevazioni di atti illeciti combinando gli studi dei grafi di big data con gli studi tramite reti neurali.

Analisi degli appalti pubblici con tecniche basate sui database a grafo

GIUNTA, MIRKO
2021/2022

Abstract

La digitalizzazione delle procedure amministrative sta producendo una quantità di dati tale da richiedere un rinnovamento riguardo le tecniche di vigilanza e rilevazioni di possibili atti illeciti. La gestione degli appalti pubblici è stata anch'essa digitalizzata in tutti i Paesi europei e non solo in maniera indipendente ed affiancata da diversi approcci di rilevamento di anomalie, corruzione e conflitti d'interesse. In Italia l'autorità atta a contrastare atti illeciti in ordine pubblico è l'Autorità Nazionale Anticorruzione meglio nota come ANAC. L’obiettivo di questa tesi è l'analisi dei dati in possesso dell'ANAC riguardo i bandi pubblici che coinvolgono amministrazioni e aziende aggiudicatarie. Sono state applicate tecniche e metodi avanzati, prima per l'elaborazione dei big data e poi per la loro analisi. Utilizzando la teoria dei grafi, per l’elaborazione è stato adottato il database NoSQL Neo4j così da considerare amministrazioni e aggiudicatari come dei nodi facenti parte del grafo di relazioni di bando e aggiudicazione tra le entità. L'analisi si è concentrata principalmente sulla centralità dei nodi e sul rilevamento di comunità dense fino alla classificazione di esse in termini di campo d'appartenenza, ad esempio sanitario, e tipologia dell'oggetto del bando (lavori, servizi e forniture). I risultati sono stati ulteriormente esportati in Gephi ed elaborati per una rappresentazione esaustiva e mirata alle entità interessate. A proposito dei legami tra le pubbliche amministrazioni e gli operatori economici che si aggiudicano le gare di appalto, è stato costruito un modello di distribuzione probabilistica del numero di archi di collegamento di un nodo con gli altri. Sviluppi futuri potrebbero essere rivolti alla rilevazioni di atti illeciti combinando gli studi dei grafi di big data con gli studi tramite reti neurali.
ITA
The digitization of administrative procedures is producing a quantity of data that requires renewal regarding the supervisory techniques and detection of possible illegal acts. The management of public procurement has also been digitized in all European countries and not only independently and flanked by different approaches to detect anomalies, corruption and conflicts of interest. In Italy, the authority capable of combating illegal acts in public order is the National Anti-Corruption Authority better known as ANAC. The objective of this thesis is the analysis of the data held by ANAC regarding public tenders involving contracting authorities and successful economic operators. Advanced techniques and methods were applied, first for the processing of big data and then for their analysis. Using graph theory, the NoSQL Neo4j database was adopted for processing so as to consider contracting authorities and economic operators as nodes forming part of the graph of tender and award relations between entities. The analysis focused mainly on the centrality of the nodes and on the detection of dense communities up to the classification of them in terms of the field of belonging, for example health, and the type of object of the tender (works, services and supplies). The results were further exported to Gephi and processed for an exhaustive and targeted representation to the interested entities. As regards the relationship between public administrations and economic operators that wins contracts, a model of probabilistic distribution of the edges that connect one node with others was built. Future developments could be aimed at detecting illegal acts by combining studies of big data graphs with studies using neural networks.
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
883069_tesi_magistrale_mirko_giunta_v2_2022-10-13.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 8.87 MB
Formato Adobe PDF
8.87 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/85753