Il sito web FakeNewsResearch raccoglie al suo interno tutti gli articoli scientifici relativi al fenomeno della disinformazione online e si occupa di analizzare, organizzare e fornire agli utenti i lavori più influenti, aiutandoli a districarsi tra le migliaia di pubblicazioni avvenute negli ultimi anni. La piattaforma si basa sui dati recuperati tramite le API offerte dal servizio Microsoft Academic Graph (MAG), il quale riporta i metadati di ogni paper, insieme con l'abstract e la lista delle sue citazioni. Gli articoli citati vengono anch'essi scaricati e resi disponibili dal sito, che li organizza in una rete di citazioni e calcola misure di centralità come il pagerank, il tutto per suggerire all'utente quali siano i paper fondamentali oppure i paper con una ricca sezione di referenze. L'obiettivo dello stage e di questa tesi è quello di riprogettare la struttura di raccolta dati, in seguito all'imminente cessazione del servizio di MAG, studiando i vari servizi alternativi e analizzandone dapprima le privacy policy ed in seguito le API per l'implementazione. Il lavoro poi consiste nella realizzazione tramite Python di un sistema di download, controllo e standardizzazione dei dati scaricati da motori di ricerca diversi tra loro. La parte finale vede, infine, l'aggiornamento della homepage, con l'inserimento di un layout responsive e di una nuova interfaccia grafica.
Analisi e riprogettazione di una piattaforma web di raccolta automatizzata di articoli scientifici sul tema della disinformazione online
DI TINCO, ANTONIO
2020/2021
Abstract
Il sito web FakeNewsResearch raccoglie al suo interno tutti gli articoli scientifici relativi al fenomeno della disinformazione online e si occupa di analizzare, organizzare e fornire agli utenti i lavori più influenti, aiutandoli a districarsi tra le migliaia di pubblicazioni avvenute negli ultimi anni. La piattaforma si basa sui dati recuperati tramite le API offerte dal servizio Microsoft Academic Graph (MAG), il quale riporta i metadati di ogni paper, insieme con l'abstract e la lista delle sue citazioni. Gli articoli citati vengono anch'essi scaricati e resi disponibili dal sito, che li organizza in una rete di citazioni e calcola misure di centralità come il pagerank, il tutto per suggerire all'utente quali siano i paper fondamentali oppure i paper con una ricca sezione di referenze. L'obiettivo dello stage e di questa tesi è quello di riprogettare la struttura di raccolta dati, in seguito all'imminente cessazione del servizio di MAG, studiando i vari servizi alternativi e analizzandone dapprima le privacy policy ed in seguito le API per l'implementazione. Il lavoro poi consiste nella realizzazione tramite Python di un sistema di download, controllo e standardizzazione dei dati scaricati da motori di ricerca diversi tra loro. La parte finale vede, infine, l'aggiornamento della homepage, con l'inserimento di un layout responsive e di una nuova interfaccia grafica.File | Dimensione | Formato | |
---|---|---|---|
893518_893518_tesi.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
2.59 MB
Formato
Adobe PDF
|
2.59 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/138416