Il sito web FakeNewsResearch raccoglie al suo interno tutti gli articoli scientifici relativi al fenomeno della disinformazione online e si occupa di analizzare, organizzare e fornire agli utenti i lavori più influenti, aiutandoli a districarsi tra le migliaia di pubblicazioni avvenute negli ultimi anni. La piattaforma si basa sui dati recuperati tramite le API offerte dal servizio Microsoft Academic Graph (MAG), il quale riporta i metadati di ogni paper, insieme con l'abstract e la lista delle sue citazioni. Gli articoli citati vengono anch'essi scaricati e resi disponibili dal sito, che li organizza in una rete di citazioni e calcola misure di centralità come il pagerank, il tutto per suggerire all'utente quali siano i paper fondamentali oppure i paper con una ricca sezione di referenze. L'obiettivo dello stage e di questa tesi è quello di riprogettare la struttura di raccolta dati, in seguito all'imminente cessazione del servizio di MAG, studiando i vari servizi alternativi e analizzandone dapprima le privacy policy ed in seguito le API per l'implementazione. Il lavoro poi consiste nella realizzazione tramite Python di un sistema di download, controllo e standardizzazione dei dati scaricati da motori di ricerca diversi tra loro. La parte finale vede, infine, l'aggiornamento della homepage, con l'inserimento di un layout responsive e di una nuova interfaccia grafica.

Analisi e riprogettazione di una piattaforma web di raccolta automatizzata di articoli scientifici sul tema della disinformazione online

DI TINCO, ANTONIO
2020/2021

Abstract

Il sito web FakeNewsResearch raccoglie al suo interno tutti gli articoli scientifici relativi al fenomeno della disinformazione online e si occupa di analizzare, organizzare e fornire agli utenti i lavori più influenti, aiutandoli a districarsi tra le migliaia di pubblicazioni avvenute negli ultimi anni. La piattaforma si basa sui dati recuperati tramite le API offerte dal servizio Microsoft Academic Graph (MAG), il quale riporta i metadati di ogni paper, insieme con l'abstract e la lista delle sue citazioni. Gli articoli citati vengono anch'essi scaricati e resi disponibili dal sito, che li organizza in una rete di citazioni e calcola misure di centralità come il pagerank, il tutto per suggerire all'utente quali siano i paper fondamentali oppure i paper con una ricca sezione di referenze. L'obiettivo dello stage e di questa tesi è quello di riprogettare la struttura di raccolta dati, in seguito all'imminente cessazione del servizio di MAG, studiando i vari servizi alternativi e analizzandone dapprima le privacy policy ed in seguito le API per l'implementazione. Il lavoro poi consiste nella realizzazione tramite Python di un sistema di download, controllo e standardizzazione dei dati scaricati da motori di ricerca diversi tra loro. La parte finale vede, infine, l'aggiornamento della homepage, con l'inserimento di un layout responsive e di una nuova interfaccia grafica.
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
893518_893518_tesi.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 2.59 MB
Formato Adobe PDF
2.59 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/138416