In the thesis we have discussed and tried to solve the problem of the data fusion between two sources that describe the geographic points of interest through the typical languages of the semantic web. In particular, we have dealt with the data sources of OpenStreetMap and Foursquare. The followed approach is divided in two phases. In the first one we have found the correspondences of the points of interest through a metric on the names of the venues and of their geographic positions. In this way we have found a first set of correspondences between the categories of OpenStreetMap and Foursquare. At the end of the first phase we have obtained a set of categories whose correspondences are ambiguous. The goal of the second phase is to find the correspondences between the categories in a way such that these correspondences would not be ambiguous. We have solved the problem by means of the generation of classifiers that predict the correct categories. The experiments produced satisfactory results that allowed us to extend the whole set of category correspondences.
Nella tesi abbiamo affrontato il problema della fusione di dati su due sorgenti che descrivono punti di interesse geografici tramite linguaggi tipici del semantic web. In particolare abbiamo affrontato le sorgenti dati di OpenStreetMap e Foursquare. L'approccio che abbiamo seguito è suddiviso in due fasi. Nella prima abbiamo trovato le corrispondenze di punti di interesse delle due sorgenti tramite una metrica sui nomi delle località e loro posizione geografica. In tal modo abbiamo ottenuto un primo insieme di corrispondenze tra le categorie di OpenStreetMap e Foursquare. Al termine della prima fase abbiamo ottenuto delle categorie da disambiguare. L'obbiettivo della seconda fase era di trovare le corrispondenze tra le categorie in modo che queste corrispondenze non fossero ambigue. Abbiamo risolto il problema tramite la generazione di classificatori che predicessero le categorie corrette. Gli esperimenti condotti producono dei risultati soddisfacenti, che ci permettono di estendere l'insieme complessivo delle corrispondenze.
Fusione di sorgenti dati del web semantico tramite classificazione
BERTORELLO, MATTIA
2014/2015
Abstract
Nella tesi abbiamo affrontato il problema della fusione di dati su due sorgenti che descrivono punti di interesse geografici tramite linguaggi tipici del semantic web. In particolare abbiamo affrontato le sorgenti dati di OpenStreetMap e Foursquare. L'approccio che abbiamo seguito è suddiviso in due fasi. Nella prima abbiamo trovato le corrispondenze di punti di interesse delle due sorgenti tramite una metrica sui nomi delle località e loro posizione geografica. In tal modo abbiamo ottenuto un primo insieme di corrispondenze tra le categorie di OpenStreetMap e Foursquare. Al termine della prima fase abbiamo ottenuto delle categorie da disambiguare. L'obbiettivo della seconda fase era di trovare le corrispondenze tra le categorie in modo che queste corrispondenze non fossero ambigue. Abbiamo risolto il problema tramite la generazione di classificatori che predicessero le categorie corrette. Gli esperimenti condotti producono dei risultati soddisfacenti, che ci permettono di estendere l'insieme complessivo delle corrispondenze.File | Dimensione | Formato | |
---|---|---|---|
715384_tesi_magistrale_mattia_bertorello.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
934.95 kB
Formato
Adobe PDF
|
934.95 kB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/157348