The purpose of this work is the implementation of Python scripts for recog- nizing certain grammatical and syntactic structures by Universal Dependencies. The focus is on creating an instrument to get most common nouns and adjectives, which verbs appears more frequently and which subjects and direct objects are linked to them and the presence of nominal predicate. The scripts have been run on a dataset made up of tweets about enviromental topics. After discovering some qualitative properties it is easier to notice and talk about more qualitative aspects that occur in the dataset.
Questo lavoro ha come obiettivo l’implementazione di script Python per il riconosci- mento di determinate strutture grammaticali e sintattiche attraverso annotazioni Universal Dependencies. In particolare, il focus è stato sulla creazione di uno strumento per ottenere informazioni su quali sostantivi e relativi aggettivi sono più frequenti, quali verbi sono più presenti e in relazione a quali soggetti e complementi oggetti e dove è presente un predicato nominale. Gli script sono stati eseguiti su un corpus di tweet inerenti tematiche ambientali. Una volta rilevate determinate carat- teristiche quantitative è stato possibile osservare e discutere aspetti più qualitativi che caratterizzano il corpus.
Analisi di un Corpus di Tweet su Temi Ambientali con Universal Dependencies
RIVELLI, FRANCESCA
2021/2022
Abstract
Questo lavoro ha come obiettivo l’implementazione di script Python per il riconosci- mento di determinate strutture grammaticali e sintattiche attraverso annotazioni Universal Dependencies. In particolare, il focus è stato sulla creazione di uno strumento per ottenere informazioni su quali sostantivi e relativi aggettivi sono più frequenti, quali verbi sono più presenti e in relazione a quali soggetti e complementi oggetti e dove è presente un predicato nominale. Gli script sono stati eseguiti su un corpus di tweet inerenti tematiche ambientali. Una volta rilevate determinate carat- teristiche quantitative è stato possibile osservare e discutere aspetti più qualitativi che caratterizzano il corpus.File | Dimensione | Formato | |
---|---|---|---|
802007_tesi.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
507.92 kB
Formato
Adobe PDF
|
507.92 kB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/136450