The indiscriminate exploitation of farm animals is one of the things that cause environmental issues, raising ethical and moral questions widely discussed by scholars and journalists from various fields. When writing about these alarming issues for informative purposes, due to the need to reach a wide range of readers the language needs to be as clear as possible. Each discipline or science has its own specific terminology that encompasses the set of words or phrases that characterize a specific field, and according to the participants taking part in the communication the language used may be more or less specialized. The degree of accuracy will depend on some variables such as the vertical dimension, which includes four types of variation: diaphasic, diatopic, diachronic and diamesic, and the horizontal dimension, i.e. specialistic knowledge. In this master's degree thesis, we created a corpus consisting of articles regarding the livestock field and its specialistic terminology has been analyzed. The aim of this work is to assess the extent to which the everyday vocabulary and the specialistic one coexists and also to evaluate the readability of these articles in their informative purpose. Subsequently, a corpus of 1000 tweets about environmental issues has been annotated by me and another student. The annotations collected have been then compared and the results analyzed in order to shed new lights on the use of green language in social media texts. The ultimate purpose of this task is to provide useful linguistic resources to train the Sentiment Analysis software so that in the future it can autonomously extract the opinions expressed by users in texts that address issues related to the environment, sustainability and nature.

Lo sfruttamento indiscriminato degli animali da allevamento e i danni arrecati all’ambiente sollevano questioni di ordine etico e morale che sono oggetto di un’ampia trattazione da parte degli studiosi, esperti o giornalisti di diversi settori. Accade che in ragione della necessità di raggiungere il più ampio numero di lettori possibili, unitamente a un intento divulgativo, spesso ci si serva di un linguaggio che vuole essere il più chiaro possibile. Naturalmente, ogni disciplina o scienza possiede una propria terminologia specifica che racchiude l’insieme di vocaboli o locuzioni che caratterizzano un settore, e in base ai partecipanti che prendono parte alla comunicazione il linguaggio usato può essere più o meno specialistico. Il grado di accuratezza del linguaggio sarà in tal caso funzione di diverse variabili quali la dimensione verticale, che rappresenta i quattro tipi di variazione: diafasica, diatopica, diacronica e diamesica, e quella orizzontale che rappresenta invece le conoscenze specialistiche. In questo elaborato, è stata presa in esame la terminologia legata alla natura, all’ambiente e all’allevamento, ricorrendo a un corpus di articoli divulgativi di ambito zootecnico, con lo scopo di valutare in che misura il lessico comune si fonde con quello specialistico, valutando allo stesso tempo il grado di leggibilità di tali testi per la generalità dei lettori. Successivamente, un corpus di 1000 tweet in cui si trattano tematiche ambientali è stato annotato da me e da un'altra studentessa. Le due annotazioni sono state confrontate tramite il calcolo dell'agreement e i risultati analizzati per vedere come anche in testi estratti da social media viene usato il linguaggio green. Il fine ultimo di questo task è quello fornire risorse linguistiche utili per allenare software di Sentiment Analysis affinché in futuro si possano estrarre automaticamente le opinioni espresse dagli utenti in testi che affrontano questioni legate all'ambiente, alla sostenibilità e alla natura.

Il linguaggio green tra divulgazione e social media: analisi ed annotazione di due corpora di testi in lingua italiana

Comandè, MARIA ROSA
2022/2023

Abstract

Lo sfruttamento indiscriminato degli animali da allevamento e i danni arrecati all’ambiente sollevano questioni di ordine etico e morale che sono oggetto di un’ampia trattazione da parte degli studiosi, esperti o giornalisti di diversi settori. Accade che in ragione della necessità di raggiungere il più ampio numero di lettori possibili, unitamente a un intento divulgativo, spesso ci si serva di un linguaggio che vuole essere il più chiaro possibile. Naturalmente, ogni disciplina o scienza possiede una propria terminologia specifica che racchiude l’insieme di vocaboli o locuzioni che caratterizzano un settore, e in base ai partecipanti che prendono parte alla comunicazione il linguaggio usato può essere più o meno specialistico. Il grado di accuratezza del linguaggio sarà in tal caso funzione di diverse variabili quali la dimensione verticale, che rappresenta i quattro tipi di variazione: diafasica, diatopica, diacronica e diamesica, e quella orizzontale che rappresenta invece le conoscenze specialistiche. In questo elaborato, è stata presa in esame la terminologia legata alla natura, all’ambiente e all’allevamento, ricorrendo a un corpus di articoli divulgativi di ambito zootecnico, con lo scopo di valutare in che misura il lessico comune si fonde con quello specialistico, valutando allo stesso tempo il grado di leggibilità di tali testi per la generalità dei lettori. Successivamente, un corpus di 1000 tweet in cui si trattano tematiche ambientali è stato annotato da me e da un'altra studentessa. Le due annotazioni sono state confrontate tramite il calcolo dell'agreement e i risultati analizzati per vedere come anche in testi estratti da social media viene usato il linguaggio green. Il fine ultimo di questo task è quello fornire risorse linguistiche utili per allenare software di Sentiment Analysis affinché in futuro si possano estrarre automaticamente le opinioni espresse dagli utenti in testi che affrontano questioni legate all'ambiente, alla sostenibilità e alla natura.
ITA
The indiscriminate exploitation of farm animals is one of the things that cause environmental issues, raising ethical and moral questions widely discussed by scholars and journalists from various fields. When writing about these alarming issues for informative purposes, due to the need to reach a wide range of readers the language needs to be as clear as possible. Each discipline or science has its own specific terminology that encompasses the set of words or phrases that characterize a specific field, and according to the participants taking part in the communication the language used may be more or less specialized. The degree of accuracy will depend on some variables such as the vertical dimension, which includes four types of variation: diaphasic, diatopic, diachronic and diamesic, and the horizontal dimension, i.e. specialistic knowledge. In this master's degree thesis, we created a corpus consisting of articles regarding the livestock field and its specialistic terminology has been analyzed. The aim of this work is to assess the extent to which the everyday vocabulary and the specialistic one coexists and also to evaluate the readability of these articles in their informative purpose. Subsequently, a corpus of 1000 tweets about environmental issues has been annotated by me and another student. The annotations collected have been then compared and the results analyzed in order to shed new lights on the use of green language in social media texts. The ultimate purpose of this task is to provide useful linguistic resources to train the Sentiment Analysis software so that in the future it can autonomously extract the opinions expressed by users in texts that address issues related to the environment, sustainability and nature.
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
965644_tesimariarosacomande.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 1.91 MB
Formato Adobe PDF
1.91 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/144480