Analysing the Neural Machine Translation of Metaphors in Newspaper Articles: A Corpus-Based Approach Nowadays, Artificial Intelligence (AI) plays an essential role in various fields, including journalism, namely the field under scrutiny in this dissertation. Specifically, Neural Machine Translation (NMT) is widely used for its efficiency, speed and reduced costs (Wang, 2021). Nevertheless, high-quality translations remain a challenge and often require post-editing. While improvements in NMT have allowed for greater lexico-grammatical accuracy, among the language features that remain difficult to translate through NMT systems is figurative speech due to the non-literal meaning of rhetorical expressions, which machines tend to render in a word-by-word manner. A case in point is the translation of metaphors. The purpose of this study is to examine NMT’s ability to handle metaphors in news translation. By creating ad hoc parallel corpora of source texts and their machine translated version, the way metaphors are rendered from English into Italian will be explored, considering that the language of journalism is rich in figurative language, as claimed by Lakoff (2006). As Semino highlights (2017), corpus-linguistics methods are crucial in metaphor studies. This dissertation will demonstrate that they can also offer insight into how NMT manages culturally and rhetorically-complex language in translation. The corpora for this study will be built collecting economic and political articles from a variety of newspapers and magazines online, e.g. The Guardian and Wired, and their translation through the use of NMT tools. The result will be a parallel corpus that will compare the input texts (source articles) with the raw translation produced by NMT systems, e.g. Google Translate. Furthermore, the texts will be aligned to analyse and compare how metaphors are rendered from English to Italian. The study will also examine post-edited versions to investigate metaphors in the raw MT output. Through this dual analysis, the purpose of this dissertation is to understand the performance of NMT in handling metaphor translation and to acknowledge the specific difficulties that require human intervention.

Analisi della traduzione automatica neurale delle metafore negli articoli di giornale: Un approccio basato sul corpus Al giorno d'oggi, l'Intelligenza Artificiale (IA) svolge un ruolo essenziale in diversi campi, tra cui il giornalismo, ovvero il campo oggetto di studio di questa tesi. In particolare, la Neural Machine Translation (NMT) è ampiamente utilizzata per la sua efficienza, velocità e riduzione dei costi (Wang, 2021). Tuttavia, le traduzioni di alta qualità rimangono una sfida e spesso richiedono un post-editing. Sebbene i miglioramenti della NMT abbiano permesso una maggiore accuratezza lessico-grammaticale, tra le caratteristiche linguistiche che rimangono difficili da tradurre attraverso i sistemi NMT c'è il discorso figurato a causa del significato non letterale delle espressioni retoriche, che le macchine tendono a rendere parola per parola. Un esempio è la traduzione di metafore. Lo scopo di questo studio è esaminare la capacità della NMT di gestire le metafore nella traduzione di notizie. Attraverso la creazione di corpora paralleli ad hoc di testi di partenza e della loro versione tradotta automaticamente, verrà esplorato il modo in cui le metafore vengono rese dall'inglese all'italiano, considerando che il linguaggio giornalistico è ricco di linguaggio figurato, come sostiene Lakoff (2006). Come sottolinea Semino (2017), i metodi della corpus-linguistics sono cruciali negli studi sulla metafora. Questa tesi dimostrerà che possono anche offrire una visione di come la NMT gestisce il linguaggio culturalmente e retoricamente complesso nella traduzione. I corpora per questo studio saranno costruiti raccogliendo articoli economici e politici da una varietà di giornali e riviste online, ad esempio The Guardian e Wired, e la loro traduzione attraverso l'uso di strumenti NMT. Il risultato sarà un corpus parallelo che confronterà i testi di input (articoli di partenza) con la traduzione grezza prodotta dai sistemi NMT, ad esempio Google Translate. Inoltre, i testi saranno allineati per analizzare e confrontare il modo in cui le metafore sono rese dall'inglese all'italiano. Lo studio esaminerà anche le versioni post-editing per indagare sulle metafore presenti nella traduzione automatica grezza. Attraverso questa doppia analisi, lo scopo di questa tesi è quello di comprendere le prestazioni della NMT nel gestire la traduzione di metafore e di riconoscere le difficoltà specifiche che richiedono l'intervento umano.

Analysing the Neural Machine Translation of Metaphors in Newspaper Articles: A Corpus-Based Approach

BUONASORA, FLAVIA
2023/2024

Abstract

Analisi della traduzione automatica neurale delle metafore negli articoli di giornale: Un approccio basato sul corpus Al giorno d'oggi, l'Intelligenza Artificiale (IA) svolge un ruolo essenziale in diversi campi, tra cui il giornalismo, ovvero il campo oggetto di studio di questa tesi. In particolare, la Neural Machine Translation (NMT) è ampiamente utilizzata per la sua efficienza, velocità e riduzione dei costi (Wang, 2021). Tuttavia, le traduzioni di alta qualità rimangono una sfida e spesso richiedono un post-editing. Sebbene i miglioramenti della NMT abbiano permesso una maggiore accuratezza lessico-grammaticale, tra le caratteristiche linguistiche che rimangono difficili da tradurre attraverso i sistemi NMT c'è il discorso figurato a causa del significato non letterale delle espressioni retoriche, che le macchine tendono a rendere parola per parola. Un esempio è la traduzione di metafore. Lo scopo di questo studio è esaminare la capacità della NMT di gestire le metafore nella traduzione di notizie. Attraverso la creazione di corpora paralleli ad hoc di testi di partenza e della loro versione tradotta automaticamente, verrà esplorato il modo in cui le metafore vengono rese dall'inglese all'italiano, considerando che il linguaggio giornalistico è ricco di linguaggio figurato, come sostiene Lakoff (2006). Come sottolinea Semino (2017), i metodi della corpus-linguistics sono cruciali negli studi sulla metafora. Questa tesi dimostrerà che possono anche offrire una visione di come la NMT gestisce il linguaggio culturalmente e retoricamente complesso nella traduzione. I corpora per questo studio saranno costruiti raccogliendo articoli economici e politici da una varietà di giornali e riviste online, ad esempio The Guardian e Wired, e la loro traduzione attraverso l'uso di strumenti NMT. Il risultato sarà un corpus parallelo che confronterà i testi di input (articoli di partenza) con la traduzione grezza prodotta dai sistemi NMT, ad esempio Google Translate. Inoltre, i testi saranno allineati per analizzare e confrontare il modo in cui le metafore sono rese dall'inglese all'italiano. Lo studio esaminerà anche le versioni post-editing per indagare sulle metafore presenti nella traduzione automatica grezza. Attraverso questa doppia analisi, lo scopo di questa tesi è quello di comprendere le prestazioni della NMT nel gestire la traduzione di metafore e di riconoscere le difficoltà specifiche che richiedono l'intervento umano.
Analysing the Neural Machine Translation of Metaphors in Newspaper Articles: A Corpus-Based Approach
Analysing the Neural Machine Translation of Metaphors in Newspaper Articles: A Corpus-Based Approach Nowadays, Artificial Intelligence (AI) plays an essential role in various fields, including journalism, namely the field under scrutiny in this dissertation. Specifically, Neural Machine Translation (NMT) is widely used for its efficiency, speed and reduced costs (Wang, 2021). Nevertheless, high-quality translations remain a challenge and often require post-editing. While improvements in NMT have allowed for greater lexico-grammatical accuracy, among the language features that remain difficult to translate through NMT systems is figurative speech due to the non-literal meaning of rhetorical expressions, which machines tend to render in a word-by-word manner. A case in point is the translation of metaphors. The purpose of this study is to examine NMT’s ability to handle metaphors in news translation. By creating ad hoc parallel corpora of source texts and their machine translated version, the way metaphors are rendered from English into Italian will be explored, considering that the language of journalism is rich in figurative language, as claimed by Lakoff (2006). As Semino highlights (2017), corpus-linguistics methods are crucial in metaphor studies. This dissertation will demonstrate that they can also offer insight into how NMT manages culturally and rhetorically-complex language in translation. The corpora for this study will be built collecting economic and political articles from a variety of newspapers and magazines online, e.g. The Guardian and Wired, and their translation through the use of NMT tools. The result will be a parallel corpus that will compare the input texts (source articles) with the raw translation produced by NMT systems, e.g. Google Translate. Furthermore, the texts will be aligned to analyse and compare how metaphors are rendered from English to Italian. The study will also examine post-edited versions to investigate metaphors in the raw MT output. Through this dual analysis, the purpose of this dissertation is to understand the performance of NMT in handling metaphor translation and to acknowledge the specific difficulties that require human intervention.
Autorizzo consultazione esterna dell'elaborato
File in questo prodotto:
File Dimensione Formato  
TESI_FLAVIA BUONASORA.pdf

non disponibili

Dimensione 2.36 MB
Formato Adobe PDF
2.36 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/167065