La scelta di effettuare questa ricerca muove dalla considerazione che l'informatica possa essere una disciplina di grande aiuto nel campo dell'analisi testuale. Nel campo degli studi linguistici, infatti, l'informatica riveste un ruolo sempre più importante, come dimostrano il nascere e lo svilupparsi di discipline come la Linguistica Computazionale, o la Corpus Linguistics, che si basano sull'utilizzo congiunto di informatica e linguistica. L'obiettivo della ricerca è dunque quello di dare una dimostrazione pratica della disciplina chiamata Corpus Linguistics, con l'analisi di un corpus di articoli giornalistici riguardanti un tema di attualità: l'Alta Velocità in Valsusa. La ricerca è stata eseguita su un corpus di testi realizzato selezionando alcuni articoli giornalistici dai quotidiani La Stampa e La Repubblica, che riguardassero l'Alta Velocità in Valsusa, redatti per il periodo di un anno, da Maggio 2009 a Maggio 2010. Successivamente sono state svolte sul corpus alcune elaborazioni con l'ausilio di particolari softwares di analisi testuale, con lo scopo di portare alla luce la struttura e lo stile di composizione degli articoli, e di verificare se l'argomento trattato nei testi, la Tav, segua un particolare modello di presentazione delle notizie. La prima parte della trattazione intende introdurre la ricerca, inserendola in un contesto disciplinare caratterizzato dall'uso congiunto di informatica e linguistica. La sezione inizia descrivendo il panorama di studi in cui la ricerca si colloca, nei capitoli 1 e 2, e prosegue esaminando più nel dettaglio la Corpus Linguistics, nel capitolo 3. Di questa disciplina sono descritti i meccanismi di codifica dei testi e di creazione di corpora (paragrafo 3.2), e le principali tecniche di analisi (paragrafo 3.3). La seconda parte descrive la ricerca vera e propria. Nel primo capitolo di questa sezione sono descritte le motivazioni alla base della ricerca, e gli obiettivi che si pone. Il secondo capitolo descrive l'argomento dei testi analizzati, l'Alta Velocità in Valsusa, e fornisce la cronologia dei principali avvenimenti dell'arco temporale considerato. Nel terzo capitolo sono spiegate le procedure di estrazione dei dati e composizione del corpus testuale, su cui sono state eseguite varie analisi, descritte nel dettaglio nel capitolo 4, suddivise per tipologia in quattro paragrafi, che contengono, nell'ordine, le word lists estratte dal corpus, le analisi di frequenza, lo studio della comprensibilità, le analisi di alcuni vocaboli e del contesto, testuale e extralinguistico, in cui si collocano. Nel capitolo 5 sono riassunte alcune considerazioni conclusive sulla ricerca e sui risultati ottenuti.

Applicazione di Corpus Linguistics: analisi di un corpus di articoli giornalistici sull'Alta Velocità in Valsusa.

MARCHIONI, ELEONORA
2009/2010

Abstract

La scelta di effettuare questa ricerca muove dalla considerazione che l'informatica possa essere una disciplina di grande aiuto nel campo dell'analisi testuale. Nel campo degli studi linguistici, infatti, l'informatica riveste un ruolo sempre più importante, come dimostrano il nascere e lo svilupparsi di discipline come la Linguistica Computazionale, o la Corpus Linguistics, che si basano sull'utilizzo congiunto di informatica e linguistica. L'obiettivo della ricerca è dunque quello di dare una dimostrazione pratica della disciplina chiamata Corpus Linguistics, con l'analisi di un corpus di articoli giornalistici riguardanti un tema di attualità: l'Alta Velocità in Valsusa. La ricerca è stata eseguita su un corpus di testi realizzato selezionando alcuni articoli giornalistici dai quotidiani La Stampa e La Repubblica, che riguardassero l'Alta Velocità in Valsusa, redatti per il periodo di un anno, da Maggio 2009 a Maggio 2010. Successivamente sono state svolte sul corpus alcune elaborazioni con l'ausilio di particolari softwares di analisi testuale, con lo scopo di portare alla luce la struttura e lo stile di composizione degli articoli, e di verificare se l'argomento trattato nei testi, la Tav, segua un particolare modello di presentazione delle notizie. La prima parte della trattazione intende introdurre la ricerca, inserendola in un contesto disciplinare caratterizzato dall'uso congiunto di informatica e linguistica. La sezione inizia descrivendo il panorama di studi in cui la ricerca si colloca, nei capitoli 1 e 2, e prosegue esaminando più nel dettaglio la Corpus Linguistics, nel capitolo 3. Di questa disciplina sono descritti i meccanismi di codifica dei testi e di creazione di corpora (paragrafo 3.2), e le principali tecniche di analisi (paragrafo 3.3). La seconda parte descrive la ricerca vera e propria. Nel primo capitolo di questa sezione sono descritte le motivazioni alla base della ricerca, e gli obiettivi che si pone. Il secondo capitolo descrive l'argomento dei testi analizzati, l'Alta Velocità in Valsusa, e fornisce la cronologia dei principali avvenimenti dell'arco temporale considerato. Nel terzo capitolo sono spiegate le procedure di estrazione dei dati e composizione del corpus testuale, su cui sono state eseguite varie analisi, descritte nel dettaglio nel capitolo 4, suddivise per tipologia in quattro paragrafi, che contengono, nell'ordine, le word lists estratte dal corpus, le analisi di frequenza, lo studio della comprensibilità, le analisi di alcuni vocaboli e del contesto, testuale e extralinguistico, in cui si collocano. Nel capitolo 5 sono riassunte alcune considerazioni conclusive sulla ricerca e sui risultati ottenuti.
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
327457_tesi-applicazionedicorpuslinguistics.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 1.91 MB
Formato Adobe PDF
1.91 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/15224