Questa tesi affronta lo studio di proprietà statistiche di testi generati da large language models. E' presente una introduzione sulla linguistica computazionale, concentrando l'attenzione su legge di Zipf e legge di Heaps. Successivamente vengono definiti i large language models e ne viene descritta l'architettura, facendo attenzione al parametro della temperatura. Nella parte centrale della tesi si analizzano testi generati mediante GPT2 e ne vengono studiate le proprietà statistiche al variare del parametro della temperatura: a temperature intorno a 1.0 mantengono gli stessi comportamenti individuati nei testi in linguaggio naturale, mentre a temperature inferiori o superiori cambiano leggermente le proprietà. Infine, viene analizzato il caso particolare della temperatura infinita.

Il ruolo della temperatura sulle fluttuazioni del vocabolario dei large language models

VIRTÙ, LUCIA
2022/2023

Abstract

Questa tesi affronta lo studio di proprietà statistiche di testi generati da large language models. E' presente una introduzione sulla linguistica computazionale, concentrando l'attenzione su legge di Zipf e legge di Heaps. Successivamente vengono definiti i large language models e ne viene descritta l'architettura, facendo attenzione al parametro della temperatura. Nella parte centrale della tesi si analizzano testi generati mediante GPT2 e ne vengono studiate le proprietà statistiche al variare del parametro della temperatura: a temperature intorno a 1.0 mantengono gli stessi comportamenti individuati nei testi in linguaggio naturale, mentre a temperature inferiori o superiori cambiano leggermente le proprietà. Infine, viene analizzato il caso particolare della temperatura infinita.
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
846165_tesivirtu.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 2.83 MB
Formato Adobe PDF
2.83 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/146713