Questa tesi affronta lo studio di proprietà statistiche di testi generati da large language models. E' presente una introduzione sulla linguistica computazionale, concentrando l'attenzione su legge di Zipf e legge di Heaps. Successivamente vengono definiti i large language models e ne viene descritta l'architettura, facendo attenzione al parametro della temperatura. Nella parte centrale della tesi si analizzano testi generati mediante GPT2 e ne vengono studiate le proprietà statistiche al variare del parametro della temperatura: a temperature intorno a 1.0 mantengono gli stessi comportamenti individuati nei testi in linguaggio naturale, mentre a temperature inferiori o superiori cambiano leggermente le proprietà. Infine, viene analizzato il caso particolare della temperatura infinita.
Il ruolo della temperatura sulle fluttuazioni del vocabolario dei large language models
VIRTÙ, LUCIA
2022/2023
Abstract
Questa tesi affronta lo studio di proprietà statistiche di testi generati da large language models. E' presente una introduzione sulla linguistica computazionale, concentrando l'attenzione su legge di Zipf e legge di Heaps. Successivamente vengono definiti i large language models e ne viene descritta l'architettura, facendo attenzione al parametro della temperatura. Nella parte centrale della tesi si analizzano testi generati mediante GPT2 e ne vengono studiate le proprietà statistiche al variare del parametro della temperatura: a temperature intorno a 1.0 mantengono gli stessi comportamenti individuati nei testi in linguaggio naturale, mentre a temperature inferiori o superiori cambiano leggermente le proprietà. Infine, viene analizzato il caso particolare della temperatura infinita.File | Dimensione | Formato | |
---|---|---|---|
846165_tesivirtu.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
2.83 MB
Formato
Adobe PDF
|
2.83 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/146713