Tesi compilativa su reinforcement learning con particolare attenzione all'analisi dei Finite Markov Decision Processes, della programmazione dinamica e quindi dei vari metodi quali value iteration e policy iteration e infine dei metodi di Monte Carlo. All'interno della tesi vi sono esempi che permettono di spiegare meglio il tutto e alla fine vi è un confronto tra la programmazione dinamica e i metodi di Monte Carlo.

Confronto di metodi i reinforcement learning con esperimenti

CONTOTTI, DAVIDE
2019/2020

Abstract

Tesi compilativa su reinforcement learning con particolare attenzione all'analisi dei Finite Markov Decision Processes, della programmazione dinamica e quindi dei vari metodi quali value iteration e policy iteration e infine dei metodi di Monte Carlo. All'interno della tesi vi sono esempi che permettono di spiegare meglio il tutto e alla fine vi è un confronto tra la programmazione dinamica e i metodi di Monte Carlo.
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
733710_contotti_davide.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 1.42 MB
Formato Adobe PDF
1.42 MB Adobe PDF

Se sei interessato/a a consultare l'elaborato, vai nella sezione Home in alto a destra, dove troverai le informazioni su come richiederlo. I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Usare il seguente URL per citare questo documento: https://hdl.handle.net/20.500.14240/33256