Tesi compilativa su reinforcement learning con particolare attenzione all'analisi dei Finite Markov Decision Processes, della programmazione dinamica e quindi dei vari metodi quali value iteration e policy iteration e infine dei metodi di Monte Carlo. All'interno della tesi vi sono esempi che permettono di spiegare meglio il tutto e alla fine vi è un confronto tra la programmazione dinamica e i metodi di Monte Carlo.
Confronto di metodi i reinforcement learning con esperimenti
CONTOTTI, DAVIDE
2019/2020
Abstract
Tesi compilativa su reinforcement learning con particolare attenzione all'analisi dei Finite Markov Decision Processes, della programmazione dinamica e quindi dei vari metodi quali value iteration e policy iteration e infine dei metodi di Monte Carlo. All'interno della tesi vi sono esempi che permettono di spiegare meglio il tutto e alla fine vi è un confronto tra la programmazione dinamica e i metodi di Monte Carlo.File in questo prodotto:
File | Dimensione | Formato | |
---|---|---|---|
733710_contotti_davide.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
1.42 MB
Formato
Adobe PDF
|
1.42 MB | Adobe PDF |
Se sei interessato/a a consultare l'elaborato, vai nella sezione Home in alto a destra, dove troverai le informazioni su come richiederlo. I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
Usare il seguente URL per citare questo documento:
https://hdl.handle.net/20.500.14240/33256