In questo elaborato viene trattata la dinamica best reply, ovvero una dinamica in un gioco in forma strategica nella quale i giocatori scelgono in modo miope, senza fare previsioni sulle scelte future, un’azione che corrisponde alla best reply al profilo di strategie giocato nel turno precedente dagli altri utenti. La best reply di un giocatore i ad un profilo di strategie degli altri n − 1 giocatori è l’insieme delle strategie di i che, se giocate contro il suddetto profilo, ne massimizzano il payoff; questo insieme è in generale convesso e non vuoto. Per ovviare al problema di molteplici best reply, consideriamo unicamente giochi non degeneri, ovvero in cui la best reply è unica; inoltre, lo studio è ristretto al solo caso dei profili di strategie pure. Nello studio delle dinamiche best reply vengono trattati principalmente due casi: quello della dinamica con update simultaneo, dove tutti i giocatori aggiornano ad ogni turno la loro best reply, e quello della dinamica associata a una successione s di giocatori, dove ad ogni turno t cambia solo la strategia del giocatore di turno s(t); le due dinamiche vengono rispettivamente denominate sincrona e asincrona. Per quest’ultimo caso, ci concentriamo maggiormente su successioni di giocatori cicliche, dove gli agenti giocano sempre nello stesso ordine. Se la dinamica best reply raggiunge un equilibrio di Nash, questa rimane sull’equilibrio per tutti i turni successivi; si dirà allora che la dinamica converge. Non abbiamo alcuna condizione che ci permetta di valutare se una generica dinamica converga o meno ad un equilibrio; in generale, questa rimane bloccata in una rotazione di un numero finito di profili distinti, che chiamiamo ciclo best reply. In alcuni casi particolari però la convergenza ad un equilibrio è assicurata. Un esempio è quello dei giochi potenziali, ovvero giochi in cui le differenze di payoff tra strategie possono essere espresse da una funzione potenziale: per questo tipo di giochi, la dinamica best reply asincrona converge sempre. La presenza di cicli best reply ha la possibilità di influire non solo sulla dinamica best reply, ma anche su altre dinamiche. Possiamo studiare infatti la relazione tra la struttura della best reply su di un gioco e la stabilità di alcune dinamiche, come la dinamica del replicatore; in particolare, vediamo che la presenza o meno di cicli best reply si riflette sulle traiettorie stabilite da quest’ultime. Infine, viene descritta un’applicazione ad una classe di giochi di segnalazione, in cui la competizione tra gli agenti segue una logica simile a quella del dilemma del prigionero. In questo caso l’esistenza di equilibri di Nash non è garantita, e la caratterizzazione dei cicli best reply è un importante strumento per l’analisi della logica del conflitto.

Analisi della dinamica best reply nella teoria dei giochi: convergenza e struttura degli attrattori

MONTINI, ENRICO
2021/2022

Abstract

In questo elaborato viene trattata la dinamica best reply, ovvero una dinamica in un gioco in forma strategica nella quale i giocatori scelgono in modo miope, senza fare previsioni sulle scelte future, un’azione che corrisponde alla best reply al profilo di strategie giocato nel turno precedente dagli altri utenti. La best reply di un giocatore i ad un profilo di strategie degli altri n − 1 giocatori è l’insieme delle strategie di i che, se giocate contro il suddetto profilo, ne massimizzano il payoff; questo insieme è in generale convesso e non vuoto. Per ovviare al problema di molteplici best reply, consideriamo unicamente giochi non degeneri, ovvero in cui la best reply è unica; inoltre, lo studio è ristretto al solo caso dei profili di strategie pure. Nello studio delle dinamiche best reply vengono trattati principalmente due casi: quello della dinamica con update simultaneo, dove tutti i giocatori aggiornano ad ogni turno la loro best reply, e quello della dinamica associata a una successione s di giocatori, dove ad ogni turno t cambia solo la strategia del giocatore di turno s(t); le due dinamiche vengono rispettivamente denominate sincrona e asincrona. Per quest’ultimo caso, ci concentriamo maggiormente su successioni di giocatori cicliche, dove gli agenti giocano sempre nello stesso ordine. Se la dinamica best reply raggiunge un equilibrio di Nash, questa rimane sull’equilibrio per tutti i turni successivi; si dirà allora che la dinamica converge. Non abbiamo alcuna condizione che ci permetta di valutare se una generica dinamica converga o meno ad un equilibrio; in generale, questa rimane bloccata in una rotazione di un numero finito di profili distinti, che chiamiamo ciclo best reply. In alcuni casi particolari però la convergenza ad un equilibrio è assicurata. Un esempio è quello dei giochi potenziali, ovvero giochi in cui le differenze di payoff tra strategie possono essere espresse da una funzione potenziale: per questo tipo di giochi, la dinamica best reply asincrona converge sempre. La presenza di cicli best reply ha la possibilità di influire non solo sulla dinamica best reply, ma anche su altre dinamiche. Possiamo studiare infatti la relazione tra la struttura della best reply su di un gioco e la stabilità di alcune dinamiche, come la dinamica del replicatore; in particolare, vediamo che la presenza o meno di cicli best reply si riflette sulle traiettorie stabilite da quest’ultime. Infine, viene descritta un’applicazione ad una classe di giochi di segnalazione, in cui la competizione tra gli agenti segue una logica simile a quella del dilemma del prigionero. In questo caso l’esistenza di equilibri di Nash non è garantita, e la caratterizzazione dei cicli best reply è un importante strumento per l’analisi della logica del conflitto.
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
919365_enrico_montini_tesi_analisi_della_dinamica_best_reply.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 915.88 kB
Formato Adobe PDF
915.88 kB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/83388