Difference between revisions of "Nash equilibrium/cs"

From Simulace.info
Jump to: navigation, search
(Příklad 2)
(Příklad 2)
Line 78: Line 78:
 
Prostor strategií prvního hráče je dán vektorem (a, b, c), prostoj strategií druhého hráče vektorem (α, β, γ). Výplatní matice určuje výplaty prvního hráče, výplaty druhého hráče jsou opačné (jde o hru s nulovým součtem).
 
Prostor strategií prvního hráče je dán vektorem (a, b, c), prostoj strategií druhého hráče vektorem (α, β, γ). Výplatní matice určuje výplaty prvního hráče, výplaty druhého hráče jsou opačné (jde o hru s nulovým součtem).
  
===Řešení===
+
;Řešení
 
Žádný ze slouců ani řádků není dominován, řešení zkusíme nalézt pomocí sedlového bodu (maximum ve sloupci, minimum v řádku).
 
Žádný ze slouců ani řádků není dominován, řešení zkusíme nalézt pomocí sedlového bodu (maximum ve sloupci, minimum v řádku).
 
Maximum ve sloupci budu značit červenou barvou, minimum v řádku zeleným rámečkem.
 
Maximum ve sloupci budu značit červenou barvou, minimum v řádku zeleným rámečkem.

Revision as of 13:11, 19 June 2012

Jedním ze základních úkolů teorie her je popsání optimálních strategií jednotlivých hráčů, respektive výsledku hry (za předpokladu racionálního chování hráčů). Vhodným nástrojem je nalezení Nashovy rovnováhy.

Definice

Nashova rovnováha je takové řešení, ve kterém platí, že pokud se jeden z hráčů nebude držet své optimální strategie, zatímco jeho soupeř (soupeři) ano, jeho výhra se sníží, nebo zůstane stejná.[1]

Vlastnosti Nashovy rovnováhy

Z definice vyplývají následující vlastnosti Nashovy rovnováhy, které jsou užitečné pro její nalezení a interpretaci:

  • Nashova rovnováha nikdy neleží v silně dominovaném sloupci.
  • Pokud má hra s konstantním součtem sedlový prvek (sedlové prvky), pak rovnováha leží v tomto prvku (těchto prvcích).
  • Nashova rovnováha není (automaticky) Pareto-efektivní. Klasickým případem je hra vězňovo dilema, ve které se hráči bez možnosti kooperace racionálně rozhodnou pro řešení, které je pro oba z hráčů horší, než jiný možný výsledek hry.
  • Každá hra s konstantním součtem má rovnovážné řešení ve smíšených strategiích. (Ryzí strategie jsou podmnožinou smíšených strategií).[1]
  • Každá hra dvou hráčů má alespoň jedno rovnovážné řešení [1][2]

Řešené příklady

V následujících kapitolách budou představeny metody hledání Nashovy rovnováhy, počínaje nejjednoduššími, použitelnými jen ve specifických případech, po lehce složitější univerzální metody.

Příklad 1: Vězňovo dilema

Najděte Nashovu rovnováhu ve hře vězňovo dilema, jejíž výplatní matice je dána takto: Pokud se ani jeden z vězňů nepřizná, dostane každý trest 2 roky. Pokud se přizná jeden z vězňů, stráví ve vězení jen jeden rok, ale jeho spolupachatel 10. Pokud se přiznají oba hráči, stráví každý ve vězení 10 let.

Přiznat Nepřiznat
Přiznat -5, -5 -1, -10
Nepřiznat -10, -1 -2, -2

Řešení

Využijeme znalosti, že rovnovážné řešení nikdy neleží v silně (ostře) dominovaném řádku či sloupci. Pro prvního hráče první řádek (přiznat) silně dominuje druhý řádek (nepřiznat). Tento řádek tedy můžeme vyškrtnout. (První řádek je pro prvního hráče lepší při každém možném rozhodnutí protihráče.) Obdobně pro druhého hráče je druhý sloupec dominován prvním.

Přiznat Nepřiznat
Přiznat -5, -5 -1, -10
Nepřiznat -10, -1 -2, -2

V šedě označených buňkách tabulky tedy Nashovo rovnovážné řešení ležet nemůže. Vzhledem k tomu, že každá hra má alespoň jedno rovnovážné řešení, toto řešení je dáno volbou "Přiznat" obou hráčů a tedy výplatní hodnotou (-5, -5).

Ve hrách, které obsahují více nedominovaných řádků či sloupců tento postup k nalezení Nashovy rovnováhy nestačí. Neuvažování dominovaných prvků ale může ulehčit postup v případě dalších metod.

Příklad 2

Nalezněte optimální strategie obou hráčů a Nashovu rovnováhu pro následující jednomaticovou hru:

α β γ
a 0 1 2
b -1 3 -2
c -2 -7 5

Prostor strategií prvního hráče je dán vektorem (a, b, c), prostoj strategií druhého hráče vektorem (α, β, γ). Výplatní matice určuje výplaty prvního hráče, výplaty druhého hráče jsou opačné (jde o hru s nulovým součtem).

Řešení

Žádný ze slouců ani řádků není dominován, řešení zkusíme nalézt pomocí sedlového bodu (maximum ve sloupci, minimum v řádku). Maximum ve sloupci budu značit červenou barvou, minimum v řádku zeleným rámečkem.

  • Maximum v prvním sloupci (optimální reakce prvního hráče, pokud druhý hráč zahraje strategii α) je 0, označím ji tedy červeně.
  • Maximum v druhém sloupci (optimální reakce prvního hráče, pokud druhý hráč zahraje strategii β) je 3, označím ji tedy červeně.
  • Maximum ve třetím sloupci (optimální reakce prvního hráče, pokud druhý hráč zahraje strategii γ) je 5, označím ji tedy červeně.
  • Minimum v prvním řádku (optimální reakce druhého hráče, pokud první hráč zahraje strategii a) je 0, označím zeleným rámečkem.
  • Minimum v druhém řádku (optimální reakce druhého hráče, pokud první hráč zahraje strategii b) je -2, označím zeleným rámečkem.
  • Minimum v druhém řádku (optimální reakce druhého hráče, pokud první hráč zahraje strategii c) je -7, označím zeleným rámečkem.
α β γ
a 0 1 2
b -1 3 -2
c -2 -7 5

V buňce, kde se řádkové minimum a sloupcové maximum setkají, leží sedlový bod, a tedy i Nashova rovnováha.

Ve hře s konstantním součtem mohou nastat následující situace:

  • Existuje jeden sedlový bod, potom Nashova rovnováha leží v tomto sedlovém bodě.
  • Existuje více sedlových bodů o stejné hodnotě, potom Nashova rovnováha leží v každém z nich.
  • Neexistuje sedlový bod, v tomto případě existuje pouze smíšené řešení.

Příklad 3: Vězňovo dilema

Řešení

Další příklady

Reference

  1. 1.0 1.1 1.2 DLOUHÝ, Martin. Úvod do teorie her. 2., přepracované vydání Praha: Oeconomica, 2009, 119 s. ISBN 978-80-245-1609-7.
  2. NASH, John F. Equilibrium Points in n-Person Games. In: Proceedings of the National Academy of Sciences of the United States of America, Vol.36, No. 1. Jan 15, 1950. Dostupné z: http://courses.engr.illinois.edu/ece586/TB/Nash-NAS-1950.pdf

Doplňující literatura

  • Ben Polak, Game Theory (Yale University: Open Yale Courses), http://oyc.yale.edu/ (Accessed June 17, 2012). License: Creative Commons BY-NC-SA, lectures 4-8