Teória hier „začala“ pokrom a dilemou dvoch väzňov

Bohdan Hemžal

Nedávno zosnulý matematik John Nash pracoval dlhé roky na takzvanej teórii hier, ktorá mu neskôr priniesla Nobelovu cenu.

Teória hier „začala“ pokrom a dilemou dvoch väzňov

Ilustračná fotografia, zdroj: flickr.com/Viri G

HEMZAL Bohdan

Autor je v súčasnosti konzultantom v spoločnosti Neulogy, a. s. Od roku 2012 sa v rámci Neulogy venuje predovšetkým technologickému transferu z akademickej pôdy na slovenské a zahraničné trhy, podporu inovácií a ich financovanie a projektovému manažmentu v hi-tech oblastiach. Jeho profil nájdete tu

Počiatky tejto teórie siahajú do dvadsiatych rokov minulého storočia, kedy sa matematik maďarského pôvodu John von Neumann začal venovať hľadaniu vedeckej argumentácie blufovania v pokri. Popri tom sa mu podarilo spojiť predošlé práce viacerých matematikov, čím položil pevné základy teórie hier ako novej aplikovanej vedy.

Čo je to teória hier

Samotná teória hier predstavuje matematický prístup k riešeniu  rozhodovacích problémov, ktoré sa týkajú nielen vedeckých domén, ale aj najrôznejších spoločenských oblastí.

Teória aplikuje stratégie a pravidlá rozhodovania sa pri nachádzaní vzájomne súvisiacich riešení problémov. Tieto problémy môžu byť najrôznejšieho druhu a zahŕňajú situácie ako napríklad politické vyjednávania, uvedenie nového produktu na trh, či rozhodovanie skupiny priateľov kam ísť spoločne na večeru.

Vďaka silnému strategickému elementu, kedy jednotliví účastníci rozhodovania predpokladajú a vzájomne reagujú na kroky toho druhého, vzniká viacero možných scenárov s rôznym úžitkom pre jednotlivých účastníkov.

Tým pádom hovoríme o rozhodovacích problémoch v daných situáciách ako o „hrách“, pričom samotní účastníci rozhodovania sú definovaný ako „hráči“. Hráči majú k dispozícii rôzne sety krokov a vyberajú si ten, ktorý im v podmienkach obmedzených alebo zdieľaných zdrojov pomôže dosiahnuť stanovené ciele.

Strategické hry

Teória hier je o matematických modeloch a  simuluje reálne podmienky prostredníctvom premenných, rovníc a pravdepodobností. Ako nástroj predpovedania ľudského správania preto nachádza svoje limity, keďže v reálnom svete hráči málokedy konajú pri voľbe stratégie v súlade s matematickými teóriami. 

Za účelom zmiernenia tohto stavu bolo vyvinutých viacero typov hier, ktoré dokážu vierohodnejšie uchopiť rozličné situácie. V praxi sa objavujú rôzne sekvenčné a simultánne hry, hry s rôznou úrovňou informácií, kooperatívne hry, hry s nulovým alebo nenulovým súčtom a iné.

John Nash a Téoria hier

Práve v poslednej zo zmienených  kategórií John Nash exceloval so svojou teóriou rovnováhy pri hrách s dvoma hráčmi a nenulovým súčtom. Zatiaľ čo pri hrách s nulovým súčtom je výsledok  hry jedného hráča presným opakom  výsledku  hry druhého, v kategórii hier s nenulovým súčtom  takýto  princíp neplatí.

Tento fakt sťažuje hľadanie rovnovážneho  bodu pre oboch hráčov a tým pádom aj výber optimálnej stratégie. V takýchto situáciách nachádza uplatnenie takzvaná Nashova rovnováha. Je to stav, v ktorom všetci hráči zvolili optimálnu stratégiu ako odpoveď na kroky protistrany. Po dosiahnutí Nashovej rovnováhy žiaden z hráčov nedokáže zlepšiť svoju pozíciu v hre len jednostrannou zmenou stratégie.

Najznámejším príkladom teórie hier je takzvaná väzňova dilema (Prisoner´s dilemma) popísaná v roku 1950 Albertom W. Tuckerom.

vzorec

Hra opisuje situáciu dvoch väzňov, ktorý boli vzatí do väzby za údajnú lúpež. Polícia však nemá dostatok dôkazov na ich usvedčenie za konkrétnu lúpež a spolieha sa na výpoveď samotných väzňov, ktorí sú držaní v izolácií a tým pádom sa nemôžu dohodnúť na prípadnej výpovedi.

Obom väzňom je ponúknutá rovnaká možnosť okamžitého oslobodenia ak sa priznajú  k lúpeži. V takejto situácii by väzeň, ktorý sa priznal, získal slobodu zatiaľ čo druhý by dostal desaťročný trest.

Pri analýze možností hrozí väzňovi B v prípade priznania sa 6 alebo 0 rokov vo väzení, zatiaľ čo v prípade klamstva je to 10 alebo 1 rok. Jednoznačnou voľbou pre väzňa B je teda možnosť priznania sa. Keďže väzni nemôžu medzi sebou komunikovať a rozhodujú sa simultánne, väzeň A na základe rovnakej logiky usúdi že druhý väzeň sa prizná. Tým pádom má na výber buď klamať, čo by za daných predpokladov viedlo k desaťročnému trestu alebo sa priznať a dostať šesťročný trest. Keďže väzeň A vie, že za týchto podmienok sa väzbe nevyhne, vyberá si nižší trest a možnosť priznania sa. Dominantnou stratégiou pre oboch väzňov sa tým pádom stáva možnosť priznania sa a teda dosiahnutia Nashovej rovnováhy.

Matematik, či ekonóm?

Hoci bol John Nash matematik, jeho meno sa spája najmä s ekonomickými vedami. Dôvodom je široké uplatnenie jeho práce a zároveň aj vtedajší stav ekonomických teórií, ktoré dokázali popísať vzťahy na konkurenčných trhoch s množstvom kupujúcich a predávajúcich (teória ponuky a dopytu) či dokonca fungovanie ekonomiky ako celku.

Teória vierohodne pokrývajúca situáciu na trhoch s nízkym počtom navzájom si konkurujúcich firiem však absentovala. Tento stav sa pokúšali zmeniť matematici John von Neumann a Oskar Morgenstern, ktorý vytvorili intelektuálny rámec pre analyzovanie práve takýchto situácií. Aplikovateľnosť ich teórie však bola značne limitovaná a použiteľná iba na úzky počet interakcií. 

John Nash nadviazal na ich prácu a dokázal, že rovnovážny bod je možné nájsť v interakcii viacerých hráčov pri akejkoľvek hre, čím výrazne zvýšil aplikovateľnosť a aj celkový význam teórie hier.

Odporučiť e-mailom

Komentáre

Prihláste sa na odber noviniek zo sveta vedy priamo do Vášho e-mailu

* povinné polia