Dilema vězeňe
Dilema vězeňe představuje problém v teorii her. To bylo původně formováno Merrill záplavou a Melvin Dresher pracováním u Randa v roce 1950. Albert W. Tucker zformoval hru s přínosy vězení a dal tomu “dilema vězeňe” jméno.
V jeho klasické formě, dilema vězeňe (PD) je představován takto:
Nepřehlédněte: Tato stránka obsahuje strojový překlad textu z anglické encyklopedie Wikipedia. Pokud budou některé pasáže špatně srozumitelné, zkuste se podívat i na text v originále, který najdete pod odkazem Prisoner's dilemma. Překlad byl vytvořen pomocí překladače Eurotran.
Jestliže my předpokládáme, že každý hráč preferuje kratší věty k delším, a že každý dostane žádnou pomůcku ze snížení jiný hráč je věta a to tam jsou žádné efekty pověsti od rozhodnutí hráče pak dilema vězeňe tvoří non-nula-hra součtu ve kterých dvou hráčích může každý spolupracovat s nebo přebíhat od (tj. prozradit) jiný hráč. V této hře, jak v celé teorii her, jediné znepokojení každého hráče jednotlivce (vězeň) maximalizuje jeho/její vlastní přínos, bez některého starost o jiného hráče je přínos. Jedinečná rovnováha pro tuto hru je Pareto-suboptimal řešení — to je, rozumný výběr vede dva hráči k oběma hrají defekt, ačkoli každá hráčská individuální odměna by byla větší jestliže oni oba hráli kooperativně.
V klasické formě této hry, spolupracování je přísně ovládáno přebíháním, tak že jediná možná rovnováha pro hru je pro všechny hráče k defektu. Bez ohledu na to co jiný hráč dělá, jeden hráč vždy získá větší přínos tím, že hraje defekt. Protože v nějakém hraní situace defekt je prospěšnější než spolupracování, všichni rozumní hráči budou hrát defekt, celé bytí věcí se rovnat.
V opakovaném vězeňském dilematu hra je hrána opakovaně. Tak každý hráč má příležitost potrestat jiného hráče pro předchozí non-kooperativní hra. Jestliže množství kroků je znáno oběma hráči předem, ekonomická teorie říká, že dva hráči by měli přeběhnout znovu a znovu, bez ohledu na to jak mnohokrát hra je hrána. Jediný když hráči hrají nejasné nebo náhodné množství časů může spolupráce být ekonomická rovnováha. V tomto případě, podnět k defektu může být přemožen hrozbou trestu. Když hra je nekonečně opakována, spolupráce může být subgame dokonalá Nash rovnováha ačkoli oba přebíhání hráčů vždy zůstane rovnováhou a tam je mnoho jiné rovnováhy výsledky.
V náhodném použití, popiska “dilema vězeňe” může být aplikováno na situace ne přísně odpovídat formálním kritériím klasických nebo opakovacích her; například, ti ve kterém dvě entity mohly mít důležité užitky od spolupracování nebo trpět opomenutím dělat tak, ale najít to pouze těžký nebo drahý, ne nutně nemožný, koordinovat jejich aktivity dosáhnout spolupráce.
Strategie pro klasické vězeňské dilema
Klasické vězeňské dilema může být shrnuto tak:
V této hře, bez ohledu na co oponent si vybere, každý hráč vždy přjímá vyšší přínos (lesser větu) tím, že prozradí; to má říkat, že prozrazení je přísně dominantní strategie. Například, vězeň moci přesně říkat,”Bez ohledu na to jaký Prisoner B dělá, Já osobně jsem lépe pryč prozrazení než zůstat tichý. Proto, pro mou vlastní příčinu, já bych měl prozradit.” nicméně, jestliže jiný hráč jedná podobně, pak oni oba prozradí a oba dostanou nižší přínos než oni by si vystačili zůstat tichý. Rozumná sobecká rozhodnutí vyústí v každé bytí vězeňe hůře pryč než jestliže každý rozhodl se zmenšit větu accomplice u ceny kotvení trochu déle ve vězení sám (od této doby zdánlivé dilema). V teorie her, toto demonstruje velmi elegantně to v nenulová součtová hra Nash rovnováha potřeba ne být Pareto optimální.
Celková forma
My můžeme vystavit kostru hry tím, že zbaví to vězeňe formovat zařízení. Celková forma hry byla použitá často v experimentální ekonomii. Následující pravidla dávají typické pochopení hry.
Jestliže hráč 1 (červené) defekty a hráč 2 (modrý) spolupracuje, hráč 1 dostane Temptation k přínosu defektu 5 zaměří hráče chvíle 2 přijme Sucker přínos 0 bodů. Jestliže oba spolupracují oni dostanou odměnu pro přínos vzájemné spolupráce 3 bodů každý, zatímco jestliže oni oba přeběhnou oni dostanou trest pro vzájemné zběhnutí přínos 1 bodu. Dáma nastoupit na matici přínosu ukazovat přínosy je dáván dole.
V “vyhrát-prohrát” terminologie stůl vypadá jako toto:
Tyto úkoly bodu jsou dávány libovolně pro ilustraci. To je možné zevšeobecnit je, takto:
Kde T kandiduje na Temptation přeběhnout, R pro odměnu pro vzájemnou spolupráci, P pro trest za vzájemné zběhnutí a S pro přínos výhonku. To je definován jako Prisoner dilema, následující nerovnosti musí držet:
T > R > P > S
Tato podmínka zajistí, že výsledek rovnováhy je zběhnutí ale ta spolupráce Pareto ovládá hru rovnováhy. Navíc k nad podmínkou, jestliže hra je opakovaně hrána dvěma hráči, následující podmínka by měla být přidána.
2 R > T + S
Jestliže ta podmínka nedrží, pak plná spolupráce není nutně Pareto optimální, jak hráči jsou kolektivně lepší pryč tím, že má každého hráče se střídat mezi Cooperate a přebíhat.
Tato pravidla byla založena poznávacím vědcem Douglas Hofstadter a tvořit formální kanonický druh typické hry Prisoner dilematu.
Jednoduchý zvláštní případ nastane, když výhoda zběhnutí přes spolupráci je nezávislá na čem co-hráč dělá a cena co-zběhnutí hráčů je nezávislé na něčím vlastním ději, tj. T + S = P + R.
Lidské chování ve vězeňském dilematu
Jeden experiment založený na jednoduchém dilematu našel to přibližně 40 % účastníků hrál “spolupracovat” (tj. zůstal tichý).
Opakované vězeňské dilema
Jestliže dva hráči hrají Prisoner dilema více než jakmile postupně a oni si pamatují předchozí akce jejich oponenta a mění jejich strategii společně, hra je volána opakoval Prisoner dilema. Jestliže hra je hrána přesně N časy, dominantní strategie je pro oba hráče k defektu N časy.
Důkaz je přerušením: převzít hru hráčů N + 1 časy. Na posledním kroku, není tam žádná možnost trestu, tak dva rozumní hráči přeběhnou. Ale pak hra je redukována k N snížit dilema a přerušení je kompletní.
Na rozdíl od standardu vězeň je dilema, v opakovaném vězeňském dilematu strategie zběhnutí je counterintuitive a selhání špatně předvídat chování hráčů člověka. Uvnitř standardní ekonomické teorie, ačkoli, toto je jediná správná odpověď.
Jestliže číslo N je ne známý hráči dopředu času, a jestliže pravděpodobnost dvou hráčů hraní další hry je dostatečně velké, spolupráce může být stabilní strategie uvnitř standardní ekonomické teorie. Mezi výsledky ukazované vítězem Nobelovy ceny Robert Aumann v jeho 1959 papíru, rozumní hráči opakovaně se ovlivňovat pro neurčitě dlouhé hry mohou podporovat kooperativní výsledek. Zájem na opakovaných vězeňích dilema (IPD) byl zapálen Robert Axelrod v jeho knize Evoluce spolupráce (1984). V tomto on reportuje o turnaji, který on organizoval N krokové vězeňské dilema (s N fixovaný) ve kterém účastníci musí vybrat si jejich vzájemnou strategii znovu a znovu, a mít paměť jejich předchozích setkání. Axelrod pozval akademické kolegy všude po světě navrhnout počítačové strategie soutěžit v IPD turnaj. Programy, které byly zadány měnily se široce v algoritmické složitosti, parafovat nepřátelství, kapacita pro shovívavosti, a tak dále.
Axelrod objevil, že, když tato setkání byla opakována přes dlouhé časové období s mnoha hráči, každý s různými strategiemi, chamtivé strategie inklinovaly dělat velmi uboze z dlouhodobého hlediska, zatímco altruističtější strategie dělaly lépe, jak soudil čistě sobeckostí. On používal toto ukazovat možný mechanismus pro evoluci altruistického chování od mechanismů, které jsou zpočátku čistě sobecké, přirozeným výběrem.
Nejlepší deterministická strategie se nalézala být “půjčka za oplátku,” který Anatol Rapoport se vyvinul a vstoupil do turnaje. To bylo nejjednodušší nějakého programu přihlášený, obsahovat jen čtyři linky základní, a zvítězil v soutěži. Strategie je jednoduše spolupracovat v první iteraci hry; po tom, hráč dělá co jeho oponent dělal na předchozím pohybu. Se spoléhat na situaci, mírně lepší strategie může být “půjčka za oplátku se shovívavostí.” když oponent přeběhne, na příštím pohybu, hráč někdy spolupracuje stejně, s malou pravděpodobností (kolem 1 % - 5 %). Toto počítá s příležitostným zotavením z dobývání chyceného v cyklu zběhnutí. Přesná pravděpodobnost závisí na sestavě hráčů oponentů.
Tím, že analyzuje vrchol-zaznamenávat strategie, Axelrod řekl několik podmínek nutných pro strategii být úspěšný.
- Nice
- Oplácení
- Odpouštění
- Non-závistivý
Proto, Axelrod dosáhl oxymoróna-znít jako závěr, že sobečtí jednotlivci pro jejich vlastní sobeckou dobrou vůli inklinují být hezký a shovívavý a non-závistivý.
Optimální (body-maximalizovat) strategie pro bývalou PD hru je prostě zběhnutí; jak vysvětlil to nahoře, toto je pravdivé kterákoliv složení oponentů může být. Nicméně, v opakovaný-PD hra optimální strategie závisí na strategiích pravděpodobných oponentů a jak oni budou reagovat na zběhnutí a cooperations. Například, zvažovat populaci kde každý přeběhne pokaždé, kromě pro jediného jednotlivce po sýkorce-pro-strategie tretky. Že jednotlivec je u drobné nevýhody protože ztráty na prvním otočení. V takový populace, optimální strategie pro toho jednotlivce má přeběhnout pokaždé. V populaci s jistým procentem vždy-odpadlíci a zbytek být sýkorka-pro-hráči tretky, optimální strategie pro jednotlivce závisí na procentu, a na délce hry.
Strategie volala Pavlov (příklad Wina-zůstávat, prohrát-přepínač) spolupracuje u první iterace a kdykoli hráč a co-hráč udělal stejnou věc u předchozí iterace; Pavlov defekty když hráč a co-hráč udělal různé věci u předchozí iterace. Pro jistý rozsah parametrů, Pavlov porazí všechny jiné strategie tím, že dává přednostní zacházení k co-hráči, kteří se podobají Pavlov.
Pocházet optimální strategie je obecně dělána dvěma způsoby:
- Bayesian Nash rovnováha: Jestliže statistické rozdělení nepřátelských strategií může být určováno (např. 50 % sýkorka-pro-tretka, 50 % vždy spolupracovat) optimální pult-strategie může být odvozena analyticky.
- Simulace Montea Carla populací byly vyrobené, kde jednotlivci s nízkými skóre umřou pryč, a ti s vysokými skóre množit (genetický algoritmus pro nález optimální strategie). Směs algoritmů v populaci finále obecně závisí na směsi v počáteční populaci. Zavedení mutace (náhodná variace během reprodukce) zmenší závislost na počáteční populaci; empirické experimenty s takovými systémy inklinují k sýkorce produkce-pro-hráči tretky (vidět například Chess 1988), ale není tam žádný analytický důkaz že toto vždy nastane.
Ačkoli sýkorka-pro-tretka je považována za nejvíce robustní základní strategii, tým od Southampton univerzity v Anglii (vedl o profesora Nicholase Jenningse [3] a sestávat z Rajdeep vervy, Sarvapali Ramchurn, Alex Rogers, Perukrishnen Vytelingum) představil novou strategii u 20th-výročí opakovaný vězeň je soutěž dilematu, který dokázal být úspěšnější než sýkorka-pro-tretka. Tato strategie spoléhala spolupráci mezi programy dosáhnout nejvyššího množství bodů pro jediný program. Univerzita předložila 60 programů k soutěži, který byl navrhnut rozpoznat každého jiný přes sérii pět k desíti pohybům na začátku. Jednou toto uznání bylo děláno, jeden program by vždy spolupracoval a jiný by vždy přeběhl, ujišťovat maximální množství bodů pro odpadlíka. Jestliže program si uvědomil, že to hrálo non-Southampton hráč, to by nepřetržitě přeběhlo v pokusu minimalizovat skóre soupeřícího programu. Jako výsledek, tato strategie skončila brát vrchol tři pozice v soutěži, stejně jako množství pozic k dolní části.
Tato strategie využívá skutečnosti, že rozmanité záznamy byly dovoleny v obzvláště této soutěži, a že výkon týmu byl změřen tím nejvyšší-zaznamenávat hráče (znamenat, že použití sebeobětujících hráčů bylo forma minmaxing). V soutěži kde jeden má kontrolu jediný jediný hráč, sýkorka-pro-tretka je jistě lepší strategie. Protože tohoto nového pravidla, tato soutěž také má málo teoretický význam když analyzuje jediné agentské strategie jak se vyrovnal Axelrod je klíčový turnaj. Nicméně, to poskytlo rám pro analyzovat jak dosáhnout kooperativních strategií v multi-kostry agenta, obzvláště v přítomnosti šumu. Ve skutečnosti, dlouho před tímto nový-turnaj pravidel byl hrán, Richard Dawkins v jeho knize Sobecký gen poukázal na možnost takových strategií vyhrávat jestliže rozmanité záznamy byly dovoleny, ale poznamenával, že nejvíce pravděpodobně Axelrod by neměl dovolil je jestliže oni byli se podrobil. To také se spoléhá na obejití pravidel o dilematu vězeňe v tom je žádná komunikace dovolená mezi dvěma hráči. Když Southampton programy zabývají se otevírat “deset tance pohybu” rozpoznat jednoho jiný, toto jen vyztuží právě jak cenná komunikace může být v posouvání rovnováha hry.
Jestliže opakoval PD jde být opakován přesně N časy, pro nějakou známou konstantu N, pak to je vždy hra teoreticky optimální k závadě ve všech kolech. Jediná možná Nash rovnováha má vždy přeběhnout. Důkaz jde jako toto: jeden by mohl jako defekt studny na posledním otočení od té doby, co oponent nebude mít šanci potrestat hráče. Proto, oba přeběhnou na posledním otočení. Tak, hráč by mohl také defekt na sekundě-k-naposledy se otočit, protože oponent přeběhne na poslední bez ohledu na to co je děláno, a tak dále. Pro spolupráci se objevit mezi hrou teoretičtí rozumní hráči, úplné množství kol musí být náhodné, nebo přinejmenším neznámý pro hráče. Nicméně, dokonce v tomto případě vždy defekt je už ne přísně dominantní strategie, jediný Nash rovnováha. Superrational strategie v tomto případě má spolupracovat proti oponentovi superrational, a v limitu velký fixovaný N, experimentální výsledky na strategiích souhlasí s verzí superrational, ne hra-teoretický rozumný.
Další zvláštní případ je “hra navždy” dilema vězeňe. Hra je opakována nekonečně mnohokrát a skóre hráče je průměr (vhodně vypočítavý).
Dilema vězeňe hra je základní pro jisté teorie lidské spolupráce a důvěry. Na předpokladu, že PD může modelovat transakce mezi dvěma osobami vyžadovat důvěru, kooperativní chování v populacích může být modelováno multi-hráč, opakovaný, verze hry. To má, následně, fascinoval mnoho učenců za ta léta. V roce 1975, Grofman a Pool odhadoval počet odborných příspěvků oddaných tomu u přes 2,000. Opakované vězeňské dilema také bylo odkázáno k jak “mír-bojová hra”.
Spojité opakované vězeňské dilema
Nejvíce práce na opakovaném vězeňském dilematu se zaměřila na jednotlivý případ, ve kterých hráčích jeden spolupracovat nebo přebíhat, protože tento model jde relativně snadno analyzovat. Nicméně, někteří výzkumníci se dívali na modely spojitého opakovaného vězeňského dilematu, ve kterém hráči jsou schopní dělat proměnné příspěvek k jinému hráči. Le a Boyd našel to v takových situacích, spolupráce je hodně tvrdější se vyvinout než v jednotlivém opakovaném vězeňském dilematu. Základní intuice pro tento výsledek je straigh tforward: v nepřetržitém vězeňském dilematu, jestliže populace odstartuje v non-kooperativní rovnováha, hráči, kteří jsou jen okrajově kooperativnější než non-cooperators mají malý užitek od třídicí spolu navzájem. Kontrastem, v jednotlivém vězeňském dilematu, sýkorka-pro-cooperators tretky dostanou velký přínos podpora od třídicí spolu navzájem v non-kooperativní rovnováha, příbuzný se non-cooperators. Protože Nature pravděpodobně nabídne více příležitostí ke spolupráci proměnné poněkud než přísná dichotomie spolupráce nebo zběhnutí, nepřetržité vězeňské dilema může pomoci vysvětlit to proč skutečně-životní příklady sýkorky-pro-tretka-jako spolupráce být extrémně vzácný v Nature (ex. Hammerstein) dokonce ačkoli sýkorka-pro-tretka vypadá robustní v teoretických modelech.
Psychologie učení a teorie her
Kde hráči hry mohou učit se odhadovat pravděpodobnost jiného přebíhání hráčů, jejich vlastní chování je ovlivňováno ze jejich zkušenosti jiní je chování. Jednoduché statistiky ukazují že nezkušení hráči více pravděpodobně mají měl, celkový, atypically dobrá nebo špatná vzájemná ovlivňování s jinými hráči. Jestliže oni jednají podle východiska pro tyto zážitky (tím, že přebíhá nebo spolupracuje více než oni odkázaný jinak) oni pravděpodobně trpí v budoucích transakcích. Jak více zážitek je zvýšen pravdivější dojem z pravděpodobnosti zběhnutí je získán a hraní hry stane se více úspěšné. Časné transakce zažité nezralými hráči pravděpodobně mají větší účinek na jejich budoucnosti hrát než takové transakce by ovlivnily zralé hráče. Tento princip jde rozdělit cestu k vyložení proč formativní zkušenosti mladých lidí jsou tak vlivné a proč, například, ti kdo být zvláště bezbranný vůči týrání někdy se stát tyrany sám.
Pravděpodobnost zběhnutí v populaci může být redukována zkušeností spolupráce v časnějších hrách dovolit důvěře vybudovat. Proto sebeobětující chování může, v některých příkladech, posílit morální hodnoty skupiny. Jestliže skupina je malá pozitivní chování je více pravděpodobné ke zpětné vazbě v vzájemně tvrdit cestu, povzbuzovat jednotlivce uvnitř té skupiny pokračovat spolupracovat. Toto je příbuzné ke stejnému dilematu povzbuzovat ty lidi koho jeden by pomáhal oddávat se chování, které by mohlo dát je v ohrožení. Takové procesy jsou hlavní starosti uvnitř studie o podobném altruismu, výběr skupiny, výběr kin a etika.
Douglas Hofstadter je Superrationality
Douglas Hofstadter v jeho Metamagical Themas navrhoval že pojetí rozumnosti, která vedla “rozumné” hráče k defektu je vadné. On navrhoval že tam je další typ racionálního chování, který on volal “superrational”, kde hráči vezmou v úvahu že jiná osoba je pravděpodobně superrational, jako oni. Superrational hráči chovají se totožně a vědí, že oni budou chovat se totožně. Oni vezmou to do účtu předtím oni maximalizují jejich přínosy a oni proto spolupracují spolu navzájem.
Tento pohled na jednorázová PD vedení ke spolupráci takto:
- Nějaká superrational strategie bude stejná pro oba hráče superrational od té doby, co oba hráči budou myslet na to .
- proto superrational odpověď bude ležet na diagonále matice přínosu
- když vy maximalizujete návrat z řešení na diagonále, vy spolupracujete
Jestliže superrational hráč hraje proti známému rozumnému oponentovi, ona přeběhne. Hráč superrational jen spolupracuje s jinými hráči superrational, jehož myšlení je korelované s ona. Jestliže superrational hráč hraje proti oponentovi superrationality neznáma v situaci symmetric, výsledek může být jeden spolupracovat nebo přeběhnout se spoléhat na šanci že oponent je superrational.
Superrationality není studovaný akademickými ekonomy, protože ekonomická definice rozumnosti vyřadí nějaké chování superrational samozřejmě. Přesto, analogs jednorázové spolupráce jsou sledovány v lidské kultuře, kdekoli náboženské nebo etické kódy existují. Hofstadter diskutuje o příkladu ekonomické transakce mezi cizinci procházet městem -- - kde jedna strana stojí k zisku podváděním jiný, s malou nadějí na odplatu. Stále, podvádění je výjimka spíše než pravidlo.
Etika
Zatímco to je někdy myšlenka ta etika musí zahrnovat omezení sobeckosti, David Gauthier skvěle argumentuje, že spolupracování v dilematu vězeňů na etických principech je shodné s sobeckostí a axiómy teorie her. Podle jeho názoru, to je nejvíce opatrné vzdát se straigh tforward maximalizovat a místo toho přijmout rozestavení omezeného zvětšení, podle kterého jeden rozhodne se spolupracovat ve víře, že oponent odpoví se stejným výběrem, zatímco v klasický PD to je výslovně stanovil, že odezva oponenta nezávisí na výběru hráče. Tato forma contractarianism prohlašuje, že dobré mravní myšlení je právě pozvednutý a jemně strategická verze základního prostředku-končit úvahu.
Douglas Hofstadter projeví silnou osobní víru že matematická symetrie je zpevněna mravní symetrií, podél řad Kantian kategorického imperativu: přebíhání v naději, že jiný hráč spolupracuje je morálně neudržitelné. Jestliže hráči zacházejí s každým jiný jak oni by se potěšili, pak oni budou spolupracovat.
Skutečný-příklady života
Tyto zvláštní příklady, zahrnovat vězeňe a přepínání tašky a tak dále, smět vypadat spiklenecký, ale tam být ve skutečnosti mnoho příkladů ve vzájemném ovlivňování člověka stejně jako vzájemná ovlivňování v přírodě to mít stejný přínos matice. Dilema vězeňe je proto zájmu ke společenským vědám takový jako ekonomika, politika a sociologie, také jak k biologickým vědám takový jako ethology a vývojová biologie. Mnoho přirozených procesů bylo zamyšlené do modelů ve kterém živé bytosti jsou zapojené do nekonečných her Prisoner má dilema (PD). Tato široká použitelnost PD dá hře jeho značnou důležitost.
V politice
V politické vědě, například, PD scénář je často používán objasnit problém dvou států zapojených do závodu v zbrojení. Oba budou vyvozovat, že oni mají dvě možnosti, jeden zvýšit vojenské výlohy nebo dělat dohodu redukovat zbraně. Žádný stát může být jistý, že ten jiný bude držet se takový dohoda; proto, oni oba inklinují k vojenské expanzi. Paradox je že oba státy jednají rozumně, ale produkovat zřejmě nerozumný výsledek. Toto mohlo být považováno za důsledek teorie zastrašování.
Ve vědě
V sociologii nebo kriminalistice, PD může být aplikován na aktuální dilema stát před dvěma chovanci. Teoretik hry Marek Kaminski, bývalý politický vězeň, analyzoval faktory přispívat k přínosům ve hře připravené žalobcem pro zatknuté obžalované (vidět dole odkazy). On uzavřel, že zatímco PD je ideální hra žalobce, četné faktory mohou silně ovlivnit přínosy a potenciálně změnit vlastnosti hry.
V environmentální studia, PD je evidentní v krizích takový jak globální změna klimatu. Všechny země budou těžit ze stabilního klimatu, ale nějaká jediná země je často váhavá k omezení CO2 emise. Výhoda pro individuální zemi udržovat proud chování je větší než výhoda pro všechny země jestliže chování bylo měněno, proto vysvětlovat aktuální slepou cestu ohledně změny klimatu.
Ve vedení programu a vývoji technologie, PD platí o vztahu mezi zákazníkem a vývojáři. Capt Dan Ward, důstojník v USA letecké síly, zkoumal dilema správce programů v článku vydávaném v Defense u a L, obranný technologický žurnál.
Steroid použití
Dilema vězeňe platí o rozhodnutí zda nebo nepoužívat výkon povznášet drogy v atletice. Daný že drogy mají přibližně rovnat se dopadu na každého atleta, to je k celé výhodě atleta to žádný atlet brát drogy (protože postranních efektů). Nicméně, jestliže nějaký jeden atlet bere drogy, oni získají výhodu ledaže všichni ostatní atleti dělají stejný. V tom případě, výhoda braní drog je odstraněna, ale disadvantages (postranní efekty) zůstanou.
V ekonomii
Reklama je někdy citována jako skutečný životní příklad dilematu vězeňe. Když reklama na cigarety byla legální ve Spojených státech, soupeřící cigaretoví výrobcové museli rozhodnout se jak hodně peněz utrácet na reklamě. Účinnost Firm reklama byla částečně určená reklamou dirigoval Firm B. podobně, zisk odvozený z reklamy pro Firm B je postižený reklamou dirigoval Firm A. jestliže oba Firm a Firm B rozhodl se inzerovat během daném období reklama se ruší, stvrzenky zůstanou konstantou a výlohy rostou kvůli ceně reklamy. Obě firmy by těžily z redukce v inzerci. Nicméně, should Firm B rozhodnout se neinzerovat, Firm mohla by výhoda velmi reklamou. Přesto, optimální množství reklamy jedné firmy závisí na jak hodně reklamy jiný pustí se do. Jak nejlepší strategie je závislá na čem jiná firma si vybere není tam žádná dominantní strategie a toto není vězeň je dilema ale spíše je příklad lovu jelena. Výsledek je podobný, ačkoli, v tom obě firmy byly by lepší pryč byli oni inzerovat méně než v rovnováze. Někdy kooperativní chování přece se objevují v situacích obchodu. Například, výrobcové cigarety souhlasili s vytvořením zákazu práv reklama na cigarety, pochopení, že toto by snížilo náklady a zvýšilo užitky přes průmysl. Tato analýza pravděpodobně je vhodná v mnoha situacích ostatních podniků zahrnovat reklamu.
Bez vynutitelných dohod, členy kartelu jsou také zahrnovány v (multi-hráč) dilema vězeňů. ' spolupracovat ' typicky znamená držet ceny u pre-dohodl minimální úroveň. ' přebíhat ' znamená prodávat pod touto minimální úrovní, okamžitě krást obchod (a profituje) od jiných členů kartelu. Anti-svěřenská oprávnění chtějí potenciální členy kartelu k vzájemně defekt, zajišťovat nejnižší možné ceny pro spotřebitele.
V právu
Teoretický závěr PD je jeden důvod proč, v mnohých zemích, vyjednávání prosby je zakázáno. Často, přesně PD scénář platí: to je v zájem obou tuší přiznávat a svědčit proti jinému vězeňi/podezřelý, dokonce jestliže každý je nevinný údajným zločinem. Pravděpodobně, nejhorší případ je, když jen jedna strana je vinná — tady, ten nevinný je nepravděpodobný přiznat, zatímco ten vinný pravděpodobně přiznává a svědčí proti nevinný.
V médiích
V 2008 vydání staršího bratra (UK), dilema bylo žádáno dva housemates, Lisa Appletonová a Sara Folino. Fond ceny £50,000 byl dostupný. Jestliže housemates rozhodl se rozdělit fond ceny, každý by přjímal £25,000. Jestliže jeden si vybral k podílu, a jiný rozhodl se brát, jeden kdo vzal to by přjímal celý £50,000. Jestliže oba rozhodli se brát, oba housemates by přijaly nic. Housemates měl minutu diskutovat o jejich rozhodnutí, a dostal možnost ke lži. Oba housemates deklarovaly, že oni by rozdělili fond ceny, ale jeden mohl mít potenciálně been ležet. Když žádal, aby dal jejich finále odpoví starším bratrem, oba housemates přece opravdu si vybíraly k podílu, a tak vyhrál £25,000 každý. Další Endemol britská televize přehlídka hry Goldenballs používá Prisoner dilema jak jeho jádrové herní pojetí, kde hráči musí si vybrat zda k ' sdílet to nebo krást ' dostupná množství, jak viděný v tomto příkladě na Youtube.
Vícehráčská dilemata
Mnoho skutečný-dilemata života zahrnují hráče násobku. Ačkoli obrazný, Hardinova tragédie commons smět být zobrazil jako příklad multi-zevšeobecňování hráče PD: Každý venkovan dělá výběr pro osobní zisk nebo omezení. Kolektivní odměna pro jednomyslný (nebo dokonce častý) zběhnutí je velmi nízké přínosy (reprezentovat ničení “commons”). Takové multi-hráč PDs není formální, zatímco oni mohou vždy být rozložení do souboru klasický dva-hry hráče. Commons být ne vždy využívaný: William Poundstone, v knize o Prisoner dilematu (vidět dole odkazy), popisuje situaci na Novém Zélandě kde krabice novin jsou vlevo odemknuty. To je možné pro lidi odebírat noviny bez placení (přebíhat) ale velmi nemnoho dělat, se cítit jako to jestliže oni neplatí pak žádný odkázat jiné, zničení systému.
Protože není tam žádný mechanismus pro osobní výběr ovlivňovat jiné je rozhodnutí, tento druh myšlení se spoléhá na korelace mezi chováním, ne na příčině. Protože této vlastnosti, ti kdo nerozumějí superrationality často zamění to za kouzelné myšlení. Bez superrationality, ne jediná drobná krádež, ale dobrovolné hlasování vyžaduje rozšířené kouzelné myšlení, od non-volič je volný jezdec na demokratickém systému.
Příbuzné hry
Uzavřený-si nahrabat výměnu
Hofstadter jednou navrhl, že lidé často najdou problémy takový jako PD problém snadnější rozumět když to je objasněno ve formě jednoduché hry nebo kompromisu. Jeden z několika příkladů, které on používal byl “výměna zavřené tašky”:
V této hře, zběhnutí je vždy nejlepší průběh, znamenat, že rozumní agenti budou nikdy hrát. Nicméně, v tomto případě oba hráči spolupracovat a oba hráči přebíhat vlastně dávat stejný výsledek, předpokládat nejsou tam žádné zisky z obchodu tak nadějí na vzájemnou spolupráci, dokonce v opakovaných hrách, být nemnoho.
Přítel nebo nepřítel?
Přítel nebo nepřítel? je hra přehlídka, která vysílala od 2002 k 2005 na Hra síť přehlídky v Spojené státy. To je příklad dilematu vězeňe hra testovaná fyzickými osobami, ale ve vykonstruovaném nastavení. Na herním výstavu, tři páry lidí soutěží. Jako každý pár je vyloučen, to hraje hru podobnou dilematu vězeňe stanovit jak winnings jsou rozděleny. Jestliže oni oba spolupracují (přítel), oni rozdělí winnings 50-50. Jestliže jeden spolupracuje a ostatní vady (nepřítel), odpadlík dostane celý winnings a cooperator dostane nic. Jestliže oba přeběhnou, oba odejdou s ničím. Poznamenat, že matice přínosu je mírně odlišná od toho standardního daný nahoře, jako platby pro “oba přeběhnou” a “spolupracovat zatímco oponent přeběhne” případy jsou totožné. Toto dělá “oba přeběhnou” případ slabá rovnováha, srovnal s bytím přísná rovnováha ve standardním vězeňském dilematu. Jestliže vy víte to váš oponent bude volit nepřítele, pak váš výběr neovlivní vaše winnings. V jistém smyslu, Přítel nebo nepřítel má model přínosu mezi “dilematem vězeňe” a”Kuře#rquote.
Matice přínosu je
Tato matice přínosu byla později použitá na Britové televize programy Shafted a Zastavárna.
Viz též
- Buněčné automaty
- Hra stonožky
- Výzkum vyřešení konfliktu
- Dilema hosta
- Evolutionarily stájová strategie
- Folk teorém (teorie her)
- Le Trou - francouzský film
- Nash rovnováha
- Neuroeconomics
- Rovnice ceny
- Veřejná výběrová teorie
- Podobný altruismus
- Problém setkání
- Současný akční výběr
- Superrationality
- Půjčka za oplátku
- Tragédie commons
- Tragédie anticommons
- Past: Co se přihodilo našemu snu o svobodě
- Dilema cestovatele
- Důvěřovat (sociologii)
- Sociální past
- Vyhlazovací válka (hra)
- Nula-součet
Další četba
- Bicchieri, Cristina a Mitchell Green (1997) “symetrické argumenty pro spolupráci v dilematu vězeňe”, v G. Holmstromovi-Hintikka a R. Tuomela (eds.), současná akční teorie: Filozofie a logika sociální akce, Kluwer.
- Plous, S. (1993). Dilema vězeňe nebo vnímavostní dilema? Žurnál mírového výzkumu, Vol. 30, ne. 2, 163-179.
Externí odkazy
- Dilema vězeňe (Stanford encyklopedie filozofie)
- Účinky Tryptophan vyčerpání na výkonu opakovaného vězeňe je hra dilematu ve zdravých dospělých - příroda Neuropsychopharmacology
- Je tam “dilema” ve vězeňském dilematu Elmer G. Wiens
- “Vězeňi her hrají” - hra-teoretická analýza vzájemných ovlivňování mezi skutečné vězeňe, včetně PD.
- Hra opakovaný vězeň je hra dilematu.
- Další verze opakovaného vězeňe je hra dilematu
- Opakoval vězeňe je hra dilematu aplikovaná k velkému bratrovi situace televizního pořadu.
- Bowerbird dilema dilema vězeňe v ornitologii — matematická karikatura Larry Gonnick.
- Příklady dilematu vězeňů
- Vícehráčská hra založená na dilematu vězeňe Play vězeň je dilema přes IRC nebo internet — Axiologic výzkumem.
- Okraj cituje Robert Axelrod knihu a diskutuje o úspěchu U2 po principech IPD.