Avanserte spillteoristrategier for beslutningstaking

Avanserte padletak (November 2024)

Avanserte padletak (November 2024)
Avanserte spillteoristrategier for beslutningstaking

Innholdsfortegnelse:

Anonim

Spillteori, studiet av strategisk beslutningsprosess, bringer sammen ulike disipliner som matematikk, psykologi og filosofi. Spillteori ble oppfunnet av John von Neumann og Oskar Morgenstern i 1944, og har kommet langt siden da. Betydningen av spillteori til moderne analyse og beslutningsprosesser kan vurderes av det faktum at siden 1970 har så mange som 12 ledende økonomer og forskere blitt tildelt Nobelprisen i økonomiske fag for deres bidrag til spillteori.

Spillteori brukes på en rekke felt, inkludert næringsliv, økonomi, økonomi, statsvitenskap og psykologi. Forstå spillteori strategier - både de populære og noen av de relativt mindre kjente lagene - er viktig for å styrke sin resonnement og beslutningsprosesser i en kompleks verden.

Fangers dilemma - I et nøtteskall

En av de mest populære og grunnleggende spillteoristrategiene er Fangers Dilemma. Dette konseptet utforsker beslutningsstrategien tatt av to individer som ved å opptre i sin egen individuelle interesse, opplever dårligere utfall enn om de hadde samarbeidet med hverandre i utgangspunktet.

I fengselsdilemma er to mistenkt som har blitt grepet av en forbrytelse holdt i separate rom og kan ikke kommunisere med hverandre. Åklageren informerer hver av dem individuelt om at hvis han (kaller ham Suspect 1) bekjenner og vitner mot den andre, kan han gå fri, men hvis han ikke samarbeider og Suspect 2 gjør, vil Suspect 1 bli dømt til tre års fengsel. Hvis begge bekjenner, vil de få en toårs setning, og hvis ingen bekjenner, blir de dømt til ett år i fengsel.

Samarbeid er den beste strategien for de to mistenkte, når de konfronteres med et slikt dilemma, viser forskning at de fleste rasjonelle mennesker foretrekker å bekjenne og vitne mot den andre personen, i stedet for å være stille og ta sjansen som den andre parten bekjenner.

Spillteori Strategier

Fangenes Dilemma legger grunnlaget for avanserte spillteori strategier, som de populære inkluderer:

Matching Pennies : Dette er et nullsum spill som involverer to spillere (ring dem Spiller A og Spiller B) plasserer samtidig en krone på bordet, med utbetalingen avhengig av om penniene passer. Hvis begge pennene er hodene eller haler, vinner spiller A og beholder spillerens penny. Hvis de ikke samsvarer, vinner Player B og beholder spillerens penny.

Deadlock : Dette er et sosial dilemma scenario som Fangers Dilemma ved at to spillere kan enten samarbeide eller mangle (jeg.e. ikke samarbeide). I Deadlock, hvis spiller A og spiller B begge samarbeider, får de hver en utbetaling på 1, og hvis de begge har feil, får de hver en utbetaling på 2. Men hvis spiller A samarbeider og spiller B-feil, får A en gevinst på 0 og B får en utbetaling på 3. I utbetalingsdiagrammet nedenfor representerer det første tallet i cellene (a) til (d) spillerens utbetaling, og det andre tallet er det for spiller B:

Deadlock Payoff Matrix < Spiller B

Samarbeider

Defekt

Spiller A

Samarbeide

(a) 1, 1

(b) 0, 3

Feil

(c) 3 , 0

(d) 2, 2

Deadlock er forskjellig fra Fangers Dilemma ved at handlingen med størst gjensidig nytte (dvs. begge feilene) også er den dominerende strategien. En dominerende strategi for en spiller er definert som en som gir den høyeste utbetalingen av en tilgjengelig strategi, uansett strategier ansatt av de andre spillerne.

Et vanlig kalt eksempel på Deadlock er at de to atomkraftene forsøker å nå enighet om å eliminere sine arsenaler av atombomber. I dette tilfellet innebærer samarbeid å overholde avtalen, mens avdekking betyr hemmelighet å avstå fra avtalen og beholde nukleær arsenal. Det beste resultatet for en nasjon, dessverre, er å renegere avtalen og beholde kjernevirksomheten, mens den andre nasjonen eliminerer sin arsenal, siden dette vil gi den førstnevnte en enorm skjult fordel over sistnevnte hvis krigen bryter ut mellom de to. Det nest beste alternativet er for både å mangle eller ikke samarbeide, siden dette beholder sin status som atomkraft.

Cournot Competition

: Denne modellen er også konseptuelt lik Prison's Dilemma, og er oppkalt etter fransk matematiker Augustin Cournot, som introduserte den i 1838. Den vanligste bruken av Cournot-modellen er å beskrive et duopol eller to hoved produsenter i et marked. For eksempel antar to selskaper A og B produserer et identisk produkt og kan produsere høye eller lave mengder. Hvis de begge samarbeider og samtykker i å produsere på lave nivåer, vil begrenset forsyning oversette til en høy pris for produktet på markedet og betydelig fortjeneste for begge selskapene. På den annen side, hvis de mangler og produserer på høye nivåer, vil markedet bli oversvømt og resultere i en lav pris for produktet og dermed lavere fortjeneste. Men dersom man samarbeider (det vil si produserer på lave nivåer) og de andre feilene (det vil si surrealistisk produserer på høye nivåer), bryter førstnevnte bare, mens sistnevnte tjener et overskudd som er høyere enn om de begge samarbeider.

Utbetalingsmatrisen for selskapene A og B er vist (tall representerer fortjeneste i millioner dollar). Således, hvis A samarbeider og produserer på lave nivåer mens B er defekt og produserer på høye nivåer, er utbetalingen som vist i celle b) - jevnlig for selskap A og 7 millioner dollar i overskudd for selskap B.

Cournot Payoff Matrix

Firma B

Samarbeide

Feil

Firma A

Samarbeide

(a) 4, 4

(b) 0, 7

Feil

) 7, 0

(d) 2, 2

Koordinering

: I samordning tjener spillere høyere utbetalinger når de velger samme handlingsmåte. For eksempel, sett på to teknologigiganter som bestemmer seg for å innføre en radikal ny teknologi i minneschips som kan tjene dem hundrevis av millioner i fortjeneste, eller en revidert versjon av en eldre teknologi som vil tjene dem mye mindre. Hvis bare ett selskap bestemmer seg for å gå videre med den nye teknologien, vil markedsopptaket fra forbrukerne bli betydelig lavere, og som et resultat vil det tjene mindre enn om begge selskapene bestemmer seg for samme tiltak. Utbetalingsmatrisen er vist nedenfor (tall representerer fortjeneste i millioner dollar).

Hvis begge selskapene bestemmer seg for å introdusere den nye teknologien, vil de tjene 600 millioner dollar, mens innføring av en revidert versjon av den eldre teknologien vil tjene dem 300 millioner dollar hver, som vist i celle (d). Men hvis selskapet A alene bestemmer seg for å introdusere den nye teknologien, vil den bare tjene 150 millioner dollar, selv om selskapet B vil tjene $ 0 (antagelig fordi forbrukerne kanskje ikke er villige til å betale for sin nå foreldede teknologi). I dette tilfellet er det fornuftig for begge selskapene å jobbe sammen i stedet for alene.

Ny teknologi

(a) 600, 600

(b) 0, 150

Ny teknologi

Gammel teknologi

Selskap A

Ny teknologi < Gammel teknologi

(c) 150, 0

(d) 300, 300

Centipede Game

: Dette er et omfattende spill hvor to spillere vekselvis får en sjanse til å ta større andel av et sakte økende pengestopp. Centipede-spillet er sekventielt, siden spillerne gjør sine trekk hver etter hverandre i stedet for samtidig; hver spiller kjenner også strategiene valgt av spillerne som spilte før dem. Spillet avsluttes så snart en spiller tar stash, med at spilleren får den større delen og den andre spilleren får den mindre delen.

For eksempel, hvis spiller A og spiller B spiller Centipede spillet, anta at spiller A går først og må avgjøre om han skal "ta" eller "passere" stashet, som for tiden beløper seg til $ 2. Hvis han tar, vil A og B få $ 1 hver, men hvis A går, må beslutningen om å "Ta eller Pass" nå gjøres av Spiller B. Hvis B tar, får hun $ 3 (dvs. forrige stash på $ 2 + $ 1 ) og A blir $ 0. Men hvis B passerer, får A nå å bestemme seg for å ta eller passere, og så videre. Hvis begge spillerne alltid velger å passere, mottar de hverandre en utbetaling på $ 100 på slutten av spillet.

Poenget med spillet er at hvis A og B begge samarbeider og "passerer" til slutten av spillet, får de maksimalt utbytte på $ 100 hver. Men hvis de mistro den andre spilleren og forventer at de skal "ta" ved første anledning, forutsetter Nash-likevekten at spillerne vil ta lavest mulig krav ($ 1 i dette tilfellet). Eksperimentelle studier har imidlertid vist at denne "rasjonelle" oppførelsen (som spådd av spillteori) sjelden utsettes i det virkelige liv. Dette er ikke intuitivt overraskende gitt den lille størrelsen på den første utbetalingen i forhold til den endelige. Liknende oppførsel av eksperimentelle fag har også blitt utvist i Traveller's Dilemma. Traveler's Dilemma

: Dette er et ikke-null sum spill hvor begge spillerne forsøker å maksimere sin egen utbetaling uten hensyn til den andre. Utviklet av økonom Kaushik Basu i 1994, i Traveller's Dilemma, samtykker et flyselskap til å betale to reisende kompensasjon for skader på identiske gjenstander. Imidlertid er de to reisende nødvendig for å estimere verdien av varen, med minimum $ 2 og maksimalt $ 100. Hvis begge skriver ned samme verdi, refunderer flyselskapet hver av dem det beløpet. Men hvis verdiene er forskjellige, betaler flyselskapet dem lavere verdi, med en bonus på $ 2 for den reisende som skrev ned denne lavere verdien og en straff på $ 2 for den reisende som skrev ned den høyere verdien.

Nash-likevektsnivået, basert på tilbaketrukket induksjon, er $ 2 i dette scenariet. Men som i Centipede-spillet demonstrerer laboratorieeksperimenter konsekvent at de fleste deltakere - naivt eller ellers - velger et tall som er mye høyere enn $ 2.

Traveler's Dilemma kan brukes til å analysere en rekke virkelige situasjoner. Fremgangsmåten med tilbaketrukket induksjon kan for eksempel bidra til å forklare hvordan to selskaper som er engasjert i cutthroat-konkurranse, stadig kan redusere produktprisene i et bud for å få markedsandeler, noe som kan føre til at de øker stadig større tap i prosessen. Ytterligere spillteori Strategier

Kampen av kjønnene

: Dette er en annen form for koordinasjonsspillet som er beskrevet tidligere, men med noen utbetalingsymmetrier. Det innebærer i hovedsak et par som prøver å koordinere deres kveld ute. Mens de hadde blitt enige om å møte ballspillet (mannenes preferanse) eller på et spill (kvinnens preferanse), har de glemt hva de hadde bestemt seg for, og for å forveksle problemet, kan ikke kommunisere med hverandre. Hvor skal de gå? Utbetalingsmatrisen er som vist - tallene i cellene representerer den relative graden av nytelse av hendelsen for henholdsvis kvinnen og mannen. For eksempel representerer celle (a) utbetalingen (i form av nivånivåer) for kvinnen og mannen, i stykket (hun nyter det mye mer enn han gjør). Cell (d) er utbetalingen hvis begge gjør det til ballspillet (han nyter det mer enn hun gjør). Cell (c) representerer misnøye hvis begge ikke bare går til feil sted, men også til arrangementet de liker minst - kvinnen til ballspillet og mannen til lekene.

Kampen av sexutbetalingsmatrisen

Man Spill

Ballspill

Kvinne

Spill

(a) 6, 3

(b) 2, 2 > Ball spill

(c) 0, 0

(d) 3, 6

Diktator Spill

: Dette er et enkelt spill hvor spiller A må bestemme hvordan man deler en pengepremie med spiller B , som ikke har innspill til spiller As beslutning. Selv om dette ikke er en spillteoristrategi

per se

, gir det noen interessante innsikter i folks oppførsel. Eksperimenter viser at rundt 50% beholder alle pengene til seg selv; 5% splitte det like, og de andre 45% gir den andre deltakeren en mindre andel. Diktatorspillet er nært relatert til ultimatumspillet, hvor spiller A får en bestemt sum penger, hvorav en del må gis til spiller B, som kan akseptere eller avvise det oppgitte beløpet.Fangsten er at hvis den andre spilleren avviser beløpet som tilbys, får både A og B ingenting. Diktator- og ultimatum-spillene holder viktige leksjoner for saker som veldedighet og filantropi.

Fredskrig : En variant av Fangeens dilemma der "Samarbeide eller Defekt" -avgjørelsene erstattes av "Fred eller krig. "En analogi kan være to selskaper engasjert i en priskrig. Hvis begge avstår fra prisreduksjon, har de relativt relativ velstand (celle a), men priskrig vil redusere utbetalingene dramatisk (celle d). Men hvis A engasjerer seg i prisreduksjon (krig), men B ikke, ville A ha et høyere utbytte på 4 siden det kan være i stand til å fange betydelig markedsandel, og dette høyere volumet ville kompensere lavere produktpriser. Fredskrig Utbetalingsmatrix Selskap B

Fred Krig

Selskap A

Fred

(a) 3, 3

(b) 0, 4 > Krig

(c) 4, 0

(d) 1, 1

Frivilligens dilemma

: I et frivillighets dilemma må noen gjennomføre en rolle eller jobb for det felles gode. Det verste resultatet er realisert hvis ingen frivillige. For eksempel, vurder et selskap der regnskapsmessig svindel er uheldig, men toppledelsen er uvitende om det. Noen junioransatte i regnskapsavdelingen er oppmerksomme på bedrageri, men nøl med å fortelle toppledelsen, fordi det ville føre til at de ansatte som er involvert i bedrageriet blir sparket og sannsynligvis saksøkt. Å være merket som en "whistleblower" kan også ha noen konsekvenser nedover linjen. Men hvis ingen frivillige, kan den omfattende svindelen resultere i selskapets eventuelle konkurs og tap av alles jobber.

Bunnlinjen

Spillteori kan brukes svært effektivt som et redskap for beslutningstaking enten i en økonomisk, forretningsmessig eller personlig setting.