賽局理論是什麼?搞懂賽局,讓你不再出局!【2021最新版】

賽局理論是什麼

賽局理論是什麼?人生何處無賽局?舉凡商業上的競爭、廣告戰等,雙方都在絞盡腦汁制定策略,此時如果能用一套公式,讓賽局變得清晰明瞭,將有助於你做出最正確的決定!

本篇主要有3個重點:

  1. 賽局理論是什麼?
  2. 囚徒困境案例
  3. 智豬博弈案例

賽局理論是什麼?

賽局理論(Game Theory)又譯為對策論博弈論,被認為是20世紀經濟學最偉大的成果之一。

主要研究將賽局公式化,並探討之間的相互作用(遊戲或者賽局),是專門用來研究具有競爭現象的數學理論與方法。

賽局理論是什麼?

賽局理論是什麼

賽局理論(Game Theory)又譯為對策論博弈論,被認為是20世紀經濟學最偉大的成果之一。

目前在生物學、經濟學、國際關係、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。

主要研究將賽局公式化,並探討之間的相互作用(遊戲或者賽局),是專門用來研究具有競爭現象的數學理論與方法。

現代的賽局理論的源頭是約翰·馮·諾伊曼對於雙人零和賽局的混合策略均衡點的發想和證明。

賽局基本要素有哪些?

賽局如果要成立,至少要有以下5個基本要素:

  1. 玩家(player):至少大於一人(畢竟自己跟自己無法比賽)
  2. 策略(strategy):玩家根據當下情況而決定的行動計劃
  3. 得失 / 支付(Payoffs)玩家執行每個可能行動後的得或失,可理解為「得分」
  4. 最佳反應 (Best Respond, 簡稱 BR):針對對手的策略選擇最有利決定的反應。
  5. 均衡(Equilibrium):均衡就是賽局的最後結果,即奈許均衡點」(Nash Equilibrium)
賽局要素
賽局基本要素為玩家、策略、得失、最佳反應、均衡

奈許均衡是什麼?

學習賽局理論之前,我們先了解一下什麼叫做奈許均衡(納許均衡)吧!

奈許均衡是什麼?

奈許均衡是指參賽者會猜測對方的行為,做出最佳的策略,則雙方決策的均衡點,就稱作奈許均衡」簡單理解就是「這場賽局的結果」

奈許均衡(Nash Equilibrium)又稱作「非合作均衡」,是由1994 年諾貝爾經濟學獎得主約翰.奈許(John Nash)提出。

那約翰.奈許(John Nash)當初是如何構想出這套賽局理論呢?《美麗境界》這部電影就是在描述奈許的故事,下面的影片就是奈許構思出賽局理論的過程。(建議從1:00開始欣賞)

影片中奈許和一群好友到了酒吧邂逅了一群美女,其中一位金髮的女子更是迷倒了所有男士。

在朋友們喧鬧著要如何追求時,奈許則開始喃喃自語,默默地完成了這套近20世紀以來最偉大的理論之一-奈許均衡

簡單描述一下賽局:

  • 如果雙方都選擇追金髮女,則會因為勾心鬥角導致誰也追不到金髮女,再找其他女生也無濟於事,因為沒有人想當備胎
  • 如果其中一方選擇追金髮女,則心裡會獲得極大的滿足,沒追金髮女的人也會有女伴,只是心理滿足感較低。
  • 如果雙方都不追金髮女,選擇其他女孩,則所有人都有女伴,也不會影響彼此友誼。

整理賽局先決條件如下:

  1. 雙方都追金髮女,會因為彼此互相牽制,而追求失敗並再也找不到女伴。
  2. 其中一方追金髮女,則可以滿足虛榮心,一方獲利大於另一方。
  3. 雙方都不追金髮女,所有人都有女伴。

整理奈許與朋友的收益比如下:

  1. 奈許與朋友一起追金髮女,收益比為(0,0)
  2. 奈許追求金髮女,收益比為(2,1)
  3. 朋友追求金髮女,收益比為(1,2)
  4. 奈許與朋友都不追金髮女,收益比為(1,1)

我們可以藉由剛剛學到的賽局理論基礎,使用賽局矩陣(Game Matrix)來描述一下這場賽局。

賽局矩陣(Game Matrix)

酒吧女伴之賽局矩陣
酒吧女伴之賽局矩陣

奈許的最佳解為「追金髮女」

如果朋友選擇追金髮女,奈許最佳解為追其他女孩,除了可以避免和朋友撕破臉之外,還能有個女伴,而朋友可以和最漂亮的金髮女共舞,因此收益比為(1,2)。

如果朋友選擇追求其他女孩,奈許的最佳解就是追金髮女,能獲得極大的心理滿足,因此收益比為(2,1)。

因此奈許的最佳解為「追金髮女」!

朋友的最佳解亦為「追金髮女」

如果奈許選擇追金髮女,朋友最佳解為追其他女孩,除了可以維持友誼,也能擁有女伴,而奈許可以和最漂亮的金髮女共舞,因此收益比為(2,1)。

賽局理論是什麼

如果奈許選擇追求其他女孩,朋友的最佳解就是追金髮女好滿足自己的虛榮心,因此收益比為(1,2)。

納許均衡

因此朋友的最佳解亦為「追金髮女」!

那這就尷尬了,朋友跟奈許的 Best Respond 都是「追金髮女,但是我們都知道,如果雙方都採取最佳反應(Best Respond)-一起追金髮女,雙方只會得到最差的結果(0,0),沒有任何人能得到女伴。

奈許均衡
奈許均衡不一定是賽局中的最優解

因此我們可以得出3點結論:

#1.奈許均衡不一定是賽局中的最優解
奈許均衡就是賽局的最終結果,在不知道對方策略的前提之下,很容易會陷入囚徒困境,落得兩敗俱傷的結果。

#2.個人最優解不等於群體最優解
從賽局矩陣中我們可以看到,群體最優解就是雙方都放棄金髮女,追求其他女孩,如果雙方都選擇對自己最好的策略,誰都得不到女伴

#3.考量「自己和群體的利益」才能得到最優解答
從奈許的故事中我們可以了解,如果每個人都只為自己努力,將無法獲得最佳利益,最好的成果來自於每個人都為自己和群體的利益而努力

經典賽局:囚徒困境

賽局理論囚徒困境

有一天警察抓到了兩個搶劫銀行的嫌犯,卻因為沒有證據所以遲遲無法定罪,如果最後證據不足,囚犯只會被關一年;如果囚犯都認罪,則會被關8年。

於是這個時候,警察想了個妙方。警察先將嫌犯兩人分開囚禁,之後分別對他們說:「好!你不認罪是吧?聽好了,一旦你的夥伴認罪了,他就會被釋放,而你將要被關10年!」根據故事我們可以將賽局做個整理。

整理賽局先決條件如下:

  1. 囚犯都抗拒,只需關1年。
  2. 囚犯都坦白,兩人都要關8年
  3. 其中一人坦白,另一人關10年

整理AB囚犯收益比如下:

  1. AB囚犯一起坦白,收益比為(-8,-8)
  2. A坦白,最佳收益比為(0,-10)
  3. B坦白,最佳收益比為(-10,0)
  4. AB囚犯都抗拒,收益比為(-1,-1)

使用賽局矩陣(Game Matrix)來表示這場賽局:

囚徒困境之賽局矩陣
囚徒困境之賽局矩陣

A囚犯的最佳解為「坦白」

如果B囚犯選擇坦白,那麼A囚犯最佳解就是「坦白」,否則最慘將面臨10年的徒刑。

如果B囚犯選擇抗拒,那麼A囚犯最佳解也是「坦白」,可以完全不用坐牢!

因此A囚犯的最佳解為「坦白」!

B囚犯的最佳解為「坦白」

如果A囚犯選擇坦白,那麼B囚犯最佳解就是也跟者「坦白」,否則最慘將面臨10年的徒刑。

如果A囚犯選擇抗拒,那麼B囚犯最佳解也是「坦白」,可以完全逃過牢獄之災。

因此B囚犯的最佳解為「坦白」!

故事中的嫌犯雖然都很清楚,只要雙方都合作不要認罪就可以有最好的結果,就是蹲完一年的牢就沒事了,結果最後卻敗在無法信任對方而「選擇只對自己好的方法」,就是認罪。

因為兩個人都覺得寧願關8年也好過關10年。最後結果就是因為害怕而雙雙招供,被判了8年的刑罰,明明已經深思熟慮做了最好的決策,卻換來最糟的結果。

以上這個故事就是由普林斯頓大學的教授-阿爾伯特.塔克(Albert Tucker)講解-經典的「囚犯困境」(Prisoner’s Dilemma)

在這個例子中,兩個歹徒都認罪就是奈許均衡點,在奈許均衡的情況下,沒人擁有改變決策的動力,因為只要改變決策就會使自己的收益減少

奈許均衡不一定是賽局中的最優解,關鍵在於能否信任或掌握對方的判斷。能掌握或與對方預先共謀,便能在賽局中取得雙贏;反之則是兩敗俱傷。

商戰上的囚徒困境,砸錢反而利潤更低?

今天假設有A、B兩家公司,都是主打保健食品,兩家公司的老闆都想藉由打廣告來提高自身的知名度,好賺取更多利潤。

如果雙方都不打廣告,雙方的利潤都是500萬元。如果其中一家打廣告,另一家沒有,則打廣告的公司利潤可提高至1000萬!沒登廣告的公司會流失一定消費者導致利潤下降至200萬元。

如果兩家公司都打廣告反而營收不會增加,雙方還會為了支付高昂的廣告費用導致利潤下滑至300萬元。

整理賽局先決條件如下:

  1. 打廣告前,AB兩家公司收益均為500
  2. 打廣告增加知名度,收益可提高至1000
  3. 如其中一家打廣告,則會使另一家公司收益下滑至200
  4. 如果一起打廣告,雙方利潤會降低至400

整理AB公司收益比如下:

  1. AB公司一起打廣告,收益比為(400,400)
  2. A打廣告,收益比為(1000,200)
  3. B打廣告,收益比為(1000,200)
  4. AB都不打廣告,收益比為(500,500)

使用賽局矩陣(Game Matrix)來表示這場賽局:

AB公司廣告戰之賽局矩陣
AB公司廣告戰之賽局矩陣

A公司的最佳解為「打廣告」

如果B公司選擇打廣告,那麼A公司最佳解就是也跟者「打廣告」,否則利潤會大幅下滑至200。

如果B公司選擇不打廣告,那麼A公司的最佳解仍然為「打廣告」,可將自己的收益大幅提升至1000!

因此A公司的最佳解為「打廣告」!

B公司的最佳解亦為「打廣告」

如果A公司選擇打廣告,B公司最佳解為「打廣告」,否則利潤將大幅縮減至200。

如果A公司選擇不打廣告,B當然不能放過這個機會,一定是選擇「打廣告」將利潤提升至1000!

因此B公司的最佳解亦為「打廣告」!

因此本場賽局的奈許均衡點即是「AB公司都選擇打廣告」

本場賽局的奈許均衡點為「AB公司都選擇打廣告」

有趣的是,AB公司都很努力花錢花心力打廣告,最後收益反而比什麼都不做還要低,陷入了囚徒困境。

要避免這個結果發生,只有AB攜手合作,發展利於雙方的策略,才能共創雙贏。

除此外還有一種情況,就是你會「因為對方的決策而捨棄你的最佳選擇,甚麼意思呢?

這就要講到另一個非常有意思的賽局叫「智豬博弈」

智豬博弈:中小企業謀生的關鍵

從剛剛提過的賽局中我們可以發現,玩家似乎都是勢均力敵的,彼此的條件、思維模式都差不多,因此思考策略也會很類似。

而智豬博亦就是賽局中的玩家有著本質上的差異,因此其中一方會被迫著捨棄自己的最佳選擇。

賽局如下:
豬舍中有一隻大豬跟小豬,他們正上方有個提供食物的輸出口。在不遠的地方有個按鈕,只要按一次按鈕,輸出口就會提供10份的食物。

整理賽局先決條件如下:

  1. 豬圈的一頭是踏板,另一頭是食物槽。
  2. 觸控按鈕,另一邊就會倒入10份食物。
  3. 觸控按鈕後跑回食物槽,會消耗2份食物的熱量。
  4. 等在食物槽旁邊,0份消耗量。

整理大小豬收益比如下(先不考慮往返消耗):

  1. 大小豬同時吃食物,收益比為(7,3)
  2. 大豬先吃食物,收益比為(9,1)
  3. 小豬先吃食物,收益比為(6,4)

使用賽局矩陣(Game Matrix)來表示這場賽局:

智豬博弈之賽局矩陣
智豬博弈之賽局矩陣

小豬的最佳解為「等待」

如果大豬選擇按按鈕,那麼小豬最佳解就是「等待」,如果和大豬一起按按鈕,會因為吃食物的速度搶不贏大豬,只能獲得1分。

如果大豬選擇等待,那麼小豬最佳解依然是「等待」,如果小豬去按按鈕,吃食物搶不贏大豬,僅能獲得-1分。

因此小豬的最佳解為「等待」!

大豬的最佳解為「等待」,卻沒有選擇

如果小豬選擇按按鈕,那麼大豬最佳解就是「等待」。不僅能獲得大部分的食物,還不需要任何消耗,何樂不為?

如果小豬選擇等待,那麼大豬最佳解只能是「按按鈕」。否則兩隻豬都沒有食物吃。

原本大豬的最佳反應應是選擇「等待」,能獲得最高的分數(9分)。

但是大豬知道小豬一定會選擇等待,如果自己也選擇等待,那麼誰也吃不到食物,因此大豬只能選擇「按按鈕」!

因此大豬的最佳解為「按按鈕」!

反觀小豬:
最利於小豬的策略便是「等待」,因為大豬一定要吃到食物,不可能不按按鈕;小豬如果主動出擊,食物收益一定搶不贏大豬,與其這樣不如就等待大豬按按鈕,自己搭便車先吃食物。

這就非常像是大企業與小公司,大企業可以開拓市場,也有很強的能力創造高營收,小企業一樣也能開拓市場與獲利。不過根據智豬博弈這場賽局我們可以發現,小企業最佳的策略「就是等待大公司把市場開拓好了再踏入市場」,以大企業走過的道路為基礎,發展更好、更精確的事業體系才是上策!

如果想了解完整的賽局理論,可以參考李永樂老師的講解,非常詳細又好懂!

李永樂老師-賽局理論

賽局理論常見問題整理

賽局理論是什麼?

賽局理論(Game Theory)又譯為對策論博弈論,主要研究將賽局公式化,並探討之間的相互作用(遊戲或者賽局),是專門用來研究具有競爭現象的數學理論與方法。

納許均衡是什麼?

納許(奈許)均衡是指參賽者會猜測對方的行為,做出最佳的策略,則雙方決策的均衡點,就稱作奈許均衡。」簡單理解就是「這場賽局的結果」

囚徒困境是什麼?

囚徒困境是指囚徒們在無法溝通的情況下,因為出賣同夥可為自己帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。

如何避免落入囚徒困境?

破解關鍵在於能否信任或掌握對方的判斷。能掌握或與對方預先共謀,便能在賽局中取得雙贏;反之則是兩敗俱傷。

延伸閱讀

更多專案管理知識

更多案例分享:

如果你喜歡我們的內容,歡迎訂閱拓璞電子報,我們將不定時發送專案管理相關的資訊!

如果您對我們的系統有興趣或需要專業的輔導諮詢,歡迎聯絡我們