賽局理論是什麼?搞懂賽局,讓你不再出局!【2021最新版】

賽局理論是什麼?人生何處無賽局?舉凡商業上的競爭、廣告戰等,雙方都在絞盡腦汁制定策略,此時如果能用一套公式,讓賽局變得清晰明瞭,將有助於你做出最正確的決定!
本篇主要有3個重點:
賽局理論是什麼?
賽局理論(Game Theory)又譯為對策論或博弈論,被認為是20世紀經濟學最偉大的成果之一。
主要研究將賽局公式化,並探討之間的相互作用(遊戲或者賽局),是專門用來研究具有競爭現象的數學理論與方法。
賽局理論是什麼?

賽局理論(Game Theory)又譯為對策論或博弈論,被認為是20世紀經濟學最偉大的成果之一。
目前在生物學、經濟學、國際關係、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。
主要研究將賽局公式化,並探討之間的相互作用(遊戲或者賽局),是專門用來研究具有競爭現象的數學理論與方法。
現代的賽局理論的源頭是約翰·馮·諾伊曼對於雙人零和賽局的混合策略均衡點的發想和證明。
賽局基本要素有哪些?
賽局如果要成立,至少要有以下5個基本要素:
- 玩家(player):至少大於一人(畢竟自己跟自己無法比賽)
- 策略(strategy):玩家根據當下情況而決定的行動計劃
- 得失 / 支付(Payoffs):玩家執行每個可能行動後的得或失,可理解為「得分」
- 最佳反應 (Best Respond, 簡稱 BR):針對對手的策略選擇最有利決定的反應。
- 均衡(Equilibrium):均衡就是賽局的最後結果,即「奈許均衡點」(Nash Equilibrium)。

奈許均衡是什麼?
學習賽局理論之前,我們先了解一下什麼叫做奈許均衡(納許均衡)吧!
奈許均衡是什麼?
奈許均衡是指「參賽者會猜測對方的行為,做出最佳的策略,則雙方決策的均衡點,就稱作奈許均衡。」簡單理解就是「這場賽局的結果」。
奈許均衡(Nash Equilibrium)又稱作「非合作均衡」,是由1994 年諾貝爾經濟學獎得主約翰.奈許(John Nash)提出。
那約翰.奈許(John Nash)當初是如何構想出這套賽局理論呢?《美麗境界》這部電影就是在描述奈許的故事,下面的影片就是奈許構思出賽局理論的過程。(建議從1:00開始欣賞)
影片中奈許和一群好友到了酒吧邂逅了一群美女,其中一位金髮的女子更是迷倒了所有男士。
在朋友們喧鬧著要如何追求時,奈許則開始喃喃自語,默默地完成了這套近20世紀以來最偉大的理論之一-奈許均衡。
簡單描述一下賽局:
- 如果雙方都選擇追金髮女,則會因為勾心鬥角導致誰也追不到金髮女,再找其他女生也無濟於事,因為沒有人想當備胎。
- 如果其中一方選擇追金髮女,則心裡會獲得極大的滿足,沒追金髮女的人也會有女伴,只是心理滿足感較低。
- 如果雙方都不追金髮女,選擇其他女孩,則所有人都有女伴,也不會影響彼此友誼。
整理賽局先決條件如下:
- 雙方都追金髮女,會因為彼此互相牽制,而追求失敗並再也找不到女伴。
- 其中一方追金髮女,則可以滿足虛榮心,一方獲利大於另一方。
- 雙方都不追金髮女,所有人都有女伴。
整理奈許與朋友的收益比如下:
- 奈許與朋友一起追金髮女,收益比為(0,0)
- 奈許追求金髮女,收益比為(2,1)
- 朋友追求金髮女,收益比為(1,2)
- 奈許與朋友都不追金髮女,收益比為(1,1)
我們可以藉由剛剛學到的賽局理論基礎,使用賽局矩陣(Game Matrix)來描述一下這場賽局。
賽局矩陣(Game Matrix)

奈許的最佳解為「追金髮女」
如果朋友選擇追金髮女,奈許最佳解為追其他女孩,除了可以避免和朋友撕破臉之外,還能有個女伴,而朋友可以和最漂亮的金髮女共舞,因此收益比為(1,2)。

如果朋友選擇追求其他女孩,奈許的最佳解就是追金髮女,能獲得極大的心理滿足,因此收益比為(2,1)。

因此奈許的最佳解為「追金髮女」!
朋友的最佳解亦為「追金髮女」
如果奈許選擇追金髮女,朋友最佳解為追其他女孩,除了可以維持友誼,也能擁有女伴,而奈許可以和最漂亮的金髮女共舞,因此收益比為(2,1)。

如果奈許選擇追求其他女孩,朋友的最佳解就是追金髮女好滿足自己的虛榮心,因此收益比為(1,2)。

因此朋友的最佳解亦為「追金髮女」!
那這就尷尬了,朋友跟奈許的 Best Respond 都是「追金髮女」,但是我們都知道,如果雙方都採取最佳反應(Best Respond)-一起追金髮女,雙方只會得到最差的結果(0,0),沒有任何人能得到女伴。

因此我們可以得出3點結論:
#1.奈許均衡不一定是賽局中的最優解
奈許均衡就是賽局的最終結果,在不知道對方策略的前提之下,很容易會陷入囚徒困境,落得兩敗俱傷的結果。
#2.個人最優解不等於群體最優解
從賽局矩陣中我們可以看到,群體最優解就是雙方都放棄金髮女,追求其他女孩,如果雙方都選擇對自己最好的策略,誰都得不到女伴。
#3.考量「自己和群體的利益」才能得到最優解答
從奈許的故事中我們可以了解,如果每個人都只為自己努力,將無法獲得最佳利益,最好的成果來自於每個人都為自己和群體的利益而努力。
經典賽局:囚徒困境

有一天警察抓到了兩個搶劫銀行的嫌犯,卻因為沒有證據所以遲遲無法定罪,如果最後證據不足,囚犯只會被關一年;如果囚犯都認罪,則會被關8年。
於是這個時候,警察想了個妙方。警察先將嫌犯兩人分開囚禁,之後分別對他們說:「好!你不認罪是吧?聽好了,一旦你的夥伴認罪了,他就會被釋放,而你將要被關10年!」根據故事我們可以將賽局做個整理。
整理賽局先決條件如下:
- 囚犯都抗拒,只需關1年。
- 囚犯都坦白,兩人都要關8年
- 其中一人坦白,另一人關10年
整理AB囚犯收益比如下:
- AB囚犯一起坦白,收益比為(-8,-8)
- A坦白,最佳收益比為(0,-10)
- B坦白,最佳收益比為(-10,0)
- AB囚犯都抗拒,收益比為(-1,-1)
使用賽局矩陣(Game Matrix)來表示這場賽局:

A囚犯的最佳解為「坦白」
如果B囚犯選擇坦白,那麼A囚犯最佳解就是「坦白」,否則最慘將面臨10年的徒刑。

如果B囚犯選擇抗拒,那麼A囚犯最佳解也是「坦白」,可以完全不用坐牢!

因此A囚犯的最佳解為「坦白」!
B囚犯的最佳解為「坦白」
如果A囚犯選擇坦白,那麼B囚犯最佳解就是也跟者「坦白」,否則最慘將面臨10年的徒刑。

如果A囚犯選擇抗拒,那麼B囚犯最佳解也是「坦白」,可以完全逃過牢獄之災。

因此B囚犯的最佳解為「坦白」!
故事中的嫌犯雖然都很清楚,只要雙方都合作不要認罪就可以有最好的結果,就是蹲完一年的牢就沒事了,結果最後卻敗在無法信任對方而「選擇只對自己好的方法」,就是認罪。
因為兩個人都覺得寧願關8年也好過關10年。最後結果就是因為害怕而雙雙招供,被判了8年的刑罰,明明已經深思熟慮做了最好的決策,卻換來最糟的結果。

以上這個故事就是由普林斯頓大學的教授-阿爾伯特.塔克(Albert Tucker)講解-經典的「囚犯困境」(Prisoner’s Dilemma)。
在這個例子中,兩個歹徒都認罪就是奈許均衡點,在奈許均衡的情況下,沒人擁有改變決策的動力,因為只要改變決策就會使自己的收益減少。
奈許均衡不一定是賽局中的最優解,關鍵在於能否信任或掌握對方的判斷。能掌握或與對方預先共謀,便能在賽局中取得雙贏;反之則是兩敗俱傷。
商戰上的囚徒困境,砸錢反而利潤更低?

今天假設有A、B兩家公司,都是主打保健食品,兩家公司的老闆都想藉由打廣告來提高自身的知名度,好賺取更多利潤。
如果雙方都不打廣告,雙方的利潤都是500萬元。如果其中一家打廣告,另一家沒有,則打廣告的公司利潤可提高至1000萬!沒登廣告的公司會流失一定消費者導致利潤下降至200萬元。
如果兩家公司都打廣告反而營收不會增加,雙方還會為了支付高昂的廣告費用導致利潤下滑至300萬元。
整理賽局先決條件如下:
- 打廣告前,AB兩家公司收益均為500
- 打廣告增加知名度,收益可提高至1000
- 如其中一家打廣告,則會使另一家公司收益下滑至200
- 如果一起打廣告,雙方利潤會降低至400
整理AB公司收益比如下:
- AB公司一起打廣告,收益比為(400,400)
- A打廣告,收益比為(1000,200)
- B打廣告,收益比為(1000,200)
- AB都不打廣告,收益比為(500,500)
使用賽局矩陣(Game Matrix)來表示這場賽局:

A公司的最佳解為「打廣告」
如果B公司選擇打廣告,那麼A公司最佳解就是也跟者「打廣告」,否則利潤會大幅下滑至200。

如果B公司選擇不打廣告,那麼A公司的最佳解仍然為「打廣告」,可將自己的收益大幅提升至1000!

因此A公司的最佳解為「打廣告」!
B公司的最佳解亦為「打廣告」
如果A公司選擇打廣告,B公司最佳解為「打廣告」,否則利潤將大幅縮減至200。

如果A公司選擇不打廣告,B當然不能放過這個機會,一定是選擇「打廣告」將利潤提升至1000!

因此B公司的最佳解亦為「打廣告」!
因此本場賽局的奈許均衡點即是「AB公司都選擇打廣告」。

有趣的是,AB公司都很努力花錢花心力打廣告,最後收益反而比什麼都不做還要低,陷入了囚徒困境。
要避免這個結果發生,只有AB攜手合作,發展利於雙方的策略,才能共創雙贏。
除此外還有一種情況,就是你會「因為對方的決策而捨棄你的最佳選擇」,甚麼意思呢?
這就要講到另一個非常有意思的賽局叫「智豬博弈」。
智豬博弈:中小企業謀生的關鍵

從剛剛提過的賽局中我們可以發現,玩家似乎都是勢均力敵的,彼此的條件、思維模式都差不多,因此思考策略也會很類似。
而智豬博亦就是賽局中的玩家有著本質上的差異,因此其中一方會被迫著捨棄自己的最佳選擇。
賽局如下:
豬舍中有一隻大豬跟小豬,他們正上方有個提供食物的輸出口。在不遠的地方有個按鈕,只要按一次按鈕,輸出口就會提供10份的食物。
整理賽局先決條件如下:
- 豬圈的一頭是踏板,另一頭是食物槽。
- 觸控按鈕,另一邊就會倒入10份食物。
- 觸控按鈕後跑回食物槽,會消耗2份食物的熱量。
- 等在食物槽旁邊,0份消耗量。
整理大小豬收益比如下(先不考慮往返消耗):
- 大小豬同時吃食物,收益比為(7,3)
- 大豬先吃食物,收益比為(9,1)
- 小豬先吃食物,收益比為(6,4)
使用賽局矩陣(Game Matrix)來表示這場賽局:

小豬的最佳解為「等待」
如果大豬選擇按按鈕,那麼小豬最佳解就是「等待」,如果和大豬一起按按鈕,會因為吃食物的速度搶不贏大豬,只能獲得1分。

如果大豬選擇等待,那麼小豬最佳解依然是「等待」,如果小豬去按按鈕,吃食物搶不贏大豬,僅能獲得-1分。

因此小豬的最佳解為「等待」!
大豬的最佳解為「等待」,卻沒有選擇。
如果小豬選擇按按鈕,那麼大豬最佳解就是「等待」。不僅能獲得大部分的食物,還不需要任何消耗,何樂不為?

如果小豬選擇等待,那麼大豬最佳解只能是「按按鈕」。否則兩隻豬都沒有食物吃。

原本大豬的最佳反應應是選擇「等待」,能獲得最高的分數(9分)。
但是大豬知道小豬一定會選擇等待,如果自己也選擇等待,那麼誰也吃不到食物,因此大豬只能選擇「按按鈕」!
因此大豬的最佳解為「按按鈕」!
反觀小豬:
最利於小豬的策略便是「等待」,因為大豬一定要吃到食物,不可能不按按鈕;小豬如果主動出擊,食物收益一定搶不贏大豬,與其這樣不如就等待大豬按按鈕,自己搭便車先吃食物。
這就非常像是大企業與小公司,大企業可以開拓市場,也有很強的能力創造高營收,小企業一樣也能開拓市場與獲利。不過根據智豬博弈這場賽局我們可以發現,小企業最佳的策略「就是等待大公司把市場開拓好了再踏入市場」,以大企業走過的道路為基礎,發展更好、更精確的事業體系才是上策!
如果想了解完整的賽局理論,可以參考李永樂老師的講解,非常詳細又好懂!
賽局理論常見問題整理
賽局理論是什麼?
賽局理論(Game Theory)又譯為對策論或博弈論,主要研究將賽局公式化,並探討之間的相互作用(遊戲或者賽局),是專門用來研究具有競爭現象的數學理論與方法。
納許均衡是什麼?
納許(奈許)均衡是指「參賽者會猜測對方的行為,做出最佳的策略,則雙方決策的均衡點,就稱作奈許均衡。」簡單理解就是「這場賽局的結果」。
囚徒困境是什麼?
囚徒困境是指囚徒們在無法溝通的情況下,因為出賣同夥可為自己帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。
如何避免落入囚徒困境?
破解關鍵在於能否信任或掌握對方的判斷。能掌握或與對方預先共謀,便能在賽局中取得雙贏;反之則是兩敗俱傷。
延伸閱讀:
- 【武漢肺炎】如何用賽局理論決定最好的防疫策略?
- 【圖解賽局理論】為什麼殺價競爭無法避免?
- 人生無處不「賽局」!4 個故事,讓你看懂「賽局理論」的心機!
- 什麼是賽局、奈許均衡?想贏過競爭對手,你該瞭解的經濟學理論
更多專案管理知識:
更多案例分享:
如果你喜歡我們的內容,歡迎訂閱拓璞電子報,我們將不定時發送專案管理相關的資訊!
如果您對我們的系統有興趣或需要專業的輔導諮詢,歡迎聯絡我們!