什麼是算法博弈論? 舉例說明

已發表: 2020-10-01

1999 年,當 Nisan 和 Ronen 將他們的想法貢獻給一篇論文時,世界見證了一個新的算法機制設計概念。 它試圖否定無政府狀態的代價,在這種情況下,自利總是導致系統退化。

他們的論文證明,多個自利方可以建立一個均衡的生產系統。 因此,我們不會著眼於退化的經濟,而是著眼於社會福利和收入最大化。

算法博弈論(AGT)是基於對算法機制設計(AMD)的理解。

雖然 AMD 描述了自利可以導致一個好的系統,但 AGT 旨在分析和設計一個描述自利參與者行為的戰略設置。

在我們了解 AGT 在戰略環境中如何運作之前,讓我們先看看博弈論是如何運作的!

目錄

讓我們藉助一個例子來理解博弈論

在一個完美的世界裡,每一步都是經過精心計算的,博弈論不會像今天這樣有意義。

計算聰明、理性的公民下一步行動的想法既令人興奮又令人恐懼。

博弈論規定,在任何給定的社會情況下,競爭方都可以通過評估可能性的有效性和估計競爭對手的淨移動來做出理性決策。

雖然這看起來像是一場賭博,但理論家們已經恢復了一種可以解釋的策略,從而根除人們認為這是一場賭博的信念。

最常見的例子是囚徒困境。

學習:每個開發人員都應該嘗試的前 8 個項目

囚徒困境解釋

前提很簡單——當警察抓到兩名罪犯並詢問他們的罪行時,他們都不會打破他們的沉默。

因此,DA 決定通過在他們面前提出三個條件來簡化這一點,因為他們坐在相鄰的位置。

  • 條件一:如果兩人都不供認罪行,則入獄六年。
  • 條件2:如果其中一隻老鼠出賣另一隻老鼠,舉報人可以自由漫遊,而另一隻老鼠進入十年。
  • 條件三:如果雙方都認罪,則入獄一年。

在聽取了條件後,他們立即被帶到一個單獨的房間做出決定。

我們可以像這樣以矩陣的形式傳輸這些數據;

資源

這個問題的解決方案很簡單;

每個囚犯都會考慮說出罪行的真相。 兩人都不能嚴格說對方會保持沉默。 所以,屈服於可能性,他們倆都決定認罪,只入獄一年。

博弈論是掌握它的有力武器。 通過了解數字的性質和社會設置位置,我們甚至可以破譯最複雜的情況。

算法博弈論

現在,考慮博弈論和計算機科學的維恩圖。 想像一下,為什麼要繪製實現答案的概率圖表的準確性水平會急劇提高。

這就是算法博弈論(AGT)所做的!

它試圖通過在計算機算法和博弈論之間取得完美平衡來解決現代問題。

用更簡單的話來說,算法博弈論試圖定義執行任務之間的社會經濟平衡。 它還使用了納什均衡的原理; 它指出,一旦參與者找到適合他們的策略,他們將不希望偏離它,直到它不再對他們有利。

讓我們舉一個小例子來了解算法博弈論的工作原理。

當我們玩 Kho-Kho、Ice & Water、Chain-Cut 等遊戲時,讓我們回到學校。這些遊戲中的每一個都有精美的設計和可玩的機制。

例如,讓我們考慮一下冰與水;

  • 有幾名球員和一名接球手。 捕手應該把每個人都變成冰。
  • 其他玩家有能力在觸碰某人時將其變回水。
  • 有自由區,玩家可以休息 30 秒。

現在,如果你仔細看,你會發現這些規則中的每一個都構成了遊戲的機制並定義了它的設計。

  • 玩家可以玩這個遊戲,只要他們覺得有趣。 在這裡,納什均衡描述了只要玩家發現他們的策略有效並且遊戲有趣,他們就會玩。
  • 玩家的口糧是不被抓住。 她通過了解設置來執行該配給。 她實施了一種目標至上的方法,在這種方法中,她通過不被抓住來贏得比賽。 這通常被稱為機制設計或反向博弈論。
  • 現在,如果每個玩家只考慮一個動機——“不被抓住”——而不考慮它的第二部分——“拯救其他玩家”,那麼這個概念被稱為無政府狀態的代價。 它解釋了任何系統的效率將如何由於玩家的自私行為而降低。

現在,從上面提到的三個概念中出現了更多的概念。 雖然它們都與博弈論完全或適度相關,但它們為算法博弈論創造了功能基礎。

結帳: 42個令人興奮的Python項目想法和初學者主題

現在,問題出現了:“我們如何用算法來表示戰略環境?”

現在讓我們看看如何使用 Python 定義戰略環境並了解 Nashpy 在給定情況下的實現。

想像一下,你正在和你的一個朋友玩剪刀石頭布遊戲。 你們每個人都有以下三個選項之一;

  • 岩石
  • 剪刀

贏得比賽的標準是

  • 石頭壓碎剪刀
  • 剪刀剪紙
  • 紙蓋岩石

這意味著,如果兩名球員都表現出色,那就是重頭戲。

我們可以用 3×3 矩陣的形式表示,其中 Aij 是;

資源

注意:這裡,i 和 j 是兩個玩家的回合。

這裡,

  • 零表示你們兩個都玩同一個對象(搖滾樂;或紙紙)
  • 一個代表你們中的一個勝過另一個(就像石頭剪刀布一樣)
  • 減一代表你們中的任何一個輸了,因為另一個勝過你(就像石頭紙一樣)

現在,為了在 Nashpy 上表示這一點,您將編寫一個看起來像這樣的代碼;

資源

最後的想法

算法博弈論是當今世界的一個完美原則,競爭源於利己,勝利是利己的成就。

因此,作為現代管理者、教師、CXO 或商人,如果您了解算法博弈論的主導地位,那麼請允許我修改《哈利·波特》中西弗勒斯·斯內普的名言;

“算法博弈論可以教你如何限制名聲、釀造榮耀,甚至阻止損失。”

了解算法博弈論可以幫助您比以往更果斷地處理數字。 在當前時代,我們決定最後的細節以製定可持續計劃,AGT 被證明是一個轉型方面。

我們已經知道數據科學可以將企業轉變為利潤豐厚的領域,但 AGT 有能力提高門檻。

假設您仍然對博弈論以及數據科學如何成為當今最賺錢和最具競爭力的職業持懷疑態度。

如果您想了解數據科學,請查看 IIIT-B 和 upGrad 的數據科學 PG 文憑,該文憑專為在職專業人士而設,提供 10 多個案例研究和項目、實用的實踐研討會、與行業專家的指導、1-與行業導師面對面交流,400 多個小時的學習和頂級公司的工作協助。

博弈論的意義是什麼?

博弈論通過克服先前定量經濟模型中的主要問題而徹底改變了經濟學。 經濟學家通常利用博弈論來更好地理解寡頭壟斷企業的行為。 當公司參與某些行動(例如定價和串通)時,它可以幫助預測可能的結果。

在博弈論中,什麼是純策略?

博弈論是對交互決策的研究,其中每個參與者或玩家的命運由所有人的行為決定。 在決定您作為此類游戲的玩家的行動方針或“策略”時,您必須考慮其他人的決定。 純粹策略提供了玩家如何玩遊戲的全面規範。 純粹的策略可以被視為基於整個遊戲中的觀察的計劃。 特別是,它會影響玩家在任何特定情況下的反應方式。

什麼是博弈論,為什麼它對經濟學家很重要?

博弈論是經濟學家用來分析、預測和解釋人類行為的工具。 它已被用於研究拍賣、討價還價、併購定價、寡頭壟斷和各種其他主題。 它已經發展為多人正和遊戲,所有參與者都可以從個人之間的“通過交易獲得的收益”(交換)中受益。