chikaku

且听风吟

永远是深夜有多好。
github
email

博弈論之關鍵機制

前兩天偶然找到了《game theory》這本書的電子版,剛看了前兩章感覺很有趣,我尤其喜歡這種把問題形式化再去解決的過程。第二章主要講決策時使用的方法,比如第二價拍賣:出價最高者贏得拍賣,但只需支付第二高的價格,和以下所討論的 The pivotal mechanism 下文把 pivotal 直譯成 "關鍵"(感覺有點怪)。

初次接觸博弈論,如有誤述請一定指出。🥺

概念#

民意調查是組織進行項目決策的重要工具,但參與者報告的意願並不總能反映出真實的情況。因為受訪者可能會由於價格、稅收,偏好等各種原因放大或縮小其真實的意願。

比如社區要兌錢建設足球場:熱愛足球運動的參與者 A 在調查時可能會誇大自己願意支出的價格,因為 A 會認為在真實出價時,高出來的價格會均攤到其他參與者身上。相反對於不喜歡足球運動的參與者 B 考慮到建設足球場的支出和自己的收益,會報告出低於自己真實意願。Everybody lies

關鍵機制 (pivotal mechanism) / Clarke 機制給出了一種激勵受訪者報告他們的真實意願的博弈模型。

關鍵機制的思想在於讓每個參與者認為自己是決定結果的關鍵,從而誘導參與者報告真實信息,以供決策。基本的流程如下:

  1. 每個參與者報告自己私有信息 (比如願意支付的價格)
  2. 計算所有信息的總和,得到一個決策結果
  3. 對每個參與者,考慮剔除其信息後重新決策的結果是否有改變
  4. 只向改變了結果的參與者收費 (比如額外的稅)

舉例#

設想一個場景,政府考慮在某社區中建造一個公園,預計總共需要需要花費 $C\$C 社區中一共有 nn 位市民。如果決定建造公園,則每位市民需要支出 $ci(c1+c2+...+cn=C)\$c_i (c_1+c_2+...+c_n = C) 由於公園對每個市民的收益不同 (比如離每個人家裡的距離不一樣),所以每位市民實際的支出會有所不同。

假設每位市民 ii 的初始財富為 $mi(mi>0)\$m_i(m_i>0) 若公園建成其能夠獲得的收益為 viv_i (這裡把收益量化為財富,注意收益有可能是負值) 則對於市民 ii 的收益函數為 (這個公式只在後續數學證明的時候有用到)

image

政府在進行決策時,只有滿足總收益大於總支出即 i=1nvi>C\sum_{i=1}^{n}v_i > C 的情況才會決定建造公園。但問題是政府無法得知每位市民的 viv_i 所以需要進行民調。

使用關鍵機制進行民意調查#

  1. 第一步,每位受訪市民報告一個其在公園建設過程中取得的收益 wiw_i 在絕對誠實的情況下 wiw_i 應該等於 viv_i

  2. 第二步,計算所有提交收益的總和,通過民調進行的決策就變成了只有在 i=1nwi>C\sum_{i=1}^{n}w_i > C 的情況下才會建造公園。

  3. 第三步,將參與者分成關鍵和不關鍵兩類,滿足以下條件即認為不關鍵 (剔除這個參與者的 wjw_j 總體的決策不會發生改變)

image

第一行表示,算上 ii 和不算上 ii 所有人的收益總和都大於所需支出總和,決策不變 (建設公園)
第二行表示,算上 ii 和不算上 ii 所有人的收益總和都小於所需支出總和,決策不變 (不建公園)

  1. 第四步,對關鍵市民 (非不關鍵市民) 徵收一定的稅,額度為

image

感性分析#

由於關鍵市民需要支付額外的稅,每位市民相對理性的選擇是使得自己的 wi=ciw_i = c_i 這樣自己總不會是關鍵市民:

  • 如果原本總 WCW \ge C 則加上 cic_i 之後兩邊仍是大於關係 W+wiC+ciW+w_i \ge C+c_i
  • 如果原本總 W<CW < C 則加上 cic_i 之後兩邊還是小於關係 W+wi<C+ciW+w_i < C+c_i

在絕對誠實和理性的環境下,對所有參與者應該有 wi=viw_i = v_i 這樣政府通過統計出來的 i=1nwi=i=1nvi\sum_{i=1}^{n}w_i = \sum_{i=1}^{n}v_iCC 比較,就能夠得到最準確的決策。

數學證明#

數學證明主要通過計算每個參與者的收益函數來證明 wi=ciw_i = c_i 確實是每個參與者的最優選擇 (每個 ii 都希望自己的最終財富最高)。這也是下面證明中所說的 our hypothesis

  • wiw_i 表示報告的收益 (量化成財富值)
  • viv_i 表示真實收益 (量化成財富值)
  • cic_i 表示在建造公園情況下的真實支出,如果不建設,則這一項為 00
  • mˉi\bar{m}_i 表示參與者 ii 的初始財富值
  • isutilityi’s utility 表示 ii 的最終財富值 ii 會按照最大化這個值的策略進行決策

case 1#

image

case2#

image

case3#

image

case4#

image

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。