擴展形式的博弈

博弈論中，與正則形式相應，擴展形式（英語：Extensive-form game）通過樹來描述博弈。每個節點（稱作決策節點）表示博弈進行中的每一個可能的狀態。博弈從唯一的初始節點開始，通過由參與者決定的路逕到達終端節點，此時博弈結束，參與者得到相應的收益。每個非終端節點只屬於一個參與者；參與者在該節點選擇其可能的行動，每個可能的行動通過邊從該節點到達另一個節點。

和正則形式不同，擴展形式允許互動的顯式模型（explicit modeling of interactions），互動中，一個參與者可以在博弈中多次行動，並且在不同的狀態中可以做出不同的行為。

表述

完整的擴展形式表述包括：

博弈中的參與者
每個參與者能行動的所有機會。
每個參與者在行動時的選擇
每個參與者在行動時所知道的情況
每個參與者通過各種可能的行動之後的收益。

右圖是一個雙人博弈：1和2。每個非終端節點上的數字表示該節點所屬的參與者。終端節點上的數字表示參與者的收益（例如:2,1表示參與者1得到2，參與者2得到1）。圖片裏每個邊上的符號是這個邊所代表的行動的名字。

初始節點屬於參與者1，表示該參與者先動。博弈順序如下：參與者1選擇U或者D；參與者2觀察到參與者1的選擇，然後選擇U' 或者D' ，最後得到最終收益。四個終端節點代表四個結果：(U,U')，(U,D')，(D,U')和(D,D')。每個結果得到的收益分別是(0,0)，(2,1)，(1,2)和(3,1)。

如果參與者1選擇D，參與者2為了最大化收益，會選擇U'，最後參與者1隻能得到1。但是如果參與者1選擇U，參與者2為了最大化收益，會選擇D' ，此時參與者1得到2。所以參與者1會選擇U，參與者2選擇D' 。即是子博弈完美均衡。

無限行動空間

參與者在一個特定的決策節點上可能有無數種可能的行動可以選擇。其表示方法是用弧形來連接從該決策節點延伸出的兩條邊。如果行動空間是在兩個數字之間的閉聯集（continuum），那麼把這兩個表示上下界限的數字分別放在弧的上方和下方，並用一個變數來表示其支付。此時無數個決策節點可以用一個在弧中心的節點所代替。這種表示方式同樣可以用在一個有限的行動空間中，只要該行動空間足夠大，此時不可能用邊來表示每個行動。

左側的樹表示這樣一個博弈：該博弈或者有一個無限行動空間（任何0到5000的實數），或者有一個很大的行動空間（可能是任何在0到5000的整數）。如果我們在這裏假設它表示兩個參與Stackelberg競爭的企業。公司的支付表示在左邊，其中q1和q2表示先行者公司以及追隨者公司分別採用的策略，c1和c2是常數（表示公司的機會成本）。該博弈的子博弈完美納殊均衡可以通過對支付函數求追隨者策略變數(q2)的一階偏導數表示其利潤最大化，並求出其最優反應函數， $q2(q1)=(5000-q1-c2)/2$ 。用同樣的方法計算先行者的最優反應函數，並假定先行者知道追隨者會選擇上述的行動，通過一階偏導數來解出 $q1*=(5000+c2-2c1)/2$ 。在將q1*代入到追隨者的最優反應函數中， $q2*=(5000+2c1-3c2)/4$ ，此時(q1*,q2*)就是子博弈完美納殊均衡。如果假設 c1=c2=1000，那麼子博弈完美納殊均衡的解就是(2000,1000)。

不完美資訊

樹圖清楚地表示了參與者1先動，參與者2觀察到參與者1的行動。然而，一些博弈並不是這樣。參與者並不是一直能觀察到另一個人的選擇（例如，同時行動或者行動被隱藏）。資訊集合是決策節點的組合：

每個節點都屬於一個參與者。
參與者無法區分資訊集合里的多個節點。也就是說：如果資訊集合有多個節點，資訊集合所屬的參與者就不知道能往哪個節點移動。

完美資訊的博弈是指在博弈的任何階段，每個參與者都清楚博弈之前發生的所有行動，也即每個資訊集合都是一個單元素集合。沒有完美資訊的博弈具有不完美資訊。

左圖中的博弈中，參與者2行動時不知道參與者1的選擇，除此之外和第一個博弈相同。第一個博弈具有完美資訊；而左圖中的沒有。如果兩個參與者都是理性的，並且都知道對方也是理性人，對方知道的資訊，自己也能獲得（即參與者1知道參與者2知道參與者1是理性的，參與者2同樣也知道，如此循環下去），

公理的公式化

博弈論是一種數學理論，所以上述的博弈樹結構可以轉化為公式表達。

擴展形式的有限樹是這樣一個結構 $\Gamma =\langle {\mathcal {K}},\mathbf {H} ,[(\mathbf {H} _{i})_{i\in {\mathcal {I}}}],\{A(H)\}_{H\in \mathbf {H} }],a,\rho ,u\rangle$ 其中：

${\mathcal {K}}=\langle V,v^{0},T,p\rangle$ 表示一個有限的樹。 $V$ 是樹的所有節點， $v^{0}\in V$ 表示唯一的初始節點， $T\subset V$ 表示所有的終端節點（ $D=V\setminus T$ 是決策節點）以及函數 $p:V\rightarrow D$ 表示博弈的規則，
$\mathbf {H}$ 表示 $D$ 里包含的資訊，
$A(H)$ 是資訊集合 $H\in \mathbf {H}$ 所允許的可能的行動。所有的行動表示為 ${\mathcal {A}}$ 。

參考文獻

Dresher M. (1961). The mathematics of games of strategy: theory and applications (Ch4: Games in extensive form, pp74--78). Rand Corp. ISBN 0-486-64216-X
Fudenberg D and Tirole J. (1991) Game theory (Ch3 Extensive form games, pp67-106). Mit press. ISBN 0-262-06141-4
Luce R.D. and Raiffa H. (1957). Games and decisions: introduction and critical survey. (Ch3: Extensive and Normal Forms, pp39-55). Wiley New York. ISBN 0-486-65943-7
Osborne MJ and Rubenstein A. 1994. A course in game theory (Ch6 Extensive game with perfect information, pp. 89-115). MIT press. ISBN 0-262-65040-1

參見

閱論編博弈論專題
定義	正則形式的博弈 · 擴展形式的博弈 · 圖博弈論 · 合作博弈 · 資訊集合 · 偏好
均衡概念（英語：Solution concept）	納殊均衡 · 強納殊均衡（英語：Strong Nash equilibrium） · 子博弈均衡（英語：Subgame perfect equilibrium） · 貝葉斯-納殊均衡 · 貝葉斯完美均衡（英語：Perfect Bayesian equilibrium） · 顫抖手完美均衡 · 恰當均衡（英語：Proper equilibrium） · ε-均衡 · 相關均衡 · 序貫均衡 · 准完美均衡（英語：Quasi-perfect equilibrium） · 進化穩定策略（英語：Evolutionarily stable strategy） · 風險佔優（英語：Risk dominance） · 柏利圖最適 · 自我應驗均衡（英語：Self-confirming equilibrium） · 馬爾可夫完美均衡（英語：Markov perfect equilibrium） · 默滕斯穩定均衡（英語：Mertens-stable equilibrium） · 核（英語：Core (game theory)） · 夏普利值（英語：Shapley value） · 吉布斯均衡（英語：Potentialg ame） · 量子響應均衡（英語：Quantal response equilibrium） · 謝林點
策略	優勢策略 · 純策略 · 混合策略 · 以牙還牙 · 冷酷觸發策略（英語：Grim trigger） · 策略複製論證（英語：Strategy-stealing argument） · 逆向歸納法（英語：Backward induction） · 前向歸納法（英語：Forward induction） · 馬爾可夫策略（英語：Markov strategy）
博弈類型	對稱博弈 · 完美資訊 · 序列博弈 · 重複博弈 · 信號博弈 · 廉價磋商（英語：Cheap talk） · 零和博弈 · 機制設計 · 隨機博弈 · 非傳遞博弈 · 全局博弈（英語：Global game） · 甄別博弈（英語：screening game） · 討價還價問題（英語：Bargaining problem） · 多人博弈（英語：n-player game） · 大型泊松博弈（英語：Large Poisson game） · 嚴格決定博弈 · 潛博弈（英語：Potential game） · 位勢博弈
博弈模型	圍棋 · 國際象棋 · 無限棋（英語：Infinite chess） · 西洋跳棋 · 井字棋 · 囚徒困境（可選擇的囚徒博弈（英語：Optional prisoner's dilemma） · 用餐者困境） · 旅行者困境 · 猜均值的2/3 · 協調博弈（英語：Coordination game） · 蜈蚣博弈 · 志願者困境 · 搭便車問題 · 拍賣美元 · 膽小鬼博弈 · 智豬博弈 · 性別戰 · 獵鹿博弈 · 賭便士（英語：Matching pennies） · 最後通牒博弈（海盜博弈） · 包、剪、揼 · 獨裁者博弈（信任遊戲） · 共用品博弈（英語：Public goods game） · 納殊討價還價問題（英語：Nash Bargaining Game） · 上校博弈 · 消耗戰 · 少數派博弈（El Farol酒吧問題） · 公平分配博弈（切蛋糕問題（英語：Fair cake-cutting）） · 古諾競爭 · 死結 · 庫恩撲克遊戲（英語：Kuhn poker） · 甄別博弈（英語：Screening Game） · 公主與怪獸遊戲（英語：Princess and monster game） · 約會問題（英語：Rendezvous problem） · 囚徒帽子謎題（英語：Prisoners and hats puzzle）
定理	極值定理 · 純化定理（英語：Purification theorem） · 無名氏定理 · 顯示定理（英語：Revelation principle） · 阿羅不可能定理 · 極小化極大算法 · 納殊均衡 · 策梅洛定理
關鍵人物（英語：List of game theorists）	阿爾伯特·W·塔克 · 阿摩司·特沃斯基 · 阿里埃勒·魯賓斯坦 · 克勞德·香農 · 丹尼爾·卡內曼 · 戴維·K·萊文（英語：David K. Levine） · 戴維·M·克雷普斯（英語：David M. Kreps） · 唐納德·B·吉利斯（英語：Donald B. Gillies） · 朱·弗登博格（英語：Drew Fudenberg） · 埃里克·馬斯金 · 哈羅德·W·庫恩（英語：Harold W. Kuhn） · 赫伯特·亞歷山大·西蒙（司馬賀） · 埃爾維·穆蘭（英語：Hervé Moulin） · 讓·梯若爾 · 讓-弗朗索瓦·默滕斯（英語：Jean-François Mertens） · 珍妮弗·圖爾·蔡司（英語：Jennifer Tour Chayes） · 夏仙義·亞諾什·卡羅伊 · 約翰·梅納德·史密斯 · 安托萬·奧古斯丁·庫爾諾 · 約翰·福布斯·納殊 · 約翰·馮·諾伊曼 · 肯尼斯·阿羅 · 肯尼思·賓默爾 · 里奧尼德·赫維克茲 · 勞埃德·沙普利 · 梅爾文·德雷希爾（英語：Melvin Dresher） · 梅里爾·M·弗勒德 · 奧嘉·邦達雷娃（英語：Olga Bondareva） · 奧斯卡·莫根施特恩（英語：Oskar Morgenstern） · 保羅·米爾格龍 · 佩頓·楊（英語：Peyton Young） · 賴因哈德·澤爾騰 · 羅伯特·阿克塞爾羅 · 羅伯特·約翰·奧曼 · 羅伯特·B·威爾遜 · 羅傑·梅爾森 · 塞繆爾·鮑爾斯（英語：Samuel Bowles (economist)） · 蘇珊娜·斯科奇姆 · 托馬斯·克羅姆比·謝林 · 威廉·維克里
參見	全支付拍賣 · Alpha-beta剪枝 · 柏氏悖論（英語：Bertrand paradox (economics)） · 有限理性 · 組合博弈論 · 對抗分析（英語：Confrontation analysis） · 合作性競爭 · 棋局中的先手優勢（英語：First-move advantage in chess） · 博弈機制（英語：Game mechanics） · 博弈論詞彙表（英語：Glossary of game theory） · 博弈理論家列表（英語：List of game theorists） · 特殊博弈列表 · 雙輸 · 國際象棋的解局策略（英語：Solving chess） · 拓撲博弈（英語：Topological game） · 公地悲劇 · 小決定暴政