博弈論歷史大全精選
博弈論是二人在平等的對局中各自利用對方的策略變換自己的對抗策略,達到取勝的意義。以下是學習啦小編為你整理的博弈論發展歷史。歡迎欣賞閱讀。
博弈論發展歷程
博弈的原始思想萌芽于兩千多年前,《孫子兵法》、《孫臏兵法》、《三十六計》、《六韜》等書中就有許多博弈案例,“田忌與齊王賽馬”就是博弈實例之一。《摩訶婆羅多》、《梨俱吠陀》、《圣經》中記述了骰子游戲,我國在春秋戰國時期就出現六博、圍棋等博弈。
在西歐,德國哲學家和數學家萊布尼茨于1710年就預言了關于策略博弈理論出現的必要性和可能性。其后兩年,詹姆斯·華爾德格拉特 (James Waldradre)首次提出了“極小極大”定理的概念。雖然對具有策略依存特點的決策問題的零星研究則可上溯到18世紀初甚至更早,但是,博弈論的真正發展與成熟還是在20世紀。
在20世紀20年代,法國數學家波萊爾 (Borel)最早用數學語言刻畫了博弈問題,提出了“策略”和“混和策略”概念,用最佳策略和概念研究了下棋和其它許多具體的決策問題,并試圖把它們作為應用數學的分支加以系統研究。馮·諾伊曼(Von Neumann)是博弈論(又稱對策論)的創始人之一,1928年他發表“關于伙伴游戲理論”(Zur Theorie der Gesellschaftsspiele)提出兩人零和博弈的極小極大定理。他首次證明了博弈論基本定理,即“每個矩陣博弈都能通過引進混合策略而被嚴格決定”,現代博弈論正式誕生。他討論了合作對策問題,特別是三人零和博弈中有兩方聯合的情形,結果表明在附加條件下,N人博弈問題的解存在且唯一。
1944年馮·諾伊曼和摩根斯坦(Morgenstern)合作的《博弈論和經濟行為》一書提出合作博弈的基本模型,標志著系統的博弈理論的初步形成。他們創立了博弈論研究的基本概念。到20世紀50年代,合作博弈發展到鼎盛時期,包括納什(Nash)和夏普里(shapley)的“討價還價模型”,吉爾斯(Gillies)和夏普里關于合作博弈中的“核”(Core)的概念以及其他一些人的貢獻。
20世紀50年代合作博弈論達到頂峰,同時非合作博弈論也開始創立。納什在1950年和1951年發表了兩篇關于非合作博弈的重要文章《N人博弈的均衡點》、《非合作博弈》,明確給出了“納什均衡”的概念和均衡存在性定理,對合作博弈和非合作博弈進行了明確的劃分。圖克(Tucker)于1950年定義了“囚徒困境”(prisoners’dilemma),他們兩人的著作基本上奠定了現代非合作博弈論的基石。
20世紀60~70年代是博弈論的發展時期。1965年,萊因哈德·澤爾騰(Reinhard Selten)將納什均衡的概念引入了動態分析,提出了子博弈完美納什均衡(subgame perfect Nash Equilibrium)概念;1967~1968年約翰·C·海薩尼(John C Harsanyi)把不完全信息引入博弈論研究,提出貝葉斯納什均衡(Bayesian Nash Equilibrium)概念。1975年,萊因哈德·澤爾騰引入動態博弈 (dynamic game)和不完全信息博弈[,提出完美貝葉斯納什均衡(Perfect Bayesian Nash Equilibrium)。
20世紀80年代以來,博弈論空前發展并逐漸成為主流經濟學的一部分。1982年克瑞普斯(Kreps)[16]和威爾遜(Wilson)合作發表關于動態不完全信息博弈的研究成果。此外還有克瑞普斯(Kreps)、米爾格羅姆(Milgrom)、羅伯茨(Roberts)和威爾遜 (Wilson)在1982年發表的關于信譽問題的研究成果,被譽為“--模型”(即KMRW聲譽模型)。
博弈論的形成是一個不斷發展的過程,也是不斷放松一系列嚴格假定的過程,尤其是嚴格的理性人假定,因為人類的目標不僅僅是經濟利益最大化。基于實驗經濟學的行為博弈論在現實的框架中用更加人性化和社會化的方式分析參與人的行動。在投資博弈(investment games)中,博弈論認為由于參與人雙方都是理性自利的,因此均衡解是雙方的支付都為0,但行為博弈論在實驗的基礎上考慮了信任這一行為因素,而后得出參與人雙方很可能合作而使雙方的支付都增加;在可置信威脅議價博弈(ultimatum bargaining)中,博弈論認為對應者會接受出價者付出的任何金額,因為有總比沒有好,但實驗研究發現若遠低于總收益的50%,對應者寧愿犧牲自己的利益拒絕對方的出價而使雙方的支付都為0,行為博弈論提出這是因為參與人偏好公平,厭惡不公平的心理因素所造成的。在“大陸分水嶺”博弈(“continental divide”coordination games )中,博弈論無法解釋為什么實驗中有的參與人選擇高支付的均衡點,而有的參與人卻選擇低支付的均衡點,但行為博弈論卻可以用文化、傳統、幸運數字以及相互的溝通來解釋這種異象。“選美比賽”競猜博弈(“beauty contest”guessing games)的標準博弈解是0,但事實上一般人根本沒有博弈論所要求的重復剔除劣戰略的能力,因此行為博弈論提出有限重復推理和博弈認知不斷深化。
進化博弈理論(Evolutionary Game Theory)來源于對生態現象的研究,從否定傳統理論賴以成立的基礎——理性人假定出發而建立起來新的分析框架。斯密斯(Smith)與普瑞斯(Price)提出演化博弈理論中的基本概念——演化穩定策略(Evolutionary Stable Strategy)。“演化穩定均衡”不是一個終極狀態,只代表博弈過程中的某個階段。演化關注的是博弈的過程,而不是博弈的結果,而演化的過程不能許諾一個完美的結局。進化博弈理論在處理有限理性參與人決策問題時,去掉參與人偏好、信念及理性假定等條件,假定參與人遵循某種比貝葉斯法則更簡單的行為規則,這種行為規則應該告訴如何采取行動及如何根據經驗來改變行為選擇,這樣參與人只要知道什么會發生,而不必知道為什么會發生。國外許多經濟學者紛紛應用該理論來分析諸如社會制度形成、行業發展趨勢、社會習俗演化等現象,獲得極大的成功。
在《博弈學習理論》一書中,朱·弗登伯格(Drew Fudenberg)和戴維·萊文(David Levine)對均衡什么時候出現以及為什么均衡會出現提出另一種解釋:均衡是并非完全理性的參與人隨時間的推移尋求最優化這一過程的長期結果。他們研究的模型為均衡理論提供了基礎,并為經濟學家評價和改進傳統的均衡概念提供了有用的方法。
總結博弈論的發展歷史,可以發現對于理性人假定的不斷放松以至于達到完全不需要理性的程度。同時,博弈論的發展過程也是它和各學科不斷緊密結合的過程。
博弈論理論歷史
博弈論是二人在平等的對局中各自利用對方的策略變換自己的對抗策略,達到取勝的目的。博弈論思想古已有之,中國古代的《孫子兵法》等著作就不僅是一部軍事著作,而且算是最早的一部博弈論著作。博弈論最初主要研究象棋、橋牌、賭博中的勝負問題,人們對博弈局勢的把握只停留在經驗上,沒有向理論化發展。
博弈論考慮游戲中的個體的預測行為和實際行為,并研究它們的優化策略。
近代對于博弈論的研究,開始于策梅洛(Zermelo),波萊爾(Borel)及馮·諾依曼(von Neumann)。
1928年,馮·諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經濟行為》將二人博弈推廣到n人博弈結構并將博弈論系統地應用于經濟領域,從而奠定了這一學科的基礎和理論體系[3]。
1950~1951年,約翰·福布斯·納什(John Forbes Nash Jr)利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的基礎。納什的開創性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。此外,萊因哈德·澤爾騰、約翰·海薩尼的研究也對博弈論發展起到推動作用。今天博弈論已發展成一門較完善的學科。
看了博弈論發展歷史