約翰?納什,這位諾獎獲得者、電影《美麗心靈》原型、世界級數學大師,意外逝世令世人震驚。納什成名學術是“納什均衡”,經濟學家保羅?薩繆爾森說過一個冷笑話,“人們可以將一只鸚鵡訓練成為經濟學家,只要讓它學會兩個單詞:需求與供給”。博弈論專家坎多爾對薩繆爾森的笑話加以補充,稱“要成為現代經濟學家,這只鸚鵡還必須學會一個單詞,‘納什均衡’”。納什正是憑借納什均衡理論獲諾貝爾經濟學獎,為何不是數學獎?因為諾貝爾根本沒有數學獎,數學家只能在經濟學或物理等旁支上開花。
納什的故事之所以吸引人,正是因為他豐富的旁支人生成就。他的簡歷中,有軍事戰略學家的頭銜,這與著名的蘭德公司有很大關系。二戰結束前夕美國空軍創始人亨利?阿諾德上將提出《戰后和下次大戰時美國研究與發展計劃》備忘錄,要求利用民間學者和科學家,成立一個“獨立的、介于官民之間的、進行客觀分析的研究機構”,“以避免未來的國家災禍,并贏得下次大戰的勝利”。于是蘭德公司在政府支持和道格拉斯飛機制造公司的投資下成立,專門為美國軍方研究重大軍事及國際政治戰略問題。
早在二戰時,美軍就發現博弈論非常適合做軍事決策。博弈論奠基人馮?諾依曼的學生梅里爾?弗勞特( “囚徒困境”發明者),曾在戰爭中利用博弈論為盟軍制定轟炸策略,確保轟炸機被擊落的概率最小。馮?諾依曼本人也受邀參與曼哈頓計劃,并通過數學方法幫助盟軍最終確定原子彈轟炸目標,廣島長崎的原爆其實是數學方法確定的。
冷戰中美蘇雙方“核威懾”,使博弈論有了更廣闊用武之地。蘭德最初設立目的之一,就是讓博弈論和軍事運籌學更好地為美國軍事及外交服務。蘭德吸引了大量優秀數學家加入,納什就是在這個時間點上,進入蘭德工作。
1950年,在普林斯頓大學攻讀博士學位的納什,發表名為《非合作博弈》的博士論文。這篇論文并不被博弈論泰斗馮?諾依曼賞識。馮?諾依曼關注零和博弈, 即假定“所有對局者收益總和為零”。他的理論中,對一方是最優策略,一定會對其他至少一方不利。而納什論文放棄這一假定,認為博弈中只要所有參與者可選擇的策略有限,則必然存在一個平衡點,使得處在此點上的博弈參與者采取的策略,都對自己最優。在一定程度上否定了馮?諾依曼。
馮?諾依曼對此嗤之以鼻,納什的師兄戴維?蓋爾卻認為納什開創了新的博弈論流派,該論文最終發表,引起轟動。隨后,納什又發表《n人博弈中的均衡點》(1950)和《非合作博弈》(1951),對自己的博士論文進行深入闡述。這三篇論文的核心觀點,被研究者概括為“納什均衡”。
納什在蘭德時,其實并未對美軍決策產生什么影響。當時,博弈論被軍隊應用在冷戰對蘇聯的核戰略。最初核戰爭追求對敵人徹底摧毀,更接近馮?諾依曼的“零和博弈”,納什均衡并無用武之地。此外,由于性格和性取向的某些原因,納什的工作成績平平,同事普遍認為他不好打交道。與此同時納什也失去對博弈論的興趣,轉而將精力投入到黎曼幾何,于1951年夏進入麻省理工任教。
1958年,受雇于蘭德的另一位數學家荷爾斯提出“恐怖的脆弱平衡理論”(The Delicate Balance of Terror),成為美國現代核威懾理論的奠基。他認為實施第一次核打擊的戰略價值(strategic value)要大于等待而準備第二次打擊。理由是,影響戰略對抗中雙方決策的主要因素是到底要冒多大風險。一方核力量處于優勢地位(譬如核彈頭數量是50比10),如無法保證在對方第一輪打擊中的生存概率,核力量的優勢無法制止對方發動攻擊,因為擁有10個彈頭一方在第一次核打擊中可能完全摧毀另一方的50個彈頭,使得其第二次打擊的力量被消滅。
根據這一理論,美軍不僅要求空軍的戰略轟炸機24小時攜帶核武器在空中巡邏,而且開始發展核潛艇以提高在蘇聯第一次打擊下的核武器生存概率。蘇聯也進行了同樣的部署。結果美蘇都發現,無論如何發展核力量,自己都沒法保證在發動突襲式的核攻擊中徹底摧毀對方全部核力量,從而制止對方發動核反擊。
從此之后,至少美蘇之間的核力量從零和博弈變成了非零和博弈,后來雙方共同制定的各種限制核武器發展以及核力量透明化的談判,正好符合納什均衡所預言的狀況。由此可見,納什確實是個天才,盡管他在研究博弈論的時候并不知道他的理論將對世界有著如此巨大的影響。