當前位置: 華文星空 > 知識

【三體】中是否過分誇大了地球文明接觸外星文明的危險?

2016-01-15知識

好久沒有在知乎認真答題了。正好這個問題出現在我關註的人的動態裏。就答一下吧。我這裏有一些博弈論的知識。滲入。

其實類似的問題我答過好多了,不知道很多已經在小說澄清的問題為啥還有那麽多人拿來挑錯。

排名第一的答案我大略看了一下。感覺應該反對。

首先,黑森林法則的前提是絕對經得起推敲的,宇宙總資源有限不是bug,聽到這個話題我想很多科幻迷都會想起來阿西莫夫【最後的問題】。事實上,反正宇宙的熵是不減的,資源怎麽可能無限?無論你是碳基生命還是矽基生命,無論你是控制多大領域,你總需要「熵」吧。

這就提到一個有趣的問題,為什麽很多人難以接受這個設定,是因為他們是從地球的以往歷史來尋找經驗,而不是從整個時間裏去規劃一個文明的最優效用。尺度不一樣,拿以往地球上文明征服的歷史說事,當然會覺得到處是bug。

對以往地球文明來說,沒有資源約束,所以資源約束是bug;對以往地球文明來說,是經過接觸然後征服奴役的,所以黑森林法則是bug;對以往地球文明來說,打擊其他文明是可能失敗,並且暴露自己的(但在宇宙中就不會暴露自己),所以黑森林法則是bug;對於地球文明來說,不會倒著逆向推導最優路徑,只會規劃很短的一段時間,所以黑森林法則是bug……

這不是宇宙社會學,這是地球對宇宙yy的社會學。

不可取。

我們來看黑森林法則是否成立。我想先科普一個概念,拿殊均衡。拿殊均衡是這樣一個概念:每個人都從多個策略當中選擇一個最優策略,但是不是最優是受到其他人策略選擇的影響的,而拿殊均衡要求給定其他人的最優策略,你的策略是最優的,同時給定你這個最優策略,其他人那個最優策略顯然也是最優的。這時候沒有人會主動偏離這個均衡。

作為一個練習,考慮只有兩個策略:一個是文明暴露之後,立馬消滅它,一個是文明暴露以後,去接觸它,然後想辦法合作或者奴役。一個合理的假設是前者的成本更低。

我們說:消滅它是一個拿殊均衡。

為什麽?

給定其他人一定消滅它,你會去接觸並合作或者奴役嗎?你當然不會,因為它一定會被消滅,你去接觸了也是無用功,你在那裏有了投資就打水漂。所以你的最優策略也是消滅它。

沒有人會偏離這個策略均衡。

當然,我們這裏只給了兩個策略,一個更合理的假設是還有一個策略,就是不管它。不管它就不用支付消滅的成本。但是不管它是有風險的,也就是它技術爆炸了跟你搶資源——而資源是有限的。只要這個期望損失大於消滅的成本,消滅還是最優的;你可以說,我不一定活到最後和他搶資源,我規劃這麽久幹嘛?答案是你以一定的概率會活到最後,所以再算一個期望損失,再接著權衡,也是會消滅它的。

我們看看什麽樣的文明會選擇消滅。

我畫了一個直觀的圖。當然這是高度簡化的,當一個文明被暴露的時候,另一個文明A要選擇要不要消滅它。消滅就走D,不消滅就走ND。無論選什麽,這個被暴露的文明都以一定的概率發生技術爆炸,我們假設這個文明技術爆炸到可以和A進行生存競爭並淘汰掉A的概率為p,被A淘汰掉的概率為1-p。

A如果消滅它,支付的成本是C。如果消滅了他,A生存下來因此獲得效用1,再減去成本C;如果不消滅它,被他淘汰的支付是0,把它淘汰的支付是1,。可以看到這是一個固定支付1-c,以及隨機支付0或者1之間的權衡。

這時候我們看A如何選擇,這取決於它的期望支付。

容易知道,A選擇D的期望收益為1-C,選擇ND的收益為1-P,因此有:

命題 1 :劉慈欣的「黑暗森林法則」成立的前提是 C 小於 P ,也就是消滅的成本足夠小,或者技術爆炸的可能性足夠大。

有趣的是,這兩個條件在書中都有特別重要的強調。

首先,從消滅成本上看,書中對每一次淪陷都強調「成本低」。地球人為了試驗黑暗森林法則而消滅的一個星球以及三體文明的母星,都受到了「光粒打擊」,也就是發射光粒催動這個星系的恒星打擊,之所以這樣就是因為成本低,這也是地球應對打擊進行一系列活動的前提;而地球被消滅是受到了「二項箔」打擊,這種方法也被強調,雖然容易帶來宇宙維度的降低,但因為成本低所以大家都在使用。


其次,技術爆炸的可能性不但促成了黑暗森林法則的成立,也帶來一個「解套」的策略,也就是釋放善意訊號的策略。這個策略就是把整個星系變成一個「黑域」,光無法逃逸出去。這樣做的目的不是為了隱藏自己,而是由於黑域內的一切都無法超越光速,所以技術被鎖死了,一個被鎖死的文明,相當於P收斂到0,自然就不構成威脅,因此消滅它純粹是浪費成本了,就不會被消滅。這就是「善意訊號」的釋放。


把這個簡單的框架推廣到多個文明多個時期,容易出現以下問題:

第一、締約的可能性 ,兩個文明為了對抗更強大的文明選擇締約,然而我們上文已經說過,如果給定其他文明一定會消滅暴露的文明,締約也就成了白費力氣,所以任何文明不會改變「消滅」這個策略;

第二、搭便車 ,也就是既然總有人消滅它,我就可以不去消滅了,對於這個問題,有可能的情況是一個「智豬博弈」,也就是能力最高的文明一定會消滅,能力低的文明可以搭便車,然而這裏的問題是,大家都不知道宇宙中有沒有其他文明,有多少,也不能對技術的分布有一個概率上的認識,甚至不知道自己在技術分布中的位置,但是由於宇宙如此之大,任何一個小概率事件發生的可能性都收斂到1,而生存與否的大事應該是盡量減少風險,所以黑暗森林法則應該是穩健的。


我們再做一個練習,看看所謂的威懾紀元的問題。這裏需要引入另外一個概念,叫子博弈完美均衡。


在小說中,三體文明想要侵略地球,然而地球人發現了黑暗森林法則,從而對三體文明構成了一個威脅:如果你來侵略我,我就會把你的座標釋出出去(於此同時地球的座標也被暴露了,從而同歸於盡),這構成了對三體文明的威懾,這就是所謂的「威懾紀元」的開始。


威懾紀元持續和很多年,直到發射座標的權利結交給下一任的幾秒之後。 奇怪的並不是它結束得如此之快,而是它竟然結束得如此之慢。 因為這個威懾並不是可置信的。果然,在三體文明摧毀地球發射裝置的間隙,主角程心仍然沒有暴露三體文明的座標。


這裏有一個動態博弈,首先三體文明選擇入侵不入侵,然後地球文明選擇暴露不暴露,這個博弈就如同新企業進入的博弈。如果地球暴露了三體的座標,二者同歸於盡,如果地球不暴露的話,三體文明如果入侵,就比不入侵強,於此同時,地球被占領也比直接被消滅強(在小說中三體文明占領地球之後會把所有人類趕到澳洲,並沒有趕盡殺絕),我們給支付賦予一定的值使其不失去上述偏好的順序。

上圖刻畫了這個博弈。參與人T和E分別代表三體文明和地球文明,T的策略包括I(入侵)和NI(不入侵),E的策略包括S(釋放座標訊號)和NS(不釋放)。如果地球釋放了訊號,二者的座標都會暴露,因此同歸於盡,支付為0。如果地球不釋放訊號,三體入侵的話他們只能被趕到澳洲,所以支付為0.1,如果不入侵他們的支付是1。對三體星來說,入侵當然比不入侵好,所以支付分別為2和0.5。

容易知道,地球(S,NS),三體NI是一個拿殊均衡,也就是地球選擇:在三體入侵的時候釋放訊號,在三體不入侵的時候不釋放訊號,三體選擇:不入侵。這也就構成了書中描述的「威懾紀元」。


但這個均衡是子博弈完美的嗎?這個博弈有三個子博弈,其中後兩個,也就是在E的節點之後的子博弈,這個策略在這倆子博弈上還是最優的嗎?

容易知道,這個均衡不是子博弈上最優的的,因為一旦三體選擇了I,在這個子博弈下,地球的最優反應是NS,去澳洲總比被摧毀好。所以,唯一的子博弈精煉均衡是地球無論如何都不釋放訊號,三體入侵。


我想之所以能夠維持威懾紀元,一個可能是以前的座標發射權持有者邏輯,是一個有點讓人摸不著頭腦的人,不是正常人,三體文明忌憚他的不按常理出牌,他的非理性可能會帶來它們的淪陷。總之,有:

命題2 :地球對三體文明的威懾構成拿殊均衡,但不是子博弈完美拿殊均衡,因此是不可置信的威脅。



最後我們討論一個關於黑域是不是可置信承諾的問題。這裏引入不完全資訊均衡,這個均衡要求參與人對參與人類別形成某種信念,而均衡和信念是一致的。


上文已經提到,任何一個被暴露的座標都被看做是威脅,惡意的存在,那麽,存在一個善意的訊號,讓其他文明一看就知道這不是威脅,從而不去消滅嗎?劉慈欣認為是存在,也就是制造一個「黑域」,這就如同一個巨大的黑洞,光無法從中逃逸。當然,黑域之所以是善意的,不是因為隱藏了自己的身份,認識放棄了超光速的可能性,從而鎖死了技術。換句話說,所謂的善意訊號,就是證明我不會再以後的生存競爭中威脅到你,那麽你自然也就不用費心思現在就消滅我,讓我自然被淘汰就好了。

在這裏做一個小小的引申,設想一個神級文明,如果它不小心暴露了,他會不會鎖死自己的技術來保全自己呢?答案是不會,如果它的能力足夠大,就不怕被消滅掉,鎖死了技術反而使得自己以後被消滅了。因此制造黑域的可能只有技術水平低的文明,或者確切說,認為自己技術爆炸概率低的文明。

問題就是,存在不存在一個分離均衡,只有技術低的文明制造黑域,技術高的文明不制造黑域,並且其他文明具有與之一致的信念,看到黑域就認為你以1的概率是低技術文明並且是沒有威脅的,看到沒有黑域就認為你以0的概率是低技術文明,從而要消滅你?

這裏的問題是,由於宇宙是一個黑暗森林,人們不知道究竟有多少文明,以及自己在技術分布中的位置。在這種情況下,一個均勻分布是最保險的。考慮兩種情況:一,所有文明認為其他n-1個文明的技術服從(0,1)的均勻分布;二、所有文明認為其他文明中的技術水平最高的文明服從(0,1)均勻分布,這種情況等價於第一種情況下n=2時。

在本文的第一部份,技術爆炸的可能性越大,被攻擊的可能性也越大,然而這個技術爆炸的可能性是「其他」文明認為的你的技術爆炸的可能性,由於其他文明無法直接觀測你的情況,所以它只能賦予一個平均的先驗概率。至於你真實的技術爆炸水平,應該是和你現有的技術水平正相關的,而你現有的技術水平越大,越不容易被其他文明幹掉。所以我們有:

假設 1 :文明現有的真實技術水平越大,技術爆炸的可能性越大,被其他文明消滅的可能性越小,而文明真實的技術水平不影響其他文明對其技術水平的先驗信念。

假設 2 :黑暗森林法則成立,任何暴露的文明都會被攻擊,並且當其他文明的技術水平超過本文明的時候,才可以消滅本文明。


由於輸入公式麻煩,我這下邊直接從word截圖,請見諒。

其含義是直觀的:這是一個以小於1的概率獲得兩期的收益,和以固定為1的概率獲得一期收益的trade-off。技術水平低的文明,獲得第二期收益的概率(技術爆炸的概率)也較低,從而寧可以1的概率只獲得一期收益,而技術水平高的文明則不願意這樣。這時技術水平低的文明以鎖死技術發展為代價殘存一段時間,而技術水平高的文明以第一階段的風險為代價,進入生存競爭階段。從而前者制造黑域,後者不制造,實作了分離均衡,同時這個均衡和其他文明的信念是一致的。


這裏很容易可以算出來,門限是0,618(黃金分隔數!),當低技能的分布在(0,0.618)高技能分布在(0.618,1)的時候,分離均衡存在。


命題 3 :黑暗森林法則成立的前提下,當兩種文明的技術被黃金分割比例分開的時候,分離均衡存在,黑域是可置信的善意訊號。


如此巧妙的結果讓我相信我發現了宇宙的真理。