AI離全社會普及，只差一個計算中心？

2021-07-09知識

原標題：AI離全社會普及，只差一個計算中心？

誰成為AI的領導者，誰將統治世界！

文丨華商韜略張靜波

過去十年，人工智能（AI）大爆炸，並第一次走進普通人的生活。

但蓬勃發展的AI卻碰到一個空前棘手的問題：自2012年以來， AI算力需求6年增長30萬倍，遠超摩爾定律！

人類現有的基礎設施，已跟不上AI算力需求的增長。未來，該怎麽辦？

【1】

一百多年前，人類也曾面臨同樣的難題。

1866年，德國西門子發明自激發電機，開啟了人類的電力時代。

此後十幾年，雖然很多企業紛紛采用電能這種新的動力，但一台電機只能供應一棟房子或一條街道的現狀，制約了電力的進一步普及。

直到1882年， 愛迪生在珍珠街建起了第一個中央發電廠，照亮了整個曼哈頓。

與一百多年前相比，今天的世界正發生翻天覆地的變化。

自1946年第一台電腦誕生以來，算力逐漸成為新的電力，推動人類社會不斷從物理世界向數碼世界遷移。

在此期間，人類對算力的需求不斷增長。尤其 2012年以後，隨著深度學習等演算法的突破，AI第一次走進普通人的生活。

一方面，AI的套用場景越來越多，從語音、目標辨識，到智慧工廠、智慧城市……乃至戰爭中的武器。

另一方面，AI模型的大小、演算法參數也呈幾何級增長，鵬城實驗室最新釋出的「鵬程.盤古」預訓練大模型， 擁有驚人的2000億個參數！

這樣的大模型，以及越來越廣泛的套用場景，對AI算力的需求呈現爆炸式的增長。

幾年前，谷歌AI負責人傑夫·迪恩（Jeff Dean）曾預言：「我們真正需要的是超過現在100萬倍的計算能力，而不僅僅是幾十倍的增長。」

即便如此大膽的預測，也還是顯得太保守。

事實上，從2012年到2019年， 短短七年，人類對AI算力的需求增長了30萬倍， 平均每100天就會翻倍，遠超摩爾定律。

與此同時，AI算力的實際增長卻有限，需求和供給之間形成一個巨大的鴻溝。

為了填補這個鴻溝，一種新的AI基礎設施誕生了，它就是： 人工智能計算中心。

在此之前，人類建過許多大型的計算中心。比如，我們熟知的超算中心，集中了一個國家或地區的最強算力，主要用於科研。

還有阿裏、華為等雲廠商興建的雲端運算中心，基於雲平台，向全社會提供大數據的計算、儲存等服務。

它們雖然也對外提供AI算力，但畢竟不是主業。

而 人工智能計算中心專為AI打造，主要用於AI模型的開發、訓練和推理，能夠為全社會提供AI所需的專用算力。

這種新的AI基礎設施，自誕生之日起，就成為全球主要AI大國的角力場。

比如，美國投資18億美金，計劃在全國打造三個E級超算，其中一個的算力，超過目前全球十大超算的總和。

德國早在2018年就推出國家級人工智能戰略，並資助一批高校建設人工智能計算中心。

中國也先後建成了 深圳鵬城雲腦和武漢人工智能計算中心。還有多個城市已開工或者正在籌建人工智能計算中心。

在政府主導下，許多頭部企業也紛紛下場。谷歌自研AI專用的TPU芯片，並透過雲平台對外輸出AI雲服務。

微軟也宣布，斥資10億美元，構建一個AI計算平台。

在中國，阿裏投入重金，建立超大規模機器學習平台。而 華為，更是鵬城雲腦和武漢人工智能計算中心背後的建設主力軍。

蓬勃發展的AI產業，無限放大了全社會對算力的需求。

為了邁過這道鴻溝， 全世界以政府主導、頭部企業參建的模式，正掀起一場AI算力的軍備競賽。

【2】

在人工智能計算中心出現前，人們是如何解決AI算力問題的呢？

除了超算中心和雲端運算中心「兼職」外，更多靠企業自建。例如，谷歌早期就用GPU來加速。後來，為了訓練AlphaGo，開發了TPU芯片。

但像谷歌這樣財大氣粗的企業，畢竟是少數。 更多的企業，缺乏足夠的資金來搭建自己的AI算力。

勉強搭起來，算力也有限。而且 不同企業的算力，還分散在全國，各自為政。

以這樣的算力，很難訓練出大模型，更別提GPT-3這種超級大模型。而後者，是推動AI技術不斷進步、產業不斷發展的關鍵。

這有點類似於愛迪生修建珍珠街中央發電廠之前的情況。

彼時，電力還屬於少數有錢人或大企業的奢侈品，門檻高，難普及。直到愛迪生修建中央發電廠，改變了這一情況。

未來， AI產業要想大發展，同樣需要降低算力門檻。

類似OpenAI那樣，花1200萬美元，訓練一個GPT-3模型的事情，很少有企業或個人負擔得起。

解決的辦法是， 像愛迪生建中央發電廠一樣，在各地集中建設AI基礎設施，也就是人工智能計算中心，降低AI的算力成本。

一個人工智能計算中心，就像一個電廠，通常包含機房，以及各種軟硬件設施。

比如，鵬城雲腦就長這個樣子：

還有大名鼎鼎的谷歌TPU伺服器機房：

人工智能計算中心，一改過去AI算力分散的局面。

在地方政府的產業政策引導下， 透過集中建設，這種AI基礎設施可將算力普惠地輸出給全社會，包括企業、科研機構和高校。

過去，訓練一個大模型，動輒上千萬美元。如今，企業和開發者，可按需租用算力，花小錢辦大事， 極大地降低了門檻，加速了AI創新。

這一點，對於AI產業的繁榮，極為關鍵。

就像電廠一樣，人工智能計算中心首先是一個 公共算力服務平台。

但，光有算力還不夠。電廠之所以是社會經濟的發動機，背後是一個生態，包括上下遊產業鏈、器材廠商和終端使用者，等等。

因此，人工智能計算中心除了是一個算力服務平台，還是一個 AI產業聚集發展平台 ，能夠聚合AI產業鏈上的各類公司，包括演算法公司、數據處理公司、行業整合公司等，形成完整的產業閉環，促進和推動AI產業集群發展。

此外，它還是一個 套用創新孵化平台 ，透過開發者AI創新，與本地優勢產業（如制造、醫療、交通、智能電動車等）相結合，讓技術轉化為產業價值，帶動當地產業智能化升級。

以武漢為例，庫柏特的智能機器人在武漢人工智能計算中心的支持下，透過視覺處理演算法創新， 其機械臂每次抓取藥盒的拍照時間，從過去200毫秒縮短至50毫秒！

武漢市政府計劃，到2023年孵化60個以上類似的AI深度套用場景，形成AI套用示範專案超過100個。

人工智能計算中心也是一個 科研創新和人才培養平台 ，為將來儲備技術和人才。

目前，經教育部批準設立AI本科專業的高校已達200余所。有了人工智能計算中心，這些院校可聯合行業龍頭企業，基於前者充沛的算力，開展技術研發和關鍵人才的培養。

在深圳，鵬城實驗室就依托「鵬城雲腦Ⅱ」，聚集了31位元院士和2000多名科研人員， 使得深圳一躍成為國內AI人才高地。

今天的中國，正在打造國家新一代人工智能創新發展試驗區。

人工智能計算中心 透過「1個中心+4個平台」，形成一個完整的算力生態， 徹底打通了「產」「學」「研」「用」全產業鏈，滿足了國家和地方對人工智能產業發展的需求。

從這個意義上講， 人工智能計算中心是中國發展人工智能產業的最佳路徑。

未來，小到手機、人臉辨識，大到無人駕駛、工業機器人……人工智能計算中心將為全社會的智能化，提供源源不斷普惠充沛的AI算力，從而托起中國經濟的明天。

【3】

先行一步的武漢和深圳，已經看到了這種希望。

在武漢，華為助力打造的人工智能計算中心，AI峰值效能可達100PFlops（1P相當於每秒1000萬次浮點運算）。

在深圳，基於華為Atlas 900集群的「鵬城雲腦Ⅱ」可提供世界頂級算力， 在最新一期IO500榜單中位居榜首，其全系統輸入輸出效能得分是排名第二的近20倍。

武漢和深圳之外，包括成都在內，全國多個城市也在積極籌建人工智能計算中心。

充沛的算力，給當地乃至全國經濟註入了強勁的動力。

從深圳到武漢，再到已開工的成都， 中國在興建人工智能計算中心的路上，再次展現了「基建狂魔」的本色。

但同時，我們也要清醒地看到，在這個事關未來的AI基礎設施建設上，我們還存在短板。

過去十年，中國在目標辨識等AI套用上，領先於世界。

可當我們向上捅破天，低下頭來建人工智能計算中心時才發現： 與西方先進水平相比，自己在AI根技術上還有不小的差距。

電廠的核心是發電機組，人工智能計算中心的核心是芯片。

過去，無論超算還是雲端運算中心，多采用CPU+GPU組合。如今，人工智能計算中心加入了NPU等異架構處理器，以多樣化算力，加速AI計算。

NPU是一種AI專用芯片，可在電路層模擬人類的神經元和突觸。 與傳統芯片相比，AI算力有數十上百倍的提升。

下圖對比了CPU、GPU和TPU（谷歌開發的NPU）的數據處理方式。

NPU的這種大吞吐量，對於需要數據清洗、模型生成、訓練和推理的AI計算來講，優勢尤其明顯。

美國排名第二的打車軟件Lyft，自從用了谷歌Cloud TPU，也就是雲上AI算力後，以前幾天才能幹完的活，現在幾小時就搞定了。

但無論CPU、GPU，還是NPU， 國內企業在這些底層芯片上的積累，還比較薄弱。

CPU、GPU幾乎被英特爾、AMD和輝達三家公司壟斷。 NPU相對好一些，華為有昇騰系列，寒武紀也開發了思元系列。

而這，還只是硬件問題。

軟件方面，人工智能計算中心是一個算力多樣化的平台，如何將眾多異架構芯片放在一起還能相互相容，需要統一的編程框架。

當年，輝達為了將圖形處理芯片GPU用在通用計算上，開發了CUDA。如今， 華為為了提高開發效率，設計了異構計算架構CANN。

演算法是AI的核心。

全世界每天都在產生新的演算法和模型，開發者不需要從頭學習，但他們需要一個統一的AI演算法平台和框架。

目前，全球大多數開發者都選擇了谷歌的TensorFlow和Facebook的Pytorch。

國內企業最初在這個領域一片空白，後來才有了 華為的MindSpore和百度的飛槳， 但在開發者人數上，與對手還有不小的差距。

有了芯片，有了編程平台和AI框架，再往上，就到了AI套用軟件開發平台。

在這一層上，國內企業實力不俗，阿裏有PAI，華為有ModelArts，百度有AI Studio。開發者們在這些平台上，最終做出賦能千行百業的APP。

根技術是AI的基石，只有根深，才能葉茂，才能從底層釋放出充沛的算力，支撐起整個AI頂層套用的全面繁榮。

這種從底層算力釋放，到頂層套用使能的AI全棧能力，可以用下圖一覽全貌：

從圖上可知，谷歌無疑是AI能力最強也最全面的科技公司之一。 在國內，擁有類似能力的企業屈指可數，華為算是一家。

2017年，AlphaGo擊敗李世石後不久，俄羅斯總統普京曾告誡國內師生： 未來，誰成為AI的領導者，誰就將統治世界！

人工智能（AI），毫無疑問，已成為全球大國角力的主戰場，並在某種程度上，決定了一個國家或地區未來的命運。

早在2017年就釋出人工智能國家戰略的中國，將AI視為重大的戰略機遇，並希望到2025年成為人工智能的世界領導者。

為了實作這一目標，我們還有很多的事情需要做。這其中，最重要、最緊迫的事情之一，就是 興建更多的人工智能計算中心。

從這個意義上講，鵬城雲腦和武漢人工智能計算中心的落成，也只是 這場世紀大戲的開場白而已。

——END——

歡迎關註【華商韜略】，識風雲人物，讀韜略傳奇。

部份圖片來源於網絡

如涉及侵權，請聯系刪除