當前位置: 華文星空 > 知識

AI離全社會普及,只差一個計算中心?

2021-07-09知識

原標題:AI離全社會普及,只差一個計算中心?

誰成為AI的領導者,誰將統治世界!

文丨華商韜略 張靜波

過去十年,人工智能(AI)大爆炸,並第一次走進普通人的生活。

但蓬勃發展的AI卻碰到一個空前棘手的問題:自2012年以來, AI算力需求6年增長30萬倍,遠超摩爾定律!

人類現有的基礎設施,已跟不上AI算力需求的增長。未來,該怎麽辦?

【1】

一百多年前,人類也曾面臨同樣的難題。

1866年,德國西門子發明自激發電機,開啟了人類的電力時代。

此後十幾年,雖然很多企業紛紛采用電能這種新的動力,但一台電機只能供應一棟房子或一條街道的現狀,制約了電力的進一步普及。

直到1882年, 愛迪生在珍珠街建起了第一個中央發電廠,照亮了整個曼哈頓。

與一百多年前相比,今天的世界正發生翻天覆地的變化。

自1946年第一台電腦誕生以來,算力逐漸成為新的電力,推動人類社會不斷從物理世界向數碼世界遷移。

在此期間,人類對算力的需求不斷增長。尤其 2012年以後,隨著深度學習等演算法的突破,AI第一次走進普通人的生活。

一方面,AI的套用場景越來越多,從語音、目標辨識,到智慧工廠、智慧城市……乃至戰爭中的武器。

另一方面,AI模型的大小、演算法參數也呈幾何級增長,鵬城實驗室最新釋出的「鵬程.盤古」預訓練大模型, 擁有驚人的2000億個參數!

這樣的大模型,以及越來越廣泛的套用場景,對AI算力的需求呈現爆炸式的增長。

幾年前,谷歌AI負責人傑夫·迪恩(Jeff Dean)曾預言:「我們真正需要的是超過現在100萬倍的計算能力,而不僅僅是幾十倍的增長。」

即便如此大膽的預測,也還是顯得太保守。

事實上,從2012年到2019年, 短短七年,人類對AI算力的需求增長了30萬倍, 平均每100天就會翻倍,遠超摩爾定律。

與此同時,AI算力的實際增長卻有限,需求和供給之間形成一個巨大的鴻溝。

為了填補這個鴻溝,一種新的AI基礎設施誕生了,它就是: 人工智能計算中心。

在此之前,人類建過許多大型的計算中心。比如,我們熟知的超算中心,集中了一個國家或地區的最強算力,主要用於科研。

還有阿裏、華為等雲廠商興建的雲端運算中心,基於雲平台,向全社會提供大數據的計算、儲存等服務。

它們雖然也對外提供AI算力,但畢竟不是主業。

人工智能計算中心專為AI打造,主要用於AI模型的開發、訓練和推理,能夠為全社會提供AI所需的專用算力。

這種新的AI基礎設施,自誕生之日起,就成為全球主要AI大國的角力場。

比如,美國投資18億美金,計劃在全國打造三個E級超算,其中一個的算力,超過目前全球十大超算的總和。

德國早在2018年就推出國家級人工智能戰略,並資助一批高校建設人工智能計算中心。

中國也先後建成了 深圳鵬城雲腦和武漢人工智能計算中心。還有多個城市已開工或者正在籌建人工智能計算中心。

在政府主導下,許多頭部企業也紛紛下場。谷歌自研AI專用的TPU芯片,並透過雲平台對外輸出AI雲服務。

微軟也宣布,斥資10億美元,構建一個AI計算平台。

在中國,阿裏投入重金,建立超大規模機器學習平台。而 華為,更是鵬城雲腦和武漢人工智能計算中心背後的建設主力軍。

蓬勃發展的AI產業,無限放大了全社會對算力的需求。

為了邁過這道鴻溝, 全世界以政府主導、頭部企業參建的模式,正掀起一場AI算力的軍備競賽。

【2】

在人工智能計算中心出現前,人們是如何解決AI算力問題的呢?

除了超算中心和雲端運算中心「兼職」外,更多靠企業自建。例如,谷歌早期就用GPU來加速。後來,為了訓練AlphaGo,開發了TPU芯片。

但像谷歌這樣財大氣粗的企業,畢竟是少數。 更多的企業,缺乏足夠的資金來搭建自己的AI算力。

勉強搭起來,算力也有限。而且 不同企業的算力,還分散在全國,各自為政。

以這樣的算力,很難訓練出大模型,更別提GPT-3這種超級大模型。而後者,是推動AI技術不斷進步、產業不斷發展的關鍵。

這有點類似於愛迪生修建珍珠街中央發電廠之前的情況。

彼時,電力還屬於少數有錢人或大企業的奢侈品,門檻高,難普及。直到愛迪生修建中央發電廠,改變了這一情況。

未來, AI產業要想大發展,同樣需要降低算力門檻。

類似OpenAI那樣,花1200萬美元,訓練一個GPT-3模型的事情,很少有企業或個人負擔得起。

解決的辦法是, 像愛迪生建中央發電廠一樣,在各地集中建設AI基礎設施,也就是人工智能計算中心,降低AI的算力成本。

一個人工智能計算中心,就像一個電廠,通常包含機房,以及各種軟硬件設施。

比如,鵬城雲腦就長這個樣子:

還有大名鼎鼎的谷歌TPU伺服器機房:

人工智能計算中心,一改過去AI算力分散的局面。

在地方政府的產業政策引導下, 透過集中建設,這種AI基礎設施可將算力普惠地輸出給全社會,包括企業、科研機構和高校。

過去,訓練一個大模型,動輒上千萬美元。如今,企業和開發者,可按需租用算力,花小錢辦大事, 極大地降低了門檻,加速了AI創新。

這一點,對於AI產業的繁榮,極為關鍵。

就像電廠一樣,人工智能計算中心首先是一個 公共算力服務平台。

但,光有算力還不夠。電廠之所以是社會經濟的發動機,背後是一個生態,包括上下遊產業鏈、器材廠商和終端使用者,等等。

因此,人工智能計算中心除了是一個算力服務平台,還是一個 AI產業聚集發展平台 ,能夠聚合AI產業鏈上的各類公司,包括演算法公司、數據處理公司、行業整合公司等,形成完整的產業閉環,促進和推動AI產業集群發展。

此外,它還是一個 套用創新孵化平台 ,透過開發者AI創新,與本地優勢產業(如制造、醫療、交通、智能電動車等)相結合,讓技術轉化為產業價值,帶動當地產業智能化升級。

以武漢為例,庫柏特的智能機器人在武漢人工智能計算中心的支持下,透過視覺處理演算法創新, 其機械臂每次抓取藥盒的拍照時間,從過去200毫秒縮短至50毫秒!

武漢市政府計劃,到2023年孵化60個以上類似的AI深度套用場景,形成AI套用示範專案超過100個。

人工智能計算中心也是一個 科研創新和人才培養平台 ,為將來儲備技術和人才。

目前,經教育部批準設立AI本科專業的高校已達200余所。有了人工智能計算中心,這些院校可聯合行業龍頭企業,基於前者充沛的算力,開展技術研發和關鍵人才的培養。

在深圳,鵬城實驗室就依托「鵬城雲腦Ⅱ」,聚集了31位元院士和2000多名科研人員, 使得深圳一躍成為國內AI人才高地。

今天的中國,正在打造國家新一代人工智能創新發展試驗區。

人工智能計算中心 透過「1個中心+4個平台」,形成一個完整的算力生態, 徹底打通了「產」「學」「研」「用」全產業鏈,滿足了國家和地方對人工智能產業發展的需求。

從這個意義上講, 人工智能計算中心是中國發展人工智能產業的最佳路徑。

未來,小到手機、人臉辨識,大到無人駕駛、工業機器人……人工智能計算中心將為全社會的智能化,提供源源不斷普惠充沛的AI算力,從而托起中國經濟的明天。

【3】

先行一步的武漢和深圳,已經看到了這種希望。

在武漢,華為助力打造的人工智能計算中心,AI峰值效能可達100PFlops(1P相當於每秒1000萬次浮點運算)。

在深圳,基於華為Atlas 900集群的「鵬城雲腦Ⅱ」可提供世界頂級算力, 在最新一期IO500榜單中位居榜首,其全系統輸入輸出效能得分是排名第二的近20倍。

武漢和深圳之外,包括成都在內,全國多個城市也在積極籌建人工智能計算中心。

充沛的算力,給當地乃至全國經濟註入了強勁的動力。

從深圳到武漢,再到已開工的成都, 中國在興建人工智能計算中心的路上,再次展現了「基建狂魔」的本色。

但同時,我們也要清醒地看到,在這個事關未來的AI基礎設施建設上,我們還存在短板。

過去十年,中國在目標辨識等AI套用上,領先於世界。

可當我們向上捅破天,低下頭來建人工智能計算中心時才發現: 與西方先進水平相比,自己在AI根技術上還有不小的差距。

電廠的核心是發電機組,人工智能計算中心的核心是芯片。

過去,無論超算還是雲端運算中心,多采用CPU+GPU組合。如今,人工智能計算中心加入了NPU等異架構處理器,以多樣化算力,加速AI計算。

NPU是一種AI專用芯片,可在電路層模擬人類的神經元和突觸。 與傳統芯片相比,AI算力有數十上百倍的提升。

下圖對比了CPU、GPU和TPU(谷歌開發的NPU)的數據處理方式。

NPU的這種大吞吐量,對於需要數據清洗、模型生成、訓練和推理的AI計算來講,優勢尤其明顯。

美國排名第二的打車軟件Lyft,自從用了谷歌Cloud TPU,也就是雲上AI算力後,以前幾天才能幹完的活,現在幾小時就搞定了。

但無論CPU、GPU,還是NPU, 國內企業在這些底層芯片上的積累,還比較薄弱。

CPU、GPU幾乎被英特爾、AMD和輝達三家公司壟斷。 NPU相對好一些,華為有昇騰系列,寒武紀也開發了思元系列。

而這,還只是硬件問題。

軟件方面,人工智能計算中心是一個算力多樣化的平台,如何將眾多異架構芯片放在一起還能相互相容,需要統一的編程框架。

當年,輝達為了將圖形處理芯片GPU用在通用計算上,開發了CUDA。如今, 華為為了提高開發效率,設計了異構計算架構CANN。

演算法是AI的核心。

全世界每天都在產生新的演算法和模型,開發者不需要從頭學習,但他們需要一個統一的AI演算法平台和框架。

目前,全球大多數開發者都選擇了谷歌的TensorFlow和Facebook的Pytorch。

國內企業最初在這個領域一片空白,後來才有了 華為的MindSpore和百度的飛槳, 但在開發者人數上,與對手還有不小的差距。

有了芯片,有了編程平台和AI框架,再往上,就到了AI套用軟件開發平台。

在這一層上,國內企業實力不俗,阿裏有PAI,華為有ModelArts,百度有AI Studio。開發者們在這些平台上,最終做出賦能千行百業的APP。

根技術是AI的基石,只有根深,才能葉茂,才能從底層釋放出充沛的算力,支撐起整個AI頂層套用的全面繁榮。

這種從底層算力釋放,到頂層套用使能的AI全棧能力,可以用下圖一覽全貌:

從圖上可知,谷歌無疑是AI能力最強也最全面的科技公司之一。 在國內,擁有類似能力的企業屈指可數,華為算是一家。

2017年,AlphaGo擊敗李世石後不久,俄羅斯總統普京曾告誡國內師生: 未來,誰成為AI的領導者,誰就將統治世界!

人工智能(AI),毫無疑問,已成為全球大國角力的主戰場,並在某種程度上,決定了一個國家或地區未來的命運。

早在2017年就釋出人工智能國家戰略的中國,將AI視為重大的戰略機遇,並希望到2025年成為人工智能的世界領導者。

為了實作這一目標,我們還有很多的事情需要做。這其中,最重要、最緊迫的事情之一,就是 興建更多的人工智能計算中心。

從這個意義上講,鵬城雲腦和武漢人工智能計算中心的落成,也只是 這場世紀大戲的開場白而已。

——END——

歡迎關註【華商韜略】,識風雲人物,讀韜略傳奇。

版權所有,禁止私自轉載!

部份圖片來源於網絡

如涉及侵權,請聯系刪除