近日,瑞士創新企業FinalSpark公司釋出了全球首款生物處理器,這一突破性技術利用人腦類器官中的生物神經元進行驅動,其功耗比傳統數碼處理器低一百萬倍,引發了業界對「生物電腦」的廣泛關註。這裏的「生物電腦」其實指的是利用人類神經元進行計算的新一代生物處理器,但是過去談及「生物計算」,人們更多指的是透過超級電腦提供加速、以生物大分子作為數據和研究物件的一個研究領域,至今已經發展了幾十年。今天我們要介紹的主角,就是十幾年來在全球生物計算領域占據主導地位、默默書寫著王者傳奇的專用超級電腦安騰Anton。
超級電腦安騰Anton於2007年由美國D.E. Shaw Research機構推出,專註於生物計算領域的分子動力學模擬加速。由於超算安騰的「目標專註」,它在執行分子動力學模擬任務時甚至比通用超算Top500榜首的最強超算前沿 Frontier還要高出50倍以上。憑借其在高效能計算領域的出色表現,安騰超級電腦曾兩度榮膺高效能計算領域的最高榮譽——「ACM哥頓貝爾獎」。
安騰超級電腦 圖片來源: David E Shaw研究所
為什麽超算安騰可以做到如此驚人的計算效率?
中國科學院院士、北京航空航天大學教授錢德沛在接受【中國科學報】采訪時就曾談到,「美國D. E. Shaw研究所就用專門設計的ASIC芯片搭建了分子動力學模擬專用電腦(Anton),透過演算法創新和軟硬件協同,在分子動力學模擬中獲得了比通用電腦高出百倍的計算能效,這是非常值得我們借鑒的。
超算安騰的前世今生:出身名門,專註分子動力學加速,為推動生物計算而生
安騰超級電腦(Anton)的發明者,大衛·E. 肖(David E. Shaw),是美國量化投資領域的領軍人物,曾任奧巴馬政府科技顧問,同時也是亞馬遜創始人貝索斯的昔日上司。【福布斯】雜誌贊譽他為「量化投資之王」,其個人資產約為41億美元,位居全球財富榜300名。
David E Shaw博士 圖片來源: 網絡
在臨近五十知命之際,這位金融巨擘果斷轉型投身於生物計算。因為當時David E. Shaw深刻認識到,相較於金融,生物計算對社會的影響更為深遠,更契合個人價值追求。他從朋友那裏了解到,分子動力學模擬(molecular dynamics)能顯著加速從分子水平理解生命過程(biological processes),不僅推動基礎科學研究,還能加速諸如癌癥等重大疾病的藥物研發。
然而長久以來,分子動力學模擬因計算效率低下的問題,難以在業務場景中套用。舉例來說,人體內典型的大分子蛋白質往往由幾十萬到上百萬個原子構成,假設用分子動力學模擬方法計算模擬一個有著50萬原子的蛋白質的0.001秒的瞬間動態,即使動用10000顆CPU平行計算,也需要耗費超過100年的時間。
為突破這一技術難題,David E. Shaw利用他在金融市場積累的財富,首先組建了一支由全球最頂尖博士組成的精英隊伍。在當年,他給每位博士開出的年薪高達10萬美元,這幾乎是常規科研崗位薪資的2-3倍。
David E. Shaw與團隊的策略,是借助超算來解決計算效率低下的問題。
為什麽選擇用超算來破局?這是因為超算具有極高的計算速度和處理能力,能夠在極短的時間內處理龐大的數據和復雜的計算任務,一直用來解決解決復雜的科學、工程和商業問題。
而Shaw博士和他團隊的創新之舉是,他們認為術業應有專攻,區別於通用超算的廣泛套用場景,他們專門設計出了一款能夠專門套用在生物計算場景,專註於分子動力學模擬加速的超級電腦——這便是安騰誕生的故事。
為了實作專用這一目標,在硬件上,超算安騰的芯片、主機板、布線都由D. E. Shaw研究所特殊設計。透過特殊設計的專用芯片,可以盡可能減少數據的傳輸和運算,在芯片上分區域、分精度計算不同任務,突破制約分子模擬速度的瓶頸——原子間相互作用力的計算。與硬件相匹配的是軟件,D. E. Shaw研究所也專門設計了適配安騰的動力學模擬軟件Desmond。
於是,在2007年,這一群技術天才們終於研發成功,這台專用超級電腦正式問世,並命名為安騰(Anton)。
安騰之名,取自「顯微鏡之父」安東·範·列文虎克(Anton van Leeuwenhoek),因為他制作了高精度光學儀器,並首次利用這些儀器觀察到各種各樣的生物體和細胞類別,開啟了對微觀世界探索的新紀元。超算安騰,正是對這份探索精神的傳承與超越,於計算領域中續寫探索微觀世界的新篇章。
超算安騰極大提升藥物研發效率 技術價值被資本市場高度認可
在超算安騰問世後,它的技術價值真正被廣泛知曉,就是在2016年它幫助美國AI制藥公司Relay Therapeutics成功研發了一款治療膽管癌的藥物,一舉打破了藥物研發領域的「雙十」魔咒,即研發一款新藥的投入至少需要十年、十億美金以上。
2016年,Relay在超算安騰的支持下,對藥物靶點和成藥小分子的結構進行分子動力學模擬和篩選設計,僅用18個月、不到1億美金就確認了一款用於治療膽管癌的高選擇性FGFR2抑制劑藥物RLY-4008的結構,並且順利進入了美國FDA的臨床II期試驗,極大程度地縮短了從藥物發現到臨床前研究近90%的投入時間和成本。
為何超算安騰可以將藥物研發效率提升如此之高?
首先,Relay重塑了藥物研發的技術路徑,將行業內對於蛋白質靶點的理解從過去的靜態檢視轉變為基於蛋白質運動的動態檢視,從傳統的基於蛋白質靜態的藥物設計(Structure-based Drug Design,SBDD)轉向基於蛋白質動態的藥物設計(Motion Based Drug Design(TM),MBDD)。
圖片來源:Relay官方
同時,Relay開創性地構建了基於運動的藥物設計平台——Dynamo Platform,該平台整合了8種實驗技術(例如室溫晶體學等)和8種計算方法(例如分子動力學模擬等),用於落地Relay提出的MBDD藥物研發路徑。
在完成整個MBDD的過程中,Dynamo平台的底層都是透過超算安騰來支撐進行模擬計算。
除了確認RLY-4008結構的案例外,Relay還曾試圖研究野生型和突變型蛋白質,並使用如室溫X射線和冷凍電鏡,然後再用超算安騰來模擬蛋白質隨時間變化的影像。與其他藥物研發公司相比,Relay宣稱其模擬速度比他們快上100倍。 對於一個有100萬個原子基準蛋白的衛星菸草鑲嵌病毒,在傳統硬件上(Nvidia V100)需要271天才能完成,而在超算安騰上只需要一天。
資本市場對Relay Therapeutics的高認可度,也間接證明了超算安騰的技術價值。
Black Diamond與Relay Therapeutics同為專註於藥物小分子研發的平台,並且兩者均僅有一個藥物進入臨床一期候選階段,但在首次公開募股(IPO)當天,兩者市場估值呈現出明顯差異。Black Diamond當天市值12.24億美元,而Relay Therapeutics當天市值是Black Diamond的兩倍多,為30.45億美元。
Relay Therapeutics之所以能贏得資本市場的如此青睞,是因為它與David E. Shaw研究所的簽署了獨家戰略合作夥伴關系,協定約定,雙方將合力進行特定靶點化合物的研發與商業化。雙方科學家需要在每一個專案上合作,充分利用David E. Shaw研究所的計算建模技術,尤其是透過安騰超級電腦來研究蛋白質的動態行為,特別聚焦在藥物發現階段提出動態基礎假設和辨識先導化合物。
可見,超算安騰不僅是生物計算領域的一項革命性創新,更是推動藥物研發進入新時代的強力引擎。安騰超級電腦不僅代表了計算技術向專業化的深度探索,預示著生物科學與計算科學交叉融合的無限可能,也證明了專註於細分領域的深度技術創新能夠帶來顛覆性的改變。未來,類似超算安騰這樣尖端科技將在加快疾病治療行程、推動精準醫療實踐方面扮演愈發重要的角色,持續鼓舞著科研工作者與企業勇闖科研無人區,不懈追求創新突破。