當前位置: 華文星空 > 心靈

AI落地:青雲科技的智算2.0

2024-11-15心靈

作為一項新興技術,AI憑借 ChatGPT讓大眾認識到了IT未來的方向,但是如何將其真正套用在企業套用當中,讓產業發展從中受益,至今依然沒有一個明確的落地實踐模式,因此存在諸多的探索空間。

「我覺得AI不能僅僅是技術,AI也不能僅僅只有訓練,也不能僅僅是打磨工具……我們還是要去發現和解決現實中最真實的需求,要解決最實際的問題,它才能產生真正的效益。」林源,青雲科技CEO日前青雲科技2024 AI 算力釋出會上強調:對於新興技術的套用,一方面是要降低其套用門檻,讓更多的人有機會擁抱新興技術,另一方面,則是要加速套用場景的落地,在現實套用當中,尋求對新興技術套用「最後一公裏」的突破。

事實上,對於整個IT產業而言,在過去的兩年時間裏,都在需求各種將「AI技術」落地為「AI套用」的模式:有些是在自身的產品當中融入更多的AI套用;有些是為企業提供套用AI的基本能力……雖然所有的努力都在很大程度上推進了AI企業級套用的步伐,但是對於企業使用者而言,這些支持都是碎片化的、彼此割裂的,需要企業自己去將這些能力「縫補」起來,才有機會構建屬於自己的AI能力——這實際上就再次讓企業使用者陷入到了IT套用的固有窠臼:技術門檻過高,信心很難建立。

事實上,AI作為一項必將被套用於企業級的IT新興技術,從技術角度講,套用其將為企業來帶諸多已知和未知的改變,如:AI套用需要GPU芯片,因此芯片的架構改變了;芯片的改變又帶來了整個伺服器架構的改變、網路連線方式的改變、數據儲存方式的改變……直至整個IT基礎設施的改變。更重要的是,企業開放套用的方式也會發生改變:以往基於作業系統、中介軟體、資料庫、大數據等進行的開放模式,將被各種模型代替。

「這是一場巨大的沖突,是一場擁抱新套用市場的驅動力與使用新技術之間產生的沖突。」在林源看來,要解決這樣一個矛盾,就需要一個從根本上降低技術門檻的方式。「PC時代我們有Windows,它幫我們管理我們不熟悉的CPU、快閃記憶體、網卡、螢幕,遮蔽我們不熟悉的硬體,同時向上支撐我們的套用;行動網際網路時代,我們有iOS、安卓,讓老人、小孩也能使用。那麽,到了AI時代,我們也需要有這樣的基石平台,這就是青雲的使命。」林源說。

一年前,青雲科技釋出了智算產品的1.0:一個AI算力排程平台、AI Cloud和AI生態同盟,將以往幾年時間內所積累的與AI相關的技術、產品、服務和生態進行了重新的排列組合。「一年過去,我們在產品的平台,生態、以及解決方案上都有了很大的進展。」林源說:「我們現在核心要解決兩方面的問題:一方面連線算力的供給方,同時也連線算力的需求方,就像作業系統一樣,一邊向下管理硬體,一邊向上支撐套用,從而為企業使用者提供一個套用AI的技術基座——青雲自創業至今已經17年,我們最擅長做的就是為企業使用者提供基座、平台和基礎軟體。」

在本次青雲科技的釋出會上,在產品和平台層面推出了更新的AI智算平台、AI算力雲服務,以及AI智算一體機產品。

「純軟體的AI 智算平台是一個大而全、覆蓋從底層裝置管理、上架、監控、效能,到上層的AI演算法最佳化等能力的平台。」苗慧,青雲科技智算產品經理:「青雲去年9月份釋出了1.0產品,以全新容器架構的形式提供了底層算力基礎設施排程管理到業務營運的功能,在過去的一年中,青雲又陸續推出了幾個產品來解決其他問題。」她說,在計算產品上,青雲提供統一集群架構來管理不同型號、不同廠商的計算卡,服務於不同的網路;在數據這一塊,青雲發現不同的業務場景下,如自動駕駛,自動駕駛是大量圖片、數據需要回傳,但是它只有部份數據需要計算,所以需要建設多地區、多中心的數據儲存服務,因此青雲提供內部的數據流轉服務,流轉到計算儲存產品上,透過GPU讀寫得到計算數據,然後再進行數據的刪除、備份等。同時,青雲還是為了降低演算法工程師管理數據的難度,將底層所有的數據基礎設施全部透過青雲AI數據平台服務化管理。網路層面上,青雲主要是提供高效能計算網路,一個是IB網路,一個是RoCE網,整體上還是RDMA通訊的調優。「作為純軟平台能力,青雲AI智算平台還提供AI開發與訓練平台、模型廣場、模型服務平台,以及營運與管理平台。同時,這一平台還可以進行算力中心的私有化交付、分布式雲的交付,以及邊緣雲的交付。」

如果有些客戶不想對自己的IT基礎設施大動幹戈,那麽青雲提供了AI算力雲服務將成為另外一種選擇。「青雲科技的AI算李雲以GPU算力為主,現在已經上線了西北1區、西北2區,華北1區,華北2區,為使用者提供一個線上的方式來並列獲取輝達H系列、A系列、RTX系列以及曙光和昇騰相關的卡,使用者可以線上申請、使用,進行線上分布式任務,透過使用AI 算力雲,演算法工程師可以立即得到算力服務及模型。」苗慧說。

與前兩者相比,青雲科技此次推出的AI智算一體機產品開箱即用、軟硬一體化的模式,獲取更加容易,私密性更容易得到保障,對於中小型科研單位、中小型研發團隊、中小型傳統企業更加適用。「透過AI智算一體機,使用者可以根據自己的需要得到自己的演算法產品和模型產品,因此從整體上來說,青雲對於演算法工程師和AI基礎設施之間要做到無界算力,為整個科研創新提供服務。」苗慧還強盜說,AI智算平台、AI算力雲服務整體背靠青雲技術專家,尤其是青雲有多年傳統雲端運算基礎、虛擬化基礎、容器基礎實戰經驗。在此基礎上,青雲科技有能力為企業使用者提供咨詢服務與規劃,提供可行性分析、面向不同場景的架構設計。「同時青雲還有7x24小時非常專業的技術專家團隊為大家服務。」她說。

然而在IT技術向套用轉化的過程中,單純依靠技術和產品的進階是完全不夠的。「基座是必需的,但是它不夠:因為太多的行業、太多的場景要落地時,有大量最後一公裏的問題要解決,所以僅有平台不夠,我們需要生態,最終服務於各個場景,這是我們在落地我們企業數位化,包括服務智算中心過程中的核心思路,非常開放。」林源說。

在本次釋出會上,青雲科技副總裁沈鷗詳細解讀了青雲科技關於AI生態圈建設的規劃和戰略部署。

「在算力方面,我們最主要做的工作是基於我們要往下承接、對接很多的算力裝置供應商。到目前為止,AI智算平台已經能支持輝達的全線產品。我們也跟英特爾合作做了相關的課題,如何在他們CPU加速器上實作AI的場景加速。同時,我們也在跟國內的一些CPU、GPU、DCU、MPU的一些廠商進行很多技術對接和驗證工作,包括有華為昇騰、曙光等公司——可以說,青雲科技正廣泛展開跟國產的GPU、DCU廠家的合作讓裝置發揮更好的效能,在降低成本的同時,能夠獲得所需要的智算支持、開發和執行的整套能力,更好發揮國產智算的能力。」沈鷗說:在模型服務方面,青雲正在與包括智譜、百川等在內的大模型廠商合作,在MaaS平台上,為企業使用者提供多種相關的大模型服務。與此同時,青雲科技還與「國內一些數據要素的廠商、AI開發鏈的廠商一起合作,希望能夠打造全面的數據服務和套用開發服務。」

沈鷗還強調說,青雲科技從2018年做雲原生底座的自主開發起,就強調計畫的開源內容,基於其開源計畫KubeSphere和雲原生開源社群,現在青雲科技提供的AI基座同樣可以更容易地對接第三方的AI能力,「我們在整個AI智算平台上會提供技術底座,還用到LuBan套用框架、Whizard可觀測性平台等能力,使我們跟第三方的生態合作對接和驗證過程中變得非常容易,同時保障整個平台的監測、故障診斷等——在與客戶保持同頻的基礎認知上,更容易在企業的實際套用中落地。」他總結說:「在過去這一年,我們推出了算力共贏計劃、算力加速計劃,模型市場共建等計劃,完成了整個生態適配138項,我們現有AI生態合作夥伴超過200+,這樣的合作夥伴給了我們很大的能力,讓我們能服務於各種行業的各種場景。在這些場景裏,也離不開合作夥伴的幫助。」

結合新釋出的技術和產品,和更全面完整的生態體系,此次青雲科技還針對不同型別、不同套用場景需求的企業,提供了具有針對性的十大套用場景。

「行業場景分為兩類:第一類,大家比較熟知的互聯網、人工智慧、自動駕駛,這種叫做新興的行業,他們肯定需要擁抱AI,同時他們也有很強的技術能力;但請大家不要忽略了,有需求的不僅僅是他們,還有大量的傳統行業,包括金融、醫療、生物制藥、高校、政務等。」對於此次提出的十大套用場景,林源強調這些「傳統行業」對於AI套用同樣具有一定的「迫切性」:「這型別企業使用者首先真實的需求;其次他們有大量的沈沒數據需要被啟用;最後,這些傳統企業更需要技術合作夥伴,因為他們在業務上非常的專業,但他們在技術上需要幫助。」

青雲科技智算解決方案總監 傅帥在介紹十大套用場景時強調:「AI的三要素就是算力、演算法和數據,在這裏面我想加一個維度:規模。」他認為,企業使用者套用AI的規模可大可小,可以是中心端,也可以是邊緣端,只有從這個維度考量,才會涉及到AI基礎設施。「所以我們的基礎設施是從中心到邊緣,從小規模到大規模,實作AI全領域、全覆蓋的能力。我們所做的工作是覆蓋青雲上層的行業和領域,為中國百行千業的客戶提供AI的支持和服務能力。」

寫在最後

一項新興技術如何才能真正發揮作用?也許需要考量的因素會有很多,但是歸根結底,在於是否能夠從全域把握解決問題的關鍵,並為使用者建立起嘗試的信心。AI的企業級套用才剛剛開始,一切都還存在無限可能。