近日,上海巖芯數智人工智慧科技有限公司(以下簡稱RockAI)的Yan架構大模型成功透過【生成式人工智慧服務管理暫行辦法】備案, 這是國內第一個非 Transformer 架構大模型透過備案。
Yan 模型簡介
Yan架構大模型是國內第一個非Transformer架構、非Attention機制的大模型。傳統的Transformer架構和Attention機制對算力要求較高,而Yan架構大模型以MCSD、類腦啟用機制為基礎原理,大幅提升模型效能與效率,以3B參數量可達到Llama3 8B的水平,還可在CPU上執行部署。MCSD架構具有快速訓練、推理能力,實作更高效的特征提取,類腦啟用機制則模擬大腦中的神經元啟用模式,在計算時選擇性啟用部份參數,減少算力冗余,更高效地解決問題。 Yan架構大模型在保證效能的同時,有效降低了對算力的依賴 。這不僅有助於提高模型的執行效率,還能降低成本,為更多企業和開發者提供了觸手可及的AI解決方案。
備案透過的價值
因此,Yan架構大模型透過備案對於RockAI以及行業發展均具有重要價值。
· 為行業發展開辟新的技術路徑
作為國內第一個非Transformer架構、非Attention機制大模型完成網信辦備案,為行業發展開辟了新的技術路徑。
· 證明非 Transformer 技術路線的潛力
證明在算力受限的情況下,非Transformer架構技術路線的可行性和潛力,從而能夠鼓勵更多企業探索多元化的技術發展方向。
· 業內唯一一家同時擁有雙機制模型
RockAI成為唯一一家非Attention機制大模型和Attention機制大模型均備案透過的廠商,彰顯了其在AI技術研發方面的創新能力。
Yan 落地情況
技術突破之外,商業落地層面Yan架構大模型也取得了顯著成果。依托低算力要求、本地部署、無失真執行等優勢,RockAI已與機器人、無人機、手機、電腦等領域的裝置廠商建立深度合作,並在上述領域落地多個計畫。
RockAI在大模型領域以「群體智慧」的理念構建通用人工智慧技術,以「讓世界上每一台裝置擁有自己的智慧」為使命,致力於打造群體智慧單元大模型,實作AI普惠。Yan架構大模型的備案透過是RockAI踐行使命的重要裏程碑,未來,我們期待Yan架構大模型在更多裝置單元部署套用,讓群體智慧引領走向通用人工智慧,與合作夥伴一起,領先一步開拓更加廣闊的市場空間。