當前位置: 華文星空 > 心靈

RockAI國內首個「非Transformer架構大模型」Yan透過網信辦備案

2024-12-05心靈

近日,上海巖芯數智人工智能科技有限公司(以下簡稱RockAI)的Yan架構大模型成功透過【生成式人工智能服務管理暫行辦法】備案, 這是國內首個非 Transformer 架構大模型透過備案。

Yan 模型簡介

Yan架構大模型是國內首個非Transformer架構、非Attention機制的大模型。傳統的Transformer架構和Attention機制對算力要求較高,而Yan架構大模型以MCSD、類腦啟用機制為基礎原理,大幅提升模型效能與效率,以3B參數量可達到Llama3 8B的水平,還可在CPU上執行部署。MCSD架構具有快速訓練、推理能力,實作更高效的特征提取,類腦啟用機制則模擬大腦中的神經元啟用模式,在計算時選擇性啟用部份參數,減少算力冗余,更高效地解決問題。 Yan架構大模型在保證效能的同時,有效降低了對算力的依賴 。這不僅有助於提高模型的執行效率,還能降低成本,為更多企業和開發者提供了觸手可及的AI解決方案。

備案透過的價值

因此,Yan架構大模型透過備案對於RockAI以及行業發展均具有重要價值。

· 為行業發展開辟新的技術路徑

作為國內首個非Transformer架構、非Attention機制大模型完成網信辦備案,為行業發展開辟了新的技術路徑。

· 證明非 Transformer 技術路線的潛力

證明在算力受限的情況下,非Transformer架構技術路線的可行性和潛力,從而能夠鼓勵更多企業探索多元化的技術發展方向。

· 業內唯一一家同時擁有雙機制模型

RockAI成為唯一一家非Attention機制大模型和Attention機制大模型均備案透過的廠商,彰顯了其在AI技術研發方面的創新能力。

Yan 落地情況

技術突破之外,商業落地層面Yan架構大模型也取得了顯著成果。依托低算力要求、本地部署、無失真執行等優勢,RockAI已與機器人、無人機、手機、電腦等領域的器材廠商建立深度合作,並在上述領域落地多個專案。

RockAI在大模型領域以「群體智能」的理念構建通用人工智能技術,以「讓世界上每一台器材擁有自己的智能」為使命,致力於打造群體智能單元大模型,實作AI普惠。Yan架構大模型的備案透過是RockAI踐行使命的重要裏程碑,未來,我們期待Yan架構大模型在更多器材單元部署套用,讓群體智能引領走向通用人工智能,與合作夥伴一起,領先一步開拓更加廣闊的市場空間。