衛星健康管理一直是航天業的熱門話題——對衛星的精心呵護可以極大延長衛星的「壽命」,從而節省衛星的建造和發射成本,因此,巨大的經濟價值蘊藏其中。如今,人工智能大模型正在這一領域初試牛刀。
2024年10月,西安中科天塔科技股份有限公司(以下簡稱「中科天塔」)釋出航天私域大模型「華山」,可透過語音、文本互動,實作航天器在軌管理和航天器管理人員培訓。 隨後,中科天塔完成近億元A輪融資,進一步加碼航天私域大模型產品。
當前,衛星互聯網已步入加速建設期。隨著在軌衛星數量的爆發式增長,衛星管理業務也將被同步推至新的數量級,人工智能的優勢和潛力愈發凸顯,這也是中科天塔CTO董衛華堅定看好大模型價值的初衷。
董衛華在接受【每日經濟新聞】記者專訪時坦言,業內一直對人工智能抱有很大的期望,而ChatGPT這樣的大語言模型的出現,為行業帶來了更多的技術手段和價值。 在董衛華看來,大模型至少會成為一個非常好的助手,同時,隨著研究的深入,大模型展現出來的能力很有可能完全顛覆整個衛星控制,實作完全的自動化和智能化。
衛星「醫生」期待人工智能
NBD: AI技術與衛星健康管理業務的接合點從何而來?
董衛華: 衛星健康管理的內涵可以分為三層。
第一層,在衛星出現故障後,地面人員(或系統)能夠對故障快速定位、快速解決;第二層,預測故障,有一些故障在發端之前是有端倪的,要能夠預測故障並及時處理; 第三層則是實作星上自動診斷,讓衛星能夠與地面人員共同「討論」、解決問題 。
第三層,也就是最後一層,目前還沒有實作,但這是大家共同追求的一個更大的目標,原因在於,前面兩層其實都需要地面工作人員的強力配合,但隨著衛星數量的增加,人力已經慢慢沒有辦法承擔這個工作量。
衛星數量增加後,相關專業知識也會累積得越來越多,僅靠一兩個衛星工程師很難完成這些知識的整理工作。例如,故障的條目盡管各自獨立,但故障之間其實有關聯性,在關聯性越來越多的時候,人腦很多情況下已經無法處理了。
特別是擔當衛星管理工作的一般都是基礎人員,他們本身對這個領域專業知識的掌握度就不足,難度也就更大了。因此, 業內通用的想法是,由電腦代替人來處理這些知識和關聯性,人則負責提供所需的技術支持。
此外,隨著深空專案的增加,時延的問題也會更加突出。以火星探測為例,火星到地球的訊號傳輸時間長達八分鐘,等故障出現之後,人再去做判斷,一來一回可能就要耗費半個小時。因此,未來肯定要依靠衛星等航天器的自主能力,使電腦在經過專門訓練後,實作快速診斷,更高效地完成處置工作。
基於這兩點,在衛星健康管理領域,業內一直對人工智能抱有很大的期望。實際上,我們一直在做人工智能演算法方面的研究工作,ChatGPT這樣的大語言模型出來後,我們也希望它能為我們帶來更多的技術手段和價值。
NBD: 以公司的「華山」大模型為例,如何賦能衛星健康管理?
董衛華: 衛星健康管理作為地面工程師日常最常用的功能,幾乎每時每刻都要用,假如衛星的壽命是20年,這個功能就要伴隨衛星執行20年。不過,衛星在軌執行時常會出現各種各樣不常見的故障,這就要求地面故障診斷系統擁有足夠的靈活性。
但目前行業面臨的最大問題就是,一旦衛星出現一些極端的異常情況,傳統的健康管理系統會完全失效,對地面人員也沒有任何幫助。我們認為, 大模型這樣的人工智能演算法擁有足夠的靈活性,只要用更多的數據、更多的知識武裝它的「頭腦」,理論上能夠比投入一線的衛星管理人員的能力更強。
一般衛星的管理團隊分為前後台,前台人員負責一些基礎的工作,7×24小時對衛星做長期、持續的監視和控制;後台是更有經驗的專家,這些專家在那些極端異常情況發生時,為前端的同事提供技術和知識經驗的支撐,我們的目標就是在「後台」的部份發揮作用。
我們的大模型訓練好之後,可以取代部份後台專家的一些工作,減輕他們的工作量。 因為隨著衛星規模的增加,這樣的故障會頻繁出現,專家支持的強度也會非常大。我們希望利用大模型這樣的技術手段,替代這些專家的經驗和知識,為前台的技術人員提供輔助和支撐。
這是一個比較穩妥的思路,也是最有意義的思路,因為這部份工作的強度確實在逐年增加,用大模型能很好地把強度降下來。此外,隨著我們研究的深入, 我們認為大模型展現出來的能力,很有可能完全顛覆整個衛星控制,變成完全的自動化和智能化,這是我們新的目標 。
大模型有上限,但至少是一個好助手
NBD: 公司為什麽選擇自研大模型?
董衛華: 一開始我們並沒有打算推出自己的模型,而是計劃在第三方模型的基礎上開發智能化套用,來解決我們行業中的問題,但我們發現,通用模型難以滿足我們這一行業的特殊需求。
大語言模型由於是生成式人工智能,所以時常會胡言亂語。但在衛星健康管理領域,大模型的反饋結果哪怕有一些瑕疵也是無法容忍的。舉個例子,衛星出現故障,工程師問大模型故障是什麽、如何解決,假如大模型不知道,但編造出了故障理由和處置方法,那這是非常嚇人的。
因此, 我們需要限制大模型的知識輸出,要求大模型的所有判斷都要有依據、有原則,且能夠充分理解航天領域的各種術語。但不管我們怎麽去寫提示詞,包括提出特殊的限制和要求,通用模型可能都很難達到期望效果,所以最後我們也是迫不得已才去訓練自己的模型 。
做一個類比的話,通用大模型就像一個剛剛畢業進入行業的大學生,他的通用技能是基礎,但專業技能才是做好手頭工作的必備條件,因此他一定要經過行業的專業培訓,重塑一個航天的世界觀;同時,也只有突破了專業技能這層窗戶紙,他的通用技能才能慢慢發揮價值。
就「華山」大模型而言,它的能力接近一個人剛入行一兩年的水平,可以做一些簡單的工作,理解一些簡單的問題,一旦進入特別復雜的問題,其實它的能力是遠遠不夠的,這時候可能需要更大的算力,我們正在解決這樣的問題。
NBD: 公司如何解決大模型出現的「幻覺」問題?
董衛華: 目前行業內有一些專門的技術可以解決部份問題,可以透過給大模型明確的要求,來減少「幻覺」的輸出。另外就是透過訓練的方式,構造各種訓練數據,讓大模型獲知哪些情況下不允許隨意發揮。 這是目前兩種通用的手段,解決了現在百分之八九十的問題,但是還有10%始終消除不了。
NBD: 為什麽有10%始終無法消除?
董衛華: 我認為這可能是技術本身造成的,從演算法機制上來講,大語言模型是生成式人工智能,其實際上是一個概率計算問題,有一部份概率就是在你的控制範圍之外的。那麽,在知道技術的上限後如何用好技術,就是我們技術研發人員的職責。
大模型很有可能沒有辦法像想象中那樣大量替代現有人員,但我認為,它至少會成為一個非常好的助手。 助手可以允許犯錯,同時助手能夠大大簡化個人的工作量和工作強度,目前來看,這也是大模型在我們這個專業領域裏實作套用的一個比較現實的想法。
未來十年,大模型重塑航天業
NBD: 您如何看待大模型對航天業的遠期影響?
董衛華: 其實,航天業各個領域的技術成熟度是非常高的,但我認為未來十年,航天業的各個領域——哪怕是再小、再專的一個領域,都會用大模型技術對領域原有的技術進行重塑,可能是解決、最佳化原先存在的問題和不足,甚至對原先做的好的地方也會有加持。
對我們公司來講,大模型也是未來公司最主要的發展方向。 我們希望利用我們的經驗和模型為航天的專業領域賦能,目前已經對接了大致4到5家使用者,計劃今年讓現有的模型能夠在衛星健康管理領域落地 。
大模型真正有什麽好處,我認為只有用過之後才能發現它的價值,這也是我們自身的實踐經驗,一開始我們只是把大模型當做一個聊天工具,但有一次在做一個功能設計的時候,我突然意識到,我應該把它當成一個「人」來看待。
當然,因為大模型不是通用人工智能,所以它還不能變成一個通用的人,但是在某一個領域裏面,就應該把它當成一個「人」來看待,我們應該想怎麽訓練他,讓這個人了解他的工作、怎麽去完成工作,而這個訓練工作一定是需要這個行業去做的,否則大模型永遠無法為你提供價值,只能是一個聊天工具。
只有用大模型去完成你的工作,把它當作一位新來的同事去訓練它,它才可能給你帶來價值,否則大模型至少在某些行業特別是垂直領域裏面,價值還是零。
NBD: 目前公司針對大模型產品有哪些開發方向?
董衛華: 首先,我們計劃實作大模型在衛星健康管理領域的落地,一開始我們預想產品部署上去後可以很快發揮作用,但目前來看, 可能還需要跟使用者一起對大模型的正確性做很長時間的確認,才能真正發揮作用 。
其次, 我們希望突破大模型在衛星軌域控制、計算領域的套用,讓「華山」大模型達到一名初級軌域控制工程師的水平 。我們的最終目標是讓大語言模型能夠在衛星上真正發揮作用,健康管理是一方面,軌域控制是另外一方面,即衛星發現問題後,可以自主地對自己的軌域進行調整和變化。
此外, 目前我們更多是在私域領域向客戶推廣,但也希望我們的模型能夠為更多商業航天公司賦能,因此我們計劃打造一個行業線上工具,面向中國商業航天的使用者開放存取許可權 ,讓大家體驗一下如何用大模型去做一些文件生成式的工作,這也是航天專案和航天公司日常工作中經常出現的一項需求。
每日經濟新聞