「AI教父」謝菲·辛頓近日在BBC廣播4台的【今日】節目中指出,AI的發展速度「非常非常快,比我預期的要快得多」,並強調這一變化速度遠超預期。據他預測,具備超人能力的AI可能在未來20年內出現,最快甚至就在5年內。
針對AI接下來的發展,【每日經濟新聞】記者(以下簡稱NBD)近日采訪了清華大學電子工程系長聘教授、博士生導師吳及。吳教授從AI技術瓶頸、AI+醫療等角度進行了全面解讀。
在吳及看來,AI在學術研究方面有待突破的一點是對真實的物理世界進行建模。以目前的技術來講,還很難做到將文本意義上的世界模型和物理意義上的世界模型關聯起來。在談及AI套用落地時,吳及強調,加強對AI的認知是首要任務,如果認識或理解不夠深,完全憑想象做事,那走的方向可能完全不對,這是很大的風險。
談AI技術瓶頸:對物理世界建模有待突破
NBD:當前AI主要的技術瓶頸是什麽呢?
吳及:從現實套用來講,AI技術或者大模型跟很多現實場景套用結合得還不是非常好。這個方向非常熱,但能夠被大規模、常態化使用的成功套用還比較有限。這方面我覺得還有相當長的路要走。
從學術研究的角度來講,一個非常重要的突破點在於,能不能把文本意義上的世界模型和物理意義上的世界模型關聯起來,也就是說,能不能建立起對真實物理世界的建模。以目前的技術來講,可能還很難完全做到,有待技術突破。
NBD:您提到的物理世界模型是不是類似於李飛飛團隊所做的工作?
吳及:對。目前大模型能力很強,具備越來越多的能力,例如寫文章,寫程式碼、生成圖片和生成影片,但核心還是語意向量,核心技術還是大語言模型。
但它對整個物理世界的理解能力,我覺得還是不夠的。以人的學習過程來打個比方,我們經常會說,「紙上得來終覺淺,絕知此事要躬行」,因此實踐非常重要。依靠文本為主的大模型也可以與其他模態對齊,但個人認為還不足以對整個物理世界進行建模。所以,建模真實的物理世界會是學術前沿研究上會面臨的下一個瓶頸。
談AI+醫療:三大場景有很大發揮空間
NBD:作為智慧醫療方面的專家,您認為,AI+醫療將如何影響我們的未來?
吳及:相比其他場景,醫療場景是比較困難的,因為醫療本質上是用全國的醫療機構和醫療隊伍去服務全體社會的過程。另外,醫學診療這件事既有理論,有科學,還有很多的經驗,很多治療還是靠經驗,靠積累,甚至靠專家的直覺。因此,從某種意義上來說,醫療場景下AI的套用難度更大,當然它也會逐步滲透到一些比較典型的場景中。
首先是提高資源配置的效率,比如分診和轉診。在當下的就診過程中,特別是國內,我們沒有非常完整的分診體系,患者就診實際上是非常隨機的,憑著自己的意願去掛某個專家的號,但醫學專家不是萬能的,越頂尖的醫院分科越細,因此,在醫療資源的有效利用上,實際上存在一定的錯配問題,也就是沒有最大限度地加以利用。在有充分資訊的支持下,AI的引入是有利於這種配置的。
我們在新冠疫情期間嘗試過,比如重癥預警,預測哪些患者可能會發展為重癥,從而更有效地分配醫療資源,整個診療狀況可能會更加有序和有效。
其次,提高診療質素,全世界都存在這樣的情況,即好的醫療資源分配是不均勻的,好的醫療資源存在很強的虹吸效應,往中心城市聚集。在很多地方,雖然醫院的資訊化水平在不斷提升,但診療水平未必達到了學科前沿。AI能夠縮小不同地區間的醫療水平差距,AI可以促進「知識下沈」,將先進的治療技術和管理經驗傳遞到基層醫療機構,提高整體診療水平。
第三,提高診療的效率,目前診療過程中有大量工作都是依靠醫生和護士來做的,如果把繁瑣的工作交一部份給機器去做,盡管機器未必比得上頂尖醫生,但可以在保證基本質素的情況下,大振幅提高效率,減輕醫生的負擔,讓醫生能夠把時間精力用來處理那些真正需要決策、判斷的事情,極大提高診療效率,讓醫療機構運轉更高效。
用有限的醫療資源更好服務整個社會群體,這是很重要的。所以,不管是提高資源配置效率,還是保證臨床診療質素以及提升診療效率,這都是AI能夠發揮重要作用的場景。
談AI套用落地:理念與認知是首位
NBD:隨著AI技術的不斷進步,商業化的行程也在加速。您認為,AI商業化落地最難的環節是什麽,技術問題,還是市場接受度,還是其他?
吳及:AI套用落地要面臨的困難還是挺多的。
首先是理念和認知的問題。現在全社會都知道AI是潮流,非常關註AI技術,包括我去很多地方講課,我也感覺大家對AI的熱情很高。
盡管大家都認可AI很重要,但對AI的認識深度還是相當不足。我有時候開玩笑,如果找10個人一起討論AI,大家可能用的是同一個詞,但心裏想的可能都不是一個事兒,在交流的過程中可能經常會出現所謂的「雞同鴨講」。也就是說,每個人都是憑自己的想象在想AI應該幹什麽,能幹什麽,適合幹什麽,但對於技術本身的理解可能是非常有限的,因此會形成很多對AI的錯誤認識和錯誤理解。
即使很多工作打上了AI這個標簽,但其實未必能真正發揮作用,如果認識或理解不夠深,完全憑想象做事,那走的方向可能完全不對,這是很大的風險。這就是為什麽我說,理念和認識可能是排在第一的。
其次,我們一直談到三要素:算力、數據和演算法。其中,數據非常關鍵。這一代AI技術對現實世界的認識主要是靠數據,從數據中去發現知識,發現模式,去建立模型,去訓練參數。但有些場景數據獲取比較容易,有些場景數據獲取相對困難。
互聯網可能是最公開的數據場地,造就了今日的大模型,但各個領域還有很多數據沒有聯網。如果沒有數據的匯聚,僅僅靠某一個單位積累的數據,難以讓特定領域的大模型具備更強的能力,不管是法律,醫療還是教育領域。
總的來說,從普遍的商業化套用落地場景來講,數據采集、質素保證和匯聚都是難題。我們國家之所以釋出【關於構建數據基礎制度更好發揮數據要素作用的意見】,提數據要素改革,就是因為數據協同非常關鍵,也非常難。數據的孤島效應和煙囪效應終存在。因此,數據對於推進整個智能化的落地以及AI技術的進一步套用是非常關鍵的。如果能理解清楚AI的三大要素,那就會知道怎麽去推動AI套用落地了。
每日經濟新聞