今天(13日),國家發展改革委、國家數據局、財政部、人力資源社會保障部四部門聯合釋出【關於促進數據標註產業高質素發展的實施意見】。
什麽是「數據標註」?簡單理解,就是給文本、語音、圖片、影片等等各種各樣的數據「打標簽」。本次印發的檔是國家層面首次對數據標註這一新興產業進行系統謀劃。
年均復合增長率將超20%
數據標註產業向知識密集型轉變
自動駕駛、低空經濟、智能制造、智慧醫療等領域都離不開數據標註。據測算,2023年中國數據標註產業規模達800億元左右。
本次釋出的【意見】提出,到2027年,數據標註產業專業化、智能化及科技創新能力水平顯著提升,產業規模大幅躍升,年均復合增長率超過20%。培育壯大數據標註產業,對於推動人工智能創新發展具有重要支撐作用。
清華大學計算社會科學與國家治理實驗室執行主任 孟慶國:高質素數據短缺,是我們一些大模型發展過程中遇到的瓶頸,數據標註就是對數據進行篩選、清洗、分類、標記等各種加工處理,能產生高質素的數據集,讓機器讀得懂、學得快、訓得好。現在的一個新趨勢是,數據標註自身的自動化、智能化程度也在明顯提高,與此同時,細分領域變多,也需要金融、交通、能源、醫療等一些背景的專業人才,數據標註正在逐步從傳統的勞動密集型向知識密集型產業轉變。
【意見】還提出,建設成效顯著、特色鮮明的數據標註基地,形成相對完善的數據標註產業生態。目前,中國已確定成都、沈陽、合肥、長沙等7個城市承擔數據標註基地建設任務。
資料圖/廣州日報新花城記者:莫偉濃
突出需求牽引和創新驅動
釋放公共數據、企業數據標註需求
本次【意見】從13個具體方面對培育壯大數據標註產業進行全面謀劃,特別突出需求牽引和創新驅動,培育一批深耕行業的數據標註瞪羚企業、獨角獸企業。
在深化需求牽引方面,【意見】首次提出釋放公共數據標註需求,依法依規有序推動公共數據標註與開發利用,在現代農業、智能制造、資訊服務等重點領域發掘公共數據標註需求。
清華大學計算社會科學與國家治理實驗室執行主任 孟慶國:中央經濟工作會議提出開展「人工智能+」行動,各個地方也在加快部署政務大模型,大模型在交通、氣象、醫療等民生領域的套用會越來越多,基於公共數據的標註需求也會不斷上升。如何讓公共數據釋放價值,一個核心工作就是做好海量公共數據的標註。
在增強創新驅動方面,【意見】中提出,完善數據標註標準,支持軟硬一體、自主可控的數據標註領域技術和關鍵器材研發。
此外,在最佳化支撐體系上,【意見】中提到,加大財稅金融支持力度,推動數據標註服務納入政府采購範疇。同時推動數據標註職業體系建設,加強產業人才支撐。
來源:央視新聞
廣州日報新花城編輯:張映武