編輯:好困 桃子
【新智元導讀】一場論壇讓全國各地總編輯齊聚於粵港澳大灣區。這場論壇,究竟有多大的吸重力?現場,央視記者和數位虛擬主播進行了一場新聞播報語速大PK,還有提供冬奧講解的AI手語主播,播報新聞的多語種AI虛擬主播...
IDC在最新的報告中指出,隨著AI技術的進步,媒體在內容的生產、管理、分發和互動上都發生著本質的變化。
那麽,我們不禁要問:
5G、8K、AI……未來媒體會是什麽模樣?
內容、技術、責任……媒體融合如何持續深入?
近日,2021年中國網路媒體論壇在廣州召開。
在這個被譽為「觀察中國網路媒體發展走向重要視窗」的年度盛會上,來自中央和國家機關,中央新聞單位,以及業界專家學者、編輯記者和社會各界代表紛紛出席。
這場論壇,究竟有多大的吸重力?
現場,中央廣播電視總台記者和數位虛擬主播小C進行了一場新聞播報語速大PK,你猜誰更勝一籌?
百度虛擬主播小C
另外,央視新聞的第一個「冬奧AI手語主播」在網路媒體論壇上正式亮相。她將在2022年冬奧會上為中國聽障人群帶來手語服務。
百度AI手語主播
除了虛擬人小C和手語主播,科大訊飛自主研發的全球第一個多語種AI虛擬主播小晴也在論壇上展出。
「大家好,我是科大訊飛AI虛擬主播小晴,我可以用多語種進行播報。」
這位端莊大氣的女主播說話聲音、動作和神情惟妙惟肖,讓人難以分辨是真是假。她不僅可以用30余種(含外語及方言)語言播報新聞,還支持文本到視訊的自動輸出。
此次論壇上匯集了來自中央和地方新聞單位、知名互聯網企業、縣級融媒體中心等43家單位。他們紛紛亮出自家的網路媒體「黑科技」。
可以看出,人工智慧的發展已經讓這個資訊社會進入了融媒體時代,AI+媒體正在進行中...
AI助力媒體的智慧轉型
過去,新聞由人來完成,現在,語音辨識、語音合成、機器轉譯、影像辨識、自然語言處理等人工智慧技術正在改變媒體傳統故事的生產和傳播方式。
從國內來看,2015年,騰訊財經最先發表了由Dreamwriter新聞寫作機器人編寫的經濟訊息,開創了中國機器人寫稿先河。
騰訊寫作機器人編寫的新聞
由此看出,AI從最初進駐新聞機構,到寫稿機器人交出新聞稿,再到機器人搶獨家新聞,前後不過3-4年時間。
那麽,效果如何?
2019年,新華社智慧化編輯部建成執行,在智慧系統助力下,生產效率可提升3-5倍。
在AI加入之後,媒體的融合也不是一蹴而就的,其先後經歷了「從流程中心轉變為數據中心」的數媒時代,「從新媒體轉向為融媒體」的融媒時代。現在則是探索「大數據+智慧化為賦能」的智媒時代。
近日,IDC釋出了一份關於【「AI+媒體」助力內容生產、稽核、分發、創新四大環節】的報告。
報告顯示,近年來中國智慧媒體解決方案的市場規模正處在快速增長的階段。僅2020年的規模就已經達到了4.8億元人民幣,並預計在2021年底達7億元左右。
復合年均增長率(CAGR)方面,2020到2025年期間將達到46.3%,尤其是2022年,增長率預計將超過50%,達到近5年的峰值。
中國智慧媒體解決方案市場規模預測
從智慧媒體市場生態上來看,科大訊飛、百度智慧雲、阿裏雲等公司基於自身的AI技術能力,面向媒體等相關領域打造越來越豐富、深入場景的產品及垂直行業解決方案。
智慧媒體市場生態(來源:IDC報告)
在AI賦能傳統媒體這條路上,這些企業給出了很多「AI+媒體」的想象,尤其是那些綜合AI技術供應商。
比如,基於人臉辨識、知識圖譜、語音等技術,阿裏雲視訊和人民日報社共同研發的「人民日報社AI智慧編輯部」,為媒體的新聞采編生產提供了看、聽、悟、審、查等各方面能力。
人民日報社AI智慧編輯部
新華智雲則是將AI能力與媒體行業場景結合,自主研發了覆蓋媒體生產策、采、寫、編、發、審全流程的「媒體大腦」。
同樣,以人工智慧為核心的科大訊飛「AI+媒體」整體解決方案早已在媒介傳播「采編播審存」的各個環節落地套用。
這背後,便是科大訊飛22年來在AI領域深耕的成果,尤其是語音技術基礎演算法貫穿了科大訊飛「AI+媒體」整個解決方案。
其中,以虛擬主播進行新聞播報的「播」,可以說是最具有代表性的一環了。
虛擬主播演變史
多年來,基於語音合成、人臉辨識、影像合成、機器轉譯等多項AI技術,科大訊飛推出了一代又一代虛擬人。
2018年,科大訊飛和南方財經推出AI虛擬主播俎江濤「上崗」,播報了當天的財經新聞。
在科大訊飛先進的語音合成技術加持下推出的虛擬主播,透過模仿真實主持人俎江濤的聲音,使其音質及自然度更加貼近本人的聲音。
此後,以虛擬主播「小晴」為代表的語音+影像的AI虛擬主播家族陸續上崗,小晴還可以講30多種語言。
科大訊飛AI虛擬主播家族
他們都是透過采集錄制真人的聲音素材,再透過聲音標註以及機器的深度學習演算法,構建發音聲學模型建成。
再套用上影像處理等技術,使得他們在播報過程能達到自然的表情和精準的口型。
為了讓虛擬主播從聲音到形象都能實作多元化,科大訊飛陸續推出了客製化多語種AI虛擬主播。
就比如,2019年,科大訊飛與中央廣播電視總台聯合打造AI虛擬記者「通通」,在視訊中帶領觀眾遊歷「一帶一路」沿途的風土人情。
科大訊飛AI虛擬記者通通
緊接著在同年央視4套五一特別節目中,科大訊飛打造出虛擬主播形象「紀小萌」亮相。
還有人民日報和訊飛聯手打造虛擬主播「果果」亮相數博會現場,能夠流利地向觀眾播報國內外熱點事件。
科大訊飛虛擬主播果果
之後,合肥電視台客製了男女雙主播「王小健」和「馬小騰」。2020年3月,新華報業聯合訊飛推出交匯點雲媒的虛擬主播「匯匯」,能聽會說,還能懂你。
科大訊飛虛擬主播匯匯
在剛剛過去的第四屆世界聲博會暨2021科大訊飛全球1024開發者節上,科大訊飛董事長劉慶峰釋出了業界第一個虛擬人互動系統,一分鐘就可以客製一個虛擬人。
科大訊飛個人化真人捏臉系統,支持根據個人喜好快速生成3D個人化人臉的主播視訊
現場,虛擬人愛加和大家打招呼。
一路走來,訊飛虛擬人在推進媒體智慧化過程中經歷不斷叠代升級。
這些虛擬主播能與真人無異地播報新聞的背後,其實都是科大訊飛的人工智慧技術在助力。
從最初語音合成主播,到語音+影像的多語種AI主播,再到現在由語音辨識、語意理解、語音合成、虛擬形象等多種AI技術加持下的虛擬人,科大訊飛在AI+媒體中的「播」這一環節一直在攀登。
當然,采、編、審、存也不例外。
構建完整的AI+媒體解決方案
巧婦難為無米之炊,對於內容的生產,素材的采集可以說是重中之重了。
在2019年的兩會現場,【中國日報】抖音號的一個小視訊分分鐘播放量突破一千萬,點贊數超過五十萬。
只見會場裏,拿著手機、錄音筆、單眼等裝置的記者把被采訪人圍著水泄不通,而【中國日報】的記者則淡定地站在人群外面,手機的螢幕上顯示著講話的文字,完全不同於其他記者的緊張狀態。
而記者當時用的,正是訊飛聽見的APP。
中國日報記者在兩會現場使用訊飛聽見APP
一直以來,整理采訪錄音都是非常繁瑣的工作。1個小時的錄音,整理成文字大概要花費3個小時以上的時間。
於是,科大訊飛在「采」這個環節上,推出了訊飛聽見APP、錄音筆等裝置。
透過語音和機器轉譯技術,不僅可以實作最基礎的錄音功能,而且還可以即時看到相應的文字版本。
而且在科大訊飛的語音技術加持下,除了可以將現場語音1秒轉換成文字,還可以只用5到10分鐘就把1個小時的會議內容轉換成文稿,極大地提高了出稿效率。
現在,科大訊飛更是支持8大語種、12種方言和2個民族語言的即時轉寫,讓記者們可以在更多的場景下高效的獲取文字素材。
科大訊飛錄音筆
有了素材,接下來就到了「編」這個步驟。
為此,訊飛推出了「智慧文稿唱詞系統」和「智慧直播字幕系統」。
文稿唱詞系統整合了采集、轉碼、轉寫、音訊編輯等功能,可以實作5-10分鐘將1小時的音訊轉寫成文稿和字幕。
早在2019年科大訊飛就為中央電視台的春節聯歡晚會提供了字幕制作支持,其文稿唱詞系統將傳統的流程簡化為語音AI轉寫、核對修改、字幕生成稽核三步。
對於字幕/時碼的編輯校驗工作來說,所需的人員數量從往年的16人減少到4人,平均的制作時間也減少23%,有效地減輕了字幕編輯者的負擔。
此外,在這個環節中還有直播字幕系統,可以在進行直播工作的同時,提供高正確率的初稿字幕文本。
央視春晚字幕制作
新聞在正式釋出之前,「審」顯然是必不可少的。
同樣,訊飛推出了相應的「智慧內容監審平台」。
透過語音轉寫、人臉辨識、聲紋辨識等人工智慧技術,可以從關鍵詞、人臉、圖片以及聲紋等不同維度與關鍵庫資訊進行匹配,承擔起新聞品質「把關人」的責任。
新聞資訊保安稽核管理系統
最後,在「存」這個環節,訊飛推出了「智慧內容管理平台」。
利用語音辨識,聲紋辨識,人臉辨識,NLP 等人工智慧技術,智慧內容管理平台提供了音視訊內容監管、檢索、自動編目、自動化標簽等功能。
由此,也就解決了困擾音視訊管理多年的檢索和編目困難的問題。
智慧內容管理平台
那麽,這個「采編播審存」和其他的方案又有何不同呢?
從IDC的報告中可以看出,現階段智慧媒體的流程可以概括為:素材的輸入,內容的生產,成品的輸出,以及稽核和管理。
而這對應的也就是,采、編、播、審、存這5個環節。(從設定的重合度上來說,創新套用完全可以放到「播」這個環節。)
智慧媒體技術架構圖(來源:IDC報告)
當然,如果想細化一些,分發營運也有對應的解決方案:內容營運和內容傳播。
AI智慧媒體解決方案生態架構
所以其實不難得出,從最初素材的收集到最終呈現的新聞,科大訊飛憑借著自己的生態構成了一個完整的AI+媒體解決方案。
而從始至終不變的是,科大訊飛在語音方面的核心能力。從語音合成技術一直到現在AI虛擬人,科大訊飛在人工智慧發展史上樹立了裏程碑。
人工智慧發展史
比人類更強大的不是AI,而是掌握了AI的新人類。在新聞傳播領域,比傳統采編更強大的不是虛擬主播,而是掌握了虛擬主播、掌握了AI賦能之下「采、編、播、審、存」能力的AI新聞人。
從讓裝置發聲到讓新聞發聲,科大訊飛一直在改變著世界溝通的方式。
未來,我們或許也可以從「靜默如謎」變成「萬物有靈」吧。
參考資料:
https://www. iflyrec.com/html/produc ts/zhmt.html
https://www. sohu.com/a/354525160_60 9520
https://www. xfyun.cn/solution/AI-sm art-media-solution
https:// baijiahao.baidu.com/s? id=1627258276246348865&wfr=spider&for=pc
https://www. sohu.com/a/503103748_99 900743