上觀新聞數據新聞中心負責人:人機協同時代,記者要警惕失去感性

智能技術時代的新聞生產圖景。

隨著AR、AI等智能技術的發展,新聞生產與傳播中也越來越多應用到了這些功能,傳統的新聞組織架構和生產模式則進一步遭受衝擊。經歷劇變的新聞業展現出哪些新面貌?機器與人如何協同分工?未來的生產模式將是怎樣的?作為新聞從業者,我們又該適應什麼、警惕什麼?

本期全媒派(ID:quanmeipai)獲得授權,公開上觀新聞數據新聞中心負責人尤蓴潔做客全媒派真愛群的分享實錄,帶你走近新聞生產變革的第一線。

上觀新聞數據新聞中心負責人:人機協同時代,記者要警惕失去感性

智能技術+新聞生產的4類主要應用

智能技術在新聞當中的應用場景可能要超出大家的想象。現在比較成熟的應用,可以分為語音類、語義類、圖像類,以及一個比較綜合的數據洞察類。

語音類在新聞生產中的應用,典型如虛擬主持人,大家都聽說過。新華社推出過虛擬主持人,央視也有外貌、聲音都像康輝的虛擬主持人,後臺運用到的就是語音合成技術。現在的語音合成技術已經可以做到跟真人聲音幾乎一樣。上觀新聞APP上的每一篇文章都帶語音閱讀輸出功能,你點一下按鈕,就有人工合成的聲音把文章念出來,不方便看文章時可以用聽的方式。

上觀新聞數據新聞中心負責人:人機協同時代,記者要警惕失去感性

語義智能技術,如機器人寫作,AI通過對知識庫的學習、合成、分析,可以生成稿件。機器人寫作有兩種模式,一種是原生類的文章,比如說寫詩,寫一些速報類的新聞,以及報道地震和體育賽事這些。還有一些就是聚合類的新聞,比如說話題盤點、熱門新聞回顧。現在有一些網絡小說,也是這樣寫出來的,當然小說不屬於新聞,只是類似的內容生產都可以通過AI完成。

語義類在新聞生產當中還有一個很廣泛的應用是智能審核,可以通過上下文進行審核,更多還是關鍵詞的直接識別。智能審核不光是算法分發平臺在運用,很多傳統媒體的App、網站都在用。還有基於文字的智能分類、智能標籤,都是語義類的應用。

另一類應用大家可能沒什麼太大的感覺,就是圖片識別、人臉識別。在新聞業當中,尤其是一些圖片社中,其實是被大量應用的。比如說,視覺中國就運用了大量智能識別的技術。一些聚合類新聞平臺也用人工智能配圖,大大提高了編輯的效率。

圖片類的智能應用在新聞產品裡面也有出現。比如《人民日報》幾年前做的軍裝照H5,今年新中國成立70週年,它又做了一個民族服裝換臉的產品,可以選擇不同民族的服裝,把自己的頭像換上去。這個技術不是它自己開發的,用的是騰訊的天天P圖的API接口,其背後就是圖片識別和圖片合成的技術。

上觀新聞數據新聞中心負責人:人機協同時代,記者要警惕失去感性

如今現在很火的Deepfake,在視頻裡就可以把自己的臉換上去。《人民日報》今年也做了一個產品,叫做“70年,我是主角”,由楊洋主演,你可以把楊洋的臉換成你自己的。這個產品不光有人臉識別的技術,還有融合生成的技術。

數據洞察類,我們可以說它是基於大量數據的特徵提取,可以給機器一個算法,讓它去自動學習,找出規律。比如很多平臺會分析讀者的行為數據,算法推薦就是數據洞察類的應用。在數據新聞的生產裡,我們也會用到。上觀新聞做了一個幹部人事的數據庫,可以自動收集政府網站上公開的一些人事變動,也可以基於記者提出的模型對這些人事變動進行一些比較和分析。

還有一些評論的情緒識別、情緒傾向分析,在一類叫作輿情分析類的產品中也是有很多應用的。

所以,按照人工智能技術的應用類別去看平時接觸到的新聞產品的話,你會發現它在前後臺都在被廣泛應用。

機器與人:難以互替的角色

在新聞生產當中,如果要去仔細分別角色的差異,其實有的時候是很難的。但我覺得基本上人工很難被機器取代。機器的很多操作要基於人先天的一些工作。比如說圖片的智能識別,需要對機器進行名為“監督學習”的訓練,人工先對圖片打標籤,然後再訓練機器通過人打的標籤進行識別。

還有一種倒過來,機器跑很大的數據,自己跑出一些特徵來。但是機器不知道這些特徵是什麼,有什麼用,需要人來做進一步的分析、總結。

上觀新聞數據新聞中心負責人:人機協同時代,記者要警惕失去感性

簡單來說,機器基本上不能從事創造性的工作,人基本上不能從事大數據量的計算。所以一般大計算量的工作由機器承擔,創造性的、邏輯性的工作就由人來承擔。

所以機器不能取代人,人也取代不了機器。當然,有一些簡單的重複性工作,比如改錯別字、簡單的排版分段等,可以由機器來做,但是新聞生產當中大部分工作還是不能被機器取代的。

如何釐清機器的真實性和優質性問題

機器其實是不會造假的,或者說它沒有故意造假的能力。

如果出現了真實性的問題,那麼第一,它是在數據的使用當中出現了問題;其次就是我們人的模型或者是人的算法出現了問題。

上觀新聞數據新聞中心負責人:人機協同時代,記者要警惕失去感性

實際上,AI反而被應用到fact check中。如果我們先通過人工標籤設定某一種差異值就意味著撒謊的話,機器比人更容易在海量的數據裡發現謊言。杜克大學有一個AI應用叫ClaimBuster,它用機器學習的方法來跑美國總統辯論的內容,可以在幾萬條陳述中辨別需要核實的事實性聲明。

如果我們把虛擬也稱為智能的話,Deepfake換臉或者VR其實就是機器做出來的虛擬信息。怎麼判斷虛擬的信息是真實的還是完全虛假的,這確實會帶來很大的倫理問題。

比如VR的戰場報道,我在千里之外的地方看到一個士兵開了一槍,怎麼保證這是真實的?這確實需要從新聞倫理層面去探討,但我覺得目前技術的應用還沒到這一步。

關於優質性的問題,現在談論比較多的是算法推薦,即機器推薦的是不是我真實需要的優質內容?

如果大家理解算法的理論基礎——貝葉斯方程,就知道它計算的是一個相對的概率,推薦的結果並不一定是讀者最想看的。所以,即使從純技術的角度你也不能放棄人在這個過程當中的功能性價值。你不能把所有的東西都交給機器,因為機器背後的算法是不完善的,它不是全知全能的,它會受很多因素干擾。所以這幾年我們強調算法也要有價值觀,一直在用人工干預的方式不斷調整算法。

上觀新聞數據新聞中心負責人:人機協同時代,記者要警惕失去感性

但不管是真實性還是優質性,目前機器在新聞生產中的介入是非常初步的,還是長途旅行中剛開始的那幾步。你不知道要走到哪個方向去,也還沒有看到最美好的風景,還不能斷定說它一定不真實,或者一定不優質。它就像剛滿週歲的嬰兒一樣,外界完全不知道它將成長為什麼模樣,更多還是要去完善它,這個路程很長。

記者面臨跨學科的挑戰

雖然智能技術已有很多應用,但它在新聞生產中怎麼跟原有的組織架構、生產模式對接呢?

從學科背景來說,大部分記者其實是文科生,計算機知識、數學知識、統計知識等相對都比較薄弱。但是智能技術本身是建立在純計算科學的基礎上,它是典型的工程學科。所以它對知識性的要求更偏工程類,這就意味著它是一個跨學科的應用。

我們碰到兩個問題,一個問題是原有的新聞生產長久以來都是由人文學科主導,那麼人文學科的人群怎麼去理解智能生產、理解計算機科學的邏輯?

這個需要通過在職的培訓、或者通過新聞學科的課程改革進行強化。現在國內外很多新聞學院意識到了這一點,開始引入一些編程、可視化和人工智能的課程。

上觀新聞數據新聞中心負責人:人機協同時代,記者要警惕失去感性

第二個問題是,你很難要求一個記者既是編程高手,同時具有很強的採編素質,會採訪,會寫稿子,會策劃,這個要求是不合理的。這就意味著智能技術在新聞當中的應用是一個團隊化的操作,隨之而來的便是組織的問題。怎麼把不同的人聚集在一起,把不同人的想法融合到產品當中。

這幾年其實趨勢是非常明顯的,比如《人民日報》作為一個傳統媒體,其在產品中用到圖像識別和算法的技術,這背後一定有一個跨專業的團隊作為支撐。

這種協作生產對整個行業的影響是非常大的,它意味著組織架構的變遷,這種變遷當然不是今天才發生,過去從鉛與火的時代(傳統鉛字印刷時代),到後來變成電子印刷,也發生過類似的變化,但可能相對來說那個衝擊沒有現在這麼大。因為現在智能技術不只是在傳播這一端,其在生產的前端就已經介入了。最大的挑戰還是人才的問題,怎麼跨專業、跨學科去合作。

上觀新聞數據新聞中心負責人:人機協同時代,記者要警惕失去感性

智能技術時代的新聞生產圖景

從經驗來看,我覺得自己並沒有預測對過任何一次未來式的媒體發展。在微信誕生之前,我無法想象微信這樣的東西;在抖音誕生之前,也沒有辦法想象抖音的產生。現在你會覺得微信很正常,抖音也很正常,感覺它們是生下來就有的東西,但其實我們仔細想想,十年以前這些東西都是沒有的。

所以十年以後,新聞生產的模式是怎樣的?我很難去想象,還有一些想象過很可能沒有實現。就好像三四年前,大家都看好VR,看好裸眼3D技術,看好可穿戴設備。但事實上我們看到的是短視頻的興起,大家越來越依賴手機設備。

上觀新聞數據新聞中心負責人:人機協同時代,記者要警惕失去感性

可以在一些具體的點上做一些判斷。比如說,人工智能技術,現在大家覺得這是一個很高大上、很深奧的技術,但我相信它在將來的內容生產當中會越來越像Excel一樣的工具,幫助我們去收集和分析數據,去提取裡面有特徵性的東西。

大部分記者在工作當中有一個習慣,收集大量的背景資料。我剛工作的時候,很多老記者收集背景資料還用剪報本,把報紙上的文章一篇一篇剪下來,用這種非常物理的方式在收集。後來有了Excel表之後,可以創建自己的資料表格,現在可能還會用My SQL等,處理更加海量的數據。

數據洞察方面的算法也有很多,可以去類似Github這樣的網站上去查開源的軟件。我們也看到了很多工具化的、便捷的人工智能技術應用。比如說做圖像識別,可以用天天P圖這樣的API接口,沒必要自己開發一個東西。今後能夠用的API非常多,能用的開放數據也非常多。人工智能會變成一個工具性的東西。

上觀新聞數據新聞中心負責人:人機協同時代,記者要警惕失去感性

其次在交互的界面上,人工智能技術會大規模的介入。它會提供更多具備互動性、智能化、真實感的東西,讓你身臨其境。比如說有遊戲產品仿照Pokemon Go,在一個實景裡嵌入虛擬的東西,放到現實的環境當中去,跟人產生一些遊戲交互,將來這種技術可能會被廣泛地應用。

再比如虛擬主播。現在的虛擬主播基本只有語音合成的功能,是不能自己來組織思維的,將來虛擬主播可能有更多的功能,跟現在人類主播的區別會越來越小。此外,戰地記者也可以用虛擬的人物代替,從現有的技術來說,我覺得這個目標不是太遙遠。

但是,讓我想象一個完全的人工智能的媒體,其實是很難的。因為,你很難預判機器智能會發展到什麼樣的程度,它到底是一種像人一樣綜合的智能還是一種比較垂直類的?就只會做這一類事情,比如說駕駛、翻譯……而媒體其實是非常綜合的知識的體現,這一點的確需要更多想象力。

越智能,越要注意什麼?

要警惕失去直覺,或者說人的感性的東西。我看到的一個趨勢是這個社會的知識越來越量化,很多東西可能是基於量化的一種反映,它的優點是非常精確。人工智能會加強這種趨勢,因為它的計算很厲害,而且它本身是機器,不帶有價值判斷,它更關注的是一個統計的結果,不管是對特徵的提取還是對模型的識別,機器學習的本質是基於一種量化的思考模式。

但是,在新聞生產當中,或者說新聞業的發展當中,我們這些從業者作為人類,是一直很關注邊緣人群、關注少數人群的利益的。如果我們大量依賴機器去觀察的話,是不是會對這部分人的生活失去感知呢?對媒體人來說,新聞還是人文主義的,不能失去跟這個社會邊邊角角直接的聯繫。我在工作中做數據新聞,也非常強調除了數據之外,記者一定要親身去採訪、去體會。

上觀新聞數據新聞中心負責人:人機協同時代,記者要警惕失去感性

一位媒體人曾說,“假如沒有對人真正的關切,就不能成為記者;假如僅僅停留在對人的關切,而不是對問題的求解上,就不會成為一個好記者。”在智能技術的時代,我們應保持自我的初心,用技術武裝自己,於傳統新聞業的“良夜”高舉前行之炬。


分享到:


相關文章: