實驗君美國行的第二站來到了美國第一大通訊社——美聯社(Associated Press)。
美聯社在2015年制定了五年計劃,其中自動化新聞技術是重點。目前美聯社與Automated Insights公司合作開發了多個技術項目,如寫稿機器人等。
美聯社的媒介合作總監Lisa Gibbs向我們介紹了美聯社近年的技術創新,利用自然語言處理(NLP)和圖像識別技術提升新聞生產效率。
她還將代表美聯社參加今年在里斯本舉行的GEN(Global Editors Network)大會。
寫稿機器人推動內容個性化生產
我們在三四年前立下了自動寫作的目標,如今這個目標已經實現。
我們和那時的初創公司Automated Insights合作,該公司專注研究自然語言處理(NLP)技術,我們後來還投資了這家公司。
利用自動寫作軟件,我們可以得到同一事件多種版本的內容。這對美聯社來說尤為重要,我們旗下有小型本地新聞媒體、內容聚合平臺、商務網站、健康網站等,這也就意味著我們的用戶類型也很多樣,
因此不同版本的內容可以迎合不同用戶的喜好。很多人都不看好、不理解我們的自動寫作項目。但我們認為,只要繼續訓練算法,改善技術,未來一定能有所突破。
自動寫作項目影響了美聯社的經營戰略,改變了我們對創新的看法。這個項目教會我們坦然面對風險和失敗,以及怎樣處理不確定因素大但回報高的項目。
在內容質量方面,我們會對自動寫作內容進行抽查,如果有不盡如人意的地方,我們會適當增補內容。
我們已經有完備的流程將報道對象公司按優先等級排序,我們會根據優先級跟蹤某些公司的消息動態。
我們目前沒有因為自動寫作項目而開除任何員工。但如果你的工作內容本身就是例行編寫一些簡單內容,那你就可能被機器替代。
我們最關注的還是新聞質量,我們想盡自己所能把新聞做得更好。
在視頻方面,我們還投資了能自動將文字轉化為視頻的平臺Wibbitz。我們希望可以使用摘要和新聞關聯圖片自動生成新聞短視頻,促進這些短視頻在社交平臺上的傳播。目前我們測試的重點領域是體育,因為體育新聞對用戶的吸引力大,能帶來高流量。
利用圖像識別技術標記海量圖片
美聯社每年發佈的新聞圖片超過100萬張。轉賣新聞圖片也為美聯社創造了鉅額收入。
我們想和Google和亞馬遜合作,也想和優秀的初創公司合作。
我們的檔案庫裡有海量內容,這對初創公司來說是非常有價值的資源,因為他們需要這些資源來構建模型、訓練算法。
我們希望識別出的內容越細緻越好。比如說內容血腥的圖片,要是能用機器學習一類的技術幫助我們過濾掉這些圖片,就能幫助我們節省很多時間。
機器學習技術應用於事實核查
我們推出的AP Verify工具將機器學習技術、視頻識別技術與採編團隊相結合,來驗證UGC內容的真實性。
對於視頻內容,我們主要從兩方面核實UGC視頻。
一是發佈視頻的用戶信息。我們會研究發佈者在社交媒體上的背景、人際關係網。下一步我們希望利用API接口等服務獲得用戶可信度的信息,比如發佈者是否在過去上傳過恐怖主義視頻。
二是視頻圖像。我們利用多種技術分析視頻的元數據,比如時間、地點、天氣等。如果視頻聲稱是在巴黎拍攝的,那麼視頻中出現埃菲爾鐵塔等地標建築就能增加視頻的可信度。這些有提示意義的建築物能幫助我們作出判斷。
我們也把AP Verify核實圖片的技術遷移過來,畢竟視頻是無數個畫面組成的。
編譯整理:劉天睿
閱讀更多 媒體實驗室 的文章