6.2萬字報告剖析「智能寫作」全貌,從落地產品看NLP商業化突破


6.2萬字報告剖析「智能寫作」全貌,從落地產品看NLP商業化突破


近年來字節跳動、百度、阿里巴巴、美團點評、微軟等各大互聯網巨頭紛紛加註智能創作/寫作,並已在自有資訊、內容平臺、電商、辦公文書等業務場景中廣泛應用;同時達觀數據、智搜、妙筆智能、文因互聯等 NLP 領域領先創業公司紮根營銷文案、文本業務自動化、金融數據分析等場景,讓 NLP 技術產生更顯著的商業價值。

「智能寫作」讓我們看到論文中 SOTA 的 NLP 模型也可以被快速應用到工業場景中,輔助或直接成為人類的生產力。因此我們針對這一技術應用領域,蒐集了數百餘篇論文、第三方市場報告及國內外新聞報道,並採訪了多位國內智能寫作公司與產品線的產品經理或技術負責人,撰寫了 6.2 萬字報告,從基礎概念到技術應用到產品案例,系統性剖析並總結了「智能寫作」的技術應用現狀、商業價值與未來發展潛力。

語言是人與人交流的工具,也是網絡用戶與互聯網連接的方式。傳統人類寫作是以表達和傳遞為目的的對主觀和客觀世界的記錄,從日常生活到資訊、法律、辦公、金融等行業都有廣泛應用。進入到互聯網時代,信息爆炸帶來了個人、企業、政府對互聯網語言文本處理的強大需求;同時,提升資訊生產速度、延展其覆蓋面的需求也不斷增加。技術人員開始探討如何讓機器輔助人類更高效、更準確地處理和分析信息,隨著自然語言處理(NLP)技術的不斷髮展,讓機器生成有價值的信息也成為可能。

現今,「機器寫作」也已不僅僅是「可利用機器來完成寫作流程中的程式化環節」,近年自然語言處理模型性能的不斷突破,促使其從規則、模板寫作發展到了以神經網絡模型為核心的「智能機器寫作」,從輔助記者創作逐步走向自動化寫作,應用場景也從模板化的資訊類數據報告,深入到分析報告、詩歌創作、長故事文本創作、廣告營銷文本寫作等更豐富、複雜的內容形式,貫穿信息監管、素材採集、文本編輯、文本創作、修改優化到敏感信息審核等多項業務環節。

機器之心希望通過本報告《智能寫作:人工智能商業應用的制高點——智能寫作中人工智能技術的應用現狀及趨勢展望》,展示「智能寫作」產業全貌,為傳媒、企業服務、電商、廣告營銷、金融等行業信息化與技術人員及從業者系統性展示 AI 技術應用可能性,同時通過對「智能寫作」領域頭部公司代表產品的技術應用思路的詳盡剖析與所對應細分市場競品的網羅式盤點,為自然語言處理技術領域的研究研發人員、軟硬件開發工程師、產品經理,提供技術研發、產品設計、產品商業化策略層面詳實的調研參考。

報告目錄

部分應用案例

5.3 美團點評:信息流摘要式文本寫作

主要產品:信息流文本的創意優化

針對信息流的落地場景,主要有三個功能:

可以針對某條分發內容自動摘要生成標題;

能生產有關單個商戶的一句話核心賣點描述;

生成完整的內容頁包括標題及多條文案的短篇推薦理由,從而實現線上點擊轉化率的優化

盈利模式及盈利情況:尚未商業化

應用案例及效果:

抽成式標題生成在 CTR/CVR/點擊曝光量、人工檢驗通過率、效率優化都累計獲得了 10% 以上的提升。生成式方向探索過程中,對低質內容的標題生成,在線上獲得了接近 10% 的效果提升。

技術思路及主要技術:

1)信息流標題生成:實際應用時,通過抽取和生成的協同使用來實現,主要方式是以業務效果為導向的偏工程化方法(生成內容即作為新增的候選集之一,參與整體的預估排序),另外一個是我們正在探索的一種 Copy 方法(對 Copy 和 Generate 概率做獨立建模,其中重點解決在受限情況下的「Where To Point」問題。

抽取式標題思路及技術模型:源數據在內容中臺完成可分發分析後,針對具體內容,進行系統化插件式的預處理,包括分句拼句、繁簡轉換、大小寫歸一等,並進行依存分析;而後將所有可選內容作質量評估,包括情感過濾、敏感過濾等通用過濾,以及規則判別等涉及表情、冗餘字符處理與語法改寫的二次基礎優化;在召回模塊中,通過實體識別+TF-IDF 打分等方式來評估候選內容標題基礎信息質量,並通過閾值召回來保證基礎閱讀體驗,從而避免一些極端的 Bad Case;最後,針對候選標題直接做句子級別的點擊/轉化率預估,負責質感、相關性及最終的業務目標的優化。整個流程的基礎模型是 Bi-LSTM+Attention 模型(輸入層是 PreTrain 的 Word Embedding,經過雙向 LSTM 給到 Attention 層,Dropout 後全連接,套一個交叉熵的 Sigmod,輸出判別),模型既可以對整句序列做雙向語義的建模,同時可以通過注意力矩陣來對詞級進行加權。在它的基礎上,嘗試添加過 ELMo 的 Loss,在模型的第一層雙向 LSTM 進行基於 ELMo Loss 的 Pre Train 作為初始化結果,在線上指標也有小幅的提升。而在原文受限問題上,則通過深度模型來表徵深層的語義,輔以更多的特徵工程來表徵用戶能感知到的淺層信息,如屬性、Topic 等。在效率上,採用了谷歌的自注意力的機制來替換 RNN-LSTM 的循環結構,解決原文表徵訓練效率和長依賴問題。

2 大技術關鍵點——在標題創意度衡量上,重點對語義+詞級的方向上來對點擊/轉化率做建模,同時輔以線上 E&E 選優的機制來持續獲取標註對,並提升在線自動糾錯的能力;在受限上,抽象了預處理和質量模型,來通用化處理文本創意內容的質控,獨立了一個召回模塊負責體驗保障。並在模型結構上來對原文做獨立表示,後又引入了 Topic Feature Context 來做針對性控制。從而在降低「標題黨」概率的同時提高內容相關性。

生成式標題思路及技術模型:為了保證控制和泛化性,初期將標題剝離原文獨立建模,通過 Context 銜接,這樣能引入更多的非標數據,並在逐步完成積累的情況下,才開始嘗試做原文的深度語義表示。除了嘗試目標單獨建模和結合原文建模的過程,在描述的泛化性方向也做了不少的嘗試,比如儘可能地描述廣而泛主題。諸如「魔都是輕易俘獲人心的聚餐勝地」,因為只面向上海的商戶,內容符合聚餐主題,泛化能力很強,但仍然不能作為一個普適的方案解決問題。這個功能主要應用的是 RNN-Base 的 Seq2Seq 模型的整體結構。Encoder 端使用的數據包括基於原文和商戶理解的主題表示和原文的雙向語義表示,輸出給注意力層。技術團隊借鑑了 NMT 的一部分研究思想,調整了 Transformer 的結構,在原結構上額外引入了 Context Encoder,並且在 Encoder 和 Decoder 端加入了 Context 的 Attention 層,來強化模型捕捉 Context 信息的能力。Decoder 端生成文本時,通過注意力機制學習主題和原文表示的權重關係,從而生成文案。

業務導向的文本生成目標:營銷類文本的評價模式是業務相關的點擊率,但是這與語言模型最終產出最小化 Word 級別的交叉熵 Loss 的目標不一致,所以在具體落實時,通過三個方向解決問題:第一是在 Context 中顯式地標註抽取式模型的 Label,讓模型學習到兩者的差異;第二是在預測 Decoder 的 Beam Search 計算概率的同時,添加一個打分控制函數;第三則是在訓練的 Decoder 中,建立一個全局損失函數參與訓練,類似於 NMT 中增加的 Coverage Loss。考慮到穩定性和實現成本,最終嘗試了第一和第二種方式。

標題 E&E 機制:採用一種 Epsilon Greedy 策略來持續獲取標註數據,並提升在線自動糾錯的能力。這個策略類似經典的 Epsilon 算法,區別是引入創意狀態,根據狀態將 Epsilon 分成多級。目的是將比較好的創意可以分配給較大概率的流量,而不是均分,差的就淘汰,以此來提升效率。在初期優化階段,這種方式發揮了很大的作用。具體根據標題和圖片的歷史表現和默認相比,將狀態分成 7 檔,從上到下效果表現依次遞減,流量分配比例也依次降低,這樣可以保證整個系統在樣本有噪音的情況下實現線上糾偏。

2)商戶文案生成:文案生成和標題生成能夠通用整體的生成模型框架,最大區別是由文案的載體"商戶"所決定。為了保證產出的文本的準確性和質量,在輸出端需要進行解碼控制。一是通過構建機制來讓模型自己學習到目標,二是在 Decoder 的 Beam Search 階段動態地加入所需的控制目標。主要有賣點控制、風格控制、多樣性控制控制等控制方法。

賣點控制:在 Hard Constrained 方面,整理了重要的賣點和實體如地域、品類等,在目標理解過程中直接加入 Context。對於 Soft Constrained,通過賣點的共現計算一個簡單的條件概率,並將賣點依此條件概率隨機添加進 Context 中,從而讓模型通過注意力學習到受限關係。最後在 Decoder fuction 部分,新增了一個 Hard&Soft Constrained 的匹配打分項,參與最終的概率計算。

風格控制:實現方法和賣點控制非常相似,只是風格其實是通過不同內容之間的差異來間接進行實現的。比如大眾點評頭條、PGC 類的內容與 UGC 類的的寫作風格,就存在極大的差異。內容屬性的差異可作為一個 Context 的控制信號,讓模型捕獲。

多樣性控制:

自然語言生成模型選取輸出文本時通常優先考慮概率最大的序列,並不考慮多樣性,而多樣性又是自動生成營銷性文本最需要解決的問題。對此,大眾點評直接對全局結果進行優化,在預測時把一個聚合頁 Context 放到同一個 batch 中,batch_size 即為文案條數,對已經生成序列上進行實體重複檢測和 n-gram 重複檢測,將檢測判重的加一個懲罰性打分,這個簡單的思想已經能非常好的解決多樣性問題。

其他同類產品概述(營銷行業):

營銷行業的人工智能寫作產品主要應用在 SEO 廣告、信息流廣告、郵件廣告及電商產品介紹中,相比資訊類產品而言,營銷類產品更需要解決的是內容個性化的問題,實現根據地點、用戶特點、品牌形象的個性化,以及對文章進行多種風格的改寫就成了主要的方向。對這一領域的探索集中爆發在 2018 年,但是國內對營銷類寫作產品展開研發的主要是與電商相關的上市互聯網公司如阿里、京東、大眾點評,百度。百度最先開始結合人工智能技術與大數據,開發生成方案的工具,但是在兩年的嘗試後轉向了輔助資訊寫作。而國外對營銷廣告工具開展研發的則主要是第三方廣告及技術服務商,這類公司大多都獲得了投資並有了比較完善的盈利模式。

SEO 廣告領域,Articoolo 的產品使用戶能針對一個主題生成多篇不同風格的文章,主要模式是進行原創撰寫或改寫,除了能為有 SEO 廣告和內容營銷需求的客戶定製服務之外,還針對個人用戶提供按篇銷售的收費模式。Dentsu Aegis Network 的項目 Leo 專門根據谷歌廣告系統針對性地生成 SEO 文案,在具體案例中,可以實現單次點擊成本降低 30%-42% 的情況下,廣告點擊率提高 3 到 10 個百分點。2018 年創立的微思寫作除了基礎的糾錯、預測寫作功能,也針對網站 SEO 優化、軟文推廣、自媒體創作等領域研發了智能仿寫工具,對文章進行重寫。藍色光標子公司捷報數據研發的妙筆機器人,可以在 1 秒內改編出數千篇新聞稿,保證中心內容不變並且根據不同傳播渠道特性變換風格,自動插入相關圖片、商品鏈接、名詞解釋和延伸閱讀。通過搜索引擎的審核標準和評判原則對內容和結構進行改進、改編出內容標題與原文相似度極低的 seo 稿件,提高稿件在搜索結果中的排名,從而提高發布稿件的訪問量。並且能監督品牌傳播效果,針對內容閱讀互動、網站流量、粉絲量的增長,以及用戶關注或流失的原因、促成留存轉化的關鍵點等等進行分析,不斷調整策略。除此之外,該機器人還能「蹭熱點」,由輿情機器人判斷新聞的調性是正面還是負面,從而選擇採納與否,再對分析主體、匹配圖片、名詞解釋、定義標籤等常用傳播點進行分析,在這之後,妙筆推薦出關鍵信息點匹配的熱點新聞,並對原文內容的每個段落匹配進行分析,在合適位置插入熱點新聞信息,從而成功「蹭」到熱度。

Phrasee 專注解決電子郵件營銷優化的問題。一鍵點擊就可以生成數百萬種像人類語言的、符合品牌要求的文本變體。該產品會查看廣告創作者在過去 12 個月裡使用的所有營銷文案的表現,通過 NLG 處理技術,著眼於數千種語言特徵。它的神經網絡知道廣告受眾會對什麼樣的情感、文體學和詞彙的組合做出反應,從而識別出帶來更好結果的個別策略。該公司通過「定製語言模型」來適應特定品牌的形象,以保證文本和品牌形象是相關的,並且支持多國語言生成。主要行業包括零售,旅遊和度假,電信和金融服務。三年裡,為 Virgin Holidays 活動生成的人工智能電子郵件主題欄的表現一直好於人工撰寫的主題欄。電子郵件營銷渠道收入大幅增長,相當於數百萬英鎊,用於 Gumtree 網站後,點擊量增加 35%-50%,幫助 superdry 增加 26% 點擊率,幫助 wowcher 降低 31% 的單人成本,幫助 Dominos 實現了驚人的 753% 的投資回報率,此前該公司利用 Phrasee 的 ai 生成的電子郵件主題行,實現了 57% 的電子郵件打開率增長。近期,該公司又針對 Facebook 和 Instagram 的信息流模式推出了新工具。

Persado 主要關注在線廣告。已經進行了 4000 次活動,平均轉化率提高了 49.5%。他們利用世界上最全面的營銷語言知識庫,擁有超過 100 萬個標記和評分的 25 種語言的單詞,短語和圖像。通過將單詞與數據相結合,Persado 將營銷創意分解為六個關鍵要素,然後對數千種潛在的消息組合進行實驗,以生成效果最佳的內容。可以實現 25 種語言生成 AI 驅動的廣告素材、情感語言個性化、品牌定製、針對廣告分發平臺的定製、風格定製、付費社交廣告的即時文本和圖片生成、用戶情緒洞察和反應數據、廣告效果報告和廣告管理等,涉及行業包括金融服務、旅行和酒店、電信技術和消費者服務。目前用戶超過 250 家,平均點擊率提升 68%,平均轉換率提升 76%。目前獲得融資 6600 萬美元。

京東和阿里對文案的嘗試都集中在各自電商平臺上的商品文案優化上,試圖通過為內部商家提供高效高質量的智能文案,來降低商家創意成本,提升平臺內容質量。京東研發了李白寫作和莎士比亞兩個產品,李白寫作通過關鍵字輸入可一秒生成上萬條相關文章或者素材語句,為電商平臺輸出高質量的商品特點介紹,詳細說明,促銷語,導購文章,評測文章等內容,打造豐富的營銷生態體系,也能為資訊平臺量身定製不同類型的文章,如快報,評測,知識百科等,還具備寫詩能力。被應用到京東發現好貨,會買專輯、千人千面、7Fresh 等頻道的內容寫作。據悉,在李白寫作上線短短數月,已取得每日發稿超千篇、累計引入訂單超過萬單,為發現好貨、會買專輯等頻道帶來了數千萬 GMV 的銷售業績。莎士比亞系統在借鑑傳統 NLG 和語言模型方法的基礎上,基於該平臺自身在商品標籤和搜索數據庫層面積累的大數據,從句子層面做結構解析、訓練模型和語言生成,從而能夠一秒鐘「吐」出千條文案,並根據用戶不同的需求自主選擇各類行文風格。且可以根據用戶矯正行為,實現機器自己優化算法。比如自動「記憶」用戶選擇及未選擇的文案,在下次類似檢索時進行優先級排序,也會記錄用戶的修改以改善下次的文案質量。2019 年,京東整合了此前莎士比亞和李白京東兩大 AI 智能文案系統,並增加了對視頻內容智能創作的支持,形成了覆蓋文案、圖像、視頻處理等多種內容創作的綜合性智能創作平臺「AI 閃電」。

阿里發佈的「AI 智能文案」產品順利通過了圖靈測試,該產品結合淘寶、天貓的海量優質內容與自然語言算法,主要聚焦於商品文案,已經實現了三項核心能力——高度模擬人寫文案(提供描述型、特價型、逗趣型等多種文案寫作風格)、自由定義字數、實時在線樣本學習。其背後的技術邏輯,是基於深度神經網絡的 sequence2sequence 模型,融合了注意力機制、位置編碼、copy 機制等,實現對商品逐次生成文案。具體的生成流程是,阿里媽媽的 AI 智能文案首先從上億幾乎覆蓋了淘寶所有類目和商品的文案樣本中,清洗出數百萬規模的高質量訓練樣本。再通過對位置信息進行編碼,改變每個詞生成時的概率分佈,實現長度可控。最後,結合質量控制模型,擬合人對生成結果的判斷。隨著數據的不斷積累,質量控制模型對結果的判斷會更加準確,同時可以更好地指導生成網絡的迭代。以最基礎的短標題文案為例,阿里媽媽「AI 智能文案」的生產能力已達到 1 秒 20000 條。

報告如何獲取?

本報告《智能寫作:人工智能商業應用的制高點——智能寫作中人工智能技術的應用現狀及趨勢展望》是機器之心產業研究團隊推出的《「智周」人工智能技術應用報告系列》之一。

本系列報告全部被收錄於人工智能領域專業信息及數據平臺「機器之心Pro」。

訪問「機器之心Pro」,認證成為專業用戶,即可免費獲取報告。

pro.jiqizhixin.com

PC訪問,體驗更佳


分享到:


相關文章: