人機共創:天貓精靈AI藏頭詩

要不要表白、怎麼表白,這成為不少單身人群糾結的問題,畢竟“蒹葭蒼蒼 白露為霜”聽上去要比“安紅,俺想你”更有回味。文學素養不是一日之功,臨時不抱佛腳似乎不太可能。不過,這個七夕不一樣了,表白不用抱佛腳,但要抱科學家的大腿。七夕前,天貓精靈上線了技能“天貓精靈為你寫詩”,通過它,用戶可以用AI給心愛的人寫一首藏頭情詩,還可以進行人機共創的合作。

人機共創:天貓精靈AI藏頭詩

這個創意來自阿里巴巴人工智能實驗室認識實驗室的科學家們,他們將實驗室的AI科研技術賦能於古詩詞創作,研發了這款有趣好玩的產品。

用人工智能寫出古詩詞並不稀奇,但要讓人工智能寫詩有情有味,前後意境、語境連貫,這就需要很高的技術水平。

人機共創:天貓精靈AI藏頭詩

500000首古詩當“老師”

“讀書破萬卷,下筆如有神”,天貓精靈就是讀了500000萬首古詩之後才在寫詩上下筆如有神的。

天貓精靈使用循環神經網絡(Recurrent Neural Networks, RNN)經過上百小時在超過50萬首古詩上的訓練,通過韻律模型進行古詩寫作的學習。經過學習積累,天貓精靈能瞭解到古人寫作用詞的習慣,並能完整做好一句詩的寫作。

以七言絕句為例,當寫到“兩個黃鸝”時,RNN語言模型會計算得到後續漢字的可能性(“鳴”字就輸入較大可能性的漢字),然後選取可能性較大的漢字並依次迭代

人機共創:天貓精靈AI藏頭詩

人機共創:天貓精靈AI藏頭詩

選擇古詩詞領域避免了語言的“歷時性”問題,讓風格更穩定。“歷時性”是指不同時期,語言風格會有較大差異。機器學習在識別這種差異時,會出現問題,導致風格錯亂,例如學習現代詩歌,會李靜文白雜糅、西方風格、歌頌型、朦朧詩等多個時期,這些東西拼在一起組成的現代詩,顯然不能直視。

賦予詩歌情境和感情

對比目前的人工智能寫詩技能看,大家在單句產出上實力比較接近,技術難點是連句成詩。古詩的連接不僅要到合轍押韻,還要讓前後語境、情景串通。

據技術負責人介紹,為了解決這個問題,技術部門採用了機器翻譯中常使用的“sequence-to-sequence(seq2seq)模型”。簡單來說,這個模型可將詩歌生成轉換成相鄰兩句詩之間編碼、解碼關係,先理解上一句的意思(解碼),再根據上一句的意思來產出(編碼),讓情境和情感得以延續。

人機共創:天貓精靈AI藏頭詩

然而,僅僅通過seq2seq只能克服從一句到兩句的寫作難點,而形成一首好詩則需要立足於宏觀層面反覆斟酌的。人工智能實驗室的科學家們用科學方法建立一套詩歌評價體系。天貓精靈在絕句的生成過程中保留了每一個位置詩句的不同表達,然後用這個評價系統來反覆斟酌不同佳句組合的質量,從中選擇情境情感表達最佳的作為成詩。最後以古詩為標尺,通過評價模型計算得分評估AI寫詩的水平,再基於模型修正。因此,每一首詩的誕生,都是一次對50萬首詩再學習的過程,通過尋章摘句確定最匹配的那一組。

人機共創,讓推敲變得更容易

為了能讓普通人體會創造詩歌和推敲的樂趣,“天貓精靈為你寫詩”技能還增加了人機協作功能,這是之前類似技能沒有的。當每一首藏頭詩生成後,會根據算法提供若干段候選的詩句,用戶可以從中選擇一個組成最終的藏頭詩。

相比人工智能,人機共創或者更有前景。在機器能夠完全自主創作之前,人機協作是一個必經的過渡階段。現在所有的撰寫工作都是由人工完成的,沒有任何機器輔助,這裡有這巨大的應用前景,人們與節省時間提高效率有著迫切的需求。

人機共創:天貓精靈AI藏頭詩

寫詩只是一個切入點,是開放域對話攻堅的一部分。所謂開放域對話是指,不限定領域、不限定目的、不限定話題,讓人與機器之間真正像兩個朋友那樣對話。在這其中創作則是最難的部分,尤其是創作中情感、情緒、隱含意義的傳達。

在介紹研發“天貓精靈為你寫詩”的初衷時,項目負責人表示,古詩詞的風格比較統一可以讓我們對/術做出更好的評判,這是一個初步的語言嘗試,想證明機器通過詩這種文學語言表達統一的語境,也能夠傳遞“假裝”的情感,甚至通過對字/詞的情感分類還可以“假裝”出不同類型的情感。

對於語言的理解和生成可以被應用到更廣泛的創作場景裡,例如深度評論,報告論文,劇本等等;技術還可以擴展到人機交互的機器回覆生成等。在未來,天貓精靈或許能成為一個超級輸入法,不用輸入每一個你想寫的字,而是一個梗概或者主題,天貓精靈就可以生成一篇對應的文章,再交互式的修改一下就完成了


分享到:


相關文章: