技術的嚮往是智能膨脹,所以你們的自媒體終將凋亡

2019年1月19日,在由中國人工智能學會、字節跳動、清華大學聯合主辦的Byte Tech 2019 機器智能前沿論壇上,北京大學計算機學院萬小軍教授發表如下演講:

為什麼要做自然語言生成(NLG),之前我們接觸比較多的是自然語言理解(NLU),即理解人類的語言,這是自然語言處理的重要目標。現在我們期望設備智能化,進一步實現機器與人的溝通,我們需要做的是進一步提高NLG技術,即自然語言生成技術,真正實現機器與人類的自然交互,提升機器的智能化水平。

令人狂熱的自然語言生成(NLG)是什麼技術?

NLG = National Language Generative,意指自然語言生成。在人類進化過程中自然形成的語言​就是自然語言,所以地球上現存7000多種自然語言。但時至今日,“生成”二字的主語已經並非人類,而是計算機,我們期望通過技術實踐,令計算機自己不僅學會理解人類的語言,更能主動生成語言,與人類的靈魂對話。

人工智能的技術邊界

當前的主流人工智能技術是深度學習和機器學習,它們的基礎原理都是數理統計,統計就意味著需要大量數據,規律才能顯現出來,所以在沒有數據存在的領域,人工智能無容身之處!

上述觀點在一些抽象學科體現得尤為明顯,例如,人文社科、歷史文化、詩歌創作、文章寫作、音樂美術等領域,即便高度智能,也不可能理解人類的文化與歷史、人類的藝術與欣賞,不可能像人類一樣創造美。

但是,這個觀點在隨著技術邊界的移動發生了微妙的改變。因為在上述抽象學科裡,也會有數據的存在,人類從古至今畫出了無數的名畫、寫出了無數的詩歌、創作了大量的文章、還有著許多音樂,數不勝數。

技術的嚮往是智能膨脹,所以你們的自媒體終將凋亡

有數據,就意味著有可能性......

從畫畫談起......

美術是一個與世無爭的領域,但深度學習的進入使畫家產生了危機感,如下面兩幅圖所示。第一幅圖是數碼相機所拍攝的圖片,而第二張圖是一個深度學習模型經過學習,將原圖變成了《星空》的風格。這樣的任務的實現,甚至已經簡單到只需要一段代碼。我會在之後的文章裡專門寫一篇如何實現這一技術,即便你不是計算機專業,也可以輕鬆學會創作。所以說,美術創作,這個領域,人工智能已經進來了。而且是很輕鬆的進來了。

技術的嚮往是智能膨脹,所以你們的自媒體終將凋亡

技術的嚮往是智能膨脹,所以你們的自媒體終將凋亡

但是,人工智能只會是一個象徵,告訴人類他的能力有多強,這些技術最多隻會留在科學史上,不會進入我們的生活。因為,這樣的畫畫技術是沒有商業價值的,一副沒有情感的圖片不值得被人類銘記。但是,如果這樣的技術有了商業價值呢.....

人工智能憑什麼攻佔自媒體

自媒體行業有大量的寫手,他們是平臺的內容創作者,但是如果他們的內容創作可以被計算機代替呢?這是有著巨大的經濟利益驅動的。​所以說,人工智能將會憑藉以下兩點,脫穎而出。

  • 第一點,行業有數據。僅僅是網上一天時間產生的新聞數量,足夠一個成年人讀上一百年的。這麼龐大的數據量,人工智能算法一旦進入這個行業,隨便學習一下,豈不是就會學習到大量的寫作規律嗎?如果把這些規律應用到新的創作中去......
  • 第二點,算法很給力。隨著當前研究的不斷深入,利用深度學習算法學習的效果日益加強,而且就在前不久,谷歌開源了BERT模型,這幾乎全面拉動了NLP、NLG領域的發展。而且,我們有足夠的理由相信,這些技術依舊在不斷髮展。

NLG將以何種形態存在於自媒體行業

當計算機可以通過文本,讀懂這個世界發生的一切,一組服務器運行著爬蟲程序把粗糙的、沒有經過加工的信息交給智能的計算機處理系統,它就會自動進行處理,輸出句式優美的文本,人類做的更多的是檢查工作。

  1. 視頻、音頻轉為新聞:幾百臺服務器組成的計算機系統,將會無時無刻盯著網上發生的一切,端詳著某個網紅的直播、聽著鄧紫棋的新歌、看著特朗普的演說,並把這些寫作成新聞發送給人類進行檢查,人工檢查無誤後會快速發送到自己的平臺,各大新聞平臺,比的不再是誰的記者跑的快,誰的電腦運行快。
  2. 新聞再生成:每當一個大新聞出來時,一般每家新聞社看問題的視角都不相同,那麼,將針對同一事件的相關新聞綜合到一起,交給計算機,它會採納百家之長,輸出一篇無懈可擊,十分全面的文章。

那麼,如今的自媒體工作者在幹什麼呢?各大新聞平臺似乎已經不再需要蹭熱點的工作者了,大部分的熱點新聞,都會在計算機系統上自動生成。自媒體工作者的就業市場勢必會大大減少,計算機讀過的文章是你的幾十萬倍,比你更懂得怎麼做一個合格的標題黨。

那麼,我說的會成真嗎?作為一個人工智能工作者,我們期待著技術的發展!事實上也是這樣的。

技術的嚮往是智能膨脹,所以你們的自媒體終將凋亡

早在2015年11月7日,在新華社84歲生日之際,就已經引進了一位新助手,這位新同事就是快筆小新,當時就已經初步具備了健全的“寫稿”和分類能力。時至今日,人工智能技術已經發展了快過一代了,學界產生了大量更前沿的技術,做出了許多更接傑出的成就。所以,我堅信,各大搜索引擎、各大電商、各大自媒體平臺會推出越來越多的“快筆小新”。


分享到:


相關文章: