百度AI——自然語言理解平臺UNIT

眾所周知,百度這幾年全力押注人工智能,在AI基礎構架和應用方面有所成就,包括語音合成ASR,語音識別TTS,自然語言處理NLP,自然語言理解NLU,智能駕駛等等。筆者之前項目對百度AI技術都有所涉及,後續會分享一系列百度AI應用的文章。本篇將帶領大家學習一下百度NLU平臺---UNIT。

隨著AI技術和理念的興起,很多產品都希望採用對話式的人機交互方式。然而對話系統(對話技能、對話機器人)的研發對於大多數開發者而言卻是一個很困難的工作,對技術和數據的要求都很高。

為此,百度將積累多年的自然語言理解與交互技術對外開放,推出了智能對話定製與服務平臺UNIT(Understanding and Interaction Technology),將業界領先的技術能力輸出給廣大的開發者,以便降低對話系統的研發門檻。

接下來,你只需花費3~5分鐘的時間,即可配置出一個完整的對話技能了。

一個簡單的對話技能從無到有需要以下四個步驟。

  • 創建技能
  • 配置意圖及詞槽
  • 配置訓練數據
  • 訓練模型

其中創建技能,配置意圖和詞槽這兩步是為了定義對話能力。

比如創建一個叫做“查天氣”的對話技能,查天氣即為該技能的對話能力,這個技能裡包含了查天氣的對話意圖,其中時間是這個對話意圖的詞槽,今天為時間這個詞槽的字典值。

標註訓練數據和訓練對話模型是為了讓UNIT理解你的對話能力。其中標註訓練數據主要是通過編輯對話模板和對話樣本來完成,可以配置對話模板或對話樣本,訓練模型則是最後一步,隨後即可生成對話模型,此時就可以在UNIT上完成自己的對話了!

創建技能

注:技能即代表某一個對話場景下的對話能力,比如打開電視指令就是針對開電視的一個技能。

  1. 進入UNIT平臺-我的技能,選擇新建自定義技能,然後選擇對話技能,例如取名為“查天氣”。點擊“創建技能”按鈕完成技能創建。

配置意圖及詞槽

注:意圖包括對話意圖和問答意圖,需要關鍵信息的應該使用對話意圖,比如訂購火車票意圖,裡面需要車次,出發時間等關鍵信息,則應該使用對話意圖,問答意圖更偏好於解決FAQ類型的問題。比如退票費怎麼收?

  1. 點擊進入查天氣技能,選擇新建對話意圖。
  2. 進入新建對話意圖以後,填寫意圖名和別名。本例中意圖名取為WEATHER,別名為查天氣。
  3. 在新建對話意圖頁面,可以添加詞槽,這裡添加以下幾個詞槽信息。 注:UNIT為大家提供了強大的系統詞槽,並在不斷豐富中,詞槽的詞典值可以一鍵選用系統提供的詞典,也可以自己添加自定義詞典。

詞槽名詞槽別名系統詞典詞槽必填澄清話術user_time時間sys_time(時間)必填請澄清一下:時間user_loc哪裡sys_loc(地點)必填請澄清一下:地點

百度AI——自然語言理解平臺UNIT

百度AI——自然語言理解平臺UNIT

  1. 配置答覆填寫完意圖和詞槽之後,需要配置回覆及觸發規則,當滿足相應規則之後,即可觸發相應回覆。這裡填寫回復內容為:”正在為您查詢天氣...“規則可以選擇智能生成。
  2. 點擊保存後,意圖配置完成啦。

配置訓練數據

簡單而言,根據規則將一句話拆解成不同的部分標註好,再訓練出對話模型,這樣UNIT就可以理解用戶的對話了。當你對話樣本數據量不夠多的時候,訓練模板可以幫你快速搭建一個對話模型;當你有大量對話樣本數據量時,可以使用對話模板+對話樣本,使你的對話模型更加強大!

點擊左邊菜單欄訓練數據-對話模板,新增一個對話模板,添加時間,地點詞槽,還有文本”天氣“,作為三個模板片段。

百度AI——自然語言理解平臺UNIT

注意:這裡user_loc和user_time的兩個模板片段前面都選擇了否,”天氣“選擇了是,意味著當一個Query進來時,進行模板匹配時,沒有命中時間和地點,只要命中了天氣,即命中了該模板。而且這裡調節了模板的閾值,如果閾值0.7的話,有些Query就識別不了了哦,具體原因可以點擊閾值旁邊的問號查看閾值的詳細解釋哦~

點擊保存,一個對話機器人馬上就要誕生啦!

注:訓練模板中可以配置特徵詞,來輔助匹配用戶的Query,達到更好的理解效果,還可以通過調節模板的閾值,是否匹配等功能,以達到更強大的泛化能力,可以深入研究一下哦~

訓練模型

選擇左側導航欄中的“技能訓練”,點擊訓練並生成新模型。

百度AI——自然語言理解平臺UNIT

驗證效果

等待模型訓練完成後,點擊左側導航欄的測試按鈕,發送”明天北京天氣如何?“試試吧!

百度AI——自然語言理解平臺UNIT


分享到:


相關文章: