AI時代玩好信息服務 你需要get的技術點百度大腦打包獻上

在人工智能的時代大潮下,整個互聯網都在面臨“AI化”的轉型契機。作為互聯網領域的“傳統項目”,信息服務領域如何更加智能,以滿足新時期的新要求?針對這一問題,百度大腦在行業創新論壇成都站上發佈了“信息服務行業解決方案”,涵蓋了語音搜索、圖像搜索、智能錄入、有聲閱讀、語音播報、口碑分析、個性化推薦、內容分類、內容審核等具體業務。

為了讓更多開發者們瞭解到,百度大腦的AI技術如何具體賦能不同場景,如何實現相關功能的具體操作,在11月9日的百度大腦行業創新技術實戰公開課上,來自於百度大腦的技術大牛們,詳細講解了百度大腦面向信息服務領域的多場景應用方案和成功案例。當天雖然陰雨綿綿,但一點也沒有降低開發者小夥伴們的熱情,會場擠得滿滿當當,不得不額外加座。

下面,我們就來看看,現場講了哪些乾貨!

AI時代玩好信息服務 你需要get的技術點百度大腦打包獻上

直擊圖像處理痛點 百度圖像識別及EasyDL實現圖片智能化分類與檢索

圖像信息處理可以說是互聯網的“老行當”了,隨著時代發展,也在處理效率、精準檢索、過濾有害信息等方面提出了新要求。而百度大腦不僅能用AI來重建優質圖像內容,還可以實現精細化的圖像數據管理,以及大幅提升圖像內容查找效率。

這對企業的意義在哪裡?以家圖網為例,經過EasyDL定製化圖像分類訓練後,實現了數百萬圖片的自動分類打標籤,家圖網的圖片利用率從30%提升至80%,分類準確率從50%提升至95%,同時因標籤準確率提高,相似圖片推薦點擊率上升了30%。此外,虎撲體育識貨APP1個小時內就訓練完成了海量鞋類照片自動分類,準確率可達95%;太平洋汽車網通過車型識別實現拍照識圖功能,準確率整體高達91.9%……不僅降低了企業在圖像處理上的人力成本,也極大提升了用戶的使用體驗。

AI時代玩好信息服務 你需要get的技術點百度大腦打包獻上

​實現這些功能,並將圖像信息處理服務體驗優化到新層次的背後,是百度豐富的細粒度圖像識別和精準的EasyDL定製化圖像識別的特性與優勢在發揮作用。

百度圖像識別中的通用物體與場景識別,覆蓋10萬多個標籤體系;細粒度圖像識別支持植物、動物、菜品、地標、車型、LOGO等垂類的精準識別;同時圖像識別接口可關聯返回百度百科信息,幫助開發者一站式獲取最豐富的圖像信息。

EasyDL是百度推出定製化模型訓練和服務平臺,幫助開發者零算法基礎定製高精度AI模型,目前已支持圖像分類、物體檢測、聲音分類三類模型的定製。EasyDL具備可即用、更輕快、高精度、強安全四大優點,只需四步就可以快速定製圖像分類模型,快速滿足個性化的業務需求,解決各垂直信息服務上數據管理難題。

同時講師還深度解析了百度大腦的圖像搜索服務,包括相似圖搜索、相同圖搜索、商品圖搜索三個細分場景的產品,支持開發者自建大規模圖片底庫(最高億級別),並實現實時精準的以圖搜圖。這項服務已經在廣大電商平臺、素材/商標/設計類圖片網站廣泛應用,幫助產品提供更好的用戶體驗。

百度大腦強大的圖像信息處理能力也讓小夥伴們開始看到AI技術與自己行業結合的可能性,比如有人現場提問,百度的圖像識別能力能否用於傳統教育行業,比如學生的情緒識別。講師表示,百度大腦能夠提供一些這方面的服務,像人臉識別簽到、人體分析學生狀態等,後續還將開放更多能力,滿足教育場景的更多需求。

AI時代玩好信息服務 你需要get的技術點百度大腦打包獻上

全面靈活可定製 用AI做安全高效的內容審核服務

內容審核崗位的小夥伴們最頭痛什麼?審核慢,容易漏看誤看……這時候就需要AI出馬了,許多小夥伴們聚精會神地盯著屏幕,用筆記本做著筆記,看來都深受內容審核工作量巨大、工作難度高之苦。

而百度大腦提供的可定製的內容審核方案,實現了對文字、圖像視頻、音頻內容的全覆蓋。比如在文本審核方面,可根據平臺預置的審核模型,結合定製的內容庫,對文字內容進行涉及政治敏感、色情等方面的審核,甚至能具體到該關鍵詞在文章中的位置,以及對廣告、低質內容的鑑別和篩選。還有圖像審核,百度大腦實現了高達98%準確率的色情識別,以及對暴恐、廣告、噁心等多個維度的自動識別篩選,甚至還能對圖像內容質量進行打分,並可根據客戶自身需求調整審核細節。

值得一提的是,百度大腦的內容審核方案,除了能夠對多種類型的內容實現緯度豐富的自動檢測審核外,還針對內容平臺機器審核的行業痛點,進行了針對性的策略優化。首先,針對不同業務之間審核標準不一致的問題,百度內容審核方案提供了精細化的識別標籤,以色情識別為例,支持多達17類細分標籤,完美適配不同的審核標準。其次,

針對模型迭代慢定製成本高的問題,提供了通過EasyDL實現便捷的定製圖像審核模型的服務,並結合圖像搜索技術,實現圖像黑白庫的自定義配置和識別。同時,針對視頻審核接入成本高的問題,提供了關鍵幀抽取、視頻指紋提取和智能檢索方案等一系列配套工具,幫助開發者降低接入成本,實現高效精準的智能內容審核。

AI時代玩好信息服務 你需要get的技術點百度大腦打包獻上

​以趣頭條為例,從關鍵詞+人工審核轉變為百度的視頻審核服務之後,效率相比於人工來說有了大幅的提升,同時也保證了統一的審核標準和高準確率。

現場有小夥伴提問,內容審核能否用於版權保護,讓用戶及時知道自己的版權圖片被複制盜用?對此,講師表示,版權所有者可以將自己的原創圖片作為底庫,百度大腦的圖像搜索能力可以幫助他將網上的圖片和版權庫中的圖片進行對比,對相似度較高的圖片進行預警維護版權所有者的合法權益。

講師與聽眾一問一答間的精彩互動以及現場的PPT都讓參會觀眾大快朵頤,不少觀眾在講師分享時不斷做著筆記,還有的小夥伴直接拿出手機拍下講師PPT,看來這次百度大腦真的是直擊行業痛點了。

AI時代玩好信息服務 你需要get的技術點百度大腦打包獻上

如何用NLP提升內容處理效率和服務質量 百度大腦讓文字處理更加智能

如果機器有一天能完全看懂聽懂人類的自然語言,會為信息服務領域帶來怎麼樣的驚人變化?百度大腦的講師就講述瞭如何用NLP來提升內容處理效率和服務質量。首先是對文章的理解,目前,百度大腦NLP已經開放了幾塊能力:文章摘要、文章標籤、文章分類、文本糾錯、文本審核等。

講師介紹,百度大腦NLP能力最核心的基礎應用就是詞法分析。百度大腦提供的詞法分析包含了中文分詞、詞性標註和實體識別等功能,已經應用在學校科研和開源工具包中。目前,申通快遞和德邦物流在百度大腦NLP能力的支持下,可以將用戶輸入的非結構化數據信息,快速轉化為快遞單據上必填的人名、省市區、聯繫方式等結構化數據,大幅提升文本處理效率。

此外,百度大腦NLP能力也為媒體和內容生產領域提供了新的思路。比如在新聞編寫方面,可以通過AI技術輔助實現內容優化,比如文本糾錯,可以達到一個行業內較高水準的準確率,以及前面所提及的內容審核幫助檢查是否有違規內容。NLP解決方案甚至能幫助文章打分,以此建議作者再次進行人工篩查,來排除文字和內容上的一些錯誤。

AI時代玩好信息服務 你需要get的技術點百度大腦打包獻上

​百度大腦的NLP能力也可以應用於客服行業,對重複或語義相似的用戶提問進行判斷和聚合,通過相似問題統一回復的策略方式,減少客服人員反覆回答同一類問題的成本,這將人工客服從繁瑣而重複的勞動中解放了出來。此外,百度大腦還可以通過文本的情緒識別,來判斷客服和用戶的情緒,在帶有負面情緒的反饋出現時,介入人工進行有針對性的回覆和建議,以幫助降低客戶不滿意導致的流失。最重要的是,NLP商業口碑分析使得商家能夠更精準地通過情感傾向分析來進行口碑上的監控,進而優化自己的服務。

幾步輕鬆實現對話機器人 百度大腦用智能對話幫企業降本增效

還記得在2018百度AI開發者大會上,百度地圖語音助手精準識別、理解了長達60多字的服務請求,並自然流暢地提供了導航服務嗎?其實智能對話不是什麼高不可攀的科技,在公開課上,百度大腦也介紹了智能對話豐富的應用場景,並展示了百度智能對話定製平臺UNIT超強的技術實力。

百度UNIT擁有著業內領先的語義技術,全面支持各類信息服務場景。以應用了UNIT的寶寶知道為例,媽媽們除了諮詢育兒問題外,還可以通過語音播放兒歌、進行常見播放操作,這有效降低了用戶對需求內容查找的時間,提升服務的準確度達到94%。汽車大師APP利用UNIT理解和問答能力,節省27%的客服人力,也大大提高問題解決的效率。在UNIT強大的算法的加持下,企業即使沒有數據積累,也可以輕鬆實現智能對話。

另外,UNIT還提供了預置對話能力,一些常見的、通用的對話場景,開發者只需“勾選”即可將相應能力應用在業務中。

UNIT的優點不僅僅在於需求理解、對話控制、機器學習等技術的領先,它也縮短了對話系統的開發時間,並降低了對話能力的應用門檻。現場,講師展示瞭如何在三秒內不需要任何代碼就能把UNIT接入企業微信公眾號:只需用微信公眾號管理員賬號掃描二維碼;完成授權,即可用微信公眾號完成客戶業務諮詢、業務辦理、售後服務等業務。

UNIT自去年7月5日正式發佈以來,已經創建了1.3萬個技能,訓練超過33萬次,累計對話量達到32億。

AI時代玩好信息服務 你需要get的技術點百度大腦打包獻上

​而UNIT除提供了可在web端操作的配置平臺外,還提供了基於整套功能開發管理API,即開發者可通過API對BOT進行配置、訓練等任何操作。這不僅能讓企業根據自身業務靈活調整預置技能,還可以為客戶快速注入新能力。比如小能智慧雲客服就利用UNIT重塑了場景化服務能力,將人工智能引入到自己的業務架構中來。

深度學習如何落地企業?百度PaddlePaddle展示新特性

很多行業很多企業一聽“深度學習”四個字就覺得特別高大上,覺得和自己的業務八竿子打不到一起。其實,百度深度學習技術平臺部劉毅就表示,深度學習技術目前已步入大規模應用階段,與此同時,深度學習框架門檻也在持續降低,未來將形成以深度學習框架為核心的“操作系統生態”。

百度深度學習框架PaddlePaddle自2016年9月開源以來,目前在提供基礎框架的同時,還推出了深度學習全功能套件——PaddlePaddle Suite,全方位滿足企業深度學習開發和應用的需求。據悉,PaddlePaddle Suite是一款技術全面領先的深度學習全功能套件,該套件包含了技術領先的核心框架、適用於企業應用的豐富配套模塊與組件、以及包含Easy DL、AI Studio、Auto DL在內的服務平臺。

與此同時,PaddlePaddle仍在不忘初心、修煉內功,不斷提高基礎框架方面的優勢。目前PaddlePaddle官方支持最全面的業務模型,在智能推薦、視覺、文本處理等眾多方向提供廣泛的場景支持。PaddlePaddle核心框架的另一項領先的技術是超大規模深度學習並行技術,依託百度業務場景在超大規模數據並行技術上的長期積累,PaddlePaddle全面支持大規模異構計算集群,同時支持異步和同步並行訓練模式,還開放了獨具特色的超大規模稀疏參數訓練能力,支持千億級別稀疏特徵任務在數百個計算節點上的並行訓練。此外,Paddle Mobile提供多平臺的預測部署,全面支持多操作系統、多硬件平臺,預測速度領先同類產品,進一步擴大了深度學習技術在移動端的應用。

AI時代玩好信息服務 你需要get的技術點百度大腦打包獻上

​在介紹完PaddlePaddle產品特性與優勢後,百度深度學習認證佈道師王文凱,還特意為大家帶來了一個前沿案例,方便大家瞭解深度學習在信息服務行業的創新應用。

與商品、電影、書籍等帶有明確標籤和屬性的娛樂產品不同,現在的“輕娛樂”內容比如笑話段子、搞笑視頻等很難準確歸類描述。王文凱在公開課現場,以Analytics Vidhya的比賽“Is this Joke funny”為topic,嘗試使用深度學習的方法,幫助每位用戶找到自己的“笑點”所在,為用戶精準推薦更加適合他的笑話。

在PaddlePaddle裡,看似運算量很大,其實本質上在計算過程當中兩個向量的相似度沒有什麼區別。訓練好之後,就可以得到這個網絡當中的參數,再把這個參數用一定的數據格式輸入到手機裡,或者寫入到嵌入式裡面。參數不斷接受新的數據量,不斷進行更新,就會有一個越學越聰明的持續學習過程。

AI時代玩好信息服務 你需要get的技術點百度大腦打包獻上

​人工智能如何與各行各業深度結合,又如何讓開發者具體去實現它們想要的AI能力?百度大腦正在回答這個問題,接下來,百度大腦行業創新論壇及技術實戰公開課還會登陸深圳、上海、蘇州和武漢等城市,議題涉及信息服務、地產物業、智慧零售、智慧工廠等六大領域,繼續將AI賦能給更多的開發者和企業,讓更多的行業引來智能化的轉身。


分享到:


相關文章: