從智能檢測到智能決策,開普雲在AI時代下還有哪些機會?

從智能檢測到智能決策,開普雲在AI時代下還有哪些機會?

在人類歷史的車輪中,始終充斥著以「科技」為名的碾壓和推動力。

遠至1萬年前的新石器時代,為適應農業及其他手工業需求的遠古人對石質工具進行打磨加工;近及18世紀60代開始席捲全球的工業革命,新能源動力機器的發明推動生產力飛躍式發展和生產關係大變革,這一點早已被一次又一次地論證過。

幾年前,AlphaGo團滅人類圍棋手,將人工智能推向臺前。所有人都在問一個問題,AI究竟是什麼。

在我看來言,AI不僅是新一輪生產資料大發現的過程,更是新一輪生產力釋放和補充。因為在AI時代,數據成為新時代的石油工業,規模甚至會更大,更特殊,更具有戰略性。

而對於一家企業來說,未來如何創造收入,隨之而來機會又要多大,這一切都要從更大的畫面上去考慮,而不是從過去的財務結果上去找預期。

有句話說得好,一個公司的命運,既要看自身的努力,更要看歷史的進程。

從這個角度上來說,依託於數字內容管理業務的開普雲,無疑卡住了一個不錯的位置,也讓它有了更大的想象空間。

01 AI時代的“敲門磚”

數字內容管理業務,是開普雲在AI時代的“敲門磚”。

什麼是數字內容管理業務?簡單來說,是依託於互聯網內容服務雲平臺及統一信息資源庫等相關產品,幫助政府完成互聯網數據中臺建設。

以開普雲$開普雲(SH688228)$的一體化政務業務為例,過去政府有很多數據,包括不同政府部門的數據,也包括文本、圖片、音頻、視頻等多種結構的數據。

隨著政務信息化改革的深入,政府需要一個更強大的數據平臺,幫助他們打通各部門的業務系統,實現不同部門數據的統一採集,不同結構數據的統一存儲,最終實現後端不同場景下數據的統一調度。

開普雲的數字內容管理業務的應用場景主要有三個:智慧門戶、一體化政務以及融媒體。從目前來看,公司在三個場景中均有不俗的表現。

在智慧門戶領域,開普雲的客戶覆蓋了全國20%左右的省級政府,國務院組成部門和直屬機構。在政府服務平臺方面,公司也承擔了多個政務服務平臺的項目建設。

回過頭看,內容管理業務對開普雲的AI業務影響巨大。

一方面,AI技術的落地應用往往會優先爆發在數據化程度較高的領域,比如醫療的數據比較少一些,AI滲透的難度會大一些。

原因在於,現在普遍的監督算法必須依賴標記數據。無監督算法對數據標記的要求會小一些,但是技術還不是很成熟,主要是做聚類和分析。

當開普雲在不同場景下完成數據平臺建設,客戶對AI的需求也逐漸爆發。

另一方面,通過數據平臺產品,開普雲能切入不同的場景,而場景則是海量數據的入口。

當這些數據通過AI技術成為結構化、可利用、可輸出的生產要素,便為開普雲積累了一筆最大的財富。這也讓它們有了更大的想象空間。

02 開普雲開闢AI新戰場

縱觀過去,每一次技術革命,都帶來全新的商業機會。互聯網本質上解決了效率和鏈接的問題,進而出現外賣、社交、打車等新業態。

而人工智能的價值主要在於兩點,生產工具的延伸和人工勞動力的替代。前者的例子是淘寶天貓的智能推薦,提高人們獲取商品的效率,而後者的典型則是海底撈的機器人。

對於人工智能企業來說,核心並不在技術,而在於場景的選擇。以開普云為例,由於積累的數據大多為政府稿件和圖片,因此他們選擇政府內容安全的場景切入。

從過去來看,人工智能的應用要經歷從感知、認知到決策的三階段。感知智能只能實現對語音、圖像和人臉的識別,而認知智能可以更好地理解語言的含義,實現和人類的交互,以及各種洞察和決策分析。

開普雲也正在經歷這個過程。

早期,開普雲的大數據服務主要以政府網站的內容安全為主。其中很重要的一個工作是,敏感詞的識別。

在當下信息爆炸時代,每天都在誕生新詞、新的敏感用語。基於對語義的正確理解,快速找到新詞和敏感用語,減少新詞、敏感用語漏報,是內容安全監測的重要工作。

在提高內容安全監測的效率上,開普雲做了兩件事。

技術方面,開普雲通過平衡語料庫自動構建技術,極大地降低了人工標註的成本,可以在較短的時間內覆蓋較大規模的文本素材。目前,基於無監督方式為主訓練的NGram計算,已基本接近人工標註的精度,依存關係計算結果的可信度達到80%以上。

在深度學習的模型下,數據規模很大程度上會影響機器學習算法的精度。目前,公司平衡語料庫覆蓋了各行各業出版圖書、電子報紙、主流媒體新聞資訊,達千億字規模的文本素材,數據量遠遠超過國內其他中文語料庫。

大數據服務具有規模效應。即客戶越多,你收到數據反饋越多,大數據產品精準度就越高,繼而被更多客戶選擇,最終形成馬太效應。

在政務大數據監測領域,這一趨勢已經極為明顯。截至目前,開普雲大數據服務的客戶覆蓋了65%的省政府以及40%的地級政府,在細分領域佔據絕對優勢。

作為大數據監測領域頭部平臺,隨著客戶需求的複雜化,開普雲的大數據服務也有計劃從感知領域向更深度的認知領域延伸,即從敏感詞識別過渡至輿情監測。

眾所周知,在識別領域,文本的識別處理難度最高。原因是文字、語言涉及語義理解,主觀色彩更重,因此更為複雜。

開普雲的做法是,通過人工智能深度學習的方式,強化文字識別的準確性。

技術能力的提升,進一步拓展了開普雲的應用場景。比如,當用戶搜索內容時,開普雲通過人工智能技術,極大加強搜索結果的準確性。

此外,大數據服務可以從網站內容的監控擴大至全網的輿情監控,比如當一個政策發佈後,網上的正面評論有多少,負面評論有多少,評論中出現最多的關鍵詞又有哪些。

基於這些反饋數據,可以為政府的決策提供參考,從而幫助其建立健全的輿情收集和回應機制。

這也代表了人工智能的一個重要發展趨勢,即隨著數據量的增長和業務場景複雜度的提升,AI應用勢必要從智能識別走向更高階的智能輔助決策。

03 AI再進化,大數據服務從智能識別到智能決策

這種趨勢的鋒芒正在開普雲身上閃現。

國家知識產權局項目正是其從智能識別到智能決策的重要體現。

要知道,國家知識產權局是文獻內容很多的政府部門。原因是按規定在專利申請過程中,申請人需要提交一系列的申請文件,如請求書、說明書、摘要和權利要求書等,再由專利審查員去看申請的內容是否滿足要求。

但隨著專利申報數量的增加,國家知識產權局每年能收到幾百萬篇申請,如何更高效地完成篩選工作變成一個棘手的問題。開普雲大數據服務的價值就凸顯出來了。

而開普雲提供的解決方案是,蒐集歷史上所有專利申報成功的稿件,通過人工智能識別網絡的算法把關鍵特徵進行提取,再將新的文獻與關鍵特徵進行匹配,最終得出一份創新性比例的參考數據。憑藉這個算法,使得客戶的審查效率大大提高。

事實上,這種類似於智能決策的業務,在各個細分領域的應用日益頻繁。比如在醫學影像領域,利用人工智能系統輔助閱片。

而隨著人工智能從感知走向認知,要解決的業務問題從單個業務場景、單點問題,向業務全流程演進,行業know-how的複雜度和壁壘變得更高,給技術驅動的人工智能服務商帶來更大的商業機會。

一方面,深入場景服務需要極強的業務理解做支撐,行業准入門檻大大提高。另一方面,人工智能與行業深度融合後重塑業務流程和產業鏈,形成巨大的商業機會,比如基於計算機視覺的智能貨櫃,相比傳統機械式無人售貨機成本下降50%以上。

在AI時代全面到來前,找到落地場景的開普雲,無疑已經佔據了競爭優勢的制高點。


分享到:


相關文章: