AI報告|知識圖譜行業報告

人工智能技術分類和趨勢

三種流派的融合應用,使人工智能向想象更進一步

人工智能是對一類能夠實現機器模擬智慧生命某些特徵的技術統稱,從學術上可以分為,對人類已有知識進行組織編輯的符號主義、通過數學理論公式推導聚類和預測問題的連接主義,以及利用機器模仿生物活體行為的行為主義三個流派,分別以知識工程、機器學習和仿生機器人為時代代表,而知識圖譜就是新一代知識工程的具體體現。2012年,深度學習在計算機視覺和智能語音上產生重大突破,打開了人工智能商業化的大門,使得連接主義一度成為人工智能的代名詞,但隨著應用落地成為主旋律,缺位行業邏輯和理論概念的連接主義,往往找不到最佳的應用場景而止步於淺層嘗試,在此背景下,人工智能技術應當走向融合,符號主義需要連接主義提供強大的計算支撐,連接主義需要符號主義的邏輯指導,二者又共同作用於行為主義,充當機器人的大腦和“記憶宮殿”,在多種技術綜合利用下的垂直領域智能解決方案才是當今最符合市場期待的方向。

AI報告|知識圖譜行業報告


人工智能技術應用本質

認知智能使AI觸及生產核心,知識圖譜決定認知智能的起點

人工智能與互聯網或5G等技術本質上存在差別,後者解決的是信息的發出、傳遞、接收與反饋的閉環問題,而人工智能的本質是進行生產力升級,因此評判人工智能使用的是否有價值,要看其技術應用是否貼近生產核心。人類生產力可以歸類為知識生產力和勞動生產力,人工智能走入產業後,可以分為感知智能、認知智能和行為智能,後兩者更與生產力相對應。以計算機視覺、語音識別為代表的感知智能應用深度學習,在算力與數據的支撐下突破了工業紅線,實現了機器對於自然界具象事物的判斷與識別,但僅僅如此並沒有觸及核心生產環節,所以也就限制了其商業應用半徑。當人們使用機器能識別更多事物的時候,自然而然的引發了,對事物背後的事理,理解、分析和決策的深層次需求,認知智能呼之欲出。認知智能核心解決的問題是對人類文明抽象概念的識別與聯想,通過自然語言處理(NLP)技術對文字內容在語義上進行初步認知和自動抓取,經由知識圖譜對概念間的關係屬性進行聯結、轉換,從而對人類社會生產、生活行為進行描繪,實現業務規範梳理、生產流程可視化、人際關係挖掘等代表應用,這與注重經驗、邏輯和方法論累積的知識生產力產生了直接對應,而與勞動生產力相對應的行為智能同樣需要知識的指導,所以認知智能的發展才是人工智能迴歸本質的表徵,而搭建知識圖譜是認知智能可以參與生產的基礎錨點。

AI報告|知識圖譜行業報告


知識圖譜概念定義

是一種描繪實體間關係的語義網絡,是認知智能的必要基礎

知識圖譜是一種描繪實體之間關係的語義網絡,是人工智能重要研究領域——知識工程的主要表現形式之一。知識圖譜通過RDF(三元組),既“實體 x 關係 x 另一實體”或“實體 x 屬性 x 屬性值”集合的形式,以人類對世界認知的角度,闡述世間萬物之間的關係,通過NLP技術、圖計算、知識表示學習等手段,將非線性世界中的知識信息結構化,以便機器計算、存儲和查詢,起到賦予機器人類認知的效果,是人工智能技術走向認知的必要基礎。

AI報告|知識圖譜行業報告


知識圖譜發展歷程

三個時期五個階段奠定了現代知識圖譜的雛形

知識圖譜發展至今可以總結為三個時期和五個階段。1950-1977年是啟蒙期,包含了基礎概念階段和專家系統階段的開端,這一時期文獻索引的符號邏輯被提出並且應用;1977-2012年是知識圖譜不斷演變的成長期,包含了大部分專家系統階段和Web 1.0和2.0階段,在此期間出現了很多如WordNet、Cyc、Hownet等大規模的人工知識庫,知識工程成為了人工智能重要的研究領域,2012年,Google正式提出的知識圖譜概念,開啟了現代知識圖譜的序章;2012年至今是知識圖譜的發展期,中國企業開始入局,以BAT為代表的科技公司依託自身業務,在搜索引擎、電商、醫療等領域開始應用知識圖譜技術,解決辦法服務商們也從大數據賽道中脫穎而出,將知識圖譜技術拓展到安防、金融、教育等更多領域,讓AI跳出感知智能的商業侷限,向解決各產業生產環節中的核心痛點更進一步。

AI報告|知識圖譜行業報告


知識圖譜結構

建設本體模型和實體數據庫是知識圖譜結構的核心

知識圖譜從邏輯上可以分為概念層和數據層,數據層指以三元組為表現形式的客觀事實集合,而概念層是它的“上層建築”,是經過積累沉澱的知識集合。建設中以本體模型和實體數據庫為核心,根據二者的建設順序又分為先定義本體和數據規範,再抽取數據的“自頂向下型”和先抽取實體數據,再逐層構建本體的“自底向上型”兩種模式,前者適用於場景較為固定,存在可量化行業邏輯的領域,如金融、醫療、法律等;後者適用於新拓展的,有大量數據積累,行業邏輯難以直接展現的領域。總體而言,搭建知識圖譜從數據源開始,經歷了知識抽取、知識融合、知識加工等步驟。原始的數據通過知識抽取或數據整合的方式轉換為三元組形式,然後三元組數據再經過實體對齊,加入數據模型,形成標準的知識表示,過程中如產生新的關係組合,通過知識推理形成新的知識形態,與原有知識共同經過質量評估,完成知識融合,最終形成完整形態上的知識圖譜。

AI報告|知識圖譜行業報告


多源異構的數據來源

結構化和半結構化數據的抽取是搭建基礎,非結構化數據抽取的發展將拓寬知識圖譜的應用邊際

知識抽取是搭建知識圖譜過程中至關重要的一環,也是目前評判知識圖譜優劣性的標準之一。知識抽取所處理的信息往往是明確的事實性信息,信息源通常分為已有關聯數據庫的結構化數據、如表格和列表類的半結構化數據,以及如TXT格式的文本類非結構化數據,前二者可以通過D2R(DRF格式轉換器)、包裝器(格式解析工具)等工具完成處理,而文本類非結構化數據需要通過自然語言處理的相關技術進行知識抽取,所有數據最終都要通過處理轉化為標準數據供圖譜使用。隨著生物識別和物體識別等AI技術的應用,指紋庫、人臉庫、車輛庫等數據庫逐步建立,對於非結構化數據的知識抽取將不再侷限於文本,所搭建的知識圖譜維度將會更豐富,應用場景更加垂直下沉。

AI報告|知識圖譜行業報告


大規模應用落地的保障——知識抽取

實體和關係抽取是核心,事件抽取是知識更新的重要手段

對信息源的知識抽取主要按照自然語義中的主謂賓語法進行抽取,分為實體抽取、關係抽取、屬性抽取和事件抽取等。實體抽取指在信息源中識別出特定的元素標籤,並與實體庫中的標籤相鏈接,是信息抽取中最基礎的部分;關係抽取意在找到信息源中實體間的關係,可分為全局抽取和局部抽取,全局抽取是通過語料庫對信息源中的所有關係對進行抽取,而局部抽取則是判斷一句話中實體的關係類型,目前可以通過特徵標註的有監督學習和藉助外部知識庫進行標註的遠程監督學習實現,後者相比前者節省人工標註成本,但準確率略低;屬性抽取可以看作實體和其屬性值之間的關係,屬於關係抽取的一種類型;事件抽取是將信息源中指定的事件信息抽取,並結構化地表現出來,包括事件的時間、地點、人物、原因、結果等,通常使用將事件劃分多個分類階段的pipeline方法和利用神經網絡的深度學習方法,事件抽取擁有時間維度,可以與時俱進地迭代學習,是知識圖譜知識更新的重要手段。

AI報告|知識圖譜行業報告


快速工程化搭建的利器——知識融合

通過本體對齊和實體對齊實現知識庫聯結合並,形成更加統一、稠密的新型知識圖譜

知識融合是指,從概念層和數據層兩方面,通過知識庫的對齊、關聯、合併等方式,將多個知識圖譜或信息源中的本體與實體進行鏈接,形成一個更加統一、稠密的新型知識圖譜,是實現知識共享的重要方法。概念層的知識融合主要表現為本體對齊,是指確定概念、關係、屬性等本體之間映射關係的過程,一般通過機器學習算法對本體間的相似度進行計算來實現,根據自然語言類型,可分為單語言對齊和跨語言對齊,其中跨語言對齊是實現知識國際交流的重要方式。數據層的知識融合主要表現為共指消解和實體對齊,前者意在將同一信息源中同一實體的不同標籤統一,實現消歧的目的;後者是將不同信息源中同一實體進行統一,使信息源之間產生聯結。知識融合的使用能夠大量應用人類已有知識儲備,節省成本,是快速搭建知識圖譜的必要手段,也是現代知識圖譜應用中重要的研究領域。

AI報告|知識圖譜行業報告


由數據向知識轉化的秘訣——知識加工

本體構建、知識推理和質量評估使RDF數據向“知識”躍遷

經過知識抽取和知識融合,實體和本體從信息源中被識別、抽取,並且消岐、統一,此時得到的關聯數據是對客觀事實的基本表達,但客觀事實還不是知識圖譜需要的知識體系,想要獲得結構化的知識網絡,還需要經過本體構建、知識推理和質量評估等知識加工過程。本體構建是知識圖譜內實體連通的語義基礎,以“點線面”組成的網狀結構為表現形式,“點”代表不同實體,“線”代表實體間的關係,“面”既是知識網絡。本體可以通過人工總結專家經驗進行手動編程,也可以由機器學習驅動進行自動構建,本體構建的模型深度和廣度,決定了知識圖譜的應用價值;知識推理是通過對已有實體間關係的計算,找到新關聯,從而豐富新知識的過程,也是知識圖譜更新的重要手段;質量評估是知識加工最後的“質檢”環節,確保經本體構建和知識推理得到的知識是合理,且符合知識圖譜應用目的,根據所建設知識圖譜的類型和具體用途,質量評估的標註有所不同。

AI報告|知識圖譜行業報告


知識圖譜的載體——知識存儲

關係型數據庫和圖存儲是現代知識圖譜較為常見的存儲方式

知識存儲是將知識圖譜的概念層和數據層以計算機可識別的數據格式進行保存的物理形式,是知識的現實容器。知識存儲按照存儲結構可以分為表格形式和圖形式,常見的表格存儲有三元組表、類型表和關係型數據庫,前二者難於大規模建設,且查詢、維護、刪改等操作成本較高,不適用於現代知識圖譜應用。關係數據庫通過屬性記錄實體,能很好的和RDF完成映射,利用SQL語言也能方便快捷的進行知識檢索,是目前應用較為廣泛的知識存儲方式;圖存儲是以圖形結構對數據進行存儲的方式,並非圖片存儲。以圖形的“節點”象徵實體,節點間的“邊”代表實體間的關係,這種結構與知識圖譜內本體結構非常貼合,更有利於知識查詢和價值挖掘,常被應用於本體層的存儲,但在某些場景中因其格式死板問題,並不適合全面應用。結合圖譜使用目的,靈活的選擇存儲搭配方式,是符合當下知識圖譜落地的最佳方案。

AI報告|知識圖譜行業報告


知識圖譜的主要算法——圖計算

用於圖結構化數據間的關聯性推理運算,善於挖掘隱藏關係

圖計算屬於大數據挖掘技術的一種,專用於圖結構化數據之間關聯性的推理運算,基礎數據格式與圖存儲相對應,由代表實體的“點”、代表本體的“邊”和邊上的權重組成,這裡的權重多指一些包含時序性信息的具體數據。圖計算算法主要包括全盤訪問每一個節點的遍歷算法、用於計算社交網絡中人際關係的社區發現、源自搜索引擎,用於網頁鏈接排序的PageRank,以及解決圖結構中距離問題的最短路徑算法,在知識圖譜中主要應用遍歷算法進行知識推理,以發現實體間隱藏的關係。為了更高效的進行圖計算,在應用中會使用圖計算系統和計算模型,圖計算系統分為單機系統和分佈式多機系統,對於大規模圖結構存儲的計算後者更具有優勢。而圖計算模型被用於解決圖計算因頻繁迭代帶來的數據讀取等待和成本高的問題、對相鄰節點和邊的計算依賴問題,以及難以在分佈不均的區塊上並行計算的問題。

AI報告|知識圖譜行業報告


知識圖譜的關鍵技術——自然語言處理

通過分詞、詞性標註和句法分析等方式使語言與程序相耦合

自然語言處理(NLP)是一門涉及語言學、數學和計算機科學的綜合學科,主要研究人與計算機之間使用人類自然語言進行有效溝通的理論和方法。NLP技術包含非常廣泛,最常應用於知識圖譜中的能力是對於自然語言中信息的抽取,基本能力包括分詞、詞性標註和句法分析,通過詞典法或統計法將文章中的詞語進行分割,由最大熵、HMM或CRF等算法訓練模型,對名詞、動詞、形容詞、標點符號等詞性類別進行識別和標註,再根據規則法或統計法對語句的主謂賓等句法結構進行分析,得到完整句式,最終產出一個計算機可識別的語料庫,供後續需求調取。NLP技術是人工智能領域最具有挑戰性的任務之一,2018年10月,谷歌公佈的BERT模型在11項NLP任務中表現卓越,將下游具體NLP任務近一步推向預訓練產生詞向量環節,增強了NLP的泛化能力和自動化能力,為業界帶來了新的思考方向,隨著訓練模型的不斷探索與開源,類似深度神經網絡於識別類任務的里程碑型訓練算法終將出現,屆時NLP訓練成本將大大降低,從而真正走向產業化,開啟認知智能的大門。

AI報告|知識圖譜行業報告


業界前沿技術——知識表示學習

將知識映射到向量空間參與計算,用深度學習挖掘隱藏關係

表示學習是深度學習的核心環節,其本質是將研究對象的語義信息轉化為稠密低維的向量,利用數學模型表示實例,並參與機器計算。知識表示學習是圖神經網絡(GNN)重要的應用表現,是面向知識庫中概念和實體進行的表示學習,它的價值在於能夠量化語義信息,進而計算概念間和實體間的相似度,實現關係抽取、實體對齊和知識推理的效果。知識表示學習的應用能夠有效提升計算效率、降低數據稀疏帶來的學習難度、解決多元異質數據的耦合問題等,是知識圖譜技術的重點研究方向。目前知識表示學習的前沿研究仍以模型試驗為主,以提高模型的預測準確性、可解釋性、泛化能力為研究重心,使知識表示能夠區分概念和實體,增強邏輯性是研究方向,隨著知識表示學習的發展成熟,認知智能將更快得以實現。

AI報告|知識圖譜行業報告


知識圖譜的應用價值

對多源異構數據和多維複雜關係的處理與可視化展示是現階段的主要價值,圖神經網絡下的深度學習算法應用將帶來更廣闊的認知市場

知識圖譜是人工智能符號學派中知識工程的代表應用,其核心價值在於對多源異構數據和多維複雜關係的處理與可視化展示,其底層邏輯是將人類社會生活與生產活動中難以用數學模型直接表示的關聯屬性,利用語義網絡和專業領域知識進行組織存儲,形成一張以關係為紐帶的數據網絡,通過對關係的挖掘與分析,能夠找到隱藏在行為之下的利益鏈條和價值鏈條,並進行直觀的圖例展示。在面對數據多樣、複雜,孤島化,且單一數據價值不高的應用場景時,存在關係深度搜索、規範業務流程、規則和經驗性預測等需求,使用知識圖譜解決方案將帶來最佳的應用價值。連接主義中的深度學習算法幾乎代表了當代整個人工智能技術,但深度學習需要具有明確因果關係的數據對訓練,且存在尚缺乏解釋性的黑箱問題,在摻雜眾多非線性問題的複雜場景中應用價值有限,通過與知識圖譜的配合使用,在一定程度上可以解決此類問題,隨著關係向量法深入研究,圖神經網絡將走向產業應用,屆時依託於行業知識與經驗的深度學習將產生更多貼近產業核心的認知智能應用,人工智能技術也將跟進一步實現生產力升級的終極目標。

AI報告|知識圖譜行業報告


知識圖譜市場商業邏輯分析

原圖應用解決查詢類問題,算法支撐造就智能化解決方案

知識圖譜作為一種更加形象的數據表現方式,其產品形式可以分為原圖應用和算法支撐兩類。原圖應用是指直接通過圖譜產生價值的服務形式,圖譜根據概念層和數據層的區別可以分為通用知識圖譜和行業知識圖譜,通用知識圖譜信息一般來自開放的互聯網,三元組多為具有普適性的常識知識,知識覆蓋的廣泛性越強,價值越凸顯,其特性更適用於如谷歌、百度、搜狗等百科型搜索引擎,被視為下一代搜索引擎的核心技術。而行業知識圖譜則更看重具體場景中的認知深度,以及與行業know-how的結合程度,在此基礎上實現的知識檢索、隱藏關係挖掘和缺失數據補足,能很好地滿足垂直領域知識類查詢的需求,例如企業業務流程查詢、司法領域案例查詢、警務領域嫌疑人關係查詢等;算法支撐是指通過知識圖譜對於信息源的生數據進行處理,將產出的結構化關聯數據用於算法模型訓練和應用,得到能解決具體場景問題的研判建議,從而形成解決辦法產生價值的服務形式。結合垂直行業B端市場的需求特點,由知識圖譜作為算法支撐的智能解決辦法具有更凸顯的市場價值和更廣闊的想象空間,用於投研投顧、輔助斷案、業績預測等偏向於認知智能的服務,是以知識圖譜和算法能力見長的數據智能服務公司應有的核心競爭力。

AI報告|知識圖譜行業報告


中國知識圖譜市場產業鏈戰略分析

中游解決方案提供方進行全流程服務,是產業鏈核心環節,中國知識圖譜市場產業鏈上游主要以各類數據源企業或機構為主,因所處理數據多具有敏感性和專屬性,所以往往數據源也是服務的需求方;中上游主要包括數據採集服務商、數據庫服務商、雲服務商等,為產業鏈做支撐服務,但涉及保密數據採集加工的業務更多交由解決方案提供方直接處理;中游主要以提供知識圖譜解決方案的大數據智能公司、互聯網公司和AI公司為主,該部分是產業鏈的核心環節。其中大數據智能公司多脫身於大數據公司,憑藉多年數據服務積累,在具體領域中具有先發優勢和工程落地經驗,隨著市場對於認知智能需求的覺醒,近些年越來越多的大數據公司開始向知識圖譜做技術拓展。互聯網公司多以巨頭企業為主,因其綜合服務能力強、具有生態優勢等因素,在資源調動和承接整體解決方案方面具有優勢。AI公司主要以機器學習能力、NLP能力切入知識圖譜市場,在技術創新和算法應用開發方面具有優勢;下游為基於知識圖譜而開發應用的各類具體場景應用,知識圖譜應用在中國剛剛起步,主要聚焦於圖中展示領域,隨著市場推進將輻射更多行業。

AI報告|知識圖譜行業報告


中國大數據智能行業市場規模和結構

2019年市場規模約為106.6億元,金融和公安領域佔比最大

據艾瑞諮詢統計推算,2019年涵蓋大數據分析預測、領域知識圖譜及NLP應用的大數據智能市場規模約為106.6億元,預計2023年將突破300億元,年複合增長率為30.8%,其中2019年市場中以金融領域和公安領域應用份額佔比最大,金融領域因標準化數據積累豐富,行業認知與直接需求最為明顯等因素,成為數據智能最早落地併產生價值的行業;公安領域經過三年的感知智能基礎設施建設,已經初步形成人工智能應用環境,在黨中央和公安部的號召指導下,公安大數據建設將成為下一階段的主題,這一趨勢也在2019年相關招標項目中得以體現。隨著整體市場數據基礎的完善和需求喚醒,大數據智能領域規模持續走高,但在行業可落地性和理性建設的限制下,預計市場增速將呈現下降趨勢,期間諮詢性需求將會大量出現,從整體發展來看增速處於良性區間,對真正有價值的公司和產品有正向意義。

AI報告|知識圖譜行業報告


AI報告|知識圖譜行業報告


知識圖譜應用——搜索引擎領域

知識索引可將有價值的信息以自然語言的形式直接展現

搜索引擎是互聯網發展中最具代表性的應用之一,它解決了人們如何方便獲取信息的問題,一度成為大部分流量的入口。但隨著網絡中信息沉積越來越多,人們真正需要的,隱藏在大量無用信息中有價值的部分,我們稱之為知識的內容,往往得不到直觀展現,這成為了搜索引擎領域重點要解決的問題。2012年5月,谷歌率先提出知識圖譜概念,用以更好的描述現實世界中實體關聯性問題,進而提高信息搜索中的知識獲取效率,隨後搜狗、微軟、百度紛紛推出相關概念架構,知識圖譜被視為下一代搜索引擎的核心技術。傳統搜索引擎一般採用網頁索引,按照“網頁--(預處理)--> 臨時庫 --(索引)--> 索引好的庫 --(由用戶行為觸發檢索)--> 為用戶展示網頁結果”的流程執行,信息源來自網頁,展現內容也是網頁鏈接。而基於知識圖譜的搜索作為和網頁索引同級、並行的另一套知識索引,更注重信息間的關聯性和自然語言理解,通過圖存儲的形式從新組織互聯網中的信息,再以人類的語言習慣進行查詢和展現,從而提高搜索體驗,因為知識的存儲形式發生了變化,所以知識索引信息來源和展現載體都不再侷限於網頁文字,語音交互和更加豐富的IoT場景將會是未來的發展方向。

AI報告|知識圖譜行業報告


知識圖譜應用——公共安全領域

公安知識圖譜重點解決數據關聯性和數據價值挖掘問題

公安大數據是全面助推公安工作質量變革、效率變革、動力變革的重要力量,受到黨中央和公安部的高度重視,而作為大數據和人工智能雙重技術的應用表現,知識圖譜通過數據分析、文本語義分析等,抽取出人、物、地、組織機構、服務標識等實體,並根據實體的屬性聯繫、空間聯繫、語義聯繫、特徵聯繫等建立相互關聯,構建一張具有公安特性的多維多層的實體與實體、實體與事件的關係網絡,在解決公安大數據發展中面臨的數據缺乏關聯性等問題時起到了重要作用。建設公安知識圖譜仍然遵循知識圖譜搭建邏輯,其中知識抽取、本體層建設和實戰應用開發,需要將公安部門多年積累的實戰經驗與技術算法相互轉換,重點考驗公安知識圖譜解決辦法提供商對公安業務的理解能力和專業積累,是該行業競爭中重要的壁壘。

AI報告|知識圖譜行業報告


知識圖譜應用——金融領域

知識圖譜與機器學習相結合的智能風控方案是主流趨勢

在金融領域中無論是傳統金融或是互聯網金融,信用評估、反欺詐和風險控制都是最為關鍵的環節,隨著近些年金融數據的爆發式增長,傳統風控系統逐漸力有不逮,而應用機器學習算法和知識圖譜的智能風控系統在風險識別能力和大規模運算方面具有突出優勢,逐漸成為金融領域風控反欺詐的主要手段。機器學習和知識圖譜相結合是目前主流的解決方案,其中機器學習算法通過概率計算的方式,以數學運算特徵反應風險情況,形成易於機器計算的風控模型;而知識圖譜通過權威經驗和規則創建本體模型和抽取實體的範圍,根據實體間關係形成關聯數據網的圖譜形式,描畫囊括個人基礎信息、金融行為、社交網絡行為等用戶綜合畫像,根據畫像情況和模型對應,形成具有金融業務特性的風控體系,在解決方案的決策環節結合規則和概率的綜合評價,給出最終的風險評估,整個過程能夠實現秒級響應。知識圖譜的應用不僅能夠為缺乏可解釋性的機器學習算法帶來必要的參考系,還可以串聯金融業務中產生的大量多源異構數據形成數據中臺,挖掘數據深層價值,為實現精準營銷、投資關係梳理、產業鏈風險預警、智能催收等上層應用打下基礎。

AI報告|知識圖譜行業報告


知識圖譜應用——投研領域

知識圖譜通過自動抓取和產業鏈關係推理解決投研領域痛點

對一級市場或二級市場的投資研究,一直是泛金融領域重要的課題,上市公司或一些重要的標的公司在公開網絡中披露了眾多如財務數據、定期公告、公司研報等有價值的信息,為投資者行為提供了充分的參考依據。傳統投研工作需要分析師通過各種渠道去搜集和判別信息,憑藉個人經驗對零散的數據進行組織建模,以報告的形式產出趨勢觀點和數據分析,大部分的物料和時間成本都花費在信息和數據的蒐集上,而且成果可控性不高,縱使頭部金融數據機構提供了相應的軟件產品,但數據的顆粒度和產業鏈關聯性仍難以滿足多元需求,這成為了該行業長久存在的痛點。投研知識圖譜以公司信息、產業鏈關聯為切入點,利用NLP技術自動抓取關鍵信息,搭建投研領域知識圖譜,將各個行業的發展變化抽象導入數字層面,為知識查詢和應用開發提供實現基礎。據統計,券商研報中80%的數據指標在傳統軟件產品中無法查詢到,分析師在進入一個新領域時要耗費一週左右的時間蒐集類似數據,而利用投研知識圖譜可以將其必要勞動時間縮短到一分鐘,大幅提高投研效率。除靜態領域圖譜外,還可以利用時間序列搭建對網絡報道、新聞事件進行抓取的事理圖譜,兩相結合,從行業固有邏輯和實時信息雙管齊下,推導事情的發展脈絡和趨勢走向,為投研機構和投資者清晰的梳理關聯脈絡,為後續判斷投資機會和持倉股票風險等研判類應用提供數據支撐。

AI報告|知識圖譜行業報告


知識圖譜應用——司法領域

知識圖譜是“智慧司法”建設的基礎工程

司法領域是以公檢法等國家司法機關及司法人員依照法定職權和法定程序,運用法律處理案件的專業領域。近年,司法領域積極運用大數據、雲計算、人工智能等先進技術,深入業務場景解決痛點問題,有效提升辦案質效、輔助司法管理、服務群眾訴訟,加速推進司法智慧化、數字化、現代化轉型升級。知識圖譜的構建是實現智慧司法不可或缺的基礎工程。司法知識圖譜將法律領域中的實體、屬性和關係進行體系化梳理,並建立邏輯關聯,通過知識圖譜和大數據技術進行數據挖掘,輔助決策,洞察知識領域動態發展規律。基於司法知識圖譜,通過技術手段可實現司法業務場景的智能應用,解決“案多人少”“同案不同判”等現實問題。目前,司法知識圖譜已廣泛運用於法律知識檢索和推送、文書自動生成、裁判結果預測預警、知識智能問答、數據可視化等方面,為司法人員辦案提供高效參考和科學依據,全新定義司法數據應用和司法智能化,凝練司法智慧,服務法治建設。

AI報告|知識圖譜行業報告


知識圖譜應用——油氣領域

知識圖譜應用為油氣勘探開發和安全環保生產提供決策輔助

目前,我國境內已探知的石油資源質量不高且產能有限,以至70%原油需求有賴於進口,加之國際原油價格持續走低,開採成本又很難攤薄,我國油氣行業面臨著生產效率與成本帶來的巨大壓力和挑戰。在油氣領域中,生產環節主要包括產業鏈上游的油氣勘探、開發生產和中游的油氣儲運、煉製與加工,存在的痛點是上游如何將鑽探數據、地質數據等“地下信息”與地面工程執行高效結合,從而準確探明更有開發價值的油井;中游如何利用大量自動化設備和傳感器產生的數據進行高效的安全生產,以及節能環保問題。知識圖譜憑藉對多源異構數據關聯性挖掘和知識體系信息化搭建等能力,在數字化程度較高、數據類型複雜的油氣領域搭建認知網絡,將領域知識與實時數據有機結合,為油氣勘探、開發生產、綜合研究、生產管理提供智能化分析手段,幫助決策者從海量的數據中洞悉規律,來提升效率和管理水平。

AI報告|知識圖譜行業報告


知識圖譜應用——教育領域

搭建知識圖譜是AI技術落地教育領域核心環節的關鍵前提

當前的教育場景可以劃分為教、管、學、考,主要圍繞教育者和受教育者進行授課、答疑、閱卷和學習、練習、考試等活動,本質上是通過系統化的知識傳授與強化練習,使受教育者掌握知識點的過程。傳統教育模式以教師集中授課為主要方式,存在著特級教師資源少、優質教學資源分配不佳、教學內容和教學節奏制式化,以及作業練習佈置缺乏個性化等問題。在教育信息化和線上教育發展普及之後,AI+教育的概念隨之產生,人工智能公司和教育機構希望通過利用AI技術部分解決上述痛點,以達到對教育參與者減負增效的目的,但因為教育領域參與個體眾多,採集到的數據駁雜且零碎,難以直接有效應用,所以目前AI技術更多應用在如拍照搜題、口語評測、課堂監控等外圍需求的工具上面,並未能有效深入到教學場景中。而類似課題推送等應用更多是將教學資源再分配,重視知識的點狀強化練習,卻不深究知識的掌握程度,以至實際使用者反饋平平。人工智能技術真正產生生產價值,一定要建立在充分且必要的數據基礎上,搭建貫穿教材知識體系、教學資源管理和受教育者學習軌跡的知識圖譜,將教與學的全過程進行可視化展現,使靜態知識點數據與動態教學活動(如考試、作業等)數據產生關聯,為算法應用提供支撐環境,是AI+教育能落地到產業核心的關鍵前提。

AI報告|知識圖譜行業報告



分享到:


相關文章: