知識本體構建的規則與邏輯

在術語的基礎上,構建術語之間的本體關係,再以術語之間的關聯關係,作為知識拓展搜索的基礎。通過基於本體的拓展搜索,能夠基於構建好的規則(術語關係),給研發人員提供更多相關知識,從而拓展知識面,發現新知識。

術語是知識準確表達的重要基礎,所有共享都需要在概念理解一致的情況下進行。規範知識的表達,減少知識的重複新建,讓知識易於理解,構建專業術語庫是基礎,讓所有貢獻知識的人員都能用相同的專業術語去表達知識。

在術語的基礎上,構建術語之間的本體關係,再以術語之間的關聯關係,作為知識拓展搜索的基礎。通過基於本體的拓展搜索,能夠基於構建好的規則(術語關係),給研發人員提供更多相關知識,從而拓展知識面,發現新知識。

本體拓展知識之間的內在聯繫,是知識工程應具備的重要特性。知識原本就是一個相互之間有很強聯繫的整體,不能因為知識管理的分類破壞知識的整體性。本體本質上是實現不同知識之間的相互關聯,例如知識跟知識關聯、知識與信息關聯、知識與具體業務和工作類型關聯、知識與人關聯等。只有通過知識之間的關聯,才能建立新舊知識、不同業務知識之間的互相引用,才能更好解決工作中的問題。

雖然現在有一些語義分析技術能夠在一定程度上自動建立這種關聯關係,但從企業長遠發展的角度看,為了關聯和搜索的準確性,企業有必要專門組織力量手動建立本企業自己的關鍵詞表。分類詞表經常被用在大數據量的信息和知識組織中,例如圖書館、檔案館、行業信息組織等。在企業內部實踐中,由於成本和時間的約束,大部分企業不大可能從頭建立分類詞表。我們的經驗是企業可以根據自身核心知識領域,結合部門、職能、流程建立關鍵詞之間的簡單關聯。例如在某個知識領域,確定其關鍵詞,然後確定關鍵詞的同義詞、近義詞、上位詞、下位詞,及跟其他關鍵詞的關係與連接,基本可以建立起初步分類詞表,滿足企業應用。

關鍵詞的同義詞、近義詞、上位、下位關係,就是術語的幾種本體關係。術語是與領域論證工作相關的術語,所以稱為領域術語。領域術語之間的關係稱為領域本體。領域本體構建方法包括4個步驟:

(1) 確定本體的領域與範圍

首先要明確本體的專業領域、目的、作用、應用對象等信息。應該明確特定專業領域的特定內容及特殊表達法。在領域本體的構建範圍確定後,可參考下圖進行領域術語本體的構建。

知識本體構建的規則與邏輯

術語本體的構建過程

(2) 列舉領域中重要術語和概念

通過專業領域的標準規範、前人的總結以及人工集中收集獲得領域術語。在領域本體創建的初始階段,儘可能列舉出想要陳述或解釋的所有概念,而不必在意所要表達的概念之間是否重疊,也不需要考慮這些概念到底用何種方式(類、屬性還是實例)來表達。

(3) 建立本體框架

上一步驟已經產生了大量領域概念,但卻是一張毫無組織結構的詞彙表,需要按照一定的邏輯規則進行分組。另外,需要對每一個概念的重要性進行評估,選出關鍵性術語,摒棄那些不必要或者超出領域範圍的概念,儘可能準確而精簡地表達出領域知識。最終形成一個領域知識的框架體系,得到領域本體的框架結構。

第(2)步和第(3)步並非是絕對的順序,這兩個步驟也可以顛倒過來或交叉迭代進行。有時會先列舉出領域中的術語和概念,然後從概念中抽象出本體框架。也可以先產生本體框架,再按照框架列舉出領域的術語。至於如何具體進行,應該根據開發人員對領域的認識程度,如果領域內已經存在非常清晰的框架或者對領域的認識已經很深刻,則可以直接產生框架。

(4) 定義領域中概念之間的本體關係

這些關係包括上位、下位、同義等常規術語關係外,還可以定義其他有意義的關係,譬如“相關”。 可以通過人工方式逐個定義術語之間的關係,也可以參考術語定義相關的標準文獻,找出術語關係描述規則,通過自動語義分析提取術語之間的關係。

這些關係僅涉及相同工作領域的概念。不同工作領域的概念也可以相關,只是在實踐中屬於同一工作領域的本體才具有實用價值,且跨領域概念之間的關係應該不限於同義詞、近義詞、上位、下位關係,這裡不對此進行深入討論。


分享到:


相關文章: