北京人才地圖—多領域人才指數領先,成全國最頂尖人才聚集高點

北京人才地圖—多領域人才指數領先,成全國最頂尖人才聚集高點

科技人才是國家科技創新經濟發展的首要驅動力,也是實現中華民族偉大復興的關鍵因素。如何發現、培養、留住、吸引、使用人才,是在當今日趨嚴峻的國際競爭中取得優勢的重要課題。


北京是世界著名的歷史文化古都和現代化國際大都市,同時,北京也是全國最頂尖人才聚集的高點,過去三十年,作為經濟、政治中心的北京集聚了全國乃至全球各地優質學者人才,不斷推動著北京綜合實力和核心競爭力的增長。


今天,學術君就帶領大家一起通過 AI+大數據,詳細瞭解一下北京的人才現狀和實力。


通過北京市智慧人才地圖(圖1)可以看出,北京市人才整體分佈與發展情況上,遙遙領先於全國其它重點城市。

北京人才地圖—多領域人才指數領先,成全國最頂尖人才聚集高點

圖1:北京市智慧人才地圖

具體而言,北京市雲計算、人工智能、大數據和物聯網四個領域的高層次人才總數為 2995 人(四個領域高影響力期刊中近 10 年發文的學者數量),遠超其它一線城市。


其中,雲計算領域的高層次人才凝聚數量最多,為 878 人(該領域高影響力期刊中近 10 年發文的學者數量,下同);人工智能領域的高層次人才聚集數量為 845 人;大數據領域的高層次人才聚集數量為 679 人;物聯網領域的高層次人才數量為 593 人。


此外,從圖1可以看出,北京市 92%的重點領域高層次人才集中在海淀區,從所屬高校/機構來看,清華大學、北京大學和北京郵電大學佔據北京人才機構排名前三。


分領域來看,在人工智能領域(圖2),北京市的人才健康指數為 92.8,在全國排行第一。

北京人才地圖—多領域人才指數領先,成全國最頂尖人才聚集高點

圖2:北京市人工智能領域人才指數

其中,地區影響力對比中,北京市與其它城市相比,在產業創新研究和產業創新影響力上較為突出;從分佈區域上看,人工智能領域人才主要集中在海淀區,清華大學和北京大學在該領域人才數量最多、成果數量最大;“機器學習”“無監督學習”“語音識別”等關鍵詞是該城市該領域的科研熱點。


在大數據領域(圖3),北京市的人才健康指數為 95.2,在全國排名第一。

北京人才地圖—多領域人才指數領先,成全國最頂尖人才聚集高點

圖3:北京市大數據領域人才指數

其中,從區域分佈上看,北京市的大數據領域人才主要集中在海淀區與朝陽區;在大數據領域的人才機構排名中,清華大學和北京大學同樣領跑一眾機構;“異構信息網絡”、“數據流”和“數據立方體”等關鍵詞揭示了北京市大數據領域的研究熱點。


在雲計算領域(圖4),北京市的人才健康指數為 90.2,在全國排名第一。

北京人才地圖—多領域人才指數領先,成全國最頂尖人才聚集高點

圖4:北京市雲計算領域人才指數

其中,地區影響力對比中,北京市在產業創新影響力上較為突出,而基礎科研影響力方面相對弱一些(但強於其它城市);從區域分佈上看,北京市的雲計算領域人才主要集中在海淀區;在大數據領域的人才機構排名中,清華大學在該領域人才數量最多、成果數量最大;“P2P 分佈式”、“虛擬桌面”和“企業混合雲”等詞是該城市該領域的研究熱點。


在物聯網領域(圖5),北京市的人才健康指數為 91.3,在全國排名第一。

北京人才地圖—多領域人才指數領先,成全國最頂尖人才聚集高點

圖5:北京市物聯網領域人才指數

其中,地區影響力對比中,北京市在產業創新影響力和產業創新上較為突出;從區域分佈上看,人才主要集中在海淀區和朝陽區;在該領域的人才機構排名中,清華大學、北京大學和北京郵電大學名列前茅;“無線通信”、“商業智能”和“傳感器”等詞是該城市該領域的研究熱點。



人才地圖的智慧之處


《智慧人才地圖》是智譜·AI 藉助科技情報大數據挖掘與服務系統平臺 AMiner,構建的超大規模多研究領域知識圖譜,基於場景提供學者的智能匹配服務的智慧人才系統。


系統利用數據挖掘和社會網絡分析技術,從海量文獻及互聯網信息中獲取信息並進行語義抽取和隱含關聯關係挖掘,構建全球全領域學者庫人才網絡,為學者、機構、企業等提供人才搜索、論文搜索、學者社會網絡關係識別、學者能力圖譜等多樣化功能。


而且,智慧人才系統提供基於大規模知識圖譜的人才語義檢索,智能理解用戶查詢的語義信息,自動從學科領域、人才姓名、研究興趣、就職單位等多個維度對系統提供的專家智庫進行快速而準確地檢索,準確定位用戶尋找的專家人才,並提供多維度人才語義屬性的快速過濾和智能排序。

北京人才地圖—多領域人才指數領先,成全國最頂尖人才聚集高點

圖6:多精度人才語義畫像

除了智能的語義檢索外,產品還為用戶提供了專家/智庫的收藏,以及對開通智庫的瀏覽,從不同功能入口幫助用戶快速找到目標專家。


智慧人才系統的亮點包括:

  • 以大數據技術為核心,構建超大規模多研究領域知識圖譜,基於場景提供學者的智能匹配服務;
  • 提取基於各地區、研究領域的人才指標,對人才結構、發展目標等多維度進行分析和預測,提供對人才數據的可視化展示,實現對學者的「按圖索驥」;
  • 產品採用 SaaS (軟件即服務)模式下的微服務架構,可對於業務需求的變更進行快速響應和快速部署,實現對業務擴展的及時支持。


正如前文展示,智慧人才地圖能夠給出北京市人工智能、大數據、雲計算、物聯網等等熱點領域的多方面信息。所呈現的數據點面結合,既包括北京該領域的人才動態、城市人才分佈、北京人才機構排名,也有該領域的全國人才分佈、全國發展情況以及北京與全國其他省會城市的影響力對比。

北京人才地圖—多領域人才指數領先,成全國最頂尖人才聚集高點

圖7:智慧人才地圖“人才健康指數”和“人才分佈地圖”功能介紹


北京人才地圖—多領域人才指數領先,成全國最頂尖人才聚集高點

圖8:智慧人才地圖“本地人才核心領域/行業”和“人才動態”功能介紹


北京人才地圖—多領域人才指數領先,成全國最頂尖人才聚集高點

圖9:智慧人才地圖“人才態勢分析”功能介紹

此外,科技情報大數據挖掘與服務系統平臺 AMiner 還結合人工智能學術知識圖譜,深度挖掘了目前北京各個領域學者的職業生涯信息。


感興趣的讀者可以訪問 AMiner 平臺進行查看。



智慧人才系統算法解析


那麼,這麼詳細、可視化的人才地圖,是怎麼做出來的呢?


智譜AI人才地圖的研發團隊表示,該智慧人才系統依託清華大學高質量大規模知識圖譜、深度隱含關聯挖掘算法和認知圖譜等核心技術,服務地方科技產業發展,展示符合地方發展方向的本地、全國和全球人才分佈態勢、人才流動趨勢,可以為地方人才引進工作中的尋、評、引、用提供基於大數據的智能化支持,構建全球人才 Global Positioning System,實現人才工作的按圖索驥。


在算法使用上,智慧人才地圖主要使用了人才指數算法和兩種城市人才分析方法。



人才指數算法:


該算法模型是一種機器學習+專家經驗的集成模型,內層根據學術人才評價指標特點分別採用使用 LR,SVM,深度神經網絡等機器學習算法。利用 AMiner 人工標註的不同領域、多層次學術機構的大量高質量學者數據庫作為模型訓練數據。在此基礎上,外層封裝專家知識的經驗模型,組合而成城市人才評分模型。


為使該算法達到最優計算效果,該模型的訓練採用了啟發式規則+模型自主學習的聯合算法,優化目標值也是從大量經過提純的學者數據中,經過統計分析得到的。


這樣得到的算法模型,結合了大數據分析和專家先驗知識,從而達到合理精準評分。


而計算城市人才指數得分的過程,就是將人才該城市的人才指標特徵(頂尖學者發文數之和,學者數,h之和,引用數之和等),輸入到模型中,會得到所屬的層級分類和具體得分,這個得分可以理解為和高等級的學術團體之間的差距。



城市人才分析方法:
針對需求領域類型的不同分別採用以下 2 種方法:
1.針對較為專業的領域方向,且和其他領域交叉較多,採用學者標註算法進行人才分析;使用2類算法對學者進行領域分析標註:


a. AMiner 學科知識圖譜:對學者的發表論文中的實體,關係等信息進行抽取(其中實體抽取方法使用 BERT+CRF 和規則,關係抽取採用多種方式結合:包括規則和遠程監督),再利用已構建的學科知識圖譜推理對學者進行領域標註。


b. 領域標註系統:這是一個以深度學習為核心算法的多標籤標註系統,算法網絡結構簡單說明:先用 bert 對學者多篇代表性論文進行 Emmbedding,再使用多個的局部 Attention 層和全局 Attention 層進行特徵的融合和提取,最後基於這些語義特徵向量進行標籤預測,即對學者進行領域的標註。


2.針對於相對獨立的學科領域採用 AMiner 會議期刊庫(包含大約 4 萬個期刊會議)進行人才篩選分析;流程如下:專家標註期刊/會議→期刊/會議影響力排序→學者篩選→學者學術水平排序。



參考資料:智譜.AI 智慧人才地圖

http://talent.zhipu.ai/

人才地圖鏈接:https://cncc2020.top3-talent.com/dashboard/?region=beijing


分享到:


相關文章: