地球大數據科學工程

中國網/中國發展門戶網訊 大數據是知識經濟時代的戰略高地,是人類的新型戰略資源。作為大數據重要組成部分的地球大數據,正成為地球科學的一個新的領域前沿,為推動地球科學的深度發展以及重大科學現象的認知發現作出貢獻。

近年來,國際上推出了一系列與地球大數據相關的研究計劃。美國的“地球立方體”項目,尋求以整體視角審視地球系統並創建管理地球科學知識的基礎設施;歐盟啟動的“活地球模擬器”研究項目,依賴於開放的標準,為所有地球科學領域提供多維數據和可擴展的服務;澳大利亞在啟動的數據立方體項目基礎上,最近又推出了澳大利亞“數字地球”項目;2017年,俄羅斯正式啟動“數字地球”計劃,包括髮射一系列的地球觀測衛星,為該計劃提供源源不斷的數據源。

我國在數字地球和全球地球觀測系統方面,進行地球觀測數據共享,整合衛星、地面監測和建模系統,評估環境條件和預測,以應對氣候變化的挑戰,推動地球系統科學發展。可見,地球大數據的發展在全球範圍內方興未艾,開展地球大數據的研究十分重要。

認識地球大數據

地球科學研究包括對大氣、陸地和海洋等圈層的研究,通過空天對地觀測、陸地傳感器網絡及其他方式的觀測生成了海量的地球科學數據集,這些數據來源於但不限於空間對地觀測數據,還包括陸地、海洋、大氣及與人類活動相關的數據,這些與地球相關聯的大數據統稱為地球大數據。地球大數據是大數據的重要組成部分,但有其獨特的特徵。地球大數據具有規模大、來源廣、多樣化、多時相、多尺度、高維度、高複雜性和非結構化等特點,是針對地球科學形成的新的數據密集型研究方向。

地球大數據通過多種對地觀測方式、地球勘測方法及地面傳感網產生。其數據集包含海量、多樣、多來源、多時相、多標量、高空間、極複雜、非結構性的信息,這極有利於促進地球科學研究的深層次發展。

地球大數據具有大數據的特性,不僅具有體量大、來源廣、多時相、高價值等特點,同時它也具有高瞬時性、任意空間性、物理相關性等特點。就其“海量規模”而言,地球大數據具有高分辨率、高動態性以及多波段的特點,數據的獲取速度高且更新週期快。“來源廣”是因為其數據來源和採集方法多種多樣,歸功於成像原理和模型變化的多樣。“多時相”指其在極短的採樣間隔和高頻信息中的採集能力。“高價值”因為其對生態環境、陸地資源、自然災害及其他地球科學研究的重要意義。

與地球大數據相關的技術有對地觀測技術、通信技術、計算技術、網絡技術等。地球大數據可以加深人類瞭解地球的能力,同時在數據傳輸、存儲、處理、分析、管理和共享等方面,地球大數據又面臨全新的挑戰。例如,海量對地觀測數據的實時獲取和多源數據融合,從大量、長期、低成本的傳感器網絡中獲得的數據增加了儲存、處理和計算的複雜性,集成的數據儲存環境需要考慮物理存儲設備和統一存儲平臺的交互技術和可視化方法等。

作為地球大數據的關鍵技術之一,經過近半個世紀的發展,對地觀測技術為地球科學研究提供了新視角和新方法,尤其在地球系統的宏觀認知方面發揮了巨大的作用。在對地觀測技術幫助下,人類可以更為方便、系統地觀測地球,對地觀測技術已成為衡量一個國家科技成就、經濟實力、國家安全的重要指標。目前,地球觀測數據量正成倍增長,據國際衛星對地觀測委員會所做的一項全球衛星研究數據顯示,過去的半個世紀,全球已發射了超過 514 顆地球觀測衛星對地球系統進行包括大氣系統、海洋系統和陸地系統的綜合觀測。

地球大數據是具有空間屬性的地球領域大數據,它具有大數據的一般性質,同時具有很強的時空關聯和物理關聯。這些特徵對地學學科的發展可以起到重大的推動作用,在環境、資源、災害等領域有重要作用和經濟社會價值。地球大數據為地球科學的深入研究帶來了重要的發展機遇,可為創建空間地球信息科學奠定基礎、並進一步推動地球科學的發展。

地球大數據目標

中國科學院充分認識到地球大數據的重要性,2018 年初設立了戰略性先導科技專項( A 類)“地球大數據科學工程”(CASEarth),系統開展地球大數據研究。CASEarth 的宗旨即利用地球大數據驅動跨學科、跨尺度宏觀科學發現,以系統性和整體性的理念去研究一系列重大科學問題,在對地球系統科學認知上有重大突破,同時在決策支持上實現新的跨越,持續地產出在科學發現、宏觀決策、技術創新和知識傳播等方面的重大成果。

CASEarth 的總體目標是建成國際地球大數據科學中心,其主要內容包括 3 部分:①建成地球大數據基礎設施。突破數據開放共享的瓶頸問題,形成多學科融合的地球大數據與雲服務平臺,成為支撐國家宏觀決策與重大科學發現的國家大數據重大科技基礎設施。②形成地球大數據學科驅動平臺。探索大數據驅動、多學科融合、全球協作的科學發現新範式,示範帶動地球系統科學、生命科學及相關學科的重大突破。③構建服務政府高層的決策支持系統。具備多問題、多視角全景式可視化分析、模擬與推演能力,展示和動態推演“一帶一路”可持續發展過程與態勢,實現對全景美麗中國可持續發展和麵向人類命運共同體的國家全球化戰略的精準評價與決策支持。

CASEarth 將在以下 3 個方面顯具特色並取得重要產出:①實現系列科學發現。形成大數據驅動科學發現的新方法、新範式,通過再現陸地、海洋、大氣、人類社會要素各參數的空間分佈和時間動態,揭示全球和區域尺度不同要素之間複雜耦合的相互作用,揭示不同分辨率下要素的細節和不同層次以及耦合關聯。②產生系列技術創新。構建高精度地球大數據雲服務平臺和新型數字地球系統,通過精確的地理關聯和物理關聯,將海量數據和信息產品集成展示。建成“全國佈局,統分結合,透明服務”的地球大數據與雲服務平臺,形成多學科交叉、可演進、可服務的地球大數據重大基礎設施。③服務於政府決策支持。建成大數據驅動、可視化、可交互、可動態演進的決策支持環境,實現多源空間信息的集成化數字再現與多要素交叉集成評估,提供宏觀實時的地球大數據決策支持系統。

地球大數據專項內涵

CASEarth 專項分解為以下 8 個部分開展研究,以實現理論和技術突破,取得創新成果。專項尤為重視數據的共享,並鼓勵國內外學者依託本平臺共同開展研究(圖 1)。

地球大数据科学工程

CASEarth小衛星研製。研製服務於 CASEarth的小衛星,建立 CASEarth 衛星運行管理與評估系統,完成 CASEarth 衛星數據接收與產品服務工作。研究面向觀測任務總體設計技術,高集成、小型化載荷總體技術,紅外、多光譜載荷技術,以及海量數據壓縮存儲與傳輸技術。通過對地觀測衛星總體設計及載荷研製、衛星工程研製、衛星運行管理與評估、衛星數據的接收與產品服務研究 4 個方面的研究,形成一套由衛星需求到數據產品的全系統流程。

大數據與雲服務平臺。建設具有一體化服務能力的地球大數據雲服務平臺,提供統一的計算與存儲雲服務;研究多源異構海量數據接入、匯聚、存儲管理與統一訪問的標準規範、協議、工具和系統,集成整合海量多源的科學數據資源及空天地一體地球大數據,建成有特色的地球大數據資源庫。突破分佈式計算資源統一調度和聚合服務的技術、格網數據計算技術、大數據計算處理技術與分析挖掘的新方法,實現大數據驅動的科學發現與決策支持。

數字“一帶一路”。構建“一帶一路”地球大數據集成技術和評價體系,以及多要素科學數據庫,實現“一帶一路”地球大數據的綜合集成,包括近 50 年49 個大類要素的時空數據;開展“一帶一路”地球大數據科學分析,認知“一帶一路”全區域環境資源空間分佈、可開發潛力、變化趨勢科學規律;建立面向可持續發展目標的區域空間評估指標體系,實現“一帶一路”可持續發展目標關鍵指標的科學監測;建立“一帶一路”地球大數據分析與決策支持系統。

全景“美麗中國”。在多角度、多維度、多環節、多因素、多層次的視角下,以地球系統科學和人-地關係理論為指導,開展基於大數據的資源環境本底分佈與格局演變、清潔空氣與環境健康、生態文明建設、區域發展與智慧城市以及“全景‘美麗中國’”評價與決策支持系統的研究和開發,全面展示“美麗中國”的本底特徵、清潔空氣與環境健康、生態文明建設和城市發展等專題情景,對“美麗中國”建設現狀及未來情景進行評價與預測,為“美麗中國”建設提供政策建議。

生物多樣性與生態安全。研究支持數據整合和共享的標準以及數據集成應用方法;有機整合生物資源數據與生態、環境、氣象、國民經濟等數據,形成完整的數據圖層;利用分析模型和可視化技術實現對生物多樣性資源數據功能挖掘和利用,構建開放開源的生物多樣性與生態安全大數據處理利用的通用接口,建立一個以生物多樣性與生態安全信息為核心的綜合大數據平臺,在不同層次上實現不同形式的數據個性化服務與決策支撐。

三維信息海洋。形成“兩點一面”的海洋信息資源池,其中“一面”是指全球尺度的海洋信息資源池和數據產品,建立全球海洋基礎數據服務系統;“兩點”是指聚焦優勢的方向和區域,在“中國近海”和“兩洋一海”兩個戰略要點開展信息集成和科學研究。在“兩洋一海”關鍵區域,研究南海島礁多源數據及變化數據庫與結構模型、西太平洋深海生物地理信息系統與深海極端生境的多維演示系統、印度洋及其重點港口區海洋災害同化數據產品及海洋災害預測預警系統,最終實現海洋信息的實時展示、動態模擬和情景分析。

時空三極環境。通過三極專題大數據共享與集成、三極遙感對比研究、三極大數據分析方法和多圈層相互作用模型等基礎研究,以及三極生態時空動態與預估、三極水環境與未來水安全、三極氣候變化及對我國影響、北極航道監測與精細化預測、冰凍圈變化及其服務功能、極地重大工程凍土等專題研究,實現佔領地球系統科學制高點,為極地治理和北極開發提供決策支持等目標。

數字地球科學平臺。該平臺是“地球大數據科學工程”專項的綜合展示平臺,重點建設地球大數據綜合展示與決策支持系統及網絡化信息服務系統,主要為面向多學科融合與大數據驅動的科學發現和技術創新提供數據、服務、計算等多類資源及其關係的可視分析支持,兼顧資源、環境、生物、生態等領域的科學傳播與公眾服務。研製彈性可擴展、多模態數字地球科學平臺,保障系統的安全可靠運行,為科學發現與技術創新提供環境和工具支持。

CASEarth 將突破數據開放共享的瓶頸問題,實現資源、環境、生物、生態等領域分散的數據、模型與服務等的全面集成,形成多學科融合、全球先進水平的地球大數據與雲服務平臺,構建大數據驅動的、具有全球影響力的數字地球科學平臺,全景展示和動態推演“一帶一路”“美麗中國”可持續發展目標實現進展,全面提升地球大數據在科學發現、宏觀決策、技術創新和社會公眾知識傳播服務等方面的重大成果產出。

CASEarth促進聯合國可持續發展目標實現

2015 年 9月,在聯合國成立 70 週年之際,各國元首和代表相聚紐約聯合國總部,通過了《變革我們的世界:2030 年可持續發展議程》。該議程的核心是實現全球可持續發展目標,旨在所有國家和利益攸關方攜手合作,阻止地球的退化,以可持續的方式進行消費和生產,管理地球環境和自然資源,使地球能夠滿足今世後代的需求,讓全球走上可持續且具恢復力的道路,形成一個人與大自然和諧共處的世界。

聯合國《2030年可持續發展議程》是一項為人類、地球與繁榮制定的宏偉戰略行動計劃,包含經濟、社會和環境 3 個方面,由 17 個可持續發展目標、169 個具體目標及 230 個指標組成。目前,聯合國、各國政府、國際組織等正在開展聯合國可持續發展目標(SDGs)指標體系構建以及指標監測評估研究。但由於 SDGs 在具體實施過程中面臨許多挑戰,其中數據缺失是監測 SDGs 各個目標最艱鉅的挑戰,數據統計體系不完善、不一致以及指標體系缺失是造成數據缺乏和質量不高的主要原因[19,20];SDGs 監測的評價指標模型化問題複雜,受限於數據的可獲取性,在進行綜合評價時,並不是所選指標均能模型化實現[21]。因此,如何科學建立綜合、交叉、多要素相互作用評價模型庫是一個難點問題。

為應對上述問題和挑戰,CASEarth 專項提出基於地球大數據的科技創新以促進可持續發展目標實現。以地球大數據平臺為基礎,綜合集成資源、環境、生態和生物領域的數據庫、模型庫和決策方法庫,構建可持續發展評價指標體系和決策支持平臺,對資源、環境、生態等方面的可持續性進行有效的監測和評估,將地球大數據納入聯合國和我國的支撐可持續發展評價體系中,同時也服務於我國的生態安全和資源安全保護工作。

CASEarth 專項圍繞 SDGs 的研究內容包括:①通過構建地球大數據共享服務平臺,努力成為聯合國可持續發展目標實施數據提供者、生產者和指標的官方聯絡者;②圍繞 SDG2、SDG6、SDG11、SDG13、SDG14 和 SDG15 等目標開展全球、區域、國家以及地區 4 個不同尺度的 SDGs 重點指標選擇與空間評估指標體系構建以及指標監測評估;③面向可持續發展目標監測的本土化問題,尤其是發展中國家,努力將我國的應用示範成果推動成為普適性的 SDGs 官方應用示範典型案例;④在數據收集分析的基礎上,定期監測和評估可持續發展目標的進展,形成“地球大數據支撐聯合國可持續發展系列報告”;⑤建設面向服務於 SDGs 目標評估和實現的開放型高端智庫,引領我國和國際 SDGs 目標的相關工作,增強各層次上的科學決策能力。

地球大數據為地球科學研究提供了全新的方法論,正在成為認識地球的新鑰匙和地球科學研究的新引擎,有可能給地球科學研究帶來重大變革。利用地球大數據,結合地球系統科學模型,發展地球大數據知識發現的理論與方法是地球科學中應解決的重大科學問題。地球大數據作為一個新的學科方向,應開展持續研究,注重地球科學、信息科學、空間科技等領域的交叉研究,發展地球大數據研究方向,促進地球系統科學研究邁上新的高度。作為代表國家水平和能力的國家創新平臺,CASEarth 將通過地球大數據研究帶來科學方法論和研究視角的創新,帶來可持續發展宏觀決策支持的革命。形成地球系統科學發現的新引擎。(作者:郭華東 中國科學院遙感與數字地球研究所 北京。《中國科學院院刊》供稿)

致謝感謝“地球大數據科學工程”專項領導小組、協調小組、總體組、科研人員和專項辦對本專項立項和研究的支持與貢獻,感謝陳方、樑棟對本文的付出。


分享到:


相關文章: