「編譯」邏輯數據倉庫-全集數據統一視圖之路

2018-12-20 14:17:59 敏捷大數據

譯自：The Logical Data Warehouse – Towards a Single View of All the Data

原文：https://www.red-gate.com/simple-talk/cloud/cloud-data/the-logical-data-warehouse-towards-a-single-view-of-all-the-data/

編譯：Ling

企業數據倉庫到底出了哪些問題呢？問題看起來似乎相當多。簡單來講，當數據量過大時，存儲和查詢都會出現困難，更別提我們還要解決數據質量、數據安全等問題。這個時候提倡諸如虛擬數據倉庫和邏輯數據倉庫這樣的方案就會很有意義了。

一、前言

多年來，傳統的EDW（Enterprise Data Warehouse，企業數據倉庫）一直是綜合商業智能（BI）解決方案的中流砥柱，它可以提供一個所有人都能相信並使用的中央儲存庫。但在當今信息已然過載的世界中，EDW幾乎無法跟上大數據數量及多樣性爆炸性的增長，這就導致IT技術人員苦苦尋找其他高度靈活、可擴展、且能夠滿足不斷增長的數據實時分析需求的BI解決方案。

在傳統的EDW平臺中，數據可能來自事務型數據庫、企業內重要的軟件應用系統（line-of-business(LOB) applications）、客戶關係管理（CRM）系統、企業資源規劃（ERP）系統或其他來源。將數據加載到數據倉庫之前，需要對其進行清洗和轉換，以確保整個企業範圍內數據的可靠性、一致性和準確性。提取-轉換-加載（ETL）操作精確且高度精煉，它提供了一個穩定且可預測的環境，可以從此環境中訪問數據。

有了EDW，數據科學家和信息工作者就擁有了一個集中處理平臺，他們可以通過該平臺執行復雜的分析並生成信息豐富的報表，供需要的人過濾和鑽取數據。理論上，EDW的設計中應該包含一組粒度足夠細的歷史數據，從中可以獲取十分有意義的信息，從而證明執行和維護這個系統所需的時間和資源投入是合理的。

二、企業數據倉庫萬歲

曾幾何時，EDW也可以存儲足夠多的數據，為決策者提供瞭解趨勢和推動業務戰略所需的信息。數據經轉換之後，被加載到數據倉庫中（通常是夜間批量加載），數據分析師便可以利用各種BI工具來分析這些數據，這些數據為少量分析師提供了豐富的信息庫，他們可以隨時任意分析這些數據。然而，這樣的日子一去不復返。

在當今的互聯網環境下，數據量正在以驚人的速度增長，這在很大程度上歸功於Web2.0時代的到來以及隨之誕生的雲服務、社交網絡、移動設備和物聯網（IoT），所有這些都被列為大數據的範疇，或者更確切地說，數據量大而多樣的、分散的、以非結構化數據為主的開放性數據，帶著無比的榮耀，重新定義了這個信息時代。

信息數量不僅在以20年前無法想象的速度增長，還以各種各樣的格式散落在全球的信息孤島中，在這種情況下，我們依然期望這些信息可訪問、有意義，並且可以被呼之欲出的最新自助式BI產品（著眼於多源、多類型、不斷倍增的數據的實時分析）消費。

面對這種數據過載的情況，傳統EDW的不足之處就顯示出來了。EDW因其單一來源/單一事實的承諾而進入全盛時期，現在卻又因閱讀器、傳感器、掃描儀、社交網站、RFID標籤和無數其他數據生成器和存儲的出現而被迫退位。

EDW提供了一箇中央儲存庫來存儲清洗過的、可信任的、結構良好的數據，雖然這樣的儲存庫仍然可以起到重要作用，但畢竟我們生活的世界主要由原始的、混亂的、非結構化的數據組成。隨著“混亂數據”的不斷升級，人們對它的興趣也不斷增長，想要更好的理解它、從其中獲取價值、並根據它做出決策。這就得需要一個靈活、敏捷、經濟且相對輕鬆的解決方案，然而這些都不是EDW的強項。

實現和維護傳統的EDW平臺需要有完整的規劃和大量的投入，需要仔細思考如何對數據進行ETL操作以及投入多少資源來維持其運轉。

當新需求出現時，EDW卻難以隨之變化，這可能會給業務帶來損害；對源應用程序的修改也可能會對EDW造成嚴重破壞。基於EDW做項目，時間往往過長，當項目實現時，通常已經不能滿足當前的業務需求。這並不是說我們應該徹底拋棄傳統的EDW，而是說，當提到大數據的種種時，EDW已不能與之匹配。

三、邏輯數據倉庫萬萬歲

企業想要更好的利用大量湧入的信息，於是開始尋求其他解決方案來滿足數據需求，這些解決方案或者是傳統EDW的補充，或者是其替代品。這通常意味著企業傾向於轉向一種更加邏輯化的架構，去抽象出大數據領域的固有複雜性。這種架構利用一些能夠緩解數據訪問和數據管控痛點的技術來融入多元環境，例如分佈式處理、數據虛擬化以及元數據管理等技術。

2011年，Mark Beyer在參與Gartner公司關於“大數據、極端信息以及信息能力框架”（Big Data, Extreme Information and Information Capabilities Framework）的研究時，研發了這種虛擬的BI分析基礎架構，並稱之為“邏輯數據倉庫（LDW, Logical Data Warehouse）”。他在博文”Mark Beyer, Father of the Logical Data Warehouse, Guest Post,” 中提到，處理分析型數據的方法是關注信息的邏輯，而不是機制：

該架構包括甚至是擴充了企業數據倉庫，但還會添加語義數據抽象（semantic data abstraction）和分佈式處理，通過數據和數據挖掘在元數據中的維護數據資產信息。它還會監控自身的性能，首先將性能信息提供給人工管理，然後逐步實現針對服務等級預期（service level expectations）的動態配置和性能評估。這很重大。這不是信口開河。這會發生。

Beyer介紹了LDW的概念後，和Gartner的同事一起將這個想法具體化，最終確定了定義LDW平臺的七個主要模塊：

儲存庫管理模塊 - 儲存庫管理是對EDW中數據儲存庫的實現，支持保持最高數據質量標準的特定用例，例如合規問題和監管事項所需的用例。假如我們不考慮數據大小的話，數據越有價值，就越有可能駐留在EDW中。
數據虛擬化模塊 - 無論數據類型和位置如何，不管是結構化、半結構化還是非結構化數據，數據虛擬化就是來自分佈式源的單一數據視圖。數據仍保留在源系統中，可以包括Hadoop集群、關係型數據庫，NoSQL數據庫、雲服務、數據湖、文件服務器、社交網絡或任意數量的系統。
分佈式處理模塊 - 分佈式處理是一種將數據處理下推到數據所在的源系統中進行數據查詢和數據分析的方法。如果查詢跨越多個數據源，則每個系統都可以處理自己的數據塊，並將所有系統的處理結果聚合到一個統一數據集裡。
元數據管理模塊 - 元數據管理系統用於維護跨所有類數據服務的元數據，從而使分佈式處理和數據虛擬化更容易進行。元數據還可用於保證數據質量，支持數據治理和主數據管理。
分類/本體解析（Taxonomy/ontology resolution）模塊 - 分類/本體解析系統是一個將數據資產分類與用例本體相關聯的系統，以便有效地聯合來自多個源的數據。從這個過程中派生出的元數據有助於在有效數據存儲中定位數據資產，以及支持審計和服務級別協議（SLA）服務。
審計和性能服務模塊 - 此模塊用於收集LDW其他模塊性能的統計信息，同時也可以記錄連接的用戶和應用程序的使用方式。

SLA管理模塊 - SLA管理模塊用於追蹤連接的應用程序和用戶的預期，根據審計統計數據監控相關的SLA性能，並據此提出建議或自動優化操作。

雖然數據虛擬化和分佈式處理作為單獨的模塊列出來，但這兩種技術通常合併在一起使用。例如已經添加到SQL Server 2016中的Microsoft PolyBase，它允許從數據庫表結構內部訪問Hadoop集群，提供了數據的虛擬化視圖，同時將處理下推到數據所在的集群中進行。

還有就是Denodo，Denodo是一個成熟的數據虛擬化解決方案，與PolyBase一樣，它也將處理下推到數據所在的系統，不管這個系統是事務型數據庫、EDW解決方案還是Hadoop集群。

在LDW架構中，Gartner所確定的其他模塊跟數據虛擬化和分佈式處理兩個模塊同樣重要，要完整的實現LDW架構，就需要全部或者大多數模塊相互結合，通過跨數據源來支持自助BI、預測分析和實時決策制定。這並不是說LDW必須以特定的方式實現，而是需要用這些模塊有機組合，形成一個邏輯整體。

LDW力求在不把數據從原始數據孤島中搬運出來的情況下，提供所有數據的單一視圖，使查詢一個或多個數據源就像是查詢關係型數據庫一樣輕鬆。只有在邏輯層面上處理數據，才能實現大數據時代所需的靈活性和可擴展性。

四、邏輯數據倉庫之名

技術在發展過程中面臨的一種挑戰是其概念會讓人產生極大的困惑，比如LDW以及Gartner提出過的其他概念。和物聯網一樣，LDW也需要有一個簡明的定義，即使是外行人也能根據其定義對LDW的實現結構有一個相對清晰的認識。它是SQL Server這一類的產品嗎？還是像Salesforce這樣的雲服務？或者它更像是一個數據庫抽象層或者說是虛擬化技術？後面這種說法相對更有吸引力，因為LDW通常又被稱為虛擬數據倉庫（VDW），雖然它還有“數據層”、“數據湖”等許多其他名稱。

但VDW畢竟有點曲折的歷史，所以這種叫法尤其讓人覺得有問題。實際上VDW已經存在了一段時間，並且跟LDW一樣，VDW承諾會完成EDW所不能完成的任務，也就是將數據統一到一個通用的虛擬儲存庫中。

然而，與LDW不同的是，VDW主要關注的是關係型數據庫，而不是大量的大數據孤島。通過將多個數據庫串聯起來，VDW承諾快速簡單的執行項目，不必操心傳統EDW所有那些惱人的集成細節。數據保留在各自的存儲中，不同的應用程序可以虛擬的連在一起，並且可以避免EDW大量消耗資源的情況。

可惜的是，VDW也有不足之處，比如它的性能就不算很完善。想象一下，假如你嘗試利用一個查詢同時訪問多個數據庫，響應時間可能會變化，緩存可能不一致，並且一個系統停機可能會造成整個操作的停止。

VDW更大的問題在於，它也未能解決傳統EDW最大的難題，即清洗所有數據。同步多個數據庫（每個數據庫都有自己真實數據的版本），可能會將最基本的查詢變成不可預測和不可靠的分析結果。無論在哪裡清洗數據，我們總要在某一時刻對數據進行清洗以獲取有價值的信息。

當然，VDW還有很多其他問題，但重點是，我們應該謹慎對待在LDW中加上 VDW的標籤，並希望LDW可以避免VDW存在的所有缺陷。

人們也常拿數據湖與LDW作比較，數據湖是一個存儲大量非結構化數據的儲存庫，通常出現在Hadoop基礎架構中。數據湖可以支持所有類型的數據，並且有能力對這些數據進行轉換，並根據需要定義數據結構。谷歌和雅虎是最先進行“數據湖運動”（data lake movement）的公司，但是之後甚至是微軟都帶著的AzureData Lake服務加入其中，現在正在公開試運行中。根據Microsoft的說法，你可以利用該服務來存儲和分析任何類型或大小的數據。

Azure Data Lake和其他技術一起構建於Hadoop YARN（YetAnother Resource Negotiator）之上。YARN是一個集群管理服務器，是Hadoop 2框架的一部分，它利用Hadoop的線性擴展存儲和處理，解耦了許多MapReduce組件，允許多個第三方引擎使用Hadoop作為訪問數據的通用標準。

LDW的分佈式處理組件很適合應用在數據湖上。實際上，數據湖在處理數據方面非常有效並且可以以相對較低的成本實現，因此LDW平臺可以將其大部分數據清洗和轉換操作推送到數據湖，甚至對EDW中的數據也可以進行這樣的操作。當然，我們需要在進行這些操作與移動數據的成本之間進行權衡，但其潛力是存在的，也必定會是有利的。

Hadoop 2和YARN框架使得數據訪問、數據處理和數據聯邦比以往更高效，但數據湖不是LDW，也不是EDW的替代品。數據湖通常是LDW解決方案中非常重要的一部分，但也只是一個組成部分。

也就是說，將LDW與VDW或數據湖區分開，並沒有給出LDW的具像。實際上，要得出這個“具像”並不容易，因為從整體上看，LDW既是一個概念或是一種倡導，也是一種物理實現。這就是為什麼“邏輯”這個詞在LDW這個名稱中如此突出。

也許我們最好把LDW看作是一個由各個部分相結合組成的邏輯結構，包括EDW、雲服務、Hadoop集群、數據湖以及其他元素，某些組成部分有虛擬化數據和分發處理的能力。然而，僅這些元素並不能完成LDW架構。因此，我們還要尋求其他產品。

例如ThoughtWeb提供的Enterprise Analytics Studio，這是一種用於集中管理、設計和構建企業LDW的軟件解決方案。該解決方案可以利用結構化和非結構化數據，組織和轉換數據，應對SLA管理以及分類/本體解析。

MarkLogic也提供了一個LDW解決方案，將其作為一個可搜索的企業數據層，這個數據層提供了各種數據孤島的統一視圖。MarkLogic解決方案中包括NoSQL數據庫、元數據目錄和儲存庫、Web服務以及用於連接遠程數據源的工具。它還可以接收大量數據，轉換和聚合數據，並將其提供給多個應用程序。

甚至Cisco也攜其數據虛擬化平臺加入了舞臺。據介紹，該平臺支持LDW的每個模塊，包括儲存庫管理、分佈式處理，當然還有數據虛擬化。

【小編語：當然，還有來自敏捷大數據團隊的 Moonbox 計算服務平臺，也是支持了數據虛擬化、分佈式處理、元數據管理以及審計功能，為用戶帶來虛擬數據庫般使用體驗，用戶只需通過統一SQL語言，即可透明實現跨異構數據系統混算和寫出，可以成為LDW架構中非常重要的一部分。】

這些解決方案看起來似乎很完整，但它們本身並不是整個LDW平臺，而是為系統提供動力的組件，目的是使所有數據完美的發揮作用。這些解決方案中的任何一個都不能絕對定義LDW，沒有一種架構可以定義LDW應該如何組成。它是可變的、可適的、可塑的，是大數據這道菜中必不可少的成分。

五、大數據世界

隨著Hadoop的YARN，微軟的PolyBase和Denodo數據虛擬化平臺等技術的不斷湧現，以及來自Cisco，ThoughtWeb和MarkLogic等公司解決方案的不斷提出，將不同系統整合到LDW平臺的能力將持續增長。確實，全球數據越來越多，除了從邏輯平臺上進行數據虛擬化、分佈式處理和數據治理之外，我們還有什麼選擇呢？

不過，隨LDW而來的，是我們不得不解決的問題：如何在適當控制訪問的基礎上確保數據安全？如何處理遠程分析所需的歷史數據？如何處理隱私、合規和監管問題？如何處理孤島之間存在的數據不一致問題？我們是否完全忽視了數據質量？

在解決這些問題之前，LDW可能面臨與VDW相同的命運。然而，如果能在不影響性能的前提下很好的解決這些問題，LDW將有望成為企業把控不斷湧入的大數據的重要工具。那麼，接下來的問題，就是該如何運用好這些送上門來的新信息以發揮更大的作用了。

分享到:

閱讀更多 敏捷大數據 的文章

關鍵字: Line 物聯網大數據

Spring Boot入門系列（十）如何使用攔截器，一學就會

一篇小短文讓你瞭解Maven

看完這篇JVM解析神仙級筆記，面試再也不怕被問源碼

乾貨：數據倉庫、OLAP和數據挖掘、統計分析的關係和區別分析

Apache Doris 百度自研的交互式 SQL 數據倉庫--集群安裝

linux快速掌握第十五章編譯 lnmp

inmon & kimball 數據倉庫&數據集市（2）應用

我這麼久，才弄清楚mysql的觸發器、視圖、索引，受益匪淺(SSS)

我這麼久，才弄清楚mysql的觸發器、視圖、索引，受益匪淺

「Django 學習筆記」3、視圖

亞馬遜的 Snowflake 數據倉庫，比阿里OceanBase強悍嗎？

Flutter路由棧和生命週期解析

01.29 Hive 用戶指南 v1.0

MySQL存儲過程實戰一：函數、視圖、存儲過程對比以及應用場景

LoopBack4 HelloWorld快速入門

數據倉庫-拉鍊表

H3C 20S2126-EI以太網交換機操作手冊

RISC、CISC、ARM、X86、PowerPC、MIPS這些CPU體系架構有何區別？

10.17 數據庫的升級版：數據倉庫

「深度好文」辨析BI、數據倉庫、數據湖和數據中臺內涵及差異點

mysql數據庫語法總結--存儲過程、函數、視圖、觸發器、表

我為什麼使用 Java

Springboot項目之攔截器使用

GO是更好的編程語言嗎？

開源精粹（二）！22個實用、有趣的開源項目

跟我一起寫操作系統（一）——10分鐘寫個操作系統

Sql Server 視圖的創建和使用詳解

MySQL：視圖，觸發器，存儲過程詳解

SpringBoot系列之—瘦身部署

C/C++程序編譯流程（預處理->編譯->彙編->連結）

數據倉庫-parquet分區取代hive分區

006-SpringMVC-理清數據模型、視圖、視圖解析器的脈絡

Scala與Java混合項目——編譯

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"