乾貨：數據倉庫、OLAP和數據挖掘、統計分析的關係和區別分析

2020-03-30 21:30:46 Python工程師

一、什麼是數據挖掘

　　數據挖掘(Data Mining)，又稱為數據庫中的知識發現(Knowledge Discovery in Database, KDD)，就是從大量數據中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程，簡單的說，數據挖掘就是從大量數據中提取或“挖掘”知識。

二、數據挖掘相關的10個問題

　 NO.1 Data Mining和統計分析有什麼不同？

　　硬要去區分Data Mining和Statistics的差異其實是沒有太大意義的。一般將之定義為Data Mining技術的CART、CHAID或模糊計算等等理論方法，也都是由統計學者根據統計理論所發展衍生，換另一個角度看，Data Mining有相當大的比重是由高等統計學中的多變量分析所支撐。在我看來統計分析應是數據挖掘的一脈祖先，因為數據挖掘的許多基本思想和方法都來源於傳統統計理論。最典型的就是時間序列分析，你可以在這兩個領域裡找到大量時序分析的論述，並且數據挖掘中時序分析的方法與統計裡的時序分析方法相同，比如一元迴歸等。但是，統計分析中的時序分析並不僅限於此，還有其他一些相關的方法。另外，數據挖掘裡的決策樹方法等人工智能方法在傳統統計理論中是不存在的。最後可以得出結論，那就是數據挖掘的一些基本方法來源於統計分析，針對性更強（比如挖掘中的時序分析針對趨勢預測），通過與人工智能等其他技術相結合，產生更靈活有效的分析方式。

但是為什麼Data Mining的出現會引發各領域的廣泛注意呢？主要原因在相較於傳統統計分析而言，Data Mining有下列幾項特性：

　　1.處理大量實際數據更強勢，且無須太專業的統計背景去使用Data Mining的工具；

　　2.數據分析趨勢為從大型數據庫抓取所需數據並使用專屬計算機分析軟件，Data Mining的工具更符合企業需求；

　　3. 純就理論的基礎點來看，Data Mining和統計分析有應用上的差別，畢竟Data Mining目的是方便企業終端用戶使用而非給統計學家檢測用的。

NO.2 Data Warehousing和 Data Mining的關係為何？

　　若將Data Warehousing（數據倉庫）比喻作礦坑，Data Mining就是深入礦坑採礦的工作。畢竟Data Mining不是一種無中生有的魔術，也不是點石成金的鍊金術，若沒有夠豐富完整的數據，是很難期待Data Mining能挖掘出什麼有意義的信息的。

　　要將龐大的數據轉換成為有用的信息，必須先有效率地收集信息。隨著科技的進步，功能完善的數據庫系統就成了最好的收集數據的工具。數據倉庫，簡單地說，就是蒐集來自其它系統的有用數據，存放在一整合的儲存區內。所以其實就是一個經過處理整合，且容量特別大的關係型數據庫，用以儲存決策支持系統（Design Support System）所需的數據，供決策支持或數據分析使用。從信息技術的角度來看，數據倉庫的目標是在組織中，在正確的時間，將正確的數據交給正確的人。

　　許多人對於Data Warehousing和Data Mining時常混淆，不知如何分辨。其實，數據倉庫是數據庫技術的一個新主題，利用計算機系統幫助我們操作、計算和思考，讓作業方式改變，決策方式也跟著改變。

　　數據倉庫本身是一個非常大的數據庫，它儲存著由組織作業數據庫中整合而來的數據，特別是指事務處理系統OLTP（On-Line Transactional Processing）所得來的數據。將這些整合過的數據置放於數據昂哭中，而公司的決策者則利用這些數據作決策；但是，這個轉換及整合數據的過程，是建立一個數據倉庫最大的挑戰。因為將作業中的數據轉換成有用的的策略性信息是整個數據倉庫的重點。綜上所述，數據倉庫應該具有這些數據：整合性數據（integrated data）、詳細和彙總性的數據(detailed and summarized data)、歷史數據、解釋數據的數據。從數據倉庫挖掘出對決策有用的信息與知識，是建立數據倉庫與使用Data Mining的最大目的，兩者的本質與過程是兩回事。換句話說，數據倉庫應先行建立完成，Data mining才能有效率的進行，因為數據倉庫本身所含數據是乾淨(不會有錯誤的數據參雜其中)、完備，且經過整合的。因此兩者關係或許可解讀為Data Mining是從巨大數據倉庫中找出有用信息的一種過程與技術。

　　NO.3 OLAP能不能代替 Data Mining？

　　所謂OLAP（Online Analytical Process）意指由數據庫所連結出來的在線分析處理程序。有些人會說：「我已經有OLAP的工具了，所以我不需要Data Mining。」事實上兩者間是截然不同的，主要差異在於Data Mining用在產生假設，OLAP則用於查證假設。簡單來說，OLAP是由使用者所主導，使用者先有一些假設，然後利用OLAP來查證假設是否成立；而Data Mining則是用來幫助使用者產生假設。所以在使用OLAP或其它Query的工具時，使用者是自己在做探索（Exploration），但Data Mining是用工具在幫助做探索。

　　舉個例子來看，一市場分析師在為超市規劃貨品架櫃擺設時，可能會先假設嬰兒尿布和嬰兒奶粉會是常被一起購買的產品，接著便可利用OLAP的工具去驗證此假設是否為真，又成立的證據有多明顯；但Data Mining則不然，執行Data Mining的人將龐大的結帳數據整理後，並不需要假設或期待可能的結果，透過Mining技術可找出存在於數據中的潛在規則，於是我們可能得到例如尿布和啤酒常被同時購買的意料外之發現，這是OLAP所做不到的。

　　Data Mining常能挖掘出超越歸納範圍的關係，但OLAP僅能利用人工查詢及可視化的報表來確認某些關係，是以Data Mining此種自動找出甚至不會被懷疑過的數據模型與關係的特性，事實上已超越了我們經驗、教育、想象力的限制，OLAP可以和Data Mining互補，但這項特性是Data Mining無法被OLAP取代的。

　　NO.4完整的Data Mining包含哪些步驟？

　　以下提供一個Data Mining的進行步驟以為參考：

　　1. 理解業務與理解數據；

　　2. 獲取相關技術與知識；

　　3. 整合與查詢數據；

　　4. 去除錯誤或不一致及不完整的數據；

　　5. 由數據選取樣本先行試驗；

　　6. 建立數據模型

　　7. 實際Data Mining的分析工作；

　　8. 測試與檢驗；

　　9. 找出假設並提出解釋；

　　10. 持續應用於企業流程中。

　　由上述步驟可看出，Data Mining牽涉了大量的準備工作與規劃過程，事實上許多專家皆認為整套Data Mining的進行有80﹪的時間精力是花費在數據前置作業階段，其中包含數據的淨化與格式轉換甚或表格的連結。由此可知Data Mining只是信息挖掘過程中的一個步驟而已，在進行此步驟前還有許多的工作要先完成。

NO.5 Data Mining運用了哪些理論與技術？

　　Data Mining是近年來數據庫應用技術中相當熱門的議題，看似神奇、聽來時髦，實際上卻也不是什麼新東西，因其所用之諸如預測模型、數據分割，連結分析（Link Analysis）、偏差偵測（Deviation Detection）等，美國早在二次世界大戰前就已應用運用在人口普查及軍事等方面。

　　隨著信息科技超乎想象的進展，許多新的計算機分析工具問世，例如關係型數據庫、模糊計算理論、基因算法則以及類神經網絡等，使得從數據中發掘寶藏成為一種系統性且可實行的程序。

　　一般而言，Data Mining的理論技術可分為傳統技術與改良技術兩支。

傳統技術以統計分析為代表，統計學內所含序列統計、概率論、迴歸分析、類別數據分析等都屬於傳統數據挖掘技術，尤其 Data Mining對象多為變量繁多且樣本數龐大的數據，是以高等統計學裡所含括之多變量分析中用來精簡變量的因素分析（Factor Analysis）、用來分類的判別分析（Discriminant Analysis），以及用來區隔群體的分群分析（Cluster Analysis）等，在Data Mining過程中特別常用。

　　在改良技術方面，應用較普遍的有決策樹理論（Decision Trees）、類神經網絡（Neural Network）以及規則歸納法（Rules Induction）等。決策樹是一種用樹枝狀展現數據受各變量的影響情形之預測模型，根據對目標變量產生之效應的不同而建構分類的規則，一般多運用在對客戶數據的分析上，例如針對有回函與未回含的郵寄對象找出影響其分類結果的變量組合，常用分類方法為CART（Classification and Regression Trees）及CHAID（Chi-Square Automatic Interaction Detector）兩種。

　　類神經網絡是一種仿真人腦思考結構的數據分析模式，由輸入之變量與數值中自我學習並根據學習經驗所得之知識不斷調整參數以期建構數據的型樣(patterns)。類神經網絡為非線性的設計，與傳統迴歸分析相比，好處是在進行分析時無須限定模式，特別當數據變量間存有交互效應時可自動偵測出；缺點則在於其分析過程為一黑盒子，故常無法以可讀之模型格式展現，每階段的加權與轉換亦不明確，是故類神經網絡多利用於數據屬於高度非線性且帶有相當程度的變量交感效應時。

　　規則歸納法是知識發掘的領域中最常用的格式，這是一種由一連串的「如果…/則…（If / Then）」之邏輯規則對數據進行細分的技術，在實際運用時如何界定規則為有效是最大的問題，通常需先將數據中發生數太少的項目先剔除，以避免產生無意義的邏輯規則。

　　NO.6 Data Mining包含哪些主要功能？

　　Data Mining實際應用功能可分為三大類六分項來說明：Classification和Clustering屬於分類區隔類；Regression和Time-series屬於推算預測類；Association和Sequence則屬於序列規則類。

　　Classification是根據一些變量的數值做計算，再依照結果作分類。（計算的結果最後會被分類為幾個少數的離散數值，例如將一組數據分為 "可能會響應"或是 "可能不會響應"兩類）。Classification常被用來處理如前所述之郵寄對象篩選的問題。我們會用一些根據歷史經驗已經分類好的數據來研究它們的特徵，然後再根據這些特徵對其他未經分類或是新的數據做預測。這些我們用來尋找特徵的已分類數據可能是來自我們的現有的客戶數據，或是將一個完整數據庫做部份取樣，再經由實際的運作來測試；譬如利用一個大型郵寄對象數據庫的部份取樣來建立一個Classification Model，再利用這個Model來對數據庫的其它數據或是新的數據作分類預測。

　　Clustering用在將數據分群，其目的在於將群間的差異找出來，同時也將群內成員的相似性找出來。Clustering與Classification不同的是，在分析前並不知道會以何種方式或根據來分類。所以必須要配合專業領域知識來解讀這些分群的意義。

　　Regression是使用一系列的現有數值來預測一個連續數值的可能值。若將範圍擴大亦可利用Logistic Regression來預測類別變量，特別在廣泛運用現代分析技術如類神經網絡或決策樹理論等分析工具，推估預測的模式已不在止於傳統線性的侷限，在預測的功能上大大增加了選擇工具的彈性與應用範圍的廣度。

　　Time-Series Forecasting與Regression功能類似，只是它是用現有的數值來預測未來的數值。兩者最大差異在於Time-Series所分析的數值都與時間有關。Time-Series Forecasting的工具可以處理有關時間的一些特性，譬如時間的週期性、階層性、季節性以及其它的一些特別因素（如過去與未來的關連性）。

　　Association是要找出在某一事件或是數據中會同時出現的東西。舉例而言，如果A是某一事件的一種選擇，則B也出現在該事件中的機率有多少。（例如：如果顧客買了火腿和柳橙汁，那麼這個顧客同時也會買牛奶的機率是85%。）

　　Sequence Discovery與Association關係很密切，所不同的是Sequence Discovery中事件的相關是以時間因素來作區隔（例如：如果A股票在某一天上漲12%，而且當天股市加權指數下降，則B股票在兩天之內上漲的機率是 68%）。

　　NO.7 Data Mining在各領域的應用情形為何？

　　Data Mining在各領域的應用非常廣泛，只要該產業擁有具分析價值與需求的數據倉儲或數據庫，皆可利用Mining工具進行有目的的挖掘分析。一般較常見的應用案例多發生在零售業、直效行銷界、製造業、財務金融保險、通訊業以及醫療服務等。

　　於銷售數據中發掘顧客的消費習性，並可藉由交易紀錄找出顧客偏好的產品組合，其它包括找出流失顧客的特徵與推出新產品的時機點等等都是零售業常見的實例；直效行銷強調的分眾概念與數據庫行銷方式在導入Data Mining的技術後，使直效行銷的發展性更為強大，例如利用Data Mining分析顧客群之消費行為與交易紀錄，結合基本數據，並依其對品牌價值等級的高低來區隔顧客，進而達到差異化行銷的目的；製造業對Data Mining的需求多運用在品質控管方面，由製造過程中找出影響產品品質最重要的因素，以期提高作業流程的效率。

　　近來電話公司、信用卡公司、保險公司以及股票交易商對於詐欺行為的偵測（Fraud Detection）都很有興趣，這些行業每年因為詐欺行為而造成的損失都非常可觀，Data Mining可以從一些信用不良的客戶數據中找出相似特徵並預測可能的詐欺交易，達到減少損失的目的。財務金融業可以利用 Data Mining來分析市場動向，並預測個別公司的營運以及股價走向。Data Mining的另一個獨特的用法是在醫療業，用來預測手術、用藥、診斷、或是流程控制的效率。

　NO.8 Web Mining和Data Mining有什麼不同？

　　如果將Web視為CRM的一個新的Channel，則Web Mining便可單純看做Data Mining應用在網絡數據的泛稱。

　　該如何測量一個網站是否成功？哪些內容、優惠、廣告是人氣最旺的？主要訪客是哪些人？什麼原因吸引他們前來？如何從堆積如山之大量由網絡所得數據中找出讓網站運作更有效率的操作因素？以上種種皆屬Web Mining分析之範疇。Web Mining不僅只限於一般較為人所知的log file分析，除了計算網頁瀏覽率以及訪客人次外，舉凡網絡上的零售、財務服務、通訊服務、政府機關、醫療諮詢、遠距教學等等，只要由網絡連結出的數據庫夠大夠完整，所有Off-Line可進行的分析，Web Mining都可以做，甚或更可整合Off-Line及On-Line的數據庫，實施更大規模的模型預測與推估，畢竟憑藉網際網絡的便利性與滲透力再配合網絡行為的可追蹤性與高互動特質，一對一行銷的理念是最有機會在網絡世界裡完全落實的。

　　整體而言，Web Mining具有以下特性：1.數據收集容易且不引人注意，所謂凡走過必留下痕跡，當訪客進入網站後的一切瀏覽行為與歷程都是可以立即被紀錄的；2.以交互式個人化服務為終極目標，除了因應不同訪客呈現專屬設計的網頁之外，不同的訪客也會有不同的服務；3.可整合外部來源數據讓分析功能發揮地更深更廣，除了log file、cookies、會員填表數據、線上調查數據、線上交易數據等由網絡直接取得的資源外，結合實體世界累積時間更久、範圍更廣的資源，將使分析的結果更準確也更深入。

　　利用Data Mining技術建立更深入的訪客數據剖析，並賴以架構精準的預測模式，以期呈現真正智能型個人化的網絡服務，是Web Mining努力的方向。

　　NO.9 Data Mining在 CRM中扮演的角色為何？

　　CRM（Customer Relationship Management）是近來引起熱烈討論與高度關切的議題，尤其在直效行銷的崛起與網絡的快速發展帶動下，跟不上CRM的腳步如同跟不上時代。事實上CRM並不算新發明，奧美直效行銷推動十數年的CO（Customer Ownership）就是現在大家談的CRM—客戶關係管理。

　　Data Mining應用在CRM的主要方式可對應在Gap Analysis之三個部分：

　　針對Acquisition Gap，可利用Customer Profiling找出客戶的一些共同的特徵，希望能藉此深入瞭解客戶，藉由Cluster Analysis對客戶進行分群后再透過Pattern Analysis預測哪些人可能成為我們的客戶，以幫助行銷人員找到正確的行銷對象，進而降低成本，也提高行銷的成功率。

　　針對Sales Gap，可利用Basket Analysis幫助瞭解客戶的產品消費模式，找出哪些產品客戶最容易一起購買，或是利用Sequence Discovery預測客戶在買了某一樣產品之後，在多久之內會買另一樣產品等等。利用 Data Mining可以更有效的決定產品組合、產品推薦、進貨量或庫存量，甚或是在店裡要如何擺設貨品等，同時也可以用來評估促銷活動的成效。

　　針對Retention Gap，可以由原客戶後來卻轉成競爭對手的客戶群中，分析其特徵，再根據分析結果到現有客戶數據中找出可能轉向的客戶，然後設計一些方法預防客戶流失；更有系統的做法是藉由Neural Network根據客戶的消費行為與交易紀錄對客戶忠誠度進行Scoring的排序，如此則可區隔流失率的等級進而配合不同的策略。

　　CRM不是設一個（080）客服專線就算了，更不僅只是把一堆客戶基本數據輸入計算機就夠，完整的CRM運作機制在相關的硬軟件系統能健全的支持之前，有太多的數據準備工作與分析需要推動。企業透過Data Mining可以分別針對策略、目標定位、操作效能與測量評估等四個切面之相關問題，有效率地從市場與顧客所蒐集累積之大量數據中挖掘出對消費者而言最關鍵、最重要的答案，並賴以建立真正由客戶需求點出發的客戶關係管理。

　　NO.10目前業界有哪些常用的Data Mining分析工具？

　　Data Mining工具市場大致可分為三類：

　　1. 一般分析目的用的軟件包

　　SAS Enterprise Miner

　　IBM Intelligent Miner

　　SPSS Clementine

Unica PRW

　 SGI MineSet

　 Oracle Darwin

　　Angoss KnowledgeSeeker

　　2. 針對特定功能或產業而研發的軟件

　　KD1（針對零售業）

　　Options & Choices（針對保險業）

　　HNC（針對信用卡詐欺或呆帳偵測）

　　Unica Model 1（針對行銷業）

　　3. 整合DSS（Decision Support Systems）/OLAP/Data Mining的大型分析系統

　　Cognos Scenario and Business Objects

以上就是我整理的一些數據倉庫、OLAP和數據挖掘、統計分析的關係和區別分析，關注我，每日為你分享更多大數據的乾貨。

分享到:

閱讀更多 Python工程師 的文章

關鍵字: 軟件歷史數據倉庫

Python數據挖掘教程-第3天(2)：變量的基本操作

Python數據挖掘教程-第3天(1)：變量

基於圖形的RDF數據索引方法

SPSS常用參數設置

03.05 GEO數據庫挖掘教程（4）一體化分析代碼（帶視頻+R代碼分享）

python數據分析工具

VGG-net訓練過程總結

5種高效利用value-counts函數的方法，一鍵提升數據挖掘姿勢水平

數據分析基本概念

帶你瞭解數據倉庫的基本架構

09.23 學弟啊，你代碼能不能不要寫得這麼爛

Python數據分析系列文章之Pandas(下)

Python開發者必備，史上最詳細的ipython教程

機器學習：處理不平衡數據的5個重要技術

7種最重要的數據挖掘技術

Vue2 添加數據可視化支持的步驟

4個步驟實現聚類分析法分析用戶

ETL介紹與ETL工具比較

你真的懂數據分析嗎？一文讀懂數據分析的流程、基本方法和實踐

6張腦圖系統講透python爬蟲和數據分析、數據挖掘

數據倉庫模型說明

基於機器學習的磁碟故障預測

java編程——淺談資料庫主鍵和外鍵及索引

數據挖掘工程師知識集錦

五段代碼，讓你輕鬆實現Python數據可視化

通過各種各樣的數據源獲取每個用戶的儘可能全面的信息

數據挖掘之數據探索及數據預處理

分佈式互連模型是知識庫模型的另一種重要結構

機器學習中的數學原理——極大似然估計

安全審計系統能夠對於網際網路上最常見的典型應用進行細化的審計

數據挖掘中使用算法做出好的業務模型：搭建數據分析體系76篇

大數據之數據挖掘的玉女心經

數據挖掘是潛在有用的信息和知識的過程

04.23 數據挖掘標準作業流程，主要分為哪幾個步驟？

如何用excel製作自己的知識庫查詢系統，絕對乾貨！！！

即使不懂代碼，你也可以做出這麼酷炫好看的圖表—百度ECharts

加米谷大數據：定製庫到Maven本地資源庫

3——實戰kerberos（筆記）——kafka0.10.x-全系列-加米谷大數據

R語言數據質量分析

R語言數據挖掘實踐——總理2015報告文本挖掘實戰

R語言數據挖掘實踐——模型評估相關概念解析

R語言數據挖掘實踐——支持向量機的常用函數

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"

乾貨：數據倉庫、OLAP和 數據挖掘、統計分析的關係和區別分析