MySQL千萬級大表優化，看這一篇就忘不掉了

2020-02-11 19:53:39 51CTO

千萬級大表如何優化，這是一個很有技術含量的問題，通常我們的直覺思維都會跳轉到拆分或者數據分區，在此我想做一些補充和梳理，想和大家做一些這方面的經驗總結，也歡迎大家提出建議。

圖片來自 Pexels

從一開始腦海裡火光四現，到不斷的自我批評，後來也參考了一些團隊的經驗，我整理了下面的大綱內容。

既然要吃透這個問題，我們勢必要回到本源，我把這個問題分為三部分：“千萬級”，“大表”，“優化”，也分別對應我們在圖中標識的“數據量”，“對象”和“目標”。

我來逐步展開說明一下，從而給出一系列的解決方案。

數據量：千萬級

千萬級其實只是一個感官的數字，就是我們印象中的數據量大。

這裡我們需要把這個概念細化，因為隨著業務和時間的變化，數據量也會有變化，我們應該是帶著一種動態思維來審視這個指標，從而對於不同的場景我們應該有不同的處理策略。

①數據量為千萬級，可能達到億級或者更高

通常是一些數據流水，日誌記錄的業務，裡面的數據隨著時間的增長會逐步增多，超過千萬門檻是很容易的一件事情。

②數據量為千萬級，是一個相對穩定的數據量

如果數據量相對穩定，通常是在一些偏向於狀態的數據，比如有 1000 萬用戶，那麼這些用戶的信息在表中都有相應的一行數據記錄，隨著業務的增長，這個量級相對是比較穩定的。

③數據量為千萬級，不應該有這麼多的數據

這種情況是我們被動發現的居多，通常發現的時候已經晚了，比如你看到一個配置表，數據量上千萬;或者說一些表裡的數據已經存儲了很久，99% 的數據都屬於過期數據或者垃圾數據。

數據量是一個整體的認識，我們需要對數據做更近一層的理解，這就可以引出第二個部分的內容。

對象：數據表

數據操作的過程就好比數據庫中存在著多條管道，這些管道中都流淌著要處理的數據，這些數據的用處和歸屬是不一樣的。

一般根據業務類型把數據分為三種：

①流水型數據

流水型數據是無狀態的，多筆業務之間沒有關聯，每次業務過來的時候都會產生新的單據。

比如交易流水、支付流水，只要能插入新單據就能完成業務，特點是後面的數據不依賴前面的數據，所有的數據按時間流水進入數據庫。

②狀態型數據

狀態型數據是有狀態的，多筆業務之間依賴於有狀態的數據，而且要保證該數據的準確性，比如充值時必須要拿到原來的餘額，才能支付成功。

③配置型數據

此類型數據數據量較小，而且結構簡單，一般為靜態數據，變化頻率很低。

至此，我們可以對整體的背景有一個認識了，如果要做優化，其實要面對的是這樣的 3*3 的矩陣，如果要考慮表的讀寫比例(讀多寫少，讀少寫多...)，那麼就會是 3*3*4=24 種，顯然做窮舉是不顯示的，而且也完全沒有必要，可以針對不同的數據存儲特性和業務特點來指定不同的業務策略。

對此我們採取抓住重點的方式，把常見的一些優化思路梳理出來，尤其是裡面的核心思想，也是我們整個優化設計的一把尺子，而難度決定了我們做這件事情的動力和風險。

而對於優化方案，我想採用面向業務的維度來進行闡述。

目標：優化

在這個階段，我們要說優化的方案了，總結的有點多，相對來說是比較全了。整體分為五個部分：

其實我們通常所說的分庫分表等方案只是其中的一小部分，如果展開之後就比較豐富了。

不難理解，我們要支撐的表數據量是千萬級別，相對來說是比較大了，DBA 要維護的表肯定不止一張，如何能夠更好的管理，同時在業務發展中能夠支撐擴展，同時保證性能，這是擺在我們面前的幾座大山。

我們分別來說一下這五類改進方案：

規範設計
業務層優化
架構層優化
數據庫優化
管理優化

規範設計

在此我們先提到的是規範設計，而不是其他高大上的設計方案。

黑格爾說：秩序是自由的第一條件。在分工協作的工作場景中尤其重要，否則團隊之間互相牽制太多，問題多多。

我想提到如下的幾個規範，其實只是屬於開發規範的一部分內容，可以作為參考。

規範的本質不是解決問題，而是有效杜絕一些潛在問題，對於千萬級大表要遵守的規範，我梳理瞭如下的一些細則，基本可以涵蓋我們常見的一些設計和使用問題。

比如表的字段設計不管三七二十一，都是 varchar(500)，其實是很不規範的一種實現方式，我們來展開說一下這幾個規範。

配置規範：

MySQL 數據庫默認使用 InnoDB 存儲引擎。
保證字符集設置統一，MySQL 數據庫相關係統、數據庫、表的字符集都使用 UTF8，應用程序連接、展示等可以設置字符集的地方也都統一設置為 UTF8 字符集。
注：UTF8 格式是存儲不了表情類數據，需要使用 UTF8MB4，可在 MySQL 字符集裡面設置。在 8.0 中已經默認為 UTF8MB4，可以根據公司的業務情況進行統一或者定製化設置。
MySQL 數據庫的事務隔離級別默認為 RR(Repeatable-Read)，建議初始化時統一設置為 RC(Read-Committed)，對於 OLTP 業務更適合。
數據庫中的表要合理規劃，控制單表數據量，對於 MySQL 數據庫來說，建議單表記錄數控制在 2000W 以內。
MySQL 實例下，數據庫、表數量儘可能少;數據庫一般不超過 50 個，每個數據庫下，數據表數量一般不超過 500 個(包括分區表)。

建表規範：

InnoDB 禁止使用外鍵約束，可以通過程序層面保證。
存儲精確浮點數必須使用 DECIMAL 替代 FLOAT 和 DOUBLE。

整型定義中無需定義顯示寬度，比如：使用 INT，而不是 INT(4)。
不建議使用 ENUM 類型，可使用 TINYINT 來代替。
儘可能不使用 TEXT、BLOB 類型，如果必須使用，建議將過大字段或是不常用的描述型較大字段拆分到其他表中;另外，禁止用數據庫存儲圖片或文件。
存儲年時使用 YEAR(4)，不使用 YEAR(2)。
建議字段定義為 NOT NULL。
建議 DBA 提供 SQL 審核工具，建表規範性需要通過審核工具審核後。

命名規範：

庫、表、字段全部採用小寫。
庫名、表名、字段名、索引名稱均使用小寫字母，並以“_”分割。
庫名、表名、字段名建議不超過 12 個字符。(庫名、表名、字段名支持最多 64 個字符，但為了統一規範、易於辨識以及減少傳輸量，統一不超過 12 字符)
庫名、表名、字段名見名知意，不需要添加註釋。

對於對象命名規範的一個簡要總結如下表所示，供參考：

命名列表

索引規範：

索引建議命名規則：idx_col1_col2[_colN]、uniq_col1_col2[_colN](如果字段過長建議採用縮寫)。
索引中的字段數建議不超過 5 個。

單張表的索引個數控制在 5 個以內。
InnoDB 表一般都建議有主鍵列，尤其在高可用集群方案中是作為必須項的。
建立複合索引時，優先將選擇性高的字段放在前面。
UPDATE、DELETE 語句需要根據 WHERE 條件添加索引。
不建議使用 % 前綴模糊查詢，例如 LIKE “%weibo”，無法用到索引，會導致全表掃描。
合理利用覆蓋索引，例如：SELECT email，uid FROM user_email WHERE uid=xx，如果 uid 不是主鍵，可以創建覆蓋索引 idx_uid_email(uid，email)來提高查詢效率。
避免在索引字段上使用函數，否則會導致查詢時索引失效。
確認索引是否需要變更時要聯繫 DBA。

應用規範：

避免使用存儲過程、觸發器、自定義函數等，容易將業務邏輯和DB耦合在一起，後期做分佈式方案時會成為瓶頸。
考慮使用 UNION ALL，減少使用 UNION，因為 UNION ALL 不去重，而少了排序操作，速度相對比 UNION 要快，如果沒有去重的需求，優先使用 UNION ALL。
考慮使用 limit N，少用 limit M，N，特別是大表或 M 比較大的時候。
減少或避免排序，如：group by 語句中如果不需要排序，可以增加 order by null。
統計表中記錄數時使用 COUNT(*)，而不是 COUNT(primary_key) 和 COUNT(1)。
InnoDB 表避免使用 COUNT(*) 操作，計數統計實時要求較強可以使用 Memcache 或者 Redis，非實時統計可以使用單獨統計表，定時更新。
做字段變更操作(modify column/change column)的時候必須加上原有的註釋屬性，否則修改後，註釋會丟失。
使用 prepared statement 可以提高性能並且避免 SQL 注入。
SQL 語句中 IN 包含的值不應過多。
UPDATE、DELETE 語句一定要有明確的 WHERE 條件。
WHERE 條件中的字段值需要符合該字段的數據類型，避免 MySQL 進行隱式類型轉化。
SELECT、INSERT 語句必須顯式的指明字段名稱，禁止使用 SELECT * 或是 INSERT INTO table_name values()。
INSERT 語句使用 batch 提交(INSERT INTO table_name VALUES(),(),()……)，values 的個數不應過多。

業務層優化

業務層優化應該是收益最高的優化方式了，而且對於業務層完全可見，主要有業務拆分，數據拆分和兩類常見的優化場景(讀多寫少，讀少寫多)!

①業務拆分

業務拆分分為如下兩個方面：

將混合業務拆分為獨立業務
將狀態和歷史數據分離

業務拆分其實是把一個混合的業務剝離成為更加清晰的獨立業務，這樣業務 1，業務 2......獨立的業務使得業務總量依舊很大，但是每個部分都是相對獨立的，可靠性依然有保證。

對於狀態和歷史數據分離，我可以舉一個例子來說明。

例如：我們有一張表 Account，假設用戶餘額為 100。

我們需要在發生數據變更後，能夠追溯數據變更的歷史信息，如果對賬戶更新狀態數據，增加 100 的餘額，這樣餘額為 200。

這個過程可能對應一條 update 語句，一條 insert 語句。對此我們可以改造為兩個不同的數據源，account 和 account_hist。

在 account_hist 中就會是兩條 insert 記錄，如下：

而在 account 中則是一條 update 語句，如下：

這也是一種很基礎的冷熱分離，可以大大減少維護的複雜度，提高業務響應效率。

②數據拆分

按照日期拆分：這種使用方式比較普遍，尤其是按照日期維度的拆分，其實在程序層面的改動很小，但是擴展性方面的收益很大。

數據按照日期維度拆分，如 test_20191021。
數據按照周月為維度拆分，如 test_201910。
數據按照季度，年維度拆分，如 test_2019。

採用分區模式：分區模式也是常見的使用方式，採用 hash，range 等方式會多一些。

在 MySQL 中我是不大建議使用分區表的使用方式，因為隨著存儲容量的增長，數據雖然做了垂直拆分，但是歸根結底，數據其實難以實現水平擴展，在 MySQL 中是有更好的擴展方式。

③讀多寫少優化場景

採用緩存，採用 Redis 技術，將讀請求打在緩存層面，這樣可以大大降低 MySQL 層面的熱點數據查詢壓力。

④讀少寫多優化場景

讀少寫多優化場景，可以採用三步走：

採用異步提交模式，異步對於應用層來說最直觀的就是性能的提升，產生最少的同步等待。
使用隊列技術，大量的寫請求可以通過隊列的方式來進行擴展，實現批量的數據寫入。
降低寫入頻率，這個比較難理解，我舉個例子：

對於業務數據，比如積分類，相比於金額來說業務優先級略低的場景，如果數據的更新過於頻繁，可以適度調整數據更新的範圍(比如從原來的每分鐘調整為 10 分鐘)來減少更新的頻率。

例如：更新狀態數據，積分為 200，如下圖所示：

可以改造為，如下圖所示：

如果業務數據在短時間內更新過於頻繁，比如 1 分鐘更新 100 次，積分從 100 到 10000，則可以根據時間頻率批量提交。

例如：更新狀態數據，積分為 100，如下圖所示：

無需生成 100 個事務(200 條 SQL 語句)可以改造為 2 條 SQL 語句，如下圖所示：

對於業務指標，比如更新頻率細節信息，可以根據具體業務場景來討論決定。

架構層優化

架構層優化其實就是我們認為的那種技術含量很高的工作，我們需要根據業務場景在架構層面引入一些新的花樣來。

①系統水平擴展場景

採用中間件技術：可以實現數據路由，水平擴展，常見的中間件有 MyCAT，ShardingSphere，ProxySQL 等。

採用讀寫分離技術：這是針對讀需求的擴展，更側重於狀態表，在允許一定延遲的情況下，可以採用多副本的模式實現讀需求的水平擴展，也可以採用中間件來實現，如 MyCAT，ProxySQL，MaxScale，MySQL Router 等。

採用負載均衡技術：常見的有 LVS 技術或者基於域名服務的 Consul 技術等。

②兼顧 OLTP+OLAP 的業務場景

可以採用 NewSQL，優先兼容 MySQL 協議的 HTAP 技術棧，如 TiDB。

③離線統計的業務場景

有幾類方案可供選擇：

採用 NoSQL 體系，主要有兩類，一類是適合兼容 MySQL 協議的數據倉庫體系，常見的有 Infobright 或者 ColumnStore，另外一類是基於列式存儲，屬於異構方向，如 HBase 技術。
採用數倉體系，基於 MPP 架構，如使用 Greenplum 統計，如 T+1 統計。

數據庫優化

數據庫優化，其實可打的牌也不少，但是相對來說空間沒有那麼大了，我們來逐個說一下。

①事務優化

根據業務場景選擇事務模型，是否是強事務依賴。對於事務降維策略，我們來舉出幾個小例子來。

降維策略 1：存儲過程調用轉換為透明的 SQL 調用

對於新業務而言，使用存儲過程顯然不是一個好主意，MySQL 的存儲過程和其他商業數據庫相比，功能和性能都有待驗證，而且在目前輕量化的業務處理中，存儲過程的處理方式太“重”了。

有些應用架構看起來是按照分佈式部署的，但在數據庫層的調用方式是基於存儲過程，因為存儲過程封裝了大量的邏輯，難以調試，而且移植性不高。

這樣業務邏輯和性能壓力都在數據庫層面了，使得數據庫層很容易成為瓶頸，而且難以實現真正的分佈式。

所以有一個明確的改進方向就是對於存儲過程的改造，把它改造為 SQL 調用的方式，可以極大地提高業務的處理效率，在數據庫的接口調用上足夠簡單而且清晰可控。

降維策略 2：DDL 操作轉換為 DML 操作

有些業務經常會有一種緊急需求，總是需要給一個表添加字段，搞得 DBA 和業務同學都挺累，可以想象一個表有上百個字段，而且基本都是 name1，name2……name100，這種設計本身就是有問題的，更不用考慮性能了。

究其原因，是因為業務的需求動態變化，比如一個遊戲裝備有 20 個屬性，可能過了一個月之後就增加到了 40 個屬性，這樣一來，所有的裝備都有 40 個屬性，不管用沒用到，而且這種方式也存在諸多的冗餘。

我們在設計規範裡面也提到了一些設計的基本要素，在這些基礎上需要補充的是，保持有限的字段，如果要實現這些功能的擴展，其實完全可以通過配置化的方式來實現，比如把一些動態添加的字段轉換為一些配置信息。

配置信息可以通過 DML 的方式進行修改和補充，對於數據入口也可以更加動態、易擴展。

降維策略 3：Delete 操作轉換為高效操作

有些業務需要定期來清理一些週期性數據，比如表裡的數據只保留一個月，那麼超出時間範圍的數據就要清理掉了。

而如果表的量級比較大的情況下，這種 Delete 操作的代價實在太高，我們可以有兩類解決方案來把 Delete 操作轉換為更為高效的方式。

第一種是根據業務建立週期表，比如按照月表、周表、日表等維度來設計，這樣數據的清理就是一個相對可控而且高效的方式了。

第二種方案是使用 MySQL rename 的操作方式，比如一張 2 千萬的大表要清理 99% 的數據，那麼需要保留的 1% 的數據我們可以很快根據條件過濾補錄，實現“移形換位”。

②SQL 優化

其實相對來說需要的極簡的設計，很多點都在規範設計裡面了，如果遵守規範，八九不離十的問題都會杜絕掉。

在此補充幾點：

SQL 語句簡化，簡化是 SQL 優化的一大利器，因為簡單，所以優越。
儘可能避免或者杜絕多表複雜關聯，大表關聯是大表處理的噩夢，一旦打開了這個口子，越來越多的需求需要關聯，性能優化就沒有回頭路了，更何況大表關聯是 MySQL 的弱項，儘管 Hash Join 才推出，不要像掌握了絕對大殺器一樣，在商業數據庫中早就存在，問題照樣層出不窮。
SQL 中儘可能避免反連接，避免半連接，這是優化器做得薄弱的一方面，什麼是反連接，半連接?
其實比較好理解，舉個例子：not in，not exists 就是反連接，in，exists 就是半連接，在千萬級大表中出現這種問題，性能是幾個數量級的差異。

③索引優化

應該是大表優化中需要把握的一個度：

首先必須有主鍵，規範設計中第一條就是，此處不接收反駁。
其次，SQL 查詢基於索引或者唯一性索引，使得查詢模型儘可能簡單。
最後，儘可能杜絕範圍數據的查詢，範圍掃描在千萬級大表情況下還是儘可能減少。

管理優化

這部分應該是在所有的解決方案中最容易被忽視的部分了，我放在最後，在此也向運維同事致敬，總是為很多認為本應該正常的問題盡職盡責(背鍋)。

千萬級大表的數據清理一般來說是比較耗時的，在此建議在設計中需要完善冷熱數據分離的策略，可能聽起來比較拗口，我來舉一個例子，把大表的 Drop 操作轉換為可逆的 DDL 操作。

Drop 操作是默認提交的，而且是不可逆的，在數據庫操作中都是跑路的代名詞，MySQL 層面目前沒有相應的 Drop 操作恢復功能，除非通過備份來恢復，但是我們可以考慮將 Drop 操作轉換為一種可逆的 DDL 操作。

MySQL 中默認每個表有一個對應的 ibd 文件，其實可以把 Drop 操作轉換為一個 rename 操作，即把文件從 testdb 遷移到 testdb_arch 下面。

從權限上來說，testdb_arch 是業務不可見的，rename 操作可以平滑的實現這個刪除功能，如果在一定時間後確認可以清理，則數據清理對於已有的業務流程是不可見的，如下圖所示：

此外，還有兩個額外建議，一個是對於大表變更，儘可能考慮低峰時段的在線變更，比如使用 pt-osc 工具或者是維護時段的變更，就不再贅述了。

最後總結一下，其實就是一句話：千萬級大表的優化是根據業務場景，以成本為代價進行優化的，絕對不是孤立的一個層面的優化。

分享到:

閱讀更多 51CTO 的文章

關鍵字: 大表支付數據庫

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"