MySQL日誌故障的處理和分析

佚名

2020-12-26 21:02:13

有一臺預上線的服務器最近在做壓力測試，也引發了一系列的相關問題，排查思路可以提供參考。

問題的起因就是收到同事提醒，根據監控報警提示，磁盤空間滿了。上面有一個MySQL服務，現在已經寫入不了數據了。

>>create table test(id int); ERROR 14 (HY000): Can't change size of file (Errcode: 28 - No space left on device)

碰到這類問題，直觀的思路就是查看分區下最大的文件，當然如果足夠智能，也可以啟用前幾天提到的故障自愈的實現思路。

當我切換到日誌目錄的時候，我發現慢日誌文件竟然有這麼大，都是百G級別。

-rw-r----- 1 mysql mysql 302365433856 Nov 7 07:55 slowquery.log

當時也是為了儘快的釋放慢日誌文件的空間，所以先是選擇了導出部分日誌到本地，作為後續的分析所用，然後清理了這個日誌文件。

系統層面是清理了文件，空間也可以通過du的方式看到是釋放了，但是使用df -h的方式卻不奏效，看起來是文件的句柄沒有正確釋放，在這種情況下，系統雖然釋放了不少的空間，但是數據庫層面還是寫入不了數據的。

這種情況該怎麼做，釋放句柄最好的一種方式就是重啟，但是顯然這不是一個好的方法，有些簡單暴力，有沒有更好的方案呢，我們來看看滿日誌相關的參數。

這裡我們可用的一個直接方式就是先關閉滿日誌，達到釋放句柄的目的，然後再次重啟開啟。

想明白了，操作就很簡單了。

>set global slow_query_log=off; Query OK, 0 rows affected (6.54 sec) >set global slow_query_log=on; Query OK, 0 rows affected (0.00 sec)

很明顯，磁盤空間釋放了不少，對於慢日誌的問題分析，其中裡面有一個數據字典表存在大量的查詢請求，添加了索引之後，該問題得到了有效控制。

# df -h Filesystem Size Used Avail Use% Mounted on /dev/sda3 25G 5.5G 18G 24% / tmpfs 31G 12K 31G 1% /dev/shm /dev/sda1 190M 78M 103M 44% /boot /dev/mapper/data-main 717G 400G 281G 59% /data

這個問題剛過一會，又收到報警說磁盤空間又滿了，這次排除了慢日誌的影響，發現是審計日誌出了問題。

$ df -h Filesystem Size Used Avail Use% Mounted on /dev/sda3 25G 5.5G 18G 24% / tmpfs 31G 12K 31G 1% /dev/shm /dev/sda1 190M 78M 103M 44% /boot /dev/mapper/data-main 717G 609G 72G 90% /data

這裡需要說明的是，審計插件有幾類比較流行的，這裡用到的是Percona audit plugin,其實從性價比來說，這個插件的控制粒度還算比較粗，如果從控制的粒度來說，MariaDB Audit plugin要好很多，推薦使用。

審計日誌有差不多600G,在這種高壓測試之下，量級還是很大的，為了緩解問題，也是刪除了600G的審計日誌文件。

打開審計日誌的參數選項：

這裡可以選的方式是修改審計日誌的策略，比如我們從ALL修改為NONE,但是這種方式還是有些侷限，因為沒有生效。到了這個時候可供選擇的方案就很少了，如果要釋放句柄，我們可以簡單先看看，比如通過lsof來查看未釋放的句柄。

# lsof|grep delete mysqld 3218 mysql 5u REG 253,0 26946 85458954 /data/mysql_4350/tmp/ib6i5l8w (deleted) mysqld 3218 mysql 6u REG 253,0 0 85458955 /data/mysql_4350/tmp/ibzgbLJz (deleted) mysqld 3218 mysql 7u REG 253,0 0 85458956 /data/mysql_4350/tmp/ibUZDalC (deleted) mysqld 3218 mysql 8u REG 253,0 0 85458960 /data/mysql_4350/tmp/ibhdSF1K (deleted) mysqld 3218 mysql 12u REG 253,0 0 85458961 /data/mysql_4350/tmp/ibo46oDR (deleted) mysqld 3218 mysql 41w REG 253,0 635612876075 85460307 /data/mysql_4350/data/audit.log (deleted)

但是很明顯這個進程就是MySQL服務的進程號，直接kill MySQL實在是太暴力了，而且這個測試還在進行中，為了避免不必要的解釋和麻煩，我們也是不能重啟數據庫的。

# ps -ef|grep 3218 mysql 3218 2015 22 Oct31 ? 1-14:53:02 /usr/local/mysql/bin/mysqld --basedir=/usr/local/mysql --datadir=/data/mysql_4350/data --plugin-dir=/usr/local/mysql/lib/mysql/plugin --user=mysql --log-error=/data/mysql_4350/log/mysql.err --open-files-limit=16384 --pid-file=/data/mysql_4350/tmp/mysql.pid --socket=/data/mysql_4350/tmp/mysql.sock --port=4350 root 87186 86999 0 15:20 pts/0 00:00:00 grep 3218

這裡有一個參數引起了我的注意，那就是audit_log_flush，有點類似於MySQL裡面的flush logs的方式。通過觸發這個參數就可以釋放已有的句柄了。

>set global audit_log_flush=on; Query OK, 0 rows affected (10.04 sec)

通過幾輪問題分析和排查，日誌類的問題總算得到了基本解決。

後續需要改進的就是對於審計日誌的管理，目前做壓力測試其實是可以關閉這一類的審計的。

而對於慢日誌的分析也是重中之重，如果在極高的壓力下，差不多1~2分鐘會產生1G的慢日誌，按照併發來看，這個值是很高的。所以在基本穩定了性能之後，慢日誌的量級有了明顯的變化。

裝修日誌3

“故事寫作營”課程練習 | 人物塑造01

2020.4.20 日誌房住不炒

MySQL 搭建上萬併發的系統架構

夜色中，鍾南山目送“七勇士”逆行而去

做好哪件事，對我們升職加薪幫助最大

疫情下的教學日誌（二）

國民黨想調“敦睦艦隊”文件臺軍稱：兩件機密

Log4j2 簡單使用

乾貨 | 讀懂 Appium 日誌，讓測試效率翻倍！

日誌排查問題困難？分佈式日誌鏈路跟蹤來幫你

2020，我們家的防“疫”日誌

APP測試面試題分享帶參考答案

復工 | 鋼銀人的戰“疫”日誌

通過ELKB實現分佈式實時日誌的幾種架構

《黑暗影集：稀望鎮》開發者日誌遊戲背景玩法揭祕

arcgis關於gp日誌統計數據

迷之 crontab 異常：不運行、不報錯、無日誌？原來是這些原因

投資不易且走且珍惜（200424模擬日誌）

龍頭是幹出來的而非炒出來的（200423模擬日誌）

「刪庫跑路」使用Binlog日誌恢復誤刪的MySQL數據

2020.4.12 日誌格力大手筆

2020.4.9 日誌業績長牛

2020.4.16 日誌大水漫溉

2020.5.5 日誌長假不平靜

考古學家發現4000年前疑似金字塔建築草稿，金字塔之謎或被揭開

又尿床了。。。

爺爺來了。。。

舒仁貴：唐山市青龍山林場20年“護林人”

相關文章:

裝修日誌3

“故事寫作營”課程練習 | 人物塑造01

2020.4.20 日誌 房住不炒

MySQL 搭建上萬併發的系統架構

夜色中，鍾南山目送“七勇士”逆行而去

做好哪件事，對我們升職加薪幫助最大

疫情下的教學日誌（二）

國民黨想調“敦睦艦隊”文件 臺軍稱：兩件機密

Log4j2 簡單使用

乾貨 | 讀懂 Appium 日誌，讓測試效率翻倍！

日誌排查問題困難？分佈式日誌鏈路跟蹤來幫你

2020，我們家的防“疫”日誌

APP測試面試題分享帶參考答案

復工 | 鋼銀人的戰“疫”日誌

通過ELKB實現分佈式實時日誌的幾種架構

《黑暗影集：稀望鎮》開發者日誌 遊戲背景玩法揭祕

arcgis關於gp日誌統計數據

迷之 crontab 異常：不運行、不報錯、無日誌？原來是這些原因

投資不易且走且珍惜（200424模擬日誌）

龍頭是幹出來的而非炒出來的（200423模擬日誌）

「刪庫跑路」使用Binlog日誌恢復誤刪的MySQL數據

2020.4.12 日誌 格力大手筆

2020.4.9 日誌 業績長牛

2020.4.16 日誌 大水漫溉

2020.5.5 日誌 長假不平靜

考古學家發現4000年前疑似金字塔建築草稿，金字塔之謎或被揭開

又尿床了。。。

爺爺來了。。。

舒仁貴：唐山市青龍山林場20年“護林人”

好用！這兩個方法，愛迪生、巴菲特、比爾蓋茨都在用

釘釘培訓-做一個系統聚合員工工作檔案，替代萬惡的“日誌”彙報

高德地圖記錄我的足跡20200201

軟件測試教程：monkey壓力測試

Java程序員須知的七個日誌管理工具

面試官之問：知道你的接口“QPS”是多少嗎？

Logback配置文件這麼寫，TPS提高10倍

日誌：“數九”這個時令是怎麼來的？為什麼數的是“九”這個數？

日誌：“二十四節氣”根據什麼命名？各個節氣的主要特點是什麼？

日誌：過去“元旦”在“正月初一”？為何現在是“1月1日”？

日誌：“二十四節氣”是依據什麼劃分？又是如何劃分呢？

2020.4.26 日誌 嚴打造假

關曉彤Cosplay造型，與洛天依合照，可以破次元女團出道

Vlogger（視頻日誌從業者），月入過萬？

支付寶崩了？我趕快打開網站服務器，竟然發生了這麼多事

【廣東援鄂戰隊】這個低調的客家男孩，回到廣州才分享這篇戰疫日誌

章齡之教育方式引熱議，不料過往情史被扒，歷任男友來頭都不小！

平江縣：審計監督助力扶貧對象實現“安居夢”

最牛國漫被我發現了！4年心血孤注一擲！《大理寺日誌》

10w行級別數據的Excel導入優化記錄

《絕地求生》官方微博發佈了一篇名為“絕地求生，百日行動”的開發者日誌，分享了遊戲團隊在這段時間以來針對客戶端優化、服務器性能、確保遊戲公平性、改進匹配邏輯和修復錯誤方面做出的努力和成果。

潛逃壓力過大暴瘦40多斤，一涉黑A級通緝犯在河北投案自首

當我們在談 SaaS 的時候，在談什麼？

合同詐騙的類型有哪些？企業無力償還借款是否構成合同詐騙罪？

5月西安招聘會時間安排來了！找工作的別錯過

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

全球鬧「美元荒」帶動穩定幣需求暴增！以太坊交易量創近兩年新高

“幫助當地居民解決用水難題”-今日頭條-手機光明網

灌籃高手無水印壁紙，每一張都是回憶

通遼藍天救援隊成功解救遼河公園水上被困群眾

5月6日·武漢要聞及抗擊肺炎快報

肖副省長等省市領導到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作

相聲界的顏值擔當張雲雷稱號大揭祕

美國百年薅羊毛攻略

《全職高手》：一口氣刷了10集，對楊洋路轉粉了

共同承擔責任！Rookie談BP問題：輸了是我們打得太臭

LOL"中韓對抗賽"遭選手反對？Zoom直言不想打，Doinb的回答太真實

李亞鵬攜李嫣出席慈善晚會，李嫣手上鑽戒搶鏡，1個動作獲誇讚！

53歲郭富城再度升級當爸，方媛懷二胎，Chant要做姐姐了

那些拼命的演員：王寶強喝了一大桶牛奶，孫儷吃10斤瓜子

賈乃亮用上了“一米陽光”這個詞，他依然渴望擁有美麗的愛情！

搞笑GIF開心一刻：我的老家農村，有妹子願意嫁給我嗎？

為什麼只有edg賺錢？

程瀟身材多好？雙腿劈叉才明白，這才是“腿精”

張柏芝承認三胎產子，否認小夥的老爸是孫東海，看來她選擇保密

T1戰隊搶注Faker商標，“囊括多個領域產品，商業潛力媲美喬丹”

雲頂之弈“最不平衡的版本”誕生，全員搶一費卡，運氣成吃雞關鍵

LPL春季賽"6宗最"：Uzi最遺憾，阿水最驚喜，V5最離譜

雷佳音被問：跟佟麗婭拍那麼多親熱戲是啥感受？他的回答笑翻眾人

JDG成最“慘”冠軍戰隊？拿到LPL冠軍人氣依舊低迷，TES成贏家！