淺談SQL Server內部運行機制

對於已經很熟悉T-SQL的讀者,或者對於較專業的DBA來說,邏輯的增刪改查,或者較複雜的SQL語句,都是非常簡單的,不存在任何挑戰,不值得一提,那麼,SQL的哪些方面是他們的挑戰 或者軟肋呢?

那就是sql優化。然而,要向成為一個好的Sql優化高手,首先要做的一件事無疑就是了解sql語句在SQL Server中是如何執行的。在這一系列中,我們將開始sqlserver優化系列講解,在本篇文章中,我們將重點講解SQL Server體系結構。在正式講解之前,我們先來看看如下問題,你是否遇到過,若你遇到過且成功解決,那麼這篇文章,你可以跳過。

為了測試需要,我們先模擬插入5億3千多萬條數據。

1SELECT COUNT(1) FROM BigDataTest

淺談SQL Server內部運行機制

(一)查詢緩慢問題

*,臨時表,表連接,子查詢等造成的查詢緩慢問題,你能解決嗎?

(二)內存洩漏

如下查詢了8分2秒,然後內存溢出,你知道問題嗎?

1SELECT * FROM BigDataTest

淺談SQL Server內部運行機制

(三)經常聽說如下概念,你都能解決嗎?

事務與鎖(請參考我另一篇文章:淺談SQL Server事務與鎖(上篇)),ACID,隔離級別,髒讀,分表分庫,水平拆分,垂直拆分,高併發等

一 SQL Server體系結構抽象

淺談SQL Server內部運行機制

二 SQL Server體系結構概述

SQL Server核心體系結構,大致包括六大部分:客戶端訪問工具、SQL Server 網絡接口(SQL Server Network Interface,SNI)、關係引擎、存儲引擎、

磁盤和緩衝池。下圖為SQL Server核心體系大致輪廓圖。

淺談SQL Server內部運行機制

(一)SQL Server客戶端訪問工具

淺談SQL Server內部運行機制

SQL Server客戶端訪問工具,提供了遠程訪問技術,它與SQL Server服務端基於一定的協議,使其能夠遠程訪問數據庫,就像在本地操作數據庫一樣,如我們經常用的

Microsoft SQL Server Management Studio。

SQL Server客戶端訪問工具是比較多的,其中比較流行的要數Microsoft SQL Server Management Studio 和Navicat(Navicat在MySQL中也是比較常用的)了,至於其他工具,

本篇文章就不列舉了,感興趣的讀者朋友,可以查詢一下。

(二)SQL Server網絡協議

淺談SQL Server內部運行機制

SQL Server網絡協議,又叫SQL Server網絡接口(SNI),它是構成客戶端和服務端通信的橋樑,它與SQL Server服務端基於一定協議,方可通信,

如我們在客戶端輸入一條查詢語句SELECT * FROM BigDataTest,這條語句,只有客戶端和服務端基於一定協議,方可被服務端解析,否則,被視為無

效語句。

SQL Server網絡協議,由一組API構成,這些API供SQL Server數據庫引擎和SQL Server本地客戶端調用,如實現最基本的CRUD通信。

SQL Server 網絡接口(SQL Server Network Interface,SNI)只需要在客戶端和服務端配置網絡協議即可,它支持一下協議:

(1)共享內存

(2)TCP/IP

(3)命名管道

(4)VIA

(三)關係引擎

淺談SQL Server內部運行機制

關係引擎,也叫查詢引擎,其主要功能是負責處理SQL語句,其核心組件由三部分組成:命令分析器、查詢優化器和查詢執行器。

(1)命令分析器:負責解析客戶端傳遞過來的T-SQL語句,如客戶端傳遞一條SQL語句:SELECT * FROM BigDataTest,它會檢查該語句的語法結構,若語法

錯誤,它會將錯誤返回給協議層,然後協議層將錯誤返回給客戶端;如果語法結構正確,它會根據查詢命令生成查詢計劃或尋找一個已存在的查詢計劃(先在緩衝池計劃緩

存中查找,若找到,則直接給查詢執行器執行,若未找到,則會生成基於T-SQL的查詢樹,然後交給查詢優化器優化)

(2)查詢優化器:負責優化命令解析器生成的T-SQL查詢樹(基於資源的優化,而非基於時間的優化),然後將最終優化結果傳遞給查詢執行器執行。查詢優化器是基於

“資源開銷”的優化器,這種算法評估多種可執行的查詢方式,並從中選擇開銷最低的方案作為優化結果,然後將該結果生成查詢計劃輸出給查詢執行器。注意,查詢優化器是

“基於資源開銷最優”而非“基於方案最優”,也就是,查詢優化器的最終優化結果未必是最好的方案,但一定是資源開銷最低的方案。

(3)查詢執行器:負責執行查詢。假若查詢執行器接收到命令解析器或查詢優化器傳遞過來的SQL語句:SELECT * FROM BigDataTest,它通過OLE DB接口傳遞到存儲

引擎,再傳遞到存儲引擎的訪問方法。

(四)存儲引擎

淺談SQL Server內部運行機制

存儲引擎,本質就是管理資源存儲的,它的核心組件包括三部分:訪問方法、事務管理器和緩衝區管理器。

(1)訪問方法:訪問方法本質是一個接口,供查詢執行器調用(該接口提供了所有檢索數據的代碼,接口的實際執行是由緩衝區管理器來執行的),假若查詢執行器傳遞一條SQL語句:

SELECT * FROM BigDataTest,訪問方法接收到該請求命令後,就會調用緩衝區管理器,緩衝區管理器就會調用緩衝池的計劃緩存,在計劃緩存中尋找到相應的結果集,然後返回給關係

引擎。

(2)緩衝區管理器:供訪問方法調用,管理緩衝池,在緩衝池中查詢相應資源並返回結果集,供訪問方法返回給關係引擎。

(3)事務管理器:主要負責事務的管理(ACID管理)和高併發管理(鎖),它包括兩個核心組件(日誌管理器和鎖管理器),鎖管理器負責提供併發數據訪問,設置隔離級別等;日誌管理器負責

記錄所有訪問方法操作動作,如基本的CRUD。

(五)緩衝池

淺談SQL Server內部運行機制

緩衝池駐於內存中,是磁盤和緩衝區管理器的橋樑SQL Server中,所有資源的查詢都是在內存中進行的,即在緩衝池中進行的,假若緩衝池

接收到緩衝區管理器傳遞過來的的一條SQL語句:SELECT * FROM BigDataTest,緩衝區管理器數據緩存先從磁盤數據庫中取滿足條件的結果集,

然後放在緩衝池數據緩衝中,然後以結果集的形式返回給緩衝區管理器,供訪問方法返回給關係引擎的查詢執行器,然後返回給協議層,協議層再

返回給客戶端。注意,這裡操作的是緩衝池中數據,而不是磁盤DB中的數據,並且操作的緩衝池數據不會立即寫入磁盤,因此就會造成查詢到結果

與BD中的結果不一致,這就是所謂的髒讀。

緩衝池主要包括兩部分:計劃緩存(生成執行計劃是非常耗時耗資源的,計劃緩存主要用來存儲執行計劃,以備後續使用)和數據緩存(通常是緩存池

中容量最大的,消耗內存最大,從磁盤中讀取的數據頁只要放在這裡,方可調用)

(六)磁盤

淺談SQL Server內部運行機制

磁盤主要是用來存儲持久化資源的,如日誌資源,數據庫資源和緩存池持久化支援等。

三 一個查詢的完整流程

如下為一個比較完善的查詢過程,即第二部分查詢語句:SELECT * FROM BigDataTest 整個過程。

淺談SQL Server內部運行機制


分享到:


相關文章: