MySQL面試題詳解

1. 如何設計一個高併發的系統

① 數據庫的優化,包括合理的事務隔離級別、SQL語句優化、索引的優化

② 使用緩存,儘量減少數據庫 IO

③ 分佈式數據庫、分佈式緩存

④ 服務器的負載均衡


2. 鎖的優化策略

① 讀寫分離

② 分段加鎖

③ 減少鎖持有的時間

④ 多個線程儘量以相同的順序去獲取資源

等等,這些都不是絕對原則,都要根據情況,比如不能將鎖的粒度過於細化,不然可能會出現線程的加鎖和釋放次數過多,反而效率不如一次加一把大鎖。這部分跟面試官談了很久


3. 索引的底層實現原理和優化

B+樹,經過優化的B+樹

主要是在所有的葉子結點中增加了指向下一個葉子節點的指針,因此InnoDB建議為大部分表使用默認自增的主鍵作為主索引。


4. 什麼情況下設置了索引但無法使用

① 以“%”開頭的LIKE語句,模糊匹配

② OR語句前後沒有同時使用索引

③ 數據類型出現隱式轉化(如varchar不加單引號的話可能會自動轉換為int型)


5. SQL語句的優化

order by要怎麼處理

alter儘量將多次合併為一次

insert和delete也需要合併


6. 實踐中如何優化MySQL

我當時是按以下四條依次回答的,他們四條從效果上第一條影響最大,後面越來越小。

① SQL語句及索引的優化

② 數據庫表結構的優化

③ 系統配置的優化

④ 硬件的優化


8. sql注入的主要特點

變種極多,攻擊簡單,危害極大


9. sql注入的主要危害

惡意纂改網頁

私自添加系統賬號或者是數據庫使用者賬號

網頁掛木馬


10、優化數據庫的方法

· 選取最適用的字段屬性,儘可能減少定義字段寬度,儘量把字段設置NOTNULL,例如'省份'、'性別'最好適用ENUM

· 使用連接(JOIN)來代替子查詢

· 適用聯合(UNION)來代替手動創建的臨時表

· 事務處理

· 鎖定表、優化事務處理

· 適用外鍵,優化鎖定表

· 建立索引

· 優化查詢語句


11. 簡單描述mysql中,索引,主鍵,唯一索引,聯合索引的區別,對數據庫的性能有什麼影響(從讀寫兩方面)

索引是一種特殊的文件(InnoDB數據表上的索引是表空間的一個組成部分),它們包含著對數據表裡所有記錄的引用指針。

普通索引(由關鍵字KEY或INDEX定義的索引)的唯一任務是加快對數據的訪問速度。

普通索引允許被索引的數據列包含重複的值。如果能確定某個數據列將只包含彼此各不相同的值,在為這個數據列創建索引的時候就應該用關鍵字UNIQUE把它定義為一個唯一索引。也就是說,唯一索引可以保證數據記錄的唯一性。

主鍵,是一種特殊的唯一索引,在一張表中只能定義一個主鍵索引,主鍵用於唯一標識一條記錄,使用關鍵字 PRIMARY KEY 來創建。

索引可以覆蓋多個數據列,如像INDEX(columnA, columnB)索引,這就是聯合索引。

索引可以極大的提高數據的查詢速度,但是會降低插入、刪除、更新表的速度,因為在執行這些寫操作時,還要操作索引文件。


12.數據庫中的事務是什麼?

事務(transaction)是作為一個單元的一組有序的數據庫操作。如果組中的所有操作都成功,則認為事務成功,即使只有一個操作失敗,事務也不成功。如果所有操作完成,事務則提交,其修改將作用於所有其他數據庫進程。如果一個操作失敗,則事務將回滾,該事務所有操作的影響都將取消。ACID 四大特性,原子性、隔離性、一致性、持久性。


13.瞭解XSS攻擊嗎?如何防止?

XSS是跨站腳本攻擊,首先是利用跨站腳本漏洞以一個特權模式去執行攻擊者構造的腳本,然後利用不安全的Activex控件執行惡意的行為。

使用htmlspecialchars()函數對提交的內容進行過濾,使字符串裡面的特殊符號實體化。


14.SQL注入漏洞產生的原因?如何防止?

SQL注入產生的原因:程序開發過程中不注意規範書寫sql語句和對特殊字符進行過濾,導致客戶端可以通過全局變量POST和GET提交一些sql語句正常執行。

防止SQL注入的方式:

  • 開啟配置文件中的magic_quotes_gpc 和 magic_quotes_runtime設置
  • 執行sql語句時使用addslashes進行sql語句轉換
  • Sql語句書寫儘量不要省略雙引號和單引號。
  • 過濾掉sql語句中的一些關鍵詞:update、insert、delete、select、 * 。
  • 提高數據庫表和字段的命名技巧,對一些重要的字段根據程序的特點命名,取不易被猜到的。
  • Php配置文件中設置register_globals為off,關閉全局變量註冊
  • 控制錯誤信息,不要在瀏覽器上輸出錯誤信息,將錯誤信息寫到日誌文件中。


15、 對於關係型數據庫而言,索引是相當重要的概念,請回答有關索引的幾個問題:

a)、索引的目的是什麼?

  • 快速訪問數據表中的特定信息,提高檢索速度
  • 創建唯一性索引,保證數據庫表中每一行數據的唯一性。
  • 加速表和表之間的連接
  • 使用分組和排序子句進行數據檢索時,可以顯著減少查詢中分組和排序的時間


b)、索引對數據庫系統的負面影響是什麼?

負面影響:

創建索引和維護索引需要耗費時間,這個時間隨著數據量的增加而增加;索引需要佔用物理空間,不光是表需要佔用數據空間,每個索引也需要佔用物理空間;當對錶進行增、刪、改、的時候索引也要動態維護,這樣就降低了數據的維護速度。


c)、為數據表建立索引的原則有哪些?

  • 在最頻繁使用的、用以縮小查詢範圍的字段上建立索引。
  • 在頻繁使用的、需要排序的字段上建立索引


d)、 什麼情況下不宜建立索引?

  • 對於查詢中很少涉及的列或者重複值比較多的列,不宜建立索引。
  • 對於一些特殊的數據類型,不宜建立索引,比如文本字段(text)等


16、 簡述在MySQL數據庫中MyISAM和InnoDB的區別

區別於其他數據庫的最重要的特點就是其插件式的表存儲引擎。切記:存儲引擎是基於表的,而不是數據庫。

InnoDB與MyISAM的區別:

InnoDB存儲引擎: 主要面向OLTP(Online Transaction Processing,在線事務處理)方面的應用,是第一個完整支持ACID事務的存儲引擎(BDB第一個支持事務的存儲引擎,已經停止開發)。

特點:

· 行鎖設計、支持外鍵,支持事務,支持併發,鎖粒度是支持mvcc得行級鎖;


MyISAM存儲引擎: 是MySQL官方提供的存儲引擎,主要面向OLAP(Online Analytical Processing,在線分析處理)方面的應用。

特點:

不支持事務,鎖粒度是支持併發插入得表級鎖,支持表所和全文索引。操作速度快,不能讀寫操作太頻繁;


17、 解釋MySQL外連接、內連接與自連接的區別

先說什麼是交叉連接: 交叉連接又叫笛卡爾積,它是指不使用任何條件,直接將一個表的所有記錄和另一個表中的所有記錄一一匹配。


內連接 則是隻有條件的交叉連接,根據某個條件篩選出符合條件的記錄,不符合條件的記錄不會出現在結果集中,即內連接只連接匹配的行。

外連接 其結果集中不僅包含符合連接條件的行,而且還會包括左表、右表或兩個表中的所有數據行,這三種情況依次稱之為左外連接,右外連接,和全外連接。


左外連接,也稱左連接,左表為主表,左表中的所有記錄都會出現在結果集中,對於那些在右表中並沒有匹配的記錄,仍然要顯示,右邊對應的那些字段值以NULL來填充。

右外連接,也稱右連接,右表為主表,右表中的所有記錄都會出現在結果集中。左連接和右連接可以互換,MySQL目前還不支持全外連接。


18、 寫出三種以上MySQL數據庫存儲引擎的名稱(提示:不區分大小寫)

MyISAM、InnoDB、BDB(BerkeleyDB)、Merge、Memory(Heap)、Example、Federated、

Archive、CSV、Blackhole、MaxDB 等等十幾個引擎


19、Myql中的事務回滾機制概述

事務是用戶定義的一個數據庫操作序列,這些操作要麼全做要麼全不做,是一個不可分割的工作單位,事務回滾是指將該事務已經完成的對數據庫的更新操作撤銷。

要同時修改數據庫中兩個不同表時,如果它們不是一個事務的話,當第一個表修改完,可能第二個表修改過程中出現了異常而沒能修改,此時就只有第二個表依舊是未修改之前的狀態,而第一個表已經被修改完畢。而當你把它們設定為一個事務的時候,當第一個表修改完,第二表修改出現異常而沒能修改,第一個表和第二個表都要回到未修改的狀態,這就是所謂的事務回滾


20. SQL語言包括哪幾部分?每部分都有哪些操作關鍵字?

答:SQL語言包括數據定義(DDL)、數據操縱(DML),數據控制(DCL)和數據查詢(DQL)四個部分。

數據定義:Create Table,Alter Table,Drop Table, Craete/Drop Index等

數據操縱:Select ,insert,update,delete,

數據控制:grant,revoke

數據查詢:select


21. 完整性約束包括哪些?

答:數據完整性(Data Integrity)是指數據的精確(Accuracy)和可靠性(Reliability)。

分為以下四類:

1) 實體完整性:規定表的每一行在表中是惟一的實體。

2) 域完整性:是指表中的列必須滿足某種特定的數據類型約束,其中約束又包括取值範圍、精度等規定。

3) 參照完整性:是指兩個表的主關鍵字和外關鍵字的數據應一致,保證了表之間的數據的一致性,防止了數據丟失或無意義的數據在數據庫中擴散。

4) 用戶定義的完整性:不同的關係數據庫系統根據其應用環境的不同,往往還需要一些特殊的約束條件。用戶定義的完整性即是針對某個特定關係數據庫的約束條件,它反映某一具體應用必須滿足的語義要求。

與表有關的約束:包括列約束(NOT NULL(非空約束))和表約束(PRIMARY KEY、foreign key、check、UNIQUE) 。


22. 什麼是事務?及其特性?

答:事務:是一系列的數據庫操作,是數據庫應用的基本邏輯單位。

事務特性:

(1)原子性:即不可分割性,事務要麼全部被執行,要麼就全部不被執行。

(2)一致性或可串性。事務的執行使得數據庫從一種正確狀態轉換成另一種正確狀態

(3)隔離性。在事務正確提交之前,不允許把該事務對數據的任何改變提供給任何其他事務,

(4) 持久性。事務正確提交後,其結果將永久保存在數據庫中,即使在事務提交後有了其他故障,事務的處理結果也會得到保存。


或者這樣理解:

事務就是被綁定在一起作為一個邏輯工作單元的SQL語句分組,如果任何一個語句操作失敗那麼整個操作就被失敗,以後操作就會回滾到操作前狀態,或者是上有個節點。為了確保要麼執行,要麼不執行,就可以使用事務。要將有組語句作為事務考慮,就需要通過ACID測試,即原子性,一致性,隔離性和持久性。


23. 什麼是鎖?

答:數據庫是一個多用戶使用的共享資源。當多個用戶併發地存取數據時,在數據庫中就會產生多個事務同時存取同一數據的情況。若對併發操作不加控制就可能會讀取和存儲不正確的數據,破壞數據庫的一致性。


加鎖是實現數據庫併發控制的一個非常重要的技術。當事務在對某個數據對象進行操作前,先向系統發出請求,對其加鎖。加鎖後事務就對該數據對象有了一定的控制,在該事務釋放鎖之前,其他的事務不能對此數據對象進行更新操作。


基本鎖類型:鎖包括行級鎖和表級鎖


24. 什麼叫視圖?遊標是什麼?

答:視圖是一種虛擬的表,具有和物理表相同的功能。可以對視圖進行增,改,查,操作,視圖通常是有一個表或者多個表的行或列的子集。對視圖的修改不影響基本表。它使得我們獲取數據更容易,相比多表查詢。


遊標:是對查詢出來的結果集作為一個單元來有效的處理。遊標可以定在該單元中的特定行,從結果集的當前行檢索一行或多行。可以對結果集當前行做修改。一般不使用遊標,但是需要逐條處理數據的時候,遊標顯得十分重要。


25. 什麼是存儲過程?用什麼來調用?

答:存儲過程是一個預編譯的SQL語句,優點是允許模塊化的設計,就是說只需創建一次,以後在該程序中就可以調用多次。如果某次操作需要執行多次SQL,使用存儲過程比單純SQL語句執行要快。可以用一個命令對象來調用存儲過程。


26. 索引的作用?和它的優點缺點是什麼?

答:索引就一種特殊的查詢表,數據庫的搜索引擎可以利用它加速對數據的檢索。它很類似與現實生活中書的目錄,不需要查詢整本書內容就可以找到想要的數據。索引可以是唯一的,創建索引允許指定單個列或者是多個列。缺點是它減慢了數據錄入的速度,同時也增加了數據庫的尺寸大小。


27. 如何通俗地理解三個範式?

答:第一範式:1NF是對屬性的原子性約束,要求屬性具有原子性,不可再分解;

第二範式:2NF是對記錄的惟一性約束,要求記錄有惟一標識,即實體的惟一性;

第三範式:3NF是對字段冗餘性的約束,即任何字段不能由其他字段派生出來,它要求字段沒有冗餘。。


範式化設計優缺點:

優點:

可以儘量得減少數據冗餘,使得更新快,體積小

缺點:

對於查詢需要多個表進行關聯,減少寫得效率增加讀得效率,更難進行索引優化


反範式化:

優點:可以減少表得關聯,可以更好得進行索引優化

缺點:數據冗餘以及數據異常,數據得修改需要更多的成本


28. 什麼是基本表?什麼是視圖?

答:基本表是本身獨立存在的表,在 SQL 中一個關係就對應一個表。 視圖是從一個或幾個基本表導出的表。視圖本身不獨立存儲在數據庫中,是一個虛表


29. 試述視圖的優點?

答:(1) 視圖能夠簡化用戶的操作 (2) 視圖使用戶能以多種角度看待同一數據;(3) 視圖為數據庫提供了一定程度的邏輯獨立性;(4) 視圖能夠對機密數據提供安全保護。


30. NULL是什麼意思

答:NULL這個值表示UNKNOWN(未知):它不表示“”(空字符串)。對NULL這個值的任何比較都會生產一個NULL值。您不能把任何值與一個 NULL值進行比較,並在邏輯上希望獲得一個答案。


使用IS NULL來進行NULL判斷


31. 主鍵、外鍵和索引的區別?

主鍵、外鍵和索引的區別

定義:

主鍵--唯一標識一條記錄,不能有重複的,不允許為空

外鍵--表的外鍵是另一表的主鍵, 外鍵可以有重複的, 可以是空值

索引--該字段沒有重複值,但可以有一個空值


作用:

主鍵--用來保證數據完整性

外鍵--用來和其他表建立聯繫用的

索引--是提高查詢排序的速度


個數:

主鍵--主鍵只能有一個

外鍵--一個表可以有多個外鍵

索引--一個表可以有多個唯一索引


32. 你可以用什麼來確保表格裡的字段只接受特定範圍裡的值?

答:Check限制,它在數據庫表格裡被定義,用來限制輸入該列的值。

觸發器也可以被用來限制數據庫表格裡的字段能夠接受的值,但是這種辦法要求觸發器在表格裡被定義,這可能會在某些情況下影響到性能。


33. 說說對SQL語句優化有哪些方法?(選擇幾條)

(1)Where子句中:where表之間的連接必須寫在其他Where條件之前,那些可以過濾掉最大數量記錄的條件必須寫在Where子句的末尾.HAVING最後。

(2)用EXISTS替代IN、用NOT EXISTS替代NOT IN。

(3) 避免在索引列上使用計算

(4)避免在索引列上使用IS NULL和IS NOT NULL

(5)對查詢進行優化,應儘量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。  

(6)應儘量避免在 where 子句中對字段進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描

(7)應儘量避免在 where 子句中對字段進行表達式操作,這將導致引擎放棄使用索引而進行全表掃描


34. SQL語句中‘相關子查詢’與‘非相關子查詢’有什麼區別?

答:子查詢:嵌套在其他查詢中的查詢稱之。

子查詢又稱內部,而包含子查詢的語句稱之外部查詢(又稱主查詢)。

所有的子查詢可以分為兩類,即相關子查詢和非相關子查詢

(1)非相關子查詢是獨立於外部查詢的子查詢,子查詢總共執行一次,執行完畢後將值傳遞給外部查詢。

(2)相關子查詢的執行依賴於外部查詢的數據,外部查詢執行一行,子查詢就執行一次。

故非相關子查詢比相關子查詢效率高


35. char和varchar的區別?

答:是一種固定長度的類型,varchar則是一種可變長度的類型,它們的區別是:

char(M)類型的數據列裡,每個值都佔用M個字節,如果某個長度小於M,MySQL就會在它的右邊用空格字符補足.(在檢索操作中那些填補出來的空格字符將被去掉)在varchar(M)類型的數據列裡,每個值只佔用剛好夠用的字節再加上一個用來記錄其長度的字節(即總長度為L+1字節).

varchar的適用場景:

  • 字符串列的最大長度比平均長度大很多
  • 字符串很少被更新,容易產生存儲碎片
  • 使用多字節字符集存儲字符串


Char的場景:

存儲具有近似得長度(md5值,身份證,手機號),長度比較短小得字符串(因為varchar需要額外空間記錄字符串長度),更適合經常更新得字符串,更新時不會出現頁分裂得情況,避免出現存儲碎片,獲得更好的io性能


36. Mysql 的存儲引擎,myisam和innodb的區別。

答:簡單的表達:

MyISAM 是非事務的存儲引擎;適合用於頻繁查詢的應用;表鎖,不會出現死鎖;適合小數據,小併發

innodb是支持事務的存儲引擎;合於插入和更新操作比較多的應用;設計合理的話是行鎖(最大區別就在鎖的級別上);適合大數據,大併發。


37. 數據表類型有哪些

答:MyISAM、InnoDB、HEAP、BOB,ARCHIVE,CSV等。

MyISAM:成熟、穩定、易於管理,快速讀取。一些功能不支持(事務等),表級鎖。

InnoDB:支持事務、外鍵等特性、數據行鎖定。空間佔用大,不支持全文索引等。


38. MySQL數據庫作發佈系統的存儲,一天五萬條以上的增量,預計運維三年,怎麼優化?

a. 設計良好的數據庫結構,允許部分數據冗餘,儘量避免join查詢,提高效率。

b. 選擇合適的表字段數據類型和存儲引擎,適當的添加索引。

c. mysql庫主從讀寫分離。

d. 找規律分表,減少單表中的數據量提高查詢速度。

e。添加緩存機制,比如memcached,apc等。

f. 不經常改動的頁面,生成靜態頁面。

g. 書寫高效率的SQL。比如 SELECT * FROM TABEL 改為 SELECT field_1, field_2, field_3 FROM TABLE.


39. 對於大流量的網站,您採用什麼樣的方法來解決各頁面訪問量統計問題?

答:a. 確認服務器是否能支撐當前訪問量。

b. 優化數據庫訪問。

c. 禁止外部訪問鏈接(盜鏈), 比如圖片盜鏈。

d. 控制文件下載。

e. 使用不同主機分流。

f. 使用瀏覽統計軟件,瞭解訪問量,有針對性的進行優化。


40、如何進行SQL優化?(關於後邊的解釋同學們可以進行理解,到時根據自己的理解把大體意思說出來即可)

(1)選擇正確的存儲引擎

以 MySQL為例,包括有兩個存儲引擎 MyISAM 和 InnoDB,每個引擎都有利有弊。


MyISAM 適合於一些需要大量查詢的應用,但其對於有大量寫操作並不是很好。甚至你只是需要update一個字段,整個表都會被鎖起來,而別的進程,就算是讀進程都無法操作直到讀操作完成。另外,MyISAM 對於 SELECT COUNT(*) 這類的計算是超快無比的。


InnoDB 的趨勢會是一個非常複雜的存儲引擎,對於一些小的應用,它會比 MyISAM 還慢。但是它支持“行鎖” ,於是在寫操作比較多的時候,會更優秀。並且,他還支持更多的高級應用,比如:事務。


(2)優化字段的數據類型

記住一個原則,越小的列會越快。如果一個表只會有幾列罷了(比如說字典表,配置表),那麼,我們就沒有理由使用 INT 來做主鍵,使用 MEDIUMINT, SMALLINT 或是更小的 TINYINT 會更經濟一些。如果你不需要記錄時間,使用 DATE 要比 DATETIME 好得多。當然,你也需要留夠足夠的擴展空間。


(3)為搜索字段添加索引

索引並不一定就是給主鍵或是唯一的字段。如果在你的表中,有某個字段你總要會經常用來做搜索,那麼最好是為其建立索引,除非你要搜索的字段是大的文本字段,那應該建立全文索引。


(4)避免使用Select *從數據庫裡讀出越多的數據,那麼查詢就會變得越慢。並且,如果你的數據庫服務器和WEB服務器是兩臺獨立的服務器的話,這還會增加網絡傳輸的負載。即使你要查詢數據表的所有字段,也儘量不要用*通配符,善用內置提供的字段排除定義也許能給帶來更多的便利。


(5)使用 ENUM 而不是 VARCHAR

ENUM 類型是非常快和緊湊的。在實際上,其保存的是 TINYINT,但其外表上顯示為字符串。這樣一來,用這個字段來做一些選項列表變得相當的完美。例如,性別、民族、部門和狀態之類的這些字段的取值是有限而且固定的,那麼,你應該使用 ENUM 而不是 VARCHAR。


(6)儘可能的使用 NOT NULL

除非你有一個很特別的原因去使用 NULL 值,你應該總是讓你的字段保持 NOT NULL。NULL其實需要額外的空間,並且,在你進行比較的時候,你的程序會更復雜。當然,這裡並不是說你就不能使用NULL了,現實情況是很複雜的,依然會有些情況下,你需要使用NULL值。


(7)固定長度的表會更快

如果表中的所有字段都是“固定長度”的,整個表會被認為是 “static” 或 “fixed-length”。例如,表中沒有如下類型的字段:VARCHAR,TEXT,BLOB。只要你包括了其中一個這些字段,那麼這個表就不是“固定長度靜態表”了,這樣,MySQL 引擎會用另一種方法來處理。


固定長度的表會提高性能,因為MySQL搜尋得會更快一些,因為這些固定的長度是很容易計算下一個數據的偏移量的,所以讀取的自然也會很快。而如果字段不是定長的,那麼,每一次要找下一條的話,需要程序找到主鍵。並且,固定長度的表也更容易被緩存和重建。不過,唯一的副作用是,固定長度的字段會浪費一些空間,因為定長的字段無論你用不用,他都是要分配那麼多的空間。


41,為表中得字段選擇合適得數據類型(物理設計)

字段類型優先級: 整形>date,time>enum,char>varchar>blob,text

優先考慮數字類型,其次是日期或者二進制類型,最後是字符串類型,同級別得數據類型,應該優先選擇佔用空間小的數據類型


42:存儲時期

Datatime:以 YYYY-MM-DD HH:MM:SS 格式存儲時期時間,精確到秒,佔用8個字節得存儲空間,datatime類型與時區無關


Timestamp:以時間戳格式存儲,佔用4個字節,範圍小1970-1-1到2038-1-19,顯示依賴於所指定得時區,默認在第一個列行的數據修改時可以自動得修改timestamp列得值


Date:(生日)佔用得字節數比使用字符串.datatime.int儲存要少,使用date只需要3個字節,存儲日期月份,還可以利用日期時間函數進行日期間得計算


Time:存儲時間部分得數據

注意:不要使用字符串類型來存儲日期時間數據(通常比字符串佔用得儲存空間小,在進行查找過濾可以利用日期得函數)


使用int存儲日期時間不如使用timestamp類型


擴展鏈接:Redis技術詳解


MySQL面試題詳解


分享到:


相關文章: