Mysql order by與limit混用陷阱技术頭條網

Mysql order by與limit混用陷阱

在Mysql中我們常常用order by來進行排序，使用limit來進行分頁，當需要先排序後分頁時我們往往使用類似的寫法select * from 表名 order by 排序字段 limt M,N。但是這種寫法卻隱藏著較深的使用陷阱。在排序字段有數據重複的情況下，會很容易出現排序結果與預期不一致的問題。

比如現在有一張user表，表結構及數據如下：

現在想根據創建時間升序查詢user表，並且分頁查詢，每頁2條，那很容易寫出sql為：select * from user order by create_time limit pageNo,2;

在執行查詢過程中會發現：

1、查詢第一頁數據時：

2、查詢第四頁數據時：

user表共有8條數據，有4頁數據，但是實際查詢過程中第一頁與第四頁竟然出現了相同的數據。

這是什麼情況？難道上面的分頁SQL不是先將兩個表關聯查詢出來，然後再排好序，再取對應分頁的數據嗎？？？

上面的實際執行結果已經證明現實與想像往往是有差距的，實際SQL執行時並不是按照上述方式執行的。這裡其實是Mysql會對Limit做優化，具體優化方式見官方文檔：https://dev.mysql.com/doc/refman/5.7/en/limit-optimization.html

這個是5.7版本的說明，提取幾個問題直接相關的點做下說明。

上面官方文檔裡面有提到如果你將Limit row_count與order by混用，mysql會找到排序的row_count行後立馬返回，而不是排序整個查詢結果再返回。如果是通過索引排序，會非常快；如果是文件排序，所有匹配查詢的行（不帶Limit的）都會被選中，被選中的大多數或者全部會被排序，直到limit要求的row_count被找到了。如果limit要求的row_count行一旦被找到，Mysql就不會排序結果集中剩餘的行了。

這裡我們查看下對應SQL的執行計劃：