mysql 随机获取记录order by rand 优化-mysql教程-PHP中文網

首頁

資料庫

mysql教程

mysql 随机获取记录order by rand 优化

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 05:52 PM

隨機

如果要随机获取记录数，在mysql里最简单的方法肯定是order by rand()了，但是这种方法只能在表记录极少的情况下才能使用。主要是因为order by rand()导致了using filesort.这个时候查询类型会变成all，索引会失效。只需简单的变通下，完成可以做到同样的效果

下面我就以users（userId，userName，password……）表（有一百多万条记录）为例，对比讲解下几个方法效率问题：

代码如下	复制代码
1.select * from users order by rand() LIMIT 1

执行该sql语句，老半天没有反应，最后被迫手动停止执行，怎个伤人了得啊！后来我查了一下MYSQL手册，里面针对RAND()的提示大概意思就是，在 ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描，导致效率相当相当的低！效率不行，切忌使用！

代码如下	复制代码
2.SELECT * FROM users AS t1 JOIN (SELECT ROUND(RAND() * ((SELECT MAX(userId) FROM `users`)-(SELECT MIN(userId) FROM users))+(SELECT MIN(userId) FROM users)) AS userId) AS t2 WHERE t1.userId >= t2.userId ORDER BY t1.userId LIMIT 1

执行该sql语句，用时0.031s，效率没说的，相当的给力！心里那个爽啊，紧接着，我把”LIMIT 1“改为了”LIMIT 100“ 随机取一百条记录，用时0.048，给力吧。可是就在此时问题出现了，发现结果好像不是随机的？为了验证结果，又执行了N次，真不是随机的，问题出现在”ORDER BY t1.userId“这里，按userId排序了。随机取一条记录还是不错的选择，多条就不行了啊！

代码如下	复制代码
3.SELECT * FROM users WHERE userId >= ((SELECT MAX(userId) FROM users)-(SELECT MIN(userId) FROM users)) * RAND() + (SELECT MIN(userId) FROM users) LIMIT 1

执行该sql语句，用时0.039s，效率太给力了！接着我就把”LIMIT 1“改为了”LIMIT 10000“，用时0.063s。经过多次验证，哥对灯发誓，结果肯定是随机的！
结论：随机取一条或多条记录，方法都不错！

4.通过sql获得最大值和最小值，然后通过php的rand生成一个随机数randnum，再通过

代码如下	复制代码
SELECT * FROM users WHERE userId >= randnum LIMIT 1

，获得一条记录效率应该还可以，多条应该就不行了。

根据记录的类型，分类连续和非连续两种。
连续指记录是连续存放的，并且有字段可以证明记录是连续的，例如自增id。
非连续是指记录是随机存放的，例如有条件的查询，结果肯定不是连续的。

一、连续记录优化
先得到表的最大id和最小id。select max(id),min(id) from table

1.在程序里随机一个在最大id和最小id的中间数，查询的时候大于这个随机数的就是随机记录了。

Sql代码

代码如下	复制代码
1.select * from table where id > 中间数 limit length; select * from table where id > 中间数 limit length;缺点：如果中间数很大的话，获取不了需要的记录数，随机性不强

代码如下	复制代码
2.在程序里随机n个最大id和最小id的中间数，查询的时候用in获得这几个中间数的记录 Sql代码 1.select * from table where id in (中间数1, 中间数2,中间数3) select * from table where id in (中间数1, 中间数2,中间数3)需要注意的是，如果你要获取5条记录，那建议随机10个数。缺点：性能不如第1种方法，但是随机性更强

二、非连续记录优化

其实非连续记录的方法一样可以应用在连续记录中。
首先获得记录的总数，例如：select count(*) from table where groupid = 1;
然后在程序里随机n个小于记录总数的中间数，之后通过循环

Sql代码

代码如下	复制代码
1.select * from table where groupid = 1 limit 中间数,1 select * from table where groupid = 1 limit 中间数,1来获得记录。

关于优化循环sql可以采用prepare或者union all来优化循环执行

结论：方法1效率不行，切忌使用；随机获得一条记录，方法2是相当不错的选择，采用JOIN的语法比直接在WHERE中使用函数效率还是要高一些的，不过方法3也不错；随机获得多条记录

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

Java教學

1664

CakePHP 教程

1423

Laravel 教程

1321

PHP教程

1269

C# 教程

1249

Related knowledge

MySQL的角色：Web應用程序中的數據庫 Apr 17, 2025 am 12:23 AM

MySQL在Web應用中的主要作用是存儲和管理數據。 1.MySQL高效處理用戶信息、產品目錄和交易記錄等數據。 2.通過SQL查詢，開發者能從數據庫提取信息生成動態內容。 3.MySQL基於客戶端-服務器模型工作，確保查詢速度可接受。

說明InnoDB重做日誌和撤消日誌的作用。 Apr 15, 2025 am 12:16 AM

InnoDB使用redologs和undologs確保數據一致性和可靠性。 1.redologs記錄數據頁修改，確保崩潰恢復和事務持久性。 2.undologs記錄數據原始值，支持事務回滾和MVCC。

MySQL：世界上最受歡迎的數據庫的簡介 Apr 12, 2025 am 12:18 AM

MySQL是一種開源的關係型數據庫管理系統，主要用於快速、可靠地存儲和檢索數據。其工作原理包括客戶端請求、查詢解析、執行查詢和返回結果。使用示例包括創建表、插入和查詢數據，以及高級功能如JOIN操作。常見錯誤涉及SQL語法、數據類型和權限問題，優化建議包括使用索引、優化查詢和分錶分區。

MySQL的位置：數據庫和編程 Apr 13, 2025 am 12:18 AM

MySQL在數據庫和編程中的地位非常重要，它是一個開源的關係型數據庫管理系統，廣泛應用於各種應用場景。 1）MySQL提供高效的數據存儲、組織和檢索功能，支持Web、移動和企業級系統。 2）它使用客戶端-服務器架構，支持多種存儲引擎和索引優化。 3）基本用法包括創建表和插入數據，高級用法涉及多表JOIN和復雜查詢。 4）常見問題如SQL語法錯誤和性能問題可以通過EXPLAIN命令和慢查詢日誌調試。 5）性能優化方法包括合理使用索引、優化查詢和使用緩存，最佳實踐包括使用事務和PreparedStatemen