MySQL的ORDER BY RAND（）如何工作？

小编典典

MySQL的ORDER BY RAND（）如何工作？

mysql

我一直在研究和测试如何在MySQL中进行快速随机选择。在此过程中，我遇到了一些意外的结果，现在我不确定我是否知道ORDER BY RAND（）的工作原理。

我一直以为，当您在表上执行ORDER BY
RAND（）时，MySQL会向表中添加一个新列，该列中填充有随机值，然后按该列对数据进行排序，然后，例如，您采用上面随机获得的值。我已经进行了大量的Google搜索和测试，最后发现Jay在他的博客中提供的查询确实是最快的解决方案：

SELECT * FROM Table T JOIN (SELECT CEIL(MAX(ID)*RAND()) AS ID FROM Table) AS x ON T.ID >= x.ID LIMIT 1;

虽然普通的ORDER BY
RAND（）在我的测试表上花费30-40秒，但他的查询仅需0.1秒即可完成工作。他在博客中解释了此功能的作用，因此我将跳过此内容，最后转到奇怪的地方。

我的表是用PRIMARY KEY公用表id和其他非索引的东西一样username，age等这里是我奋力解释的东西

SELECT * FROM table ORDER BY RAND() LIMIT 1; /*30-40 seconds*/
SELECT id FROM table ORDER BY RAND() LIMIT 1; /*0.25 seconds*/
SELECT id, username FROM table ORDER BY RAND() LIMIT 1; /*90 seconds*/

我一直希望对所有三个查询都看到大致相同的时间，因为我总是在单个列上进行排序。但是由于某种原因，这没有发生。如果您对此有任何想法，请告诉我。我有一个项目需要快速执行ORDER
BY RAND（），我个人更喜欢使用

SELECT id FROM table ORDER BY RAND() LIMIT 1;
SELECT * FROM table WHERE id=ID_FROM_PREVIOUS_QUERY LIMIT 1;

是的，它比Jay的方法慢，但是更小，更易于理解。我的查询很大，有几个JOIN和WHERE子句，而Jay的方法仍然有效，但查询却变得又大又复杂，因为我需要在JOINed（在他的查询中称为x）子请求中使用所有的JOIN和WHERE。

谢谢你的时间！

阅读 696

2020-05-17

共1个答案

小编典典

尽管没有“通过rand（）快速订购”之类的东西，但是有针对您特定任务的解决方法。

要获取任何随机行 ，您可以像德国博主一样：http : //www.roberthartung.de/mysql-order-by-
rand-a-case-study-of-alternatives/（我看不到一个热链接网址。如果有人看到，请随时编辑该链接。）

文本是德语，但是SQL代码在页面下方并且在大白框中，因此不难看出。

基本上，他所做的是做一个程序来获取有效行。这将生成一个介于0到max_id之间的随机数，尝试获取一行，如果不存在该行，请继续进行操作，直到找到一个行为止。他允许通过将它们存储在临时表中来获取x个随机行，因此您可能可以重写该过程，以便仅提取一行就更快了。

这样做的缺点是，如果您删除很多行，并且存在巨大的差距，那么很有可能错过很多次，从而使其无效。

更新：不同的执行时间

SELECT * FROM table ORDER BY RAND（）LIMIT 1; / 30-40秒 /

SELECT ID FROM table ORDER BY RAND（）LIMIT 1; / 0.25秒 /

SELECT ID，用户名，来自表ORDER BY RAND（）LIMIT 1；/ 90秒 /

我一直希望对所有三个查询都看到大致相同的时间，因为我总是在单个列上进行排序。但是由于某种原因，这没有发生。如果您对此有任何想法，请告诉我。

它可能与索引有关。id被索引并可以快速访问，而添加username到结果中则意味着它需要从每一行中读取它并将其放入内存表中。使用，*它还必须将所有内容读取到内存中，但不需要在数据文件中跳转，这意味着不会浪费时间寻找。

仅当存在可变长度的列（varchar / text）时，这才有所不同，这意味着必须先检查长度，然后跳过该长度，而不是仅跳过每行之间的设置长度（或0）。

2020-05-17