小编典典

MySQL的ORDER BY RAND()如何工作?

mysql

我一直在研究和测试如何在MySQL中进行快速随机选择。在此过程中,我遇到了一些意外的结果,现在我不确定我是否知道ORDER BY RAND()的工作原理。

我一直以为,当您在表上执行ORDER BY
RAND()时,MySQL会向表中添加一个新列,该列中填充有随机值,然后按该列对数据进行排序,然后,例如,您采用上面随机获得的值。我已经进行了大量的Google搜索和测试,最后发现Jay在他的博客中提供的查询确实是最快的解决方案:

SELECT * FROM Table T JOIN (SELECT CEIL(MAX(ID)*RAND()) AS ID FROM Table) AS x ON T.ID >= x.ID LIMIT 1;

虽然普通的ORDER BY
RAND()在我的测试表上花费30-40秒,但他的查询仅需0.1秒即可完成工作。他在博客中解释了此功能的作用,因此我将跳过此内容,最后转到奇怪的地方。

我的表是用PRIMARY KEY公用表id和其他非索引的东西一样usernameage等这里是我奋力解释的东西

SELECT * FROM table ORDER BY RAND() LIMIT 1; /*30-40 seconds*/
SELECT id FROM table ORDER BY RAND() LIMIT 1; /*0.25 seconds*/
SELECT id, username FROM table ORDER BY RAND() LIMIT 1; /*90 seconds*/

我一直希望对所有三个查询都看到大致相同的时间,因为我总是在单个列上进行排序。但是由于某种原因,这没有发生。如果您对此有任何想法,请告诉我。我有一个项目需要快速执行ORDER
BY RAND(),我个人更喜欢使用

SELECT id FROM table ORDER BY RAND() LIMIT 1;
SELECT * FROM table WHERE id=ID_FROM_PREVIOUS_QUERY LIMIT 1;

是的,它比Jay的方法慢,但是更小,更易于理解。我的查询很大,有几个JOIN和WHERE子句,而Jay的方法仍然有效,但查询却变得又大又复杂,因为我需要在JOINed(在他的查询中称为x)子请求中使用所有的JOIN和WHERE。

谢谢你的时间!


阅读 696

收藏
2020-05-17

共1个答案

小编典典

尽管没有“通过rand()快速订购”之类的东西,但是有针对您特定任务的解决方法。

要获取任何随机行 ,您可以像德国博主一样:http : //www.roberthartung.de/mysql-order-by-
rand-a-case-study-of-alternatives/(我看不到一个热链接网址。如果有人看到,请随时编辑该链接。)

文本是德语,但是SQL代码在页面下方并且在大白框中,因此不难看出。

基本上,他所做的是做一个程序来获取有效行。这将生成一个介于0到max_id之间的随机数,尝试获取一行,如果不存在该行,请继续进行操作,直到找到一个行为止。他允许通过将它们存储在临时表中来获取x个随机行,因此您可能可以重写该过程,以便仅提取一行就更快了。

这样做的缺点是,如果您删除很多行,并且存在巨大的差距,那么很有可能错过很多次,从而使其无效。

更新:不同的执行时间

SELECT * FROM table ORDER BY RAND()LIMIT 1; / 30-40秒 /

SELECT ID FROM table ORDER BY RAND()LIMIT 1; / 0.25秒 /

SELECT ID,用户名,来自表ORDER BY RAND()LIMIT 1;/ 90秒 /

我一直希望对所有三个查询都看到大致相同的时间,因为我总是在单个列上进行排序。但是由于某种原因,这没有发生。如果您对此有任何想法,请告诉我。

它可能与索引有关。id被索引并可以快速访问,而添加username到结果中则意味着它需要从每一行中读取它并将其放入内存表中。使用,*它还必须将所有内容读取到内存中,但不需要在数据文件中跳转,这意味着不会浪费时间寻找。

仅当存在可变长度的列(varchar / text)时,这才有所不同,这意味着必须先检查长度,然后跳过该长度,而不是仅跳过每行之间的设置长度(或0)。

2020-05-17