mysql获取随机数据问题总结-百分百源码网

mysql获取随机数据问题总结

发布时间：01/15 来源：浏览：关键词：

在mysql中获取随机数据方法很简单只要使用order by rand()即可了，但是如果你是百万级数据量，使用order by rand()获取随机数据你会等死去，下面我来介绍具体的解决办法。

1.order by rand()

数据多了极慢，随机性非常好，适合非常小数据量的情况。

代码如下
SELECT * FROM table_name AS r1 JOIN (SELECT (ROUND(RAND() * (SELECT ABS(MAX(id)-MIN(id)-$limit) FROM table_name))+(SELECT MIN(id) from table_name)) AS id) AS r2 WHERE r1.id >= r2.id ORDER BY r1.id ASC LIMIT $limit;

速度非常快，但是得到的数据是id连续的，没办法解决。

子查询产生一个随机数。

rand()是0到1的随机数，可以等于0到1。
MAX(id)-MIN(id)还要要减去$limit以免结果数量不够$limit条
因为主表id可能不连续，所以r1.id要>=r2.id

还要注意的是有时候最小id不是从1开始的，可能从一个很大的数开始，所以必须加上M(id)的值
手册相关内容：若要在i ≤ R ≤ j 这个范围得到一个随机整数R ，需要用到表达式 FLOOR(i + RAND() * (j – i + 1))。

例如，若要在7 到 12 的范围（包括7和12）内得到一个随机整数, 可使用以下语句：

代码如下
SELECT FLOOR(7 + (RAND() * 6)); select * from test where rand()>0.0005 limit 10;

0.0005是一个计算出的比例直接关系到随机的质量，比如数据表10000条数据，需要随机取300条，那么0.0005就需要改成(300/10000=0.03)。
这种方法不能保证每次能取到多少，需要取多次。

2和3速度一样的快，主要区别是2总能返回limit条数据，3就没准了（符合正太分布）。2是连续数据，3是随机行。

打赏

感谢您的支持，我会继续努力的!

扫码打赏，你说多少就多少

打开支付宝扫一扫，即可进行扫码打赏哦

百分百源码网建议打赏1～10元，土豪随意，感谢您的阅读！

mysql获取随机数据问题总结