高效地从 MySQL 数据库查询随机样本
初始方法和局限性:
使用 SELECT * FROM table ORDER BY 生成随机样本的简单方法RAND() LIMIT 10000 面临大表的性能瓶颈。由于需要对整个表进行排序,这种方法计算量很大,对于具有数十万行的表来说不切实际。
优化采样技术:
An有效的替代方法是利用以下查询:
SELECT * FROM table WHERE rand() <= .3
此查询采用以下查询原理:
这种方法的优点:
以上是如何高效地从大型MySQL数据库中查询随机样本?的详细内容。更多信息请关注PHP中文网其他相关文章!