mysql - php随机生成200万条记录中有很多重复的
我在mysql优化的时候,随便建立了一张临时表,生成200W条数据,但是不明白,生成的记录中有重复的,而且还比较多,不解
在此谢谢诸位了
<code>$conn=new mysqli("localhost","root","","test"); $conn->query("set names utf8"); function str_rand($num){ $str="abcdefghijkmnpqrstuvwxyz0123456789"; $return_str=""; for($i=0;$iprepare($sql); for($i=1;$ibind_param("issss",$i,$title,$author,$keywords,$descrition); $res=$mysqli_stmt->execute(); } $mysqli_stmt->close(); $conn->close(); </code>
备注:执行时间过长,肯定超过了php的最大执行时间,修改了配置文件,插入的数据中,100条以后的记录中,比如查询title='xxx'的字段,能查询出1.4W多条
回复内容:
我在mysql优化的时候,随便建立了一张临时表,生成200W条数据,但是不明白,生成的记录中有重复的,而且还比较多,不解
在此谢谢诸位了
<code>$conn=new mysqli("localhost","root","","test"); $conn->query("set names utf8"); function str_rand($num){ $str="abcdefghijkmnpqrstuvwxyz0123456789"; $return_str=""; for($i=0;$iprepare($sql); for($i=1;$ibind_param("issss",$i,$title,$author,$keywords,$descrition); $res=$mysqli_stmt->execute(); } $mysqli_stmt->close(); $conn->close(); </code>
备注:执行时间过长,肯定超过了php的最大执行时间,修改了配置文件,插入的数据中,100条以后的记录中,比如查询title='xxx'的字段,能查询出1.4W多条
PHP
的rand()
采用的是伪随机算法,其产生的数据是有规律的。
给你一张真随机产生的数据分布图和一张PHP rand()
产生的数据分布图,结果一目了然。
真随机:结果均匀分布PHP rand()
:有明显条纹(规律性)
而用mt_rand()就不存在这样的问题
php7的random_int()会比mt_rand()再好一些
如果需要产生无重复的随机数列,一般是预先生成一个连续的数列,存到一个list里面。然后通过伪随机算法获取index,取出数值;或者写一个洗牌方法打乱该连续数列,通过伪随机算法控制洗牌,然后顺序读取。
当然,伪随机算法最重要的还是种子的选择。种子的来源最常用的当然是当前时间戳。也可以有其他的方式,这些网上很多关于随机数种子的文章,可以去看看。
引用PHP手册中对mt_rand()函数的介绍:
很多老的 libc 的随机数发生器具有一些不确定和未知的特性而且很慢。PHP 的 rand() 函数默认使用 libc 随机数发生器。mt_rand() 函数是非正式用来替换它的。该函数用了 » Mersenne Twister 中已知的特性作为随机数发生器,它可以产生随机数值的平均速度比 libc 提供的 rand() 快四倍。
你需要把rand()换成mt_rand(),另外可以使用GUID来生成唯一数据。

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

PHP 8.4 带来了多项新功能、安全性改进和性能改进,同时弃用和删除了大量功能。 本指南介绍了如何在 Ubuntu、Debian 或其衍生版本上安装 PHP 8.4 或升级到 PHP 8.4

MySQL 8.4(截至 2024 年的最新 LTS 版本)中引入的主要变化之一是默认情况下不再启用“MySQL 本机密码”插件。此外,MySQL 9.0完全删除了这个插件。 此更改会影响 PHP 和其他应用程序

Visual Studio Code,也称为 VS Code,是一个免费的源代码编辑器 - 或集成开发环境 (IDE) - 可用于所有主要操作系统。 VS Code 拥有针对多种编程语言的大量扩展,可以轻松编写

本教程演示了如何使用PHP有效地处理XML文档。 XML(可扩展的标记语言)是一种用于人类可读性和机器解析的多功能文本标记语言。它通常用于数据存储

字符串是由字符组成的序列,包括字母、数字和符号。本教程将学习如何使用不同的方法在PHP中计算给定字符串中元音的数量。英语中的元音是a、e、i、o、u,它们可以是大写或小写。 什么是元音? 元音是代表特定语音的字母字符。英语中共有五个元音,包括大写和小写: a, e, i, o, u 示例 1 输入:字符串 = "Tutorialspoint" 输出:6 解释 字符串 "Tutorialspoint" 中的元音是 u、o、i、a、o、i。总共有 6 个元

如果您是一位经验丰富的 PHP 开发人员,您可能会感觉您已经在那里并且已经完成了。您已经开发了大量的应用程序,调试了数百万行代码,并调整了一堆脚本来实现操作

PHP连接MySQL后页面空白,die()函数失效的原因分析在学习PHP和MySQL数据库连接的过程中,常常会遇到一些让人困惑...

CMS 代表内容管理系统。它是一种软件应用程序或平台,使用户能够创建、管理和修改数字内容,而无需先进的技术知识。 CMS 允许用户轻松创建和组织内容
