mysql - php随机生成200万条记录中有很多重复的
我在mysql优化的时候,随便建立了一张临时表,生成200W条数据,但是不明白,生成的记录中有重复的,而且还比较多,不解
在此谢谢诸位了
<code>$conn=new mysqli("localhost","root","","test"); $conn->query("set names utf8"); function str_rand($num){ $str="abcdefghijkmnpqrstuvwxyz0123456789"; $return_str=""; for($i=0;$iprepare($sql); for($i=1;$ibind_param("issss",$i,$title,$author,$keywords,$descrition); $res=$mysqli_stmt->execute(); } $mysqli_stmt->close(); $conn->close(); </code>
备注:执行时间过长,肯定超过了php的最大执行时间,修改了配置文件,插入的数据中,100条以后的记录中,比如查询title='xxx'的字段,能查询出1.4W多条
回复内容:
我在mysql优化的时候,随便建立了一张临时表,生成200W条数据,但是不明白,生成的记录中有重复的,而且还比较多,不解
在此谢谢诸位了
<code>$conn=new mysqli("localhost","root","","test"); $conn->query("set names utf8"); function str_rand($num){ $str="abcdefghijkmnpqrstuvwxyz0123456789"; $return_str=""; for($i=0;$iprepare($sql); for($i=1;$ibind_param("issss",$i,$title,$author,$keywords,$descrition); $res=$mysqli_stmt->execute(); } $mysqli_stmt->close(); $conn->close(); </code>
备注:执行时间过长,肯定超过了php的最大执行时间,修改了配置文件,插入的数据中,100条以后的记录中,比如查询title='xxx'的字段,能查询出1.4W多条
PHP
的rand()
采用的是伪随机算法,其产生的数据是有规律的。
给你一张真随机产生的数据分布图和一张PHP rand()
产生的数据分布图,结果一目了然。
真随机:结果均匀分布PHP rand()
:有明显条纹(规律性)
而用mt_rand()就不存在这样的问题
php7的random_int()会比mt_rand()再好一些
如果需要产生无重复的随机数列,一般是预先生成一个连续的数列,存到一个list里面。然后通过伪随机算法获取index,取出数值;或者写一个洗牌方法打乱该连续数列,通过伪随机算法控制洗牌,然后顺序读取。
当然,伪随机算法最重要的还是种子的选择。种子的来源最常用的当然是当前时间戳。也可以有其他的方式,这些网上很多关于随机数种子的文章,可以去看看。
引用PHP手册中对mt_rand()函数的介绍:
很多老的 libc 的随机数发生器具有一些不确定和未知的特性而且很慢。PHP 的 rand() 函数默认使用 libc 随机数发生器。mt_rand() 函数是非正式用来替换它的。该函数用了 » Mersenne Twister 中已知的特性作为随机数发生器,它可以产生随机数值的平均速度比 libc 提供的 rand() 快四倍。
你需要把rand()换成mt_rand(),另外可以使用GUID来生成唯一数据。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック

PHP 8.4 では、いくつかの新機能、セキュリティの改善、パフォーマンスの改善が行われ、かなりの量の機能の非推奨と削除が行われています。 このガイドでは、Ubuntu、Debian、またはその派生版に PHP 8.4 をインストールする方法、または PHP 8.4 にアップグレードする方法について説明します。

Visual Studio Code (VS Code とも呼ばれる) は、すべての主要なオペレーティング システムで利用できる無料のソース コード エディター (統合開発環境 (IDE)) です。 多くのプログラミング言語の拡張機能の大規模なコレクションを備えた VS Code は、

MySQL 8.4 (2024 年時点の最新の LTS リリース) で導入された主な変更の 1 つは、「MySQL Native Password」プラグインがデフォルトで有効ではなくなったことです。さらに、MySQL 9.0 ではこのプラグインが完全に削除されています。 この変更は PHP および他のアプリに影響します

このチュートリアルでは、PHPを使用してXMLドキュメントを効率的に処理する方法を示しています。 XML(拡張可能なマークアップ言語)は、人間の読みやすさとマシン解析の両方に合わせて設計された多用途のテキストベースのマークアップ言語です。一般的にデータストレージに使用されます

文字列は、文字、数字、シンボルを含む一連の文字です。このチュートリアルでは、さまざまな方法を使用してPHPの特定の文字列内の母音の数を計算する方法を学びます。英語の母音は、a、e、i、o、u、そしてそれらは大文字または小文字である可能性があります。 母音とは何ですか? 母音は、特定の発音を表すアルファベットのある文字です。大文字と小文字など、英語には5つの母音があります。 a、e、i、o、u 例1 入力:string = "tutorialspoint" 出力:6 説明する 文字列「TutorialSpoint」の母音は、u、o、i、a、o、iです。合計で6元があります

PHPがMySQLに接続した後、ページは空白になり、DIE()関数が失敗する理由。 PHPとMySQLデータベースの間の接続を学習するとき、あなたはしばしばいくつかの混乱することに遭遇します...

静的結合(静的::) PHPで後期静的結合(LSB)を実装し、クラスを定義するのではなく、静的コンテキストで呼び出しクラスを参照できるようにします。 1)解析プロセスは実行時に実行されます。2)継承関係のコールクラスを検索します。3)パフォーマンスオーバーヘッドをもたらす可能性があります。

CMSはコンテンツマネジメントシステムの略称です。これは、ユーザーが高度な技術知識を必要とせずにデジタル コンテンツを作成、管理、変更できるようにするソフトウェア アプリケーションまたはプラットフォームです。 CMS を使用すると、ユーザーはコンテンツを簡単に作成および整理できます
