Mysql での 4 つの挿入方法の効率比較

零下一度
リリース: 2017-05-03 11:18:01
オリジナル
1627 人が閲覧しました

この記事では、項目ごとの挿入、トランザクションベースのバッチ挿入、一度に複数のデータセットを挿入する単一ステートメント、およびインポートの 4 つの方法の比較を含む、Mysql でのいくつかの挿入方法の効率の比較を例で紹介します。この記事では、サンプルコードを通じてそれを詳しく紹介しています。必要な場合は、一緒に見てください。

はじめに

最近、仕事の都合でMysqlに1000万ほどの大量のデータを入れる必要があり、目視検査の方が手間がかかります。したがって、現在は、どの方法でデータを挿入するのがより速く、より効率的であるかをテストするようなものです。

以下では、各メソッドの異なるデータ量での挿入効率をテストします。

テスト データベースの基本と操作は次のとおりです:

mysql> create database test;
Query OK, 1 row affected (0.02 sec)
mysql> use test;
Database changed
mysql> create table mytable(id int primary key auto_increment ,value varchar(50));
Query OK, 0 rows affected (0.35 sec)
mysql> desc mytable;
+-------+-------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra  |
+-------+-------------+------+-----+---------+----------------+
| id | int(11) | NO | PRI | NULL | auto_increment |
| value | varchar(50) | YES | | NULL |  |
+-------+-------------+------+-----+---------+----------------+
2 rows in set (0.02 sec)
ログイン後にコピー

テストを容易にするために、ここでは 2 つのフィールドを含むテーブルが構築されます。1 つは自動インクリメントされる ID、もう 1 つはコンテンツを表す文字列です。

テストする場合は、実験のたびにmysql> truncate mytable既存のテーブルをクリアする必要があります。

方法1: 1つずつ挿入

テストコード:(途中に1000個のinsert文があります。vimでコピー&ペーストした方が便利です。書いた後、a.sqlに保存し、 mysql プロンプト .sql にソース a と入力します)

set @start=(select current_timestamp(6));
insert into mytable values(null,"value");
......
insert into mytable values(null,"value");
set @end=(select current_timestamp(6));
select @start;
select @end;
ログイン後にコピー

出力結果:

Query OK, 1 row affected (0.03 sec)
......
Query OK, 1 row affected (0.03 sec)
Query OK, 0 rows affected (0.00 sec)
+----------------------------+
| @start   |
+----------------------------+
| 2016-05-05 23:06:51.267029 |
+----------------------------+
1 row in set (0.00 sec)
+----------------------------+
| @end   |
+----------------------------+
| 2016-05-05 23:07:22.831889 |
+----------------------------+
1 row in set (0.00 sec)
ログイン後にコピー

実際、ほぼすべてのステートメントに同じ時間がかかり、基本的には 30 ミリ秒かかります。

この方法では、1000wのデータには87時間かかります。

データ量が大きい場合は、この方法は絶対にお勧めしません。

方法 2: トランザクションベースのバッチ挿入

実際には、1 つのトランザクションに非常に多くのクエリを入れることになります。実際、メソッド 1 のすべてのステートメントはトランザクションを開くため、特に遅くなります。

テストコード: (基本的に方法1と似ていますが、主に2行追加しています。高速なため、ここではさまざまなデータ量をテストします)

set @start=(select current_timestamp(6));
start transaction;
insert into mytable values(null,"value");
......
insert into mytable values(null,"value");
commit;
set @end=(select current_timestamp(6));
select @start;
select @end;
ログイン後にコピー

テスト結果:

数据量 时间(s)
1k  0.1458
1w  1.0793
10w 5.546006
100w 38.930997
ログイン後にコピー

基本的に対数時間であることがわかります、効率は依然として比較的高いです。

方法3: 1つのステートメントで一度に複数のデータセットを挿入する

一度に複数の値を挿入する挿入です。

テストコード:

insert into mytable values (null,"value"),
    (null,"value"),
    ......
    (null,"value");
ログイン後にコピー

テスト結果:

数据量 时间(s)
1k  0.15
1w  0.80
10w 2.14
100w *
ログイン後にコピー

これも対数時間のようで、方法2より若干速いです。ただし、問題は、単一の SQL ステートメントにはバッファ サイズ制限があることです。設定を変更してサイズを大きくすることはできますが、大きすぎることはできません。そのため、大量のデータを挿入する場合には使用できません。

方法 4: データ ファイルをインポートする

数値データをデータ ファイルに書き込み、直接インポートします (前のセクションを参照)。

データファイル(a.dat):

null value
null value
.....
null value
null value
ログイン後にコピー

テストコード:

mysql> load data local infile "a.dat" into table mytable;
ログイン後にコピー

テスト結果:

数据量 时间(s)
1k  0.13
1w  0.75
10w 1.97
100w 6.75
1000w 58.18
ログイン後にコピー

最速タイムを出したのは彼です。 。 。 。

以上がMysql での 4 つの挿入方法の効率比較の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート