MySQL では、トランザクションはデータベースにアクセスして更新するためのメカニズム、一連の操作、およびプログラム実行単位です。トランザクションには 1 つ以上のデータベース操作コマンドが含まれており、すべてのコマンドはシステム全体に対して送信または取り消されます。つまり、このグループのデータベース コマンドが実行されるか、まったく実行されません。
このチュートリアルの動作環境: Windows7 システム、mysql5.6 バージョン、Dell G3 コンピューター。
データベーストランザクション(Transaction)とは、データベースへのアクセスや更新を行うための仕組み、操作手順、プログラムの実行単位であり、データベース操作コマンド群を含みます。
トランザクションは、すべてのコマンド全体とともに操作リクエストをシステムに送信または取り消します。つまり、このデータベース コマンドのグループは実行されるか実行されないかのいずれかであるため、トランザクションは分割できない論理的な作業単位です。 。
データベース システムで同時操作を実行する場合、トランザクションは最小の制御単位として使用されます。これは、複数のユーザーが同時に操作するデータベース システムに特に適しています。
MySQL はリレーショナル データベースとしてトランザクションをサポートしています。この記事は MySQL5.6 に基づいています。
まず、MySQL トランザクションの基本を確認してください。
1. 論理アーキテクチャとストレージ エンジン
画像ソース: https://blog.csdn .net/fuzhongmin05/article/details/70904190
上の図に示すように、MySQL サーバーの論理アーキテクチャは上から下に 3 つの層に分けることができます。
(1) 最初の層層:顧客端末接続処理、認可認証など
(2) 第 2 層: サーバー層。クエリ ステートメントの解析、最適化、キャッシュ、組み込み関数の実装、ストアド プロシージャなどを担当します。
(3) 3 番目のレイヤー: ストレージ エンジン。MySQL でのデータの保存と取得を担当します。 MySQLサーバー層はトランザクションを管理せず、トランザクションはストレージ エンジンによって実装されます。 トランザクションをサポートする MySQL のストレージ エンジンには、InnoDB、NDB Cluster などがあり、その中で InnoDB が最も広く使用されていますが、MyIsam、Memory などの他のストレージ エンジンはトランザクションをサポートしていません。
特に指定のない限り、次の記事で説明する内容は InnoDB に基づいています。
2. 送信とロールバック
典型的な MySQL トランザクションは次のように操作されます:
start transaction; …… #一条或多条sql语句 commit;
ここで、開始トランザクションはトランザクションが開始され、 commit トランザクションがコミットされ、実行結果がデータベースに書き込まれます。 SQL ステートメントの実行に問題がある場合、ロールバックが呼び出され、正常に実行されたすべての SQL ステートメントがロールバックされます。もちろん、トランザクション内で rollback ステートメントを直接使用してロールバックすることもできます。
Autocommit
MySQL は、以下に示すように、デフォルトで自動コミット モードを使用します。
自動コミットこのモードでは、トランザクションが starttransaction によって明示的に開始されない場合、各 SQL ステートメントはコミット操作を実行するトランザクションとして扱われます。
次の方法で自動コミットをオフにできます。自動コミット パラメータは接続に固有であることに注意してください。1 つの接続でパラメータを変更しても、他の接続には影響しません。
自動コミットがオフになっている場合、コミットまたはロールバックが実行され、トランザクションが終了し、別のトランザクションが開始されるまで、すべての SQL ステートメントは 1 つのトランザクション内にあります。
特別な操作
MySQL にはいくつかの特別なコマンドがあります。これらのコマンドがトランザクション内で実行されると、コミットはトランザクションをただちにコミットするように強制されます。 DDL ステートメント (create table/drop table/alter/table)、lock tables ステートメントなど。
ただし、一般的に使用される select、insert、update、および delete コマンドは、トランザクションを強制的にコミットしません。
3. ACID の特性
ACID は、トランザクションの 4 つの特性の尺度です:
による 厳格な基準に従って、ACID特性を同時に満たすトランザクションのみはトランザクションとみなされますが、主要なデータベース ベンダーの実装では、ACID を真に満たすトランザクションはほとんどありません。たとえば、MySQL の MySQL Cluster トランザクションは耐久性と分離を満たしていません。InnoDB のデフォルトのトランザクション分離レベルは反復読み取りであり、分離を満たしていません。Oracle のデフォルトのトランザクション分離レベルは READ COMMITTED であり、分離を満たしていません...So ACID はトランザクションが満たさなければならない条件であると言われるのではなく、トランザクションを測定する 4 つの側面であると言った方が適切です。
ACID の特性とその実装原理については、以下で詳しく紹介しますが、理解を容易にするため、紹介の順序は厳密には A-C-I-D ではありません。
1.定義
原子性とは、トランザクションが分割できない作業単位であり、すべての操作が完了するか何も行われないことを意味します。トランザクション内の SQL ステートメントの実行に失敗した場合、実行されたステートメントもロールバックしてデータベースが戻る必要があります。取引前の状態に戻ります。
2. 実装原則: アンドゥ ログ
アトミック性の原則を説明する前に、まず MySQL トランザクション ログを紹介します。 MySQL ログには、バイナリ ログ、エラー ログ、クエリ ログ、スロー クエリ ログなど、さまざまな種類があります。さらに、InnoDB ストレージ エンジンは、REDO ログ (REDO ログ) と UNDO ログ (ロールバック ログ) の 2 つのトランザクション ログも提供します。 )。 REDO ログはトランザクションの耐久性を確保するために使用され、UNDO ログはトランザクションの原子性と分離の基礎となります。
アンドゥログについて話しましょう。アトミック性を実現する鍵は、トランザクションがロールバックされたときに、正常に実行されたすべての SQL ステートメントを元に戻せることです。 InnoDBロールバックは、UNDO ログに依存することで実現されます: トランザクションがデータベースを変更すると、InnoDB は対応する UNDO ログを生成します ; トランザクションの実行が失敗するか、rollback が呼び出され、トランザクションがロールバックされる場合、アンドゥ ログ 内の情報を使用して、データを元の状態にロールバックできます。改造前でした。
undo ログは、SQL の実行に関連する情報を記録する論理ログです。ロールバックが発生すると、InnoDB は元に戻すログの内容に基づいて前の作業の逆を実行します。挿入ごとに、ロールバック中に削除が実行され、削除ごとに、ロールバック中に挿入が実行され、更新ごとに実行されます。の場合、ロールバック中に削除が実行され、ロールバック時にはデータを元に戻す逆更新が実行されます。
更新操作を例に挙げます。トランザクションが更新を実行すると、生成される元に戻すログには、変更された行の主キー (どの行が変更されたかを知るため)、どの列が変更されたのかが含まれます。変更された値と、変更前後のこれらの列の値やその他の情報を使用して、ロールバック時にデータを更新前の状態に戻すことができます。
1. 定義
永続性とは、トランザクションがコミットされると、その変更がデータベースに反映されることを意味します。永続的です。後続の操作や障害が影響を与えることはありません。
2. 実装原則: REDO ログ
REDO ログと UNDO ログは両方とも InnoDB トランザクション ログに属します。まずはREDOログが存在する背景についてお話しましょう。
InnoDB は MySQL のストレージ エンジンであり、データはディスクに保存されますが、データの読み書きに毎回ディスク IO が必要になると効率が非常に低くなります。この目的のために、InnoDB はキャッシュ (バッファ プール) を提供します。バッファ プールにはディスク上のいくつかのデータ ページのマッピングが含まれており、データベースにアクセスするためのバッファとして機能します。データベースからデータを読み取るときは、最初にバッファ プール。バッファ プールがプールに存在しない場合は、ディスクから読み取られてバッファ プールに入れられます。データベースにデータを書き込む場合は、最初にバッファ プールに書き込まれ、変更されたデータがバッファ プールに書き込まれます。バッファ プール内のデータは定期的にディスクに更新されます (このプロセスは ダーティ フラッシュ と呼ばれます)。
バッファ プールを使用すると、データの読み取りと書き込みの効率が大幅に向上しますが、新たな問題も生じます。MySQL がダウンし、バッファ プール内の変更されたデータがディスクにフラッシュされていない場合、データ損失とトランザクションの耐久性は保証できません。
そこで、この問題を解決するために REDO ログが導入されました。データが変更されると、バッファー プール内のデータの変更に加えて、トランザクションがコミットされたときの操作も REDO ログに記録されます。 、 fsync インターフェースが呼び出され、REDO ログがディスクをフラッシュするために使用されます。 MySQL がダウンした場合、REDO ログ内のデータを読み取り、再起動時にデータベースを復元できます。 REDO ログは WAL (先行書き込みログ、先行書き込みログ) を使用し、すべての変更は最初にログに書き込まれ、次にバッファ プールに更新されるため、MySQL のダウンタイムによってデータが失われることがないため、耐久性が満たされます。要件。
トランザクションのコミット時に REDO ログもディスクにログを書き込む必要があるのに、バッファ プール内の変更されたデータを直接ディスクに書き込む (つまり、ダーティに書き込む) よりも高速なのはなぜでしょうか。 ?理由は主に 2 つあります。
(1) ダーティ クリーニングはランダム IO です。毎回変更されるデータの場所はランダムですが、REDO ログの書き込みは追加操作であり、シーケンシャル IO に属します。
(2) ダーティ クリーニングはデータ ページ (ページ) に基づいています。MySQL のデフォルトのページ サイズは 16KB です。ページ上の小さな変更にはページ全体を書き込む必要があり、REDO ログには内容のみが含まれます。書き込み部分では、無効な IO が大幅に削減されます。
3. REDO ログと binlog
MySQL には、書き込み操作を記録できる binlog (バイナリ ログ) もあることはわかっています。
(1) 異なる機能: REDO ログは MySQL のダウンタイムが耐久性に影響を与えないようにクラッシュ リカバリに使用され、binlog はクラッシュ リカバリに使用されます。 -in-time リカバリにより、サーバーは時点に基づいてデータをリカバリできるようになり、さらに、binlog はマスター/スレーブ レプリケーションにも使用されます。
(2) さまざまなレベル: REDO ログは InnoDB ストレージ エンジンによって実装され、binlog は MySQL サーバー層によって実装されます (記事前半の MySQL 論理アーキテクチャの概要を参照してください)。 InnoDB と他のストレージを同時に使用できます。
(3)内容不同:redo log是物理日志,内容基于磁盘的Page;binlog的内容是二进制的,根据binlog_format参数的不同,可能基于sql语句、基于数据本身或者二者的混合。
(4)写入时机不同:binlog在事务提交时写入;redo log的写入时机相对多元:
1. 定义
与原子性、持久性侧重于研究事务本身不同,隔离性研究的是不同事务之间的相互影响。隔离性是指,事务内部的操作与其他事务是隔离的,并发执行的各个事务之间不能互相干扰。严格的隔离性,对应了事务隔离级别中的Serializable (可串行化),但实际应用中出于性能方面的考虑很少会使用可串行化。
隔离性追求的是并发情形下事务之间互不干扰。简单起见,我们主要考虑最简单的读操作和写操作(加锁读等特殊读操作会特殊说明),那么隔离性的探讨,主要可以分为两个方面:
2. 锁机制
首先来看两个事务的写操作之间的相互影响。隔离性要求同一时刻只能有一个事务对数据进行写操作,InnoDB通过锁机制来保证这一点。
锁机制的基本原理可以概括为:事务在修改数据之前,需要先获得相应的锁;获得锁之后,事务便可以修改数据;该事务操作期间,这部分数据是锁定的,其他事务如果需要修改数据,需要等待当前事务提交或回滚后释放锁。
行锁与表锁
按照粒度,锁可以分为表锁、行锁以及其他位于二者之间的锁。表锁在操作数据时会锁定整张表,并发性能较差;行锁则只锁定需要操作的数据,并发性能好。但是由于加锁本身需要消耗资源(获得锁、检查锁、释放锁等都需要消耗资源),因此在锁定数据较多情况下使用表锁可以节省大量资源。MySQL中不同的存储引擎支持的锁是不一样的,例如MyIsam只支持表锁,而InnoDB同时支持表锁和行锁,且出于性能考虑,绝大多数情况下使用的都是行锁。
如何查看锁信息
有多种方法可以查看InnoDB中锁的情况,例如:
select * from information_schema.innodb_locks; #锁的概况 show engine innodb status; #InnoDB整体状态,其中包括锁的情况
下面来看一个例子:
#在事务A中执行: start transaction; update account SET balance = 1000 where id = 1; #在事务B中执行: start transaction; update account SET balance = 2000 where id = 1;
此时查看锁的情况:
show engine innodb status查看锁相关的部分:
通过上述命令可以查看事务24052和24053占用锁的情况;其中lock_type为RECORD,代表锁为行锁(记录锁);lock_mode为X,代表排它锁(写锁)。
除了排它锁(写锁)之外,MySQL中还有共享锁(读锁)的概念。由于本文重点是MySQL事务的实现原理,因此对锁的介绍到此为止,后续会专门写文章分析MySQL中不同锁的区别、使用场景等,欢迎关注。
介绍完写操作之间的相互影响,下面讨论写操作对读操作的影响。
3. 脏读、不可重复读和幻读
首先来看并发情况下,读操作可能存在的三类问题:
(1)脏读:当前事务(A)中可以读到其他事务(B)未提交的数据(脏数据),这种现象是脏读。举例如下(以账户余额表为例):
(2)不可重复读:在事务A中先后两次读取同一个数据,两次读取的结果不一样,这种现象称为不可重复读。脏读与不可重复读的区别在于:前者读到的是其他事务未提交的数据,后者读到的是其他事务已提交的数据。举例如下:
(3) ファントム リーディング: トランザクション A において、ある条件に従って 2 回データベースにクエリが実行され、2 回のクエリの結果の数が異なる現象をファントム リーディングと呼びます。 Non-Repeatable Read と Phantom Read の違いは、前者はデータが変更されたことを意味し、後者はデータの行数が変更されたことを意味すると簡単に理解できます。例:
4. トランザクション分離レベル
SQL には 4 つの分離レベルが定義されています。標準 で、各分離レベルで上記の問題が存在するかどうかを規定しています。一般に、分離レベルが低いほど、システムのオーバーヘッドが低くなり、サポートできる同時実行性は高くなりますが、分離は悪化します。分離レベルと読み取りの問題の関係は次のとおりです。
実際のアプリケーションでは、read uncommitted は同時実行中に多くの問題を引き起こし、パフォーマンスは比較的低くなります。その他の分離レベルの改善には制限があるため、あまり一般的には使用されません。 Serializableトランザクションを強制的にシリアル化すると、同時実行効率が非常に低くなります。これは、データの一貫性要件が非常に高く、同時実行性が許容されない場合にのみ使用できるため、ほとんど使用されません。したがって、ほとんどのデータベース システムでは、デフォルトの分離レベルは Read Committed (Oracle などの ) または Repeatable Read (以下 # # と呼ばれます) です。 #RR)。
次の 2 つのコマンドを使用して、グローバル分離レベルとこのセッションの分離レベルを表示できます: InnoDB デフォルトの分離レベルは RR ですが、RR については後ほど説明します。 SQL 標準では、RR はファントム リードの問題を回避できませんが、InnoDB によって実装された RR はファントム リードの問題を回避することに注意してください。5. MVCC
RR は、MVCC を使用して、ダーティ リード、反復不能リード、ファントム リードなどの問題を解決します。正式名は Multi-Version Concurrency Control で、複数バージョンの同時実行制御プロトコルです。次の例は、MVCC の特性をよく反映しています: 同時に、異なるトランザクションによって読み取られるデータは異なる場合があります (つまり、複数のバージョン) - 時間 T5 では、トランザクション A とトランザクション C は異なるバージョンのデータを読み取ることができます。 #MVCC の最大の利点は、読み取りがロックされないため、読み取りと書き込みの間に競合がなく、同時実行パフォーマンスが優れていることです。 InnoDB は MVCC を実装しており、複数のバージョンのデータが共存できます。これは主に次のテクノロジとデータ構造に基づいています: 1) 非表示列: InnoDB のデータの各行には非表示列があり、非表示列には以下が含まれます。この行のデータ、トランザクション ID、アンドゥ ログへのポインタなど。 2) アンドゥ ログに基づくバージョン チェーン: 前述したように、データの各行の非表示列にはアンドゥ ログへのポインタが含まれており、各アンドゥ ログは以前のバージョンのアンドゥ ログも指します。したがって、A バージョン チェーンが形成されます。 3) ReadView: カラムとバージョン チェーンを非表示にすることで、MySQL はデータを指定されたバージョンに復元できますが、具体的にどのバージョンに復元するかは ReadView に基づいて決定する必要があります。いわゆる ReadView とは、トランザクション (トランザクション A として記録される) がある瞬間にトランザクション システム全体 (trx_sys) のスナップショットを取得することを意味し、後で読み取り操作が実行されるときに、読み取られたデータ内のトランザクション ID と比較されます。 trx_sys スナップショット。したがって、データが ReadView に表示されるかどうか、つまりトランザクション A に表示されるかどうかが判断されます。 trx_sys の主な内容と可視性の判定方法は以下のとおりです。当事务A在T3时刻读取zhangsan的余额前,会生成ReadView,由于此时事务B没有提交仍然活跃,因此其事务id一定在ReadView的rw_trx_ids中,因此根据前面介绍的规则,事务B的修改对ReadView不可见。接下来,事务A根据指针指向的undo log查询上一版本的数据,得到zhangsan的余额为100。这样事务A就避免了脏读。
(2)不可重复读
当事务A在T2时刻读取zhangsan的余额前,会生成ReadView。此时事务B分两种情况讨论,一种是如图中所示,事务已经开始但没有提交,此时其事务id在ReadView的rw_trx_ids中;一种是事务B还没有开始,此时其事务id大于等于ReadView的low_limit_id。无论是哪种情况,根据前面介绍的规则,事务B的修改对ReadView都不可见。
当事务A在T5时刻再次读取zhangsan的余额时,会根据T2时刻生成的ReadView对数据的可见性进行判断,从而判断出事务B的修改不可见;因此事务A根据指针指向的undo log查询上一版本的数据,得到zhangsan的余额为100,从而避免了不可重复读。
(3)幻读
MVCC避免幻读的机制与避免不可重复读非常类似。
当事务A在T2时刻读取0 当事务A在T5时刻再次读取0 扩展 前面介绍的MVCC,是RR隔离级别下“非加锁读”实现隔离性的方式。下面是一些简单的扩展。 (1)读已提交(RC)隔离级别下的非加锁读 RC与RR一样,都使用了MVCC,其主要区别在于: RR是在事务开始后第一次执行select前创建ReadView,直到事务提交都不会再创建。根据前面的介绍,RR可以避免脏读、不可重复读和幻读。 RC每次执行select前都会重新建立一个新的ReadView,因此如果事务A第一次select之后,事务B对数据进行了修改并提交,那么事务A第二次select时会重新建立新的ReadView,因此事务B的修改对事务A是可见的。因此RC隔离级别可以避免脏读,但是无法避免不可重复读和幻读。 (2)加锁读与next-key lock 按照是否加锁,MySQL的读可以分为两种: 一种是非加锁读,也称作快照读、一致性读,使用普通的select语句,这种情况下使用MVCC避免了脏读、不可重复读、幻读,保证了隔离性。 另一种是加锁读,查询语句有所不同,如下所示: 加锁读在查询时会对查询的数据加锁(共享锁或排它锁)。由于锁的特性,当某事务对数据进行加锁读后,其他事务无法对数据进行写操作,因此可以避免脏读和不可重复读。而避免幻读,则需要通过next-key lock。next-key lock是行锁的一种,实现相当于record lock(记录锁) + gap lock(间隙锁);其特点是不仅会锁住记录本身(record lock的功能),还会锁定一个范围(gap lock的功能)。因此,加锁读同样可以避免脏读、不可重复读和幻读,保证隔离性。 6. 总结 要約すると、InnoDB によって実装された RR は、ロック メカニズム (ネクスト キー ロックを含む)、MVCC (データの非表示列、アンドゥ ログに基づくバージョン チェーン、ReadView) などを通じて、ある程度の分離を実現します。ほとんどのシナリオのニーズを満たします。 ただし、RR はファントム読み取りの問題を回避しますが、結局のところシリアライズ可能ではなく、完全な分離を保証できないことに注意してください。以下に 2 つの例を示します: 最初の例は、トランザクションの最初の読み取りは非ロック読み取りを使用し、2 番目の読み取りはロック読み取りを使用します。2 つの読み取り間でデータが変更された場合、ロックのため 2 つの読み取りの結果は異なります。読み取り時には MVCC は使用されません。 2 番目の例は以下に示すとおりで、自分で確認できます。 1. 基本概念 データベースの整合性制約は破壊されておらず、トランザクション実行前後のデータ状態は正常です。 データベースの整合性制約には、エンティティの整合性 (行の主キーが存在し、一意であるなど)、列の整合性 (フィールドのタイプ、サイズ、長さが満たさなければならないなど) が含まれますが、これらに限定されません。要件)、外部キー制約、およびユーザー定義の完全性(たとえば、2 つの口座の残高の合計は転送の前後で変更されない必要があります)。 2. 実装 以上がmysqlのトランザクションとは何ですかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。#共享锁读取
select...lock in share mode
#排它锁读取
select...for update
アトミック性、耐久性、分離性を確保します。これらの特性が保証できない場合、トランザクションの一貫性も保証できません
概要以下は、ACID の特性とその実装原則の概要です:
原子性: ステートメントは完全に実行されるか、まったく実行されません。これはトランザクションの中核機能です。トランザクション自体は原子性によって定義されます。実装は主に undo ログに基づいています