Heim > Datenbank > MySQL-Tutorial > Detaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL

Detaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL

青灯夜游
Freigeben: 2021-09-08 09:58:54
nach vorne
3985 Leute haben es durchsucht

Dieser Artikel führt Sie durch count(), Union() und Group-by-Anweisungen und ergänzt MySQL-Wissenspunkte (die Verwendung verschiedener count()-, Union-Ausführungsprozesse, Group-by-Anweisungen).

Detaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL

1. Verschiedene Verwendungen von count() in MySQL

count() ist eine Aggregatfunktion. Die zurückgegebene Ergebnismenge wird zeilenweise beurteilt. Wenn der Parameter der Zählfunktion nicht NULL ist, wird die Summe ermittelt Wert wird 1 addiert, andernfalls nicht addieren. Abschließend wird der kumulative Wert zurückgegeben. [Verwandte Empfehlungen: MySQL-Video-Tutorial]

1 Für count (Primärschlüssel-ID) durchläuft die InnoDB-Engine die gesamte Tabelle, entnimmt den ID-Wert jeder Zeile und gibt ihn an die Serverebene zurück. Nachdem die Serverschicht die ID erhalten hat, beurteilt sie, dass sie nicht leer sein darf, und akkumuliert sie daher zeilenweise

2. Für count(1) durchläuft die InnoDB-Engine die gesamte Tabelle, nimmt jedoch keinen Wert an. Die Serverschicht fügt in jede zurückgegebene Zeile eine Zahl ein. Es wird davon ausgegangen, dass sie nicht leer sein darf, und wird in Zeile 3 akkumuliert. Wenn dieses Feld nicht als Null definiert ist, wird dieses Feld zeilenweise gelesen Beurteilen Sie den Datensatz, dass er nicht null sein kann, und akkumulieren Sie ihn zeilenweise. Wenn die Felddefinition Null zulässt, wird bei der Ausführung beurteilt, dass er möglicherweise null ist, und der Wert muss herausgenommen und beurteilt werden, um festzustellen, ob dies der Fall ist nicht null. Akkumulieren

4. Für

darf es nicht null sein. Akkumulieren nach Zeile

count(*)来说,并不会把全部字段取出来,而是专门做了优化。不取值,count(*)

Detaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL 2. Union-Ausführungsprozess

Um die quantitative Analyse zu erleichtern, nehmen Sie die folgende Tabelle t1 als Beispiel
create table t1(id int primary key, a int, b int, index(a));

CREATE DEFINER=`root`@`%` PROCEDURE `idata`()
BEGIN
	declare i int;
  set i=1;
  while(i<=1000)do
    insert into t1 values(i, i, i);
    set i=i+1;
  end while;

END
Nach dem Login kopieren
analysieren Sie die folgende SQL-Anweisung: Die Semantik von

(select 1000 as f) union (select id from t1 order by id desc limit 2);
Nach dem Login kopieren

union besteht darin, die Ergebnisse dieser beiden Unterabfragen zu vereinen. Die Vereinigung bedeutet, dass die beiden Sätze addiert werden und nur eine Zeile doppelter Zeilen erhalten bleibt

key=PRIMARY in der zweiten Zeile, was darauf hinweist, dass die zweite Klausel das Index-IDDetaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL

Extra-Feld in der dritten verwendet Zeile: Gibt an, dass beim Durchführen einer Vereinigung für die Ergebnismenge der Unterabfrage eine temporäre Tabelle verwendet wird:
  • 1 Diese temporäre Tabelle enthält nur ein ganzzahliges Feld , und f ist das Primärschlüsselfeld
  • 2. Führen Sie die erste Unterabfrage aus und erhalten Sie den Wert 1000
3. Führen Sie die zweite Unterabfrage aus:

Erhalten Sie die erste Zeilen-ID = 1000 und versuchen Sie, sie in die temporäre Tabelle einzufügen. Da jedoch der Wert 1000 bereits in der temporären Tabelle vorhanden ist, was gegen die Eindeutigkeitsbeschränkung verstößt, schlägt das Einfügen fehl und die Ausführung wird fortgesetzt

Die zweite Zeilen-ID = 999 wird erhalten und das Einfügen in die temporäre Tabelle ist erfolgreich

4. Drücken Sie aus der temporären Tabelle. Nehmen Sie die Daten Zeile für Zeile heraus, geben Sie das Ergebnis zurück und löschen Sie die temporäre Tabelle. Das Ergebnis enthält zwei Datenzeilen, nämlich 1000 und 999
  • Die temporäre Speichertabelle spielt hier ab Rolle der temporären Speicherung von Daten, und der Berechnungsprozess verwendet auch die temporäre Tabelle. Die Eindeutigkeitsbeschränkung der Primärschlüssel-ID implementiert die Semantik von Union

Wenn die Union in der obigen Anweisung in Union All geändert wird, gibt es keine Semantik von Deduplizierung. Bei dieser Ausführung werden die Unterabfragen nacheinander ausgeführt und die erhaltenen Ergebnisse werden als Teil der Ergebnismenge direkt an den Client gesendet. Daher ist keine temporäre Tabelle erforderlich

Detaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL

Das Feld „Extra“ in der zweiten Zeile zeigt „Index verwenden“, was bedeutet, dass nur der abdeckende Index verwendet wird und die temporäre Tabelle nicht verwendet wird

3 Erklärung der Gruppierung nach AnweisungDetaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL


1, Gruppierung nach Ausführungsprozess

Verwenden Sie weiterhin die obige Tabelle t1, um die folgende SQL-Anweisung zu analysieren:
select id%10 as m, count(*) as c from t1 group by m;
Nach dem Login kopieren

Die Logik dieser Anweisung besteht darin, die Daten in Tabelle t1 entsprechend zu gruppieren id%10 und führen Sie Statistiken gemäß dem Ergebnis von m durch. Ausgabe nach der Sortierung. Das Erklärungsergebnis lautet wie folgt:

Im Extra-Feld können Sie drei Informationen sehen:

Index verwenden, was bedeutet, dass diese Anweisung einen abdeckenden Index verwendet, Index a auswählt und nicht zurückgegeben werden muss Die Tabelle

Die Verwendung einer temporären Tabelle Detaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL
Die Verwendung von Dateisortierung bedeutet, dass eine Sortierung erforderlich ist

  • Der Ausführungsablauf dieser Anweisung ist wie folgt:
  • 1 Erstellen Sie eine temporäre Tabelle im Speicher m und c in der Tabelle, und der Primärschlüssel ist m
  • 2. Scannen Sie Tabelle t1, indizieren Sie a, nehmen Sie nacheinander den ID-Wert auf dem Blattknoten heraus, berechnen Sie das Ergebnis von id%10 und zeichnen Sie es als auf Zeile mit dem Primärschlüssel x, addieren Sie 1 zum c-Wert der Zeile

    内存临时表排序流程图:

    Detaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL

    Detaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL

    如果并不需要对结果进行排序,在SQL语句末尾增加order by null:

    select id%10 as m, count(*) as c from t1 group by m order by null;
    Nach dem Login kopieren

    Detaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL

    由于表t1中的id值是从1开始的,因此返回的结果集中第一行是id=1

    这个例子里由于临时表只有10行,内存可以放得下,因此全程只使用了内存临时表。但是,内存临时表的大小是有限的,参数tmp_table_size就是控制整个内存大小的,默认是16M

    set tmp_table_size=1024;
    select id%100 as m, count(*) as c from t1 group by m order by null limit 10;
    Nach dem Login kopieren

    把内存临时表的大小限制为最大1024字节,并把语句改成id%100,这样返回结果里有100行数据。但是,这时的内存临时表大小不够存下这100行数据,也就是说,执行过程中会发现内存临时表大小达到了上限。那么,这时候会把内存临时表转成磁盘临时表,磁盘临时表默认使用的引擎是InnoDB

    2、group by优化方法——索引

    group by的语义逻辑,是统计不同的值的个数。但是,由于每一行的id%100的结果是无序的,所以就需要有一个临时表来记录并统计结果。那么,如果扫描过程中可以保证出现的数据是有序的就可以了

    假设,现在有一个类似下图的这么一个数据结构

    Detaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL
    如果可以确保输入的数据是有序的,那么计算group by的时候,就只需要从左到右,顺序扫描,依次累加。也就是下面这个流程:

    • 当碰到第一个1的时候,已经知道累积了X个0,结果集里的第一行就是(0,X)
    • 当碰到第一个2的时候,已经知道累积了Y个1,结果集里的第一行就是(1,Y)

    按照这个逻辑执行的话,扫描到整个输入的数据结束,就可以拿到group by的结果,不需要临时表,也需要再额外排序

    在MySQL5.7版本支持了generated column机制,用来实现列数据的关联更新。创建一个列z,在z列上创建一个索引

    alter table t1 add column z int generated always as(id % 100), add index(z);
    Nach dem Login kopieren

    这样,索引z上的数据就是有序的了。group by语句就可以改成:

    select z, count(*) as c from t1 group by z;
    Nach dem Login kopieren

    Detaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL
    从这个Extra字段可以看到,这个语句的执行不再需要临时表,也不需要排序了

    3、group by优化方法——直接排序

    在group by语句中加入SQL_BIG_RESULT这个提示,就可以告诉优化器:这个语句涉及的数据量很大,直接用磁盘临时表。因为磁盘临时表是B+树存储,存储效率不如数组来得高。所以MySQL优化器直接用数组来存

    select SQL_BIG_RESULT id%100 as m, count(*) as c from t1 group by m;
    Nach dem Login kopieren

    1.初始化sort_buffer,确定放入一个整型字段,记为m

    2.扫描表t1的索引a,依次取出里面的id值,将id%100的值存入sort_buffer中

    3.扫描完成后,对sort_buffer的字段m做排序(如果sort_buffer内存不够用,就会利用磁盘临时文件辅助排序)

    4.排序完成后,就得到了一个有序数组

    根据有序数组,得到数组里面的不同值,以及每个值的出现次数

    Detaillierte Erläuterung der Anweisungen count(), union() und group by in MySQLDetaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL
    这个语句的执行没有再使用临时表,而是直接用了排序算法

    更多编程相关知识,请访问:编程入门!!

    Das obige ist der detaillierte Inhalt vonDetaillierte Erläuterung der Anweisungen count(), union() und group by in MySQL. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:csdn.net
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage