group-by - mysql group by原理？

Question

我们知道，在mysql中执行以下语句会报错： {代码...} 会提示#1062 - Duplicate entry '5.6.171' for key 'group_key' ，主键重复了。 group by 实际是将查询到的每列插入到临时表中，然后再排序。那为什么插入包...

阿神 · Answer

「照這個說法，floor(rand(0)*2)可能產生0或1。那每次執行上述SQL，有50%幾率應該是可以執行成功的。」這個應該是rand函數是偽隨機，所以給定種子每次執行的結果是一樣的，可以用select rand（0）from information_schema來驗證，多次執行後，結果相同。

group by的執行過程，是掃描過程，會建立臨時表來在驗證key。但是樓主的問題，我也在思考，期待高手解惑。

另外除了你描述的問題外，還有一個現象。對於不同的種子，成功和失敗的情況也是不一樣的，如下圖。

迷茫 · Answer

select count(*),concat(version(),'-',floor(rand(0)*100000))x
from information_schema.tables 
group by x

執行結果：[Err] 1062 - Duplicate entry '5.5.20-log-95655' for key 'group_key'
說明：執行floor(rand(0)*100000)結果中包含多個數值等於95655的項

證明

select count(*),concat(version(),'-',floor(rand(0)*1000000))x from information_schema.tables group by x
執行結果：