MySQL 中的 Collation 是一套规则,用于定义数据的排序和比较方式。它主要针对字符编码和字符串操作制定规则,例如:
大小写敏感性(大写字母与小写字母,例如:A 与 a)
重音符号敏感性(例如:é 与 e)
基于语言的排序规则(例如:德语中 ä 排在 a 附近,但在瑞典语中排在 z 之后)。
它与字符集相关联,字符集定义了数据库中可以存储的字符(字母)。
为什么需要 Collation?
Collation 决定数据显示的顺序。例如:在 utf8mb4_general_ci Collation 中,Apple 和 apple 被认为相同(不区分大小写),但在 utf8mb4_bin 中则不同。
在 WHERE 子句或 JOIN 中进行字符串比较时,会应用 Collation 规则。例如:'café' = 'cafe' 是否为真取决于 Collation。
根据 Collation,搜索结果会发生变化。例如:在 LIKE '�t%' 查询中,是否能找到 Cat 或 CAT 取决于 Collation。
Collation 用于正确排序或比较不同语言的字符。例如:西班牙语 ñ 或德语 ß 的特殊规则。
在所有操作(排序、比较、搜索)中应用相同的规则,以保持数据的连贯性。
Collation 的示例 utf8mb4_general_ci:
不区分大小写,支持一般 Unicode。
A = a,É = E。
utf8mb4_bin:
二进制比较(区分大小写)。
A ≠ a,É ≠ E。
utf8mb4_unicode_ci:
完全支持 Unicode,适用于多种语言。
如何设置 Collation?
sql Copy CREATE DATABASE mydb CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci; 2. 在表级别:
sql Copy CREATE TABLE mytable ( id INT, name VARCHAR(255) ) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci; 3. 在列级别:
sql Copy CREATE TABLE mytable ( id INT, name VARCHAR(255) COLLATE utf8mb4_bin ); 选择哪个 Collation? 大小写敏感性:选择 _ci(不区分大小写)或 _bin(区分大小写)。
语言需求:对于多语言数据,utf8mb4_unicode_ci 更好。
性能:utf8mb4_general_ci 更快,但 unicode_ci 更准确。
警告 Collation 不匹配:为避免表连接或比较中的错误,请在所有表/列中使用相同的 Collation。
索引:更改 Collation 可能需要重新构建索引。
总结 Collation 影响 MySQL 中数据的排序、比较和搜索。根据应用程序的语言、大小写敏感性和性能选择合适的 Collation!
以上是为什么在数据库中进行整理?的详细内容。更多信息请关注PHP中文网其他相关文章!