Emoji-Ausdrücke kommen in unserer täglichen Entwicklung häufig vor, aber kürzlich bin ich auf ein Problem beim Einfügen von Emoji-Ausdrücken in MySQL gestoßen. Ich habe es schließlich durch die Suche nach relevanten Informationen gelöst, daher werde ich in diesem Artikel hauptsächlich den Prozess zur Lösung dieses Problems vorstellen Ich werde Ihnen die Lösung für das Problem vorstellen, dass MySQL keine Emoji-Ausdrücke einfügt. Freunde in Not können sich darauf beziehen.
Vorwort
Ich dachte immer, dass UTF-8 eine universelle Lösung für Zeichensatzprobleme sei, bis ich kürzlich auf dieses Problem stieß. Kürzlich habe ich an einem Crawler für Sina Weibo gearbeitet. Beim Speichern habe ich festgestellt, dass die folgende Ausnahme ausgelöst wird, solange ich den Emoji-Ausdruck behalte:
Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...'
Das bekannte UTF -8 ist 3 Byte groß, was bereits die meisten Schriftarten enthält, die wir jeden Tag sehen. Aber 3 Byte reichen bei weitem nicht aus, um den gesamten Text aufzunehmen, also gibt es utf8mb4, eine Obermenge von utf8 , was 4 Bytes entspricht, abwärtskompatibel mit utf8. Die Emoji-Ausdrücke, die wir täglich verwenden, sind
Wenn wir also Daten in die utf8-Datentabelle einfügen, wird dieser Fehler gemeldet .Incorrect string value
Ändern Sie den Zeichensatz der Daten Tabelle Es ist sehr einfach, utf8mb4 zu ändern
zu sichern die entsprechende Datentabelle und ändern Sie den Zeichensatz der Tabellenanweisung, und importieren Sie dann SQL erneut, um den Zeichensatzänderungsvorgang abzuschließen 🎜> 2. Die MySQL-Datenbankversion muss 5.5.3 und höher sein. Das Obige mysqldump -uusername -ppassword database_name table_name > table.sql
mysql -uusername -ppassword database_name < table.sql
Alle Artikel im Internet weisen darauf hin, dass MySQL 5.5.3 oder höher erforderlich ist, um utf8mb4 zu unterstützen Die von mir verwendete Datenbankversion ist jedoch 5.5.18 und kann am Ende immer noch gelöst werden. Daher sollten die Schüler nicht zuerst zum Betriebs- und Wartungsbruder eilen, um die Datenbank zu aktualisieren Beheben Sie das Problem selbst.
3. Ändern Sie die Datenbankkonfigurationsdatei /etc/my .cnf und starten Sie den MySQL-Dienst neu
Hauptsächlich zum Ändern des Standardzeichensatzes der Datenbank sowie des Verbindungs- und Abfragezeichensatzes. [Mysql unterstützt Emoji und die Emoticon-Upgrade-Codierung ist UTF8MB4][1] Dieser Artikel enthält detaillierte Einstellungsmethoden, [Ausführlich MySQL-Zeichensatzeinstellung][2] In diesem Artikel wird die Rolle jedes Zeichensatzes beschrieben. Sie können mehr darüber erfahren.
4. Aktualisieren Sie MySQL Connector auf 5.1. 21 und höher
Für alle oben genannten Vorgänge ist der kritischste Schritt 3, das Ändern der Datenbankkonfigurationsdatei, bei dem es sich um Geändert <🎜 handelt >
Aber Online-Datenbanken können Datenbankdateien oft nicht beiläufig ändern, daher haben mich unsere Klassenkameraden für Betrieb und Wartung entschieden abgelehnt, die Datenbankkonfiguration (T_T) zu ändern.
Das ist möglich kann nur mit Code gelöst werden. Der erste Schritt besteht darin, mit dem beim Herstellen einer Verbindung zu JDBC angegebenen Zeichensatz zu beginnen.
[client] # 客户端来源数据的默认字符集 default-character-set = utf8mb4 [mysqld] # 服务端默认字符集 character-set-server=utf8mb4 # 连接层默认字符集 collation-server=utf8mb4_unicode_ci [mysql] # 数据库默认字符集 default-character-set = utf8mb4
Hauptsächlich UTF-8 in utf8mb4 ändern für Java Style Charset Strings sollten das Problem lösen, oder?
Aber leider verfügt Java JDBC nicht über einen Zeichensatz für utf8mb4. Bei Verwendung von UTF-8 kann es mit urf8mb4 kompatibel sein und automatisch konvertiert werden den Zeichensatz.
Um beispielsweise 4-Byte-UTF-8-Zeichensätze mit Connector/J zu verwenden, konfigurieren Sie den MySQL-Server mit „character_set_server=utf8mb4“ und lassen Sie „characterEncoding“ aus der Connector/J-Verbindung heraus string. Connector/J erkennt dann automatisch die UTF-8-Einstellung – [MySQL:Verwenden von Zeichensätzen und Unicode] Sie können den zu verwendenden Zeichensatz explizit angeben. Geben Sie mit
jdbc:mysql://localhost:3306/ding?characterEncoding=UTF-8
Es sollte beachtet werden Wenn wir das ORM-Framework verwenden, verzögert das Framework aus Gründen der Leistungsoptimierung die Übermittlung, es sei denn, die Transaktion endet oder der Benutzer ruft aktiv die erzwungene Übermittlung auf, und die für die Ausführung verantwortliche Person
Wird immer noch nicht wirksam.
set names utf8mb4
Hier verwende ich myBatis und nehme MessageDao als Beispiel
set names utf8mb4
An diesem Punkt ist das Problem gelöst...
jdbcTemplate.execute("set names utf8mb4"); jdbcTempalte.execute("...");
set names utf8mb4
Wenn es bei Verwendung von AOP möglich ist, 4-Byte-UTF8-Zeichen einzufügen, wird die Präfixmethode ausgeführt set names utf8mb4
, aber diese Lösung kann noch nicht bestimmen, ob die AOP-Methode von Spring für Transaktionen verwaltet wird Verwaltung, und prüfen Sie in der Front-End-Methode, ob der erhaltene Link dieselbe Sitzung ist wie das als nächstes erhaltene Verbindungsobjekt.
Untersuchen Sie die Erstellungsmethode von Spring JDBC und schreiben Sie einen Hook Um jedes Mal eine neue zu erstellen, führen Sie set names utf8mb4
einmal aus, um sicherzustellen, dass der Zeichensatz für jeden erhaltenen Link
Das obige ist der detaillierte Inhalt vonLösung für das Problem, dass Emoji-Ausdrücke nicht in MySQL eingefügt werden konnten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!