json_encode の後、配列内の中国語の文字がデータベースに保存され、unicode になっていることがわかりました。
例: 「私は中国人です」
は次のようになります。
\u6211\u662f\u4e2a\u4e2d\u6587
元々、「私は中国人です」は合計 10 文字でした。
が Unicode になったら、 文字数は合計 30 文字だけになりますか? ? ?
テキストの長さは 65535 です。中国語の文字を直接保存できれば、おそらく 30,000 文字以上の中国語文字が存在することになります。
Unicode になったら保存できる漢字は6,500 文字くらいではないでしょうか?
テキストの長さが十分でない場合は、テキストの長さを中程度のテキストに変更します。データベースが大きくなり、速度が遅くなりますか?
質問は全部で 3 つあります。質問してください。初心者の方には申し訳ありません。
パフォーマンスは間違いなく影響を受けます。このような大きなテキストを通常保存する場合は、別のテーブルが作成されます。
はい
JSON_UNESCAPED_UNICODE
、中国語をエスケープせずに直接保存します。