node.js を使用してファイルをアップロードまたはダウンロードすると、チャンク文字化けの問題がよく発生します。いわゆるチャンクとはデータの塊のことで、ファイルを転送したりダウンロードしたりする際、ファイルは小さなデータに分割されて送信されます。このブロック送信方法により、送信時間とトラフィックを削減し、ファイル送信の効率を向上させることができます。しかし、ブロック送信の際、データブロックを正しくエンコード、デコードしないと文字化けが発生します。
チャンク文字化けの問題に対処する前に、まずいくつかの概念を理解する必要があります。 1 つ目はエンコードとデコードです。エンコードは文字セット内のテキストをコンピュータが処理できるバイナリ データに変換するプロセスであり、デコードはバイナリ データを元の文字セットのテキストに変換するプロセスです。一般的に使用されるエンコード形式には、ASCII エンコード、UTF-8 エンコードなどが含まれます。node.js では、Buffer オブジェクトがエンコードおよびデコード操作に使用されます。
2 つ目はフローです。 node.js では、ストリームはデータを処理のためにチャンクに分割する抽象的な概念です。ストリーム経由でファイルを転送する場合、データはデータ ストリーム送信用のブロックに分割されるため、メモリ負荷が軽減され、プログラムのパフォーマンスが向上します。 node.js では、一般的に使用されるストリームには、読み取り可能ストリーム (Readable)、書き込み可能ストリーム (Writable)、読み取り可能および書き込み可能ストリーム (Duplex) などが含まれます。
最後のものはチャンクです。 node.js では、チャンクはストリーム内の小さなデータ部分を指します。チャンク転送プロセス中、サーバーはデータ送信のためにファイルをいくつかのチャンクに分割し、クライアントはサーバーからこれらのチャンクを受信して、それらを結合して完全なファイルを作成します。
チャンクに非 ASCII 文字が含まれている場合、正しいエンコードおよびデコード操作を実行しないと、チャンクが文字化けします。 res.write メソッドを使用してチャンク データを返すときは、データに対して正しいエンコード操作を実行する必要があります。例:
const str = "中文"; res.write(Buffer.from(str, "utf-8"));
最初のパラメータはエンコードされる文字列で、2 番目のパラメータはエンコード形式。中国語の文字セットの場合、通常は UTF-8 エンコーディングが使用されます。このようにして、データのチャンクを正しくエンコードしてクライアントに送信できます。
チャンク データを受信して処理するときは、次のような適切なデコード操作も実行する必要があります。
let data = ""; res.on("data", chunk => { // 拼接接收到的数据 data += chunk; }); res.on("end", () => { // 将数据解码为字符串 const str = Buffer.from(data, "base64").toString("utf-8"); });
チャンク データを受信した後、データを結合し、データ送信後に完了すると、データは文字列形式にデコードされます。また、デコード時に正しいデコード形式を指定する必要があります。
要約すると、正しいエンコードおよびデコード操作が、node.js チャンクの文字化け問題を解決する鍵となります。さらに、チャンク サイズを調整することでファイル転送のパフォーマンスを最適化することもでき、大きなファイルを処理する必要がある場合は、チャンク転送にストリームの使用を検討できます。チャンク データを正しくエンコードおよびデコードすることで、チャンクの文字化けの問題を回避し、ファイル送信の信頼性と効率を向上させることができます。
以上がNodejsチャンクのコードが文字化けするの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。