1. 1 つ目は、PHP Web ページのエンコーディングです
1。PHP ファイル自体のエンコーディングと Web ページのエンコーディングは一致している必要があります
a gb2312 エンコーディングを使用したい場合、PHP はヘッダーを出力する必要があります: header( "Content-Type: text/html;すべてのファイルは ANSI であり、メモ帳で開くことができ、名前を付けて保存し、エンコードを ANSI として選択し、ソース ファイルを上書きします。
b. utf-8 エンコードを使用する場合、php はヘッダーを出力する必要があります: header(“Content-Type: text/html; charset=utf-8”)、」と入力すると、すべてのファイルのエンコード形式は utf-8 になります。 utf-8 として保存するのは少し面倒かもしれません。セッションを使用する場合は、editplus を使用して保存できます。パラメータの選択 -> ファイル -> UTF-8 署名で、[常に削除] を選択し、BOM 情報を削除します。
2. PHP 自体は Unicode ではないため、substr などのすべての関数を mb_substr に変更するか、iconv を使用してトランスコードする必要があります。
2. PHP と Mysql の間のデータ対話
PHP とデータベースのエンコーディングは一貫している必要があります
1. mysql 設定ファイル my.ini または my.cnf を変更します。mysql には utf8 エンコーディングを使用するのが最適です
[mysql]
default- Character-set=utf8
[mysqld]
default-character-set=utf8
default-storage-engine=MyISAM
[mysqld] の下に追加します:
default-collation=utf8_bin
init_connect='SET NAMES utf8'
2.データベース操作を行う必要がある PHP プログラムの前に mysql_query("set names 'encoding'"); を追加します。PHP エンコーディングが gb2312 の場合、mysql エンコーディングは gb2312 です。 -8 の場合、mysql エンコーディングは utf8 になります。 これにより、データの挿入または取得時に文字化けが発生しません
3 つ。 PHPはオペレーティングシステムと関係があります
WindowsとLinuxのエンコーディングが異なります。 Windows環境でPHP関数を呼び出す際、パラメータがutf-8エンコーディングの場合、move_uploaded_file()、filesize()などのエラーが発生します。 、readfile() など。これらの関数は、アップロードとダウンロードの処理時によく使用されます。呼び出し時に次のエラーが発生する場合があります:
警告: move_uploaded_file()[function.move-uploaded-file]: ストリームを開けませんでした: 無効な引数…
警告: move_uploaded_file()[function.move-uploaded-file]:… の ” を ” に移動できません
警告: filesize() [function.filesize]: … の stat に失敗しました
警告: readfile() [function . readfile]: failed to open stream: Invalid argument in ..
Linux 環境で gb2312 エンコーディングを使用する場合、これらのエラーは発生しませんが、この場合、保存されたファイル名が文字化けし、ファイルを読み取ることができません。オペレーティング システムが認識するエンコーディングを mb_convert_encoding (文字列、新しいエンコーディング、元のエンコーディング) または iconv (元のエンコーディング、新しいエンコーディング、文字列) を使用して変換できます。この方法では、処理後に保存されたファイル名は変わりません。中国語名のファイルをアップロードおよびダウンロードするには、文字化けしますが、正常に読み取ることができます。
実際、より良い解決策があります。それはシステムから完全に分離することであり、システムのエンコーディングを考慮する必要はありません。ファイル名として文字と数字のみのシーケンスを生成し、データベースに漢字を含む元の名前を保存することができます。この方法では、ダウンロード時に move_uploaded_file() を呼び出すときに問題は発生しません。ファイル名を中国語の文字を含む元の名前に変更します。ダウンロードを実装するコードは次のとおりです。
header(”Pragma: public”);
header(”Expires: 0″); 0'') ;
header("コンテンツの種類: $file_size");
header("コンテンツの配置: 添付ファイル名"); header(" Content-Transfer-Encoding: binary");
readfile($file_path);
$file_type はファイルの種類、$file_name は元の名前、$file_path はサービス上に保存されたファイルのアドレスです。
4つ。文字化けが発生する原因をまとめてみましょう
文字化けが発生する原因は大きく分けて2つあります。 1つ目は、エンコード(文字セット)の設定が間違っているため、ブラウザが間違ったエンコードで解析してしまい、文字化けが発生してしまうことが原因です。画面いっぱいに「天国の本」というメッセージが表示され、その後、ファイルが間違ったエンコードで開かれ、その後保存されました。たとえば、テキスト ファイルは元々 GB2312 でエンコードされていましたが、UTF-8 エンコードで開かれて保存されました。上記の文字化けコードの問題を解決するには、まず開発のどの側面にエンコーディングが関係しているかを知る必要があります:
1. ファイル エンコーディング: ページ ファイル (.html、.php など) 自体が保存されるエンコーディングを指します。 Notepad と Dreamweaver では、ページを開くときにファイルのエンコーディングが自動的に認識されるため、問題は少なくなります。ただし、ZendStudio はエンコーディングを自動的に認識しません。作業中に誤って間違ったエンコーディングでファイルを開き、変更を行った後にファイルを保存すると、文字化けしてしまいます。の文字が出てきます(しみじみ)。
2. ページ宣言のエンコーディング: HTML コード HEAD で、3. データベース接続エンコーディング: データベース操作を実行する際にどのエンコーディングが使用されるかを指します。たとえば、MySQL のデフォルトのエンコーディングは latin1 エンコーディングです。これは、Mysql に送信されたデータが latin1 エンコーディングで保存されることを意味します。 latin1 エンコーディング
エンコーディングに関しては、文字化けの原因がわかります。さまざまなエンコーディングのほとんどが ASCII 互換であるため、英語の記号は表示されません。
5. よくあるエラーの状況と解決策:
1. データベースは UTF8 エンコーディングを使用しており、これが文字化けの最も一般的な原因です。 、PHP スクリプトで直接 SELECT されたデータは文字化けするため、mysql_query("SET NAMES GBK"); を使用して MYSQL 接続エンコーディングを設定する前に、ページ宣言エンコーディングが接続と一致していることを確認してください。ここで設定したエンコーディング (GBK は GB2312 の拡張子)、ページが UTF-8 でエンコードされている場合は問題ありません: mysql_query("SET NAMES UTF8");
一般的に使用される UTF-8 ではなく UTF8 であることに注意してください。ページによって宣言されたエンコーディングがデータベースの内部エンコーディングと一致している場合、接続エンコーディングは必要ありません。
注: 実際には、MYSQL の出力は上記よりも複雑ではありません。 MYSQL 設定ファイル my.ini には 2 つのデフォルトのエンコーディングが定義されており、それぞれ [client] のデフォルト文字セットと [mysqld] のデフォルト文字セットで、クライアント接続で使用されます。上記で指定したエンコーディングは実際には、MYSQL クライアントがサーバーに接続するときのコマンド ライン パラメーターcharacter_set_client であり、デフォルトのエンコーディング
2 を使用するのではなく、受信したクライアント データのエンコーディングを MYSQL サーバーに伝えます。ページ宣言のエンコードがファイル自体のエンコードと一致しない場合、ページの作成時にブラウザに表示される内容が公開後に修正される可能性が高いため、これはめったに起こりません。間違ったエンコードでページを開いて保存したり、CuteFTP などの FTP ソフトウェアを使用してオンラインでファイルを直接変更したり、ソフトウェアのエンコード設定が間違っていたために間違ったエンコードが変換されたりしました。
3. バーチャルホストをレンタルしている一部の友人は、上記の 3 つのエンコードが正しく設定されているにもかかわらず、依然としてコードが文字化けしています。たとえば、Web ページが GB2312 でエンコードされている場合、ブラウザのエンコードを手動で GB2312 に変更すると、Web ページの HEAD はすでに GB2312 として認識されます。 、ページは正常に表示されます。その理由は、サーバー Apache がサーバーのグローバルなデフォルト エンコーディングを設定し、httpd.conf に AddDefaultCharset UTF-8 を追加するためです。このとき、サーバーは最初に HTTP ヘッダーをブラウザーに送信しますが、その優先順位はページ内で宣言されたエンコーディングよりも高くなります。当然、ブラウザーはそれを誤って認識します。解決策は 2 つあります。管理者は、AddDefaultCharset GB2312 を独自の仮想マシンの構成ファイルに追加してグローバル構成をオーバーライドするか、独自のディレクトリの .htaccess で構成する必要があります。
要約: 一言で言えば、PHP の中国語の文字化けコードを解決する最善かつ最速の方法は、ページに適用されているページ番号がデータベースの内部エンコーディングと一致しない場合、ページによって宣言されたエンコーディングを一致させることです。データベースの内部エンコーディング、接続エンコーディングを設定します。 mysql_query("SET NAMES XXX"); XXX は文字化けの問題を確実に解決します。