ホームページ > バックエンド開発 > PHPチュートリアル > mysqlエンコーディングに関する質問

mysqlエンコーディングに関する質問

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
リリース: 2016-06-23 14:08:32
オリジナル
1364 人が閲覧しました

現在、私たちは毎日日本の Web サイトから注文 txt ファイルをダウンロードし、それを PHP 経由でデータベースにインポートしています。インポート前にメモ帳を使用して txt を utf-8 に変換する必要があります。直接インポートすると文字化けします。毎回メモ帳を使用する代わりに PHP を使用する方法を教えてください。 ? ?

以下は、分析に役立つ情報です
サーバー文字セット latin1
DB 文字セット latin1
接続 chatacterset latin1



Character_set_client latin1
Character_set_connection latin1
ベースラテン1
キャラクターセットファイルシステムラテン1
キャラクターセット結果ラテン1
キャラクターセットサーバーラテン1
character_set_system latin1
character_sets_dir latin1

以下はコードの一部です

mysql_query("set names utf-8");$ship_address3=mb_convert_encoding(addslashes($u[19]), 'UTF-8','auto');
ログイン後にコピー


ディスカッションへの返信(解決策)

トランスコードするかどうか、トランスコードする方法は元のデータに依存します

あなたは「メモ帳を使用して、 txt を utf -8 に変換します。このファイルをメモ帳で開くと、内容は正しく表示されますか?意味不明なことはありませんか?
日本のオペレーティングシステムを使用していますか?
可能であれば、分析のためにデータ ファイルのフラグメントを投稿できます
echo Base64_encode(file_get_contents('your data file.txt', false, null, 0, 40));
結果を投稿します


両方を開きます見えますよ

本当に私の助けが必要な場合は、私の言うとおりにしてください

写真を投稿しても意味がありません

出力結果:

b3JkZXItaWQJb3JkZXItaXRlbS1pZAlwdXJjaGFzZS1kYXRlCXBheQ==

システム、日本語、繁体字中国語、簡体字中国語も可能ですが主に日本語系です。

xuzuning に、base64_encode() は一般的にどこで使用されているのか聞いてもいいですか?

もう一度確認してください、どのオペレーティング システムを使用していますか?必ず回答してください


あなたの説明、写真、データの断片に従ってください
1. 毎回、メモ帳を使用して txt を utf-8 に変換する必要があります。明らかにテキストは utf-8 ではありません。そうでない場合は、その必要はありません。変換するには
2. オペレーティング システムは Windows シリーズです。それ以外の場合は、「メモ帳」などありません
3. データには BOM ヘッダーがありません。つまり、オペレーティング システムのデフォルトの文字セットを使用して保存されます
4
オペレーティングシステムが簡体字中国語の場合、文字セットは gbk であることがわかります。
オペレーティングシステムが繁体字中国語の場合、日本語部分は完全に完了しているようです。の場合、文字セットは big5 です
オペレーティング システムが日本語の場合、文字セットは EUC または Shift-JIS です

したがって、データを操作するオペレーティング システムの文字セットに基づいて次のステートメントを入力するだけで済みます
mysql_query("set namescharacter set");
トランスコーディング作業は mysql によって自動的に完了します

xuzuning : こんにちは!

回答: 日本の Amazon ウェブサイトからダウンロードしました。オペレーターのシステムは通常、繁体字中国語と日本語です。複数のシステムを実装できない場合は、オペレーターにすべての日本語システムを使用するよう要求することができます。


1. メモ帳には ansi エンコードが表示されます
2. 私が訪問する日本の Web サイトの多くは、shift-jis エンコードで表示されます


聞きたいのですが、EUC またはシフト JIS を使用する場合、簡体字中国語または繁体字中国語を使用します。ディスプレイに問題はありますか? ?

日本の多くのWebサイトはshift-jisでエンコードされています
そして、ダウンロードしたファイルもshift-jisでエンコードされ、インポートされたデータベースもshift-jisでエンコードされています

簡体字や繁体字は中国語の概念であり、日本語とは何の関係もありません
簡体字中国語や繁体字中国語のデータソースを操作するとき、それは当然 gbk または big5 ですよね?
データベースに保存されるものはすべて utf-8 ですよね?
そうですね。ありがとうxuzuning、私は今日です 試してみてください!

私たちのアプローチは、まずダウンロードした注文を Excel 形式に変換し、次にそれを php を通じて読み取ることです。

こんにちは、zy205817 さん、これを行う場合は、メモ帳を使用して UTF-8 を変換する場合と同じで、一度手動でコードを変換する必要があります。

xuzuning こんにちは、お聞きしたいのですが、PHP は txt ファイルをトランスコードできますか?メモ帳を使ってトランスコードするような感じでしょうか? ? ?

xuzuning Da:
そして、前回は文字化けせずに日本語のテキストをスクリーンショットしました。これは私の同僚が私にくれたtxtファイルで、今日日本語の部分を開くと、ありました。 Excelを使用してトランスコードし、Uft-8に直接変換すると機能しません

関連ラベル:
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート