ユニコード
1. 現在処理されているファイルの種類は 2 つあります: txt html
2. ファイルのエンコーディングは不明です。ファイルのコンテンツを読み取るために、コンテンツのエンコーディングは最終的に utf-8 に変換され、最終的にデータベースに保存されます
現在、 mb_convert_encoding($file_content,'utf-8',"auto"); を使用したいのですが、うまくいかないようです。教えてください。分析を手伝ってください (txt の複雑さ)
ディスカッションに返信 (解決策)
ほとんどの場合、mb_convert_encoding を使用しても正しい判断を得ることができません
そこで、mb_string 拡張機能には新しいメンバー mb_check_encoding が追加されました
この関数は、次のことを正確に判断できますソースは指定された文字セットです
ただし、使用可能な文字セットを列挙するコードを記述する必要があります:
if(mb_check_encoding($s, 'utf-8')) ....
elseif(mb_check_encoding($s, ' gbk')) . ...
elseif(mb_check_encoding($s, 'big5')) ....
else ....
ほとんどの場合、mb_convert_encoding を使用しても正しい判断を得ることができません
したがって、mb_string 拡張機能には新しいメンバー mb_check_encoding が追加されました
この関数は、ソースが指定された文字セットであるかどうかを正確に判断できます
ただし、可能な文字セットを列挙するコードを記述する必要があります:
if(mb_check_encoding($s, 'utf-8) ')) ....
elseif(mb_check_encoding ($s, 'gbk')) ....
elseif(mb_check_encoding($s, 'big5')) ....
else ....
便利です、数日前、csv 形式を読み取る方法を書きました。データについては、txt を csv 形式に変換するエンコードの問題に苦労したことがあります...
ほとんどの場合、mb_convert_encoding を使用しても正しい判断が得られません
そこでmb_string 拡張機能には、新しいメンバー mb_check_encoding が追加されました
この関数は、ソースが指定された文字セットであるかどうかを正確に判断できます
ただし、使用可能な文字セットを列挙するコードを記述する必要があります:
if(mb_check_encoding($s, 'utf-8' )) ....
elseif(mb_check_encoding($s, 'gbk')) . ...
elseif(mb_check_encoding($s, 'big5')) ....
else ....
if(mb_convert_encoding($file_content,'ASCII')){ mb_convert_encoding($file_content,'UTF-8',"ASCII"); }elseif(mb_convert_encoding($file_content,'GB2312')){ mb_convert_encoding($file_content,'UTF-8',"GB2312"); }elseif(mb_convert_encoding($file_content,'GBK')){ mb_convert_encoding($file_content,'UTF-8',"GBK"); }elseif(mb_convert_encoding($file_content,'BIG5')){ mb_convert_encoding($file_content,'UTF-8',"BIG5"); }else{ mb_convert_encoding($file_content,'UTF-8',"auto"); }
も文字化けコードです
http://fashionistess.com/awr1/1.php
あなたが与えたリンクが何を反映しているのか理解できません
mb_convert_encoding が不正確であることが分かったのに、なぜまだ使用しているのですかそれ?
$file_content = '待转码的内容';$charset = '';if(mb_check_encoding($file_content, 'utf-8')) $charset = ''; //已是 utf-8 了无需转码elseif(mb_check_encoding($file_content, 'big5')) $charset = 'big5'; //big5 的码值范围小于 gbk,应先判断elseif(mb_check_encoding($file_content, 'gbk')) $charset = 'gbk'; //gb2312 是 gbk 的子集,只判 gbk 就可以了if($charset) $file_content = mb_convert_encoding($file_content, 'utf-8', $charset);
あなたが与えた接続が何を反映しているのか理解できません
mb_convert_encoding が不正確であることが分かったのに、なぜまだそれを使用しているのですか?
$file_content = '待转码的内容';$charset = '';if(mb_check_encoding($file_content, 'utf-8')) $charset = ''; //已是 utf-8 了无需转码elseif(mb_check_encoding($file_content, 'big5')) $charset = 'big5'; //big5 的码值范围小于 gbk,应先判断elseif(mb_check_encoding($file_content, 'gbk')) $charset = 'gbk'; //gb2312 是 gbk 的子集,只判 gbk 就可以了if($charset) $file_content = mb_convert_encoding($file_content, 'utf-8', $charset);
申し訳ありませんが、今間違ったコードを書いてしまいました
リンクはテスト結果です。エンコーディングの問題は解析結果に影響します (以前は Linux で生成されたファイルのみを分析したため、この問題は見つかりませんでした) ありがとうございます。解決しました

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









JWTは、JSONに基づくオープン標準であり、主にアイデンティティ認証と情報交換のために、当事者間で情報を安全に送信するために使用されます。 1。JWTは、ヘッダー、ペイロード、署名の3つの部分で構成されています。 2。JWTの実用的な原則には、JWTの生成、JWTの検証、ペイロードの解析という3つのステップが含まれます。 3. PHPでの認証にJWTを使用する場合、JWTを生成および検証でき、ユーザーの役割と許可情報を高度な使用に含めることができます。 4.一般的なエラーには、署名検証障害、トークンの有効期限、およびペイロードが大きくなります。デバッグスキルには、デバッグツールの使用とロギングが含まれます。 5.パフォーマンスの最適化とベストプラクティスには、適切な署名アルゴリズムの使用、有効期間を合理的に設定することが含まれます。

PHP開発における固体原理の適用には、次のものが含まれます。1。単一責任原則(SRP):各クラスは1つの機能のみを担当します。 2。オープンおよびクローズ原理(OCP):変更は、変更ではなく拡張によって達成されます。 3。Lischの代替原則(LSP):サブクラスは、プログラムの精度に影響を与えることなく、基本クラスを置き換えることができます。 4。インターフェイス分離原理(ISP):依存関係や未使用の方法を避けるために、細粒インターフェイスを使用します。 5。依存関係の反転原理(DIP):高レベルのモジュールと低レベルのモジュールは抽象化に依存し、依存関係噴射を通じて実装されます。

記事では、PHP 5.3で導入されたPHPの後期静的結合(LSB)について説明し、より柔軟な継承を求める静的メソッドコールのランタイム解像度を可能にします。 LSBの実用的なアプリケーションと潜在的なパフォーマ

PHP開発でPHPのCurlライブラリを使用してJSONデータを送信すると、外部APIと対話する必要があることがよくあります。一般的な方法の1つは、Curlライブラリを使用して投稿を送信することです。

記事では、入力検証、認証、定期的な更新など、脆弱性から保護するためのフレームワークの重要なセキュリティ機能について説明します。

システムが再起動した後、UnixSocketの権限を自動的に設定する方法。システムが再起動するたびに、UnixSocketの許可を変更するために次のコマンドを実行する必要があります:sudo ...

この記事では、フレームワークにカスタム機能を追加し、アーキテクチャの理解、拡張ポイントの識別、統合とデバッグのベストプラクティスに焦点を当てています。
