最近、WeChat アプレットで使用するために Web ページを解析する必要があるクローラーを作成しています。テキストと画像の分析はどちらも理解しやすく、ミニ プログラムにはプレゼンテーション用に対応するテキストと画像のタグも含まれています。テーブルなどのより複雑なものは、サーバー側の解析でもミニ プログラムのレンダリングでも、非常に手間がかかり、すべての状況をカバーするのは困難です。そこで、表に対応するHTMLコードを画像に変換することが回避策になるのではないかと考えました。
ここでは、PhantomJS を軽量にカプセル化し、Web ページをスクリーンショットとして簡単に保存できる、node-webshot モジュールを使用します。 D まず Node.js と Phantomjs をインストールし、次にノード Web ショット モジュールをロードするための新しい JS ファイルを作成します。
内部の HTML コードは改行を削除し、二重引用符を置き換える必要があることに注意してください。一重引用符で囲みます。このようにして、HTML コードからローカル画像への変換が実現され、後で Qiniu クラウドにアップロードできますなど。サーバーサイドの解析であっても、ミニプログラムのプレゼンテーションであっても、難しいことはありません。
以上がWeChat ミニ プログラムにおける複雑なリッチ テキスト解析の詳細な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。