ホームページ バックエンド開発 PHPチュートリアル WeChatパブリックアカウントの履歴メッセージページを収集する方法の詳細な説明

WeChatパブリックアカウントの履歴メッセージページを収集する方法の詳細な説明

Jul 07, 2018 pm 05:48 PM
WeChatの公開アカウント

WeChatの公開アカウント記事から収集した入力履歴メッセージページの情報を取得する方法を説明しますので、困っている友人は参考にしてください。

WeChat の記事の収集は Web サイトのコンテンツの収集と同じであり、リスト ページから始める必要があります。 WeChat記事一覧ページは、公式アカウント内の閲覧履歴メッセージページです。現在、インターネット上の他の多くの WeChat 収集者は Sogou を使用して検索を行っており、収集方法ははるかに簡単ですが、内容は不完全です。したがって、最も標準的で包括的なパブリック アカウント履歴メッセージ ページから情報を収集する必要があります。

WeChat の制限により、コピーできるリンクは不完全であるため、ブラウザーで開いてコンテンツを表示することはできません。したがって、anyproxy を使用して、前の記事で紹介した方法で完全な WeChat パブリック アカウント履歴メッセージ ページのリンク アドレスを取得する必要があります。

http://mp.weixin.qq.com/mp/getmasssendmsg?__biz=MjM5NDAwMTA2MA==&uin=NzM4MTk1ODgx&key=bf9387c4d02682e186a298a18276d8e0555e3ab51d81ca46de339e6082eb767343 bef6 10edd80c9e1bfda66c2b62751511f7cc091a33a029709e94f0d1604e11220fc099a27b2e2d29db75cc0849d4bf&devicetype=android-17&version=26031c34&lang=zh_CN&nettype=WIFI&as cene=3&pass_tic ket=Iox5ZdpRhrSxGYEeopVJwTBP7kZj51GYyEL24AT5Zyx+BoEMdPDBtOun1F /9ENSz&wx_header =1

前回の記事でも触れましたが、bizパラメータは公式アカウントのID、uinはユーザーのIDで、現時点ではuinは全公式アカウントの中で一意です。他の 2 つの重要なパラメーター key と pass_ticket は、WeChat クライアントの補足パラメーターです。

ということで、このアドレスの有効期限が切れる前に、ブラウザで原文を閲覧することで過去のメッセージの記事一覧を取得することができ、内容を自動解析したい場合には、このアドレスを追加するプログラムを作成することも可能です。有効期限が切れていないアドレス key と pass_ticket のリンクアドレスを送信し、php プログラムなどで記事一覧を取得します。

最近、友人が収集対象が単一の公開アカウントであると教えてくれたので、前の記事で書いた一括収集方法を使用する必要がなくなると思います。では、履歴メッセージページの記事一覧を取得する方法を見てみましょう 記事一覧を解析することで、この公式アカウントのコンテンツリンクアドレスをすべて取得し、コンテンツを収集することができます。

anyproxy Web インターフェイスで証明書が正しく構成されている場合は、https コンテンツを表示できます。 Web インターフェイスのアドレスは http://localhost:8002 です。localhost は独自の IP アドレスまたはドメイン名に置き換えることができます。リストから getmasssendmsg で始まるレコードを見つけてクリックすると、右側にこのレコードの詳細が表示されます:

赤枠部分が完全なリンクですWeChat public プラットフォームのドメイン名が前に結合されると、ブラウザで開くことができます。

次に、HTML コンテンツの最後までページをプルすると、過去のニュース記事のリストである json 変数が表示されます:

msgList の変数値をコピーし、json 整形ツールで分析すると、json が次の構造になっていることがわかります:

{
  "list": [
    {
      "app_msg_ext_info": {
        "author": "",
        "content": "",
        "content_url": "http://mp.weixin.qq.com/s?__biz=MzA5MzEzNDg3MQ==&mid=2652767427&idx=1&sn=37da0d7208283bf90e9a4a536e0af0ea&chksm=8b882dbbbcffa4ad2f0b8a141cc988d16bace564274018e68e5c53ee6f354f8ad56c9b98bade&scene=4#wechat_redirect",
        "copyright_stat": 100,
        "cover": "http://mmbiz.qpic.cn/mmbiz/MofBAcBsJ6X0xGrQ2XK5yQjzwb2eswxkRNBTgLtcqGziaFqwibzvtZAHCDkMeJU1fGZHpjoeibanPJ8rziaq68Akkg/0?wx_fmt=jpeg",
        "digest": "擦亮双眼,远离谣言。",
        "fileid": 505283695,
        "is_multi": 1,
        "multi_app_msg_item_list": [
          {
            "author": "",
            "content": "",
            "content_url": "http://mp.weixin.qq.com/s?__biz=MzA5MzEzNDg3MQ==&mid=2652767427&idx=2&sn=449ef1a874a37fed2429e14f724b56ef&chksm=8b882dbbbcffa4ade48a7932cda4263687e34fca8ea3a5a6233d2589d448b9f6130d3890ce93&scene=4#wechat_redirect",
            "copyright_stat": 100,
            "cover": "http://mmbiz.qpic.cn/mmbiz_png/MofBAcBsJ6XyaIn0qEDSSicBUBZbMYHYrhibia89ZnksCsUiaia2TLI1fyqjclibGa1hw3icP6oXeSpaWMjiabaghHl7yw/0?wx_fmt=png",
            "digest": "12月28日,广州亚运城综合体育馆,内附购票入口~",
            "fileid": 0,
            "source_url": "http://wechat.show.wepiao.com/detail/ff764b0731b7465db03b56b998e1f2b8?detailReferrer=1&from=groupmessage&isappinstalled=0",
            "title": "2017微信公开课Pro版即将召开"
          },
         ...//循环被省略
        ],
        "source_url": "",
        "subtype": 9,
        "title": "谣言热榜 | 十一月朋友圈十大谣言"
      },
      "comm_msg_info": {
        "content": "",
        "datetime": 1480933315,
        "fakeid": "3093134871",
        "id": 1000000010,
        "status": 2,
        "type": 49 //类型为49的时候是图文消息
      }
    },
   ...//循环被省略
  ]
}
ログイン後にコピー

簡単に分析するこの JSON (ここではいくつかの重要な情報のみが紹介されており、その他は省略されています):

"list": [ //最外层的键名;只出现一次,所有内容都被它包含。
  {//这个大阔号之内是一条多图文或单图文消息,通俗的说就是一天的群发都在这里
    "app_msg_ext_info":{//图文消息的扩展信息
      "content_url": "图文消息的链接地址",
      "cover": "封面图片",
      "digest": "摘要",
      "is_multi": "是否多图文,值为1和0",
      "multi_app_msg_item_list": [//这里面包含的是从第二条开始的图文消息,如果is_multi=0,这里将为空
        {
          "content_url": "图文消息的链接地址",
          "cover": "封面图片",
          "digest": ""摘要"",
          "source_url": "阅读原文的地址",
          "title": "子内容标题"
        },
        ...//循环被省略
      ],
      "source_url": "阅读原文的地址",
      "title": "头条标题"
    },
    "comm_msg_info":{//图文消息的基本信息
      "datetime": '发布时间,值为unix时间戳',
      "type": 49 //类型为49的时候是图文消息
    }
  },
  ...//循环被省略
]
ログイン後にコピー

ここでもう 1 つ言及しておきたいのは、コンテンツを取得したい場合古いメッセージの履歴を表示するには、携帯電話またはシミュレーターでページを一番下までプルする必要があります。ページを一番下までプルすると、WeChat が自動的に次のページの内容を読み上げます。次ページのリンクアドレス、履歴メッセージページのリンクアドレスもgetmasssendmsgで始まるアドレスとなる。ただし、コンテンツは HTML ではなく json のみです。 json を直接解析するだけです。

この時点で、前の記事で紹介した方法を使用して、anyproxy を使用して msgList 変数の値を定期的に照合し、非同期でサーバーに送信し、サーバーから php の json_decode を使用して json を解析することができます。配列に入れます。次に、配列をループします。各記事のタイトルとリンクアドレスを取得できます。

単一の公開アカウントのコンテンツのみを収集する必要がある場合は、毎日一括送信した後、anyproxy を介してキーと pass_ticket を含む完全なリンク アドレスを取得できます。次に、自分でプログラムを作成し、プログラムにアドレスを手動で送信します。 php などの言語を使用して定期的に msgList と照合し、json を解析します。この方法では、anyproxy のルールを変更する必要はなく、コレクション キューやジャンプ ページを作成する必要もありません。

関連する推奨事項:

PHP で基数ソートを実装する方法の説明

PHP が依存関係挿入ベースの自動実装を行う方法リフレクション メカニズムについての説明

PHP 変数と変数の動的文字列挿入の詳細な説明

以上がWeChatパブリックアカウントの履歴メッセージページを収集する方法の詳細な説明の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Scrapy は WeChat パブリック アカウント記事のクロールと分析を実装します Scrapy は WeChat パブリック アカウント記事のクロールと分析を実装します Jun 22, 2023 am 09:41 AM

Scrapy は記事のクローリングと WeChat パブリックアカウントの分析を実装します 近年人気のソーシャルメディアアプリケーションである WeChat で運用されているパブリックアカウントも非常に重要な役割を果たしています。誰もが知っているように、WeChat の公開アカウントは記事、グラフィック メッセージ、その他の情報を公開できるため、情報と知識の海です。この情報は、メディア報道、学術研究など、さまざまな分野で広く使用できます。そこで、この記事では、Scrapy フレームワークを使用して WeChat パブリック アカウントの記事をクロールおよび分析する方法を紹介します。 Scr

WeChat公式アカウント認証と非認証の違いは何ですか? WeChat公式アカウント認証と非認証の違いは何ですか? Sep 19, 2023 pm 02:15 PM

WeChat パブリック アカウント認証と非認証の違いは、認証ロゴ、機能権限、プッシュ頻度、インターフェイス権限、およびユーザーの信頼にあります。詳細な紹介: 1. 認証ロゴ. 認証されたパブリック アカウントは、青い V ロゴである公式認証ロゴを取得します. このロゴは、パブリック アカウントの信頼性と権威を高め、ユーザーが本物の公式パブリック アカウントを識別しやすくします。 ; 2. 機能の権限: 認証されたパブリック アカウントには、非認証のパブリック アカウントよりも多くの機能と権限があります。たとえば、認証されたパブリック アカウントは、オンライン決済や商用操作などを実現するための WeChat 支払い機能の有効化を申請できます。

Python での実践的なクローラー戦闘: WeChat パブリック アカウント クローラー Python での実践的なクローラー戦闘: WeChat パブリック アカウント クローラー Jun 10, 2023 am 09:01 AM

Python は、強力なデータ処理機能と Web クローリング機能を備えたエレガントなプログラミング言語です。デジタル時代において、インターネットには大量のデータが溢れており、クローラはデータを取得する重要な手段となっており、Python クローラはデータ分析やマイニングに広く使用されています。この記事では、Python クローラーを使用して WeChat 公開アカウントの記事情報を取得する方法を紹介します。 WeChat 公式アカウントは、オンラインで記事を公開するための人気のソーシャル メディア プラットフォームであり、多くの企業やセルフメディアのプロモーションとマーケティングのための重要なツールです。

Laravel を使用して WeChat パブリック アカウントに基づいたオンライン注文システムを開発する方法 Laravel を使用して WeChat パブリック アカウントに基づいたオンライン注文システムを開発する方法 Nov 02, 2023 am 09:42 AM

Laravel を使用して WeChat 公式アカウントをベースにしたオンライン注文システムを開発する方法 WeChat 公式アカウントの普及に伴い、ますます多くの企業がオンライン マーケティングの重要なチャネルとして使用し始めています。ケータリング業界では、WeChat パブリック アカウントに基づいたオンライン注文システムを開発することで、企業の効率と売上を向上させることができます。この記事では、Laravel フレームワークを使用してそのようなシステムを開発する方法と、具体的なコード例を紹介します。プロジェクトの準備 まず、Laravel フレームワークがローカル環境にインストールされていることを確認する必要があります。わかりました

PHP を使用して WeChat パブリック アカウント API インターフェイスを構築する PHP を使用して WeChat パブリック アカウント API インターフェイスを構築する May 13, 2023 pm 12:01 PM

今日のインターネット時代において、WeChat 公式アカウントはますます多くの企業にとって重要なマーケティング チャネルとなっています。 WeChat 公式アカウントにさらに多くの機能を実装したい場合は、多くの場合、対応するインターフェイスを作成する必要があります。この記事では、例として PHP 言語を使用して、WeChat パブリック アカウント API インターフェイスを構築する方法を紹介します。 1. 準備 WeChat パブリック アカウント API インターフェイスを作成する前に、開発者は WeChat パブリック アカウントを取得し、WeChat パブリック プラットフォームで開発者インターフェイスの権限を申請する必要があります。アプリケーションが成功すると、関連する開発者の AppID と AppSe を取得できます。

公式アカウントは1日1記事しか投稿できないのでしょうか? 公式アカウントは1日1記事しか投稿できないのでしょうか? Jun 16, 2023 pm 02:04 PM

公開アカウントでは、1 日に 1 つの記事を投稿できるだけでなく、一度に最大 8 つの記事を公開することができます 複数の記事を公開する方法: 1. 左側の「素材管理」をクリックし、「新しいグラフィックとテキスト素材」をクリックします。編集を開始します。最初の記事; 2. 最初の記事を編集したら、左側の最初の記事の下にある + 記号をクリックし、「画像とテキストメッセージ」をクリックして 2 番目の記事を編集します; 3. 複数の画像とテキストが完了したら、 をクリックします「保存して一括送信」で複数記事の公開が完了します。

Go 言語フレームワークを使用して WeChat パブリック アカウント アプリケーションを構築する Go 言語フレームワークを使用して WeChat パブリック アカウント アプリケーションを構築する Jun 04, 2023 am 10:40 AM

インターネットの普及とモバイルデバイスの普及により、WeChat 公式アカウントは企業のマーケティングに欠かせないものになりました。 WeChat パブリック アカウントを通じて、企業はユーザーと簡単に対話し、製品やサービスを宣伝し、ブランド認知度を高めることができます。 WeChat パブリック アカウント アプリケーションをより適切に開発するために、Go 言語を使用して WeChat パブリック アカウント アプリケーションを構築することを選択する開発者や企業がますます増えています。 Go 言語は Google によって開発されたプログラミング言語であり、その構文は簡潔であり、高性能で同時実行性の高いリアルタイム アプリケーションの構築に適しています。使いやすさの面でも、

PHP および WeChat パブリック アカウント開発ガイド PHP および WeChat パブリック アカウント開発ガイド Jun 11, 2023 pm 03:31 PM

ソーシャル ネットワークで WeChat パブリック アカウントが徐々に普及するにつれて、ますます多くの開発者が WeChat パブリック アカウント開発の分野に関与し始めています。その中で、PHP は一般的なバックエンド プログラミング言語として、WeChat 公開アカウントの開発にも広く使用され始めています。この記事では、WeChat パブリック アカウント開発における PHP の基礎知識と一般的なテクニックを紹介します。 1. PHP および WeChat パブリック アカウント開発の基本 WeChat パブリック アカウントの開発 WeChat パブリック アカウントとは、情報プッシュなどのさまざまな種類のサービスやコンテンツをユーザーに提供できる、WeChat プラットフォームに基づくインターネット アプリケーションを指します。

See all articles