WeChat 공개 계정의 과거 메시지 페이지를 수집하는 방법에 대한 자세한 설명-PHP 튜토리얼-php.cn

집

백엔드 개발

PHP 튜토리얼

WeChat 공개 계정의 과거 메시지 페이지를 수집하는 방법에 대한 자세한 설명

jacklove

Jul 07, 2018 pm 05:48 PM

위챗 공개 계정

위챗 공개 계정 글에서 수집된 응모 내역 메시지 페이지에서 정보를 얻는 방법을 설명하겠습니다. 도움이 필요한 친구는 이 내용을 참고할 수 있습니다.

WeChat 기사 수집은 웹사이트 콘텐츠 수집과 동일합니다. 목록 페이지에서 시작해야 합니다. WeChat 기사 목록 페이지는 공식 계정의 조회 기록 메시지 페이지입니다. 현재 인터넷상의 많은 다른 WeChat 수집가는 Sogou를 사용하여 검색합니다. 수집 방법은 훨씬 간단하지만 내용은 불완전합니다. 따라서 우리는 여전히 가장 표준적이고 포괄적인 공개 계정 내역 메시지 페이지에서 이를 수집해야 합니다.

WeChat의 제한으로 인해 복사할 수 있는 링크가 불완전하며 브라우저에서 열어 콘텐츠를 볼 수 없습니다. 따라서 이전 기사에서 소개한 방법을 통해 전체 WeChat 공개 계정 내역 메시지 페이지의 링크 주소를 얻으려면 anyproxy를 사용해야 합니다. ㅋㅋㅋ 67343bef610edd80c9e1bfda66c2b62751511f7cc091a33a029709e94f0d1604e11220fc099 a27b2e2d29db75cc0849d4bf&devicetype=android-17&version=26031c34&lang=zh_CN& nettype=WIFI &ascene=3&pass_ticket=Iox5ZdpRhrSxGYEeopVJwTBP7kZj51GYyEL24AT5Zyx%2BBoEMdPDBtOun1F%2F9ENSz&wx_header= 1

이전 글에서 언급했듯이 biz 매개변수는 공식 계정의 ID이고, uin은 사용자의 ID입니다. 현재 uin은 모든 공식 계정 중에서 고유합니다. 다른 두 가지 중요한 매개변수인 key와 pass_ticket은 WeChat 클라이언트의 보충 매개변수입니다.

이 주소가 만료되기 전에 브라우저로 원본 텍스트를 보면 과거 메시지의 기사 목록을 얻을 수 있습니다. 콘텐츠를 자동으로 분석하려면 키와 pass_ticket을 사용하여 이 주소를 변환하는 프로그램을 만들 수도 있습니다. 아직 만료되지 않은 링크 주소를 제출한 다음, 예를 들어 PHP 프로그램을 통해 기사 목록을 얻으세요.

최근 한 친구가 수집 대상이 단일 공개 계정이라고 하더군요. 이렇게 하면 이전 글에서 설명한 일괄 수집 방법을 사용할 필요가 없을 것 같습니다. 그럼 이력 메시지 페이지에서 기사 목록을 얻는 방법을 살펴보겠습니다. 기사 목록을 분석하면 이 공식 계정의 모든 콘텐츠 링크 주소를 얻을 수 있고, 이어서 콘텐츠를 수집할 수 있습니다.

anyproxy 웹 인터페이스에서 인증서가 올바르게 구성되면 https 콘텐츠가 표시될 수 있습니다. 웹 인터페이스의 주소는 http://localhost:8002입니다. 여기서 localhost는 자신의 IP 주소나 도메인 이름으로 바꿀 수 있습니다. 목록에서 getmasssendmsg로 시작하는 레코드를 찾으세요. 클릭하면 이 레코드의 세부 정보가 오른쪽에 표시됩니다.

빨간색 상자는 WeChat 공개 플랫폼의 도메인 이름을 연결한 후의 전체 링크 주소입니다. 앞에는 브라우저에서 열 수 있습니다.

그런 다음 페이지를 HTML 콘텐츠 끝까지 끌어내리면 json 변수가 기록 메시지의 기사 목록임을 알 수 있습니다.

msgList의 변수 값을 복사하고 json 형식 지정 도구를 사용합니다. 분석을 통해 우리는 이 json이 다음과 같은 구조를 가지고 있음을 알 수 있습니다:

{
  "list": [
    {
      "app_msg_ext_info": {
        "author": "",
        "content": "",
        "content_url": "http://mp.weixin.qq.com/s?__biz=MzA5MzEzNDg3MQ==&mid=2652767427&idx=1&sn=37da0d7208283bf90e9a4a536e0af0ea&chksm=8b882dbbbcffa4ad2f0b8a141cc988d16bace564274018e68e5c53ee6f354f8ad56c9b98bade&scene=4#wechat_redirect",
        "copyright_stat": 100,
        "cover": "http://mmbiz.qpic.cn/mmbiz/MofBAcBsJ6X0xGrQ2XK5yQjzwb2eswxkRNBTgLtcqGziaFqwibzvtZAHCDkMeJU1fGZHpjoeibanPJ8rziaq68Akkg/0?wx_fmt=jpeg",
        "digest": "擦亮双眼，远离谣言。",
        "fileid": 505283695,
        "is_multi": 1,
        "multi_app_msg_item_list": [
          {
            "author": "",
            "content": "",
            "content_url": "http://mp.weixin.qq.com/s?__biz=MzA5MzEzNDg3MQ==&mid=2652767427&idx=2&sn=449ef1a874a37fed2429e14f724b56ef&chksm=8b882dbbbcffa4ade48a7932cda4263687e34fca8ea3a5a6233d2589d448b9f6130d3890ce93&scene=4#wechat_redirect",
            "copyright_stat": 100,
            "cover": "http://mmbiz.qpic.cn/mmbiz_png/MofBAcBsJ6XyaIn0qEDSSicBUBZbMYHYrhibia89ZnksCsUiaia2TLI1fyqjclibGa1hw3icP6oXeSpaWMjiabaghHl7yw/0?wx_fmt=png",
            "digest": "12月28日，广州亚运城综合体育馆，内附购票入口~",
            "fileid": 0,
            "source_url": "http://wechat.show.wepiao.com/detail/ff764b0731b7465db03b56b998e1f2b8?detailReferrer=1&from=groupmessage&isappinstalled=0",
            "title": "2017微信公开课Pro版即将召开"
          },
         ...//循环被省略
        ],
        "source_url": "",
        "subtype": 9,
        "title": "谣言热榜 | 十一月朋友圈十大谣言"
      },
      "comm_msg_info": {
        "content": "",
        "datetime": 1480933315,
        "fakeid": "3093134871",
        "id": 1000000010,
        "status": 2,
        "type": 49 //类型为49的时候是图文消息
      }
    },
   ...//循环被省略
  ]
}

로그인 후 복사

이 json을 간략하게 분석합니다(여기서는 몇 가지 중요한 정보만 소개하고 나머지는 생략합니다):

"list": [ //最外层的键名；只出现一次，所有内容都被它包含。
  {//这个大阔号之内是一条多图文或单图文消息，通俗的说就是一天的群发都在这里
    "app_msg_ext_info":{//图文消息的扩展信息
      "content_url": "图文消息的链接地址",
      "cover": "封面图片",
      "digest": "摘要",
      "is_multi": "是否多图文，值为1和0",
      "multi_app_msg_item_list": [//这里面包含的是从第二条开始的图文消息，如果is_multi=0，这里将为空
        {
          "content_url": "图文消息的链接地址",
          "cover": "封面图片",
          "digest": ""摘要"",
          "source_url": "阅读原文的地址",
          "title": "子内容标题"
        },
        ...//循环被省略
      ],
      "source_url": "阅读原文的地址",
      "title": "头条标题"
    },
    "comm_msg_info":{//图文消息的基本信息
      "datetime": &#39;发布时间，值为unix时间戳&#39;,
      "type": 49 //类型为49的时候是图文消息
    }
  },
  ...//循环被省略
]

로그인 후 복사

여기서 언급할 또 다른 사항 더 긴 시간의 기록 메시지 내용을 얻으려면 휴대폰이나 시뮬레이터에서 페이지를 아래로 끌어당겨야 하며, 아래로 당기면 WeChat이 자동으로 다음 페이지를 읽습니다. 다음 페이지의 링크 주소와 기록 메시지 페이지의 링크 주소도 getmasssendmsg로 시작하는 주소입니다. 하지만 내용은 html이 아닌 json일 뿐입니다. json을 직접 구문 분석하면 됩니다.

이때, 이전 글에서 소개한 방법을 이용하면 anyproxy를 이용하여 정기적으로 msgList 변수 값을 매칭하고, 이를 비동기적으로 서버에 제출한 후, 서버에서 php의 json_decode를 이용하여 json을 배열로 파싱할 수 있습니다. 그런 다음 배열을 반복합니다. 각 기사의 제목과 링크 주소를 얻을 수 있습니다.

단일 공식 계정의 콘텐츠만 수집해야 하는 경우, 매일 대량 전송 후 anyproxy를 통해 key와 pass_ticket으로 전체 링크 주소를 얻을 수 있습니다. 그런 다음 프로그램을 직접 만들고 주소를 프로그램에 수동으로 제출하세요. php와 같은 언어를 사용하여 msgList를 정기적으로 일치시킨 다음 json을 구문 분석합니다. 이렇게 하면 anyproxy의 규칙을 수정할 필요가 없고, 컬렉션 큐와 점프 페이지를 생성할 필요도 없습니다.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7711

자바 튜토리얼

1640

Cakephp 튜토리얼

1394

라라벨 튜토리얼

1288

PHP 튜토리얼

1232

Related knowledge

Scrapy는 WeChat 공개 계정 기사의 크롤링 및 분석을 구현합니다. Jun 22, 2023 am 09:41 AM

Scrapy는 WeChat 공개 계정의 기사 크롤링 및 분석을 구현합니다. WeChat은 최근 몇 년 동안 인기 있는 소셜 미디어 애플리케이션이며, 여기서 운영되는 공개 계정도 매우 중요한 역할을 합니다. 우리 모두 알고 있듯이 WeChat 공개 계정은 정보와 지식의 바다입니다. 왜냐하면 각 공개 계정은 기사, 그래픽 메시지 및 기타 정보를 게시할 수 있기 때문입니다. 이 정보는 언론보도, 학술연구 등 다양한 분야에서 폭넓게 활용될 수 있습니다. 그래서 이 글에서는 Scrapy 프레임워크를 사용하여 WeChat 공개 계정 글을 크롤링하고 분석하는 방법을 소개하겠습니다. Scr

WeChat 공식 계정 인증과 비인증의 차이점은 무엇인가요? Sep 19, 2023 pm 02:15 PM

WeChat 공개 계정 인증과 비인증의 차이점은 인증 로고, 기능 권한, 푸시 빈도, 인터페이스 권한 및 사용자 신뢰에 있습니다. 자세한 소개: 1. 인증 로고 인증된 공개 계정은 파란색 V 로고인 공식 인증 로고를 얻게 됩니다. 이 로고는 공개 계정의 신뢰성과 권위를 높이고 사용자가 실제 공식 공개 계정을 더 쉽게 식별할 수 있게 해줍니다. 2. 기능 허가. 인증된 공개 계정은 비인증 공개 계정보다 더 많은 기능과 권한을 갖습니다. 예를 들어, 인증된 공개 계정은 온라인 결제 및 상업 운영 등을 위해 WeChat 결제 기능을 활성화할 수 있습니다.

Python의 실제 크롤러 전투: WeChat 공개 계정 크롤러 Jun 10, 2023 am 09:01 AM

Python은 강력한 데이터 처리 및 웹 크롤링 기능을 갖춘 우아한 프로그래밍 언어입니다. 디지털 시대에 인터넷은 엄청난 양의 데이터로 가득 차 있으며, 크롤러는 데이터를 얻는 중요한 수단이 되었습니다. 따라서 데이터 분석 및 마이닝에 Python 크롤러가 널리 사용됩니다. 이 기사에서는 Python 크롤러를 사용하여 WeChat 공개 계정 기사 정보를 얻는 방법을 소개합니다. WeChat 공식 계정은 온라인에 기사를 게시하는 인기 있는 소셜 미디어 플랫폼이며 많은 기업과 셀프 미디어의 홍보 및 마케팅을 위한 중요한 도구입니다.

Laravel을 사용하여 WeChat 공개 계정 기반 온라인 주문 시스템을 개발하는 방법 Nov 02, 2023 am 09:42 AM

Laravel을 사용하여 WeChat 공식 계정을 기반으로 온라인 주문 시스템을 개발하는 방법 WeChat 공식 계정이 널리 사용됨에 따라 점점 더 많은 회사가 이를 온라인 마케팅의 중요한 채널로 사용하기 시작했습니다. 케이터링 업계에서 WeChat 공개 계정을 기반으로 한 온라인 주문 시스템을 개발하면 기업의 효율성과 매출을 향상시킬 수 있습니다. 이 글에서는 Laravel 프레임워크를 사용하여 이러한 시스템을 개발하는 방법을 소개하고 구체적인 코드 예제를 제공합니다. 프로젝트 준비 먼저 로컬 환경에 Laravel 프레임워크가 설치되어 있는지 확인해야 합니다. 좋아요

PHP를 사용하여 WeChat 공개 계정 API 인터페이스 구축 May 13, 2023 pm 12:01 PM

오늘날 인터넷 시대에 WeChat 공식 계정은 점점 더 많은 회사의 중요한 마케팅 채널이 되었습니다. WeChat 공식 계정에 더 많은 기능을 구현하려면 해당 인터페이스를 작성해야 하는 경우가 많습니다. 이 기사에서는 PHP 언어를 예로 들어 WeChat 공개 계정 API 인터페이스를 구축하는 방법을 소개합니다. 1. 준비 WeChat 공개 계정 API 인터페이스를 작성하기 전에 개발자는 WeChat 공개 계정 계정을 보유하고 WeChat 공개 플랫폼에서 개발자 인터페이스 권한을 신청해야 합니다. 신청이 성공적으로 완료되면 관련 개발자 AppID 및 AppSe를 얻을 수 있습니다.

공식 계정은 하루에 한 개의 글만 올릴 수 있나요? Jun 16, 2023 pm 02:04 PM

공개 계정은 하루에 하나의 기사를 게시할 수 있을 뿐만 아니라 동시에 최대 8개의 기사를 게시할 수 있습니다. 여러 기사를 게시하는 방법: 1. 왼쪽의 "자료 관리"를 클릭한 후 "새 그래픽 및 텍스트 자료"를 클릭합니다. 첫 번째 기사 편집을 시작합니다. 2. 첫 번째 기사를 편집한 후 왼쪽 첫 번째 기사 아래에 있는 + 기호를 클릭하고 "그래픽 메시지"를 클릭하여 두 번째 기사를 편집합니다. 3. 여러 이미지와 텍스트를 편집한 후 "저장"을 클릭합니다. 대량으로 보내기'를 선택하면 여러 기사의 게시가 완료됩니다.

Go 언어 프레임워크를 사용하여 WeChat 공개 계정 애플리케이션 구축 Jun 04, 2023 am 10:40 AM

인터넷의 인기와 모바일 장치의 광범위한 사용으로 인해 WeChat 공식 계정은 기업 마케팅에 없어서는 안될 부분이 되었습니다. WeChat 공개 계정을 통해 기업은 사용자와 쉽게 상호작용하고, 제품과 서비스를 홍보하며, 브랜드 인지도를 높일 수 있습니다. WeChat 공개 계정 애플리케이션을 더 잘 개발하기 위해 점점 더 많은 개발자와 회사가 Go 언어를 사용하여 WeChat 공개 계정 애플리케이션을 구축하기로 선택하고 있습니다. Go 언어는 Google이 개발한 프로그래밍 언어로, 구문이 간결하고 고성능, 동시성이 뛰어난 실시간 애플리케이션을 구축하는 데 적합합니다. 사용 편의성 측면에서

PHP 및 WeChat 공개 계정 개발 가이드 Jun 11, 2023 pm 03:31 PM

소셜 네트워크에서 WeChat 공개 계정이 점차 인기를 끌면서 점점 더 많은 개발자가 WeChat 공개 계정 개발 분야에 참여하기 시작했습니다. 그 중 일반적인 백엔드 프로그래밍 언어인 PHP도 WeChat 공개 계정 개발에 널리 사용되기 시작했습니다. 이 글에서는 WeChat 공개 계정 개발에 있어서 PHP의 기본 지식과 공통 기술을 소개합니다. 1. PHP 및 WeChat 공개 계정 개발의 기본 WeChat 공개 계정 개발 WeChat 공개 계정은 사용자에게 정보 푸시와 같은 다양한 유형의 서비스와 콘텐츠를 제공할 수 있는 WeChat 플랫폼을 기반으로 하는 인터넷 애플리케이션을 의미합니다.

See all articles