python - 如何爬取登录后的socket连接

Question

需要爬取一个登录以后的socket连接,这个socket会不定期的传数据到网页上,然后我目前只能通过不断刷新网页去完成,有没有什么好的办法可以去爬取需要网页登录后的socket呢? ===继续描述: 已实现的部分 模拟登录 (se...

PHP中文网 · Answer

HTTP はステートレスであるため、ログイン後 のステータスは、1 つ以上の特別な値をサーバーに渡すことによって決定されます (通常はメッセージヘッダーの Cookie フィールドにあります)。
HTTP パケットをキャッチし、シミュレーション中にこれらの特別な値を持ち込めば問題ありません。 登陆以后状态是通过传给服务器一个或多个特殊值（一般在报文头的cookie字段里）来确定的。
抓一下HTTP包，然后模拟时带上这些特殊值就OK了。

更新内容：
看到它Status Code了，这应该是将连接换成websocket了，那么这个页面一定是对方来提供的了。你可以看一下页面的源码，应该会有var ws = new WebSocket("ws://ip:3000"); 之类的内容。
看一下对方客户端的要求，然后改写ws.onmessage回调函数，这个函数的话内容就任你拿捏了，你可以用它来判断返回了新内容或者再去请求另一个服务器来处理这些新内容。
你可以看一下这篇文章网页实时聊天之PHP实现websocket 的客户端

更新コンテンツ:
ステータスコードを参照してください。これは、接続が WebSocket に置き換えられたことを意味するため、このページは相手側から提供される必要があります。ページのソースコードを確認すると、var ws = new WebSocket("ws://ip:3000"); のような内容が含まれているはずです。
他のクライアントの要件を確認して、ws.onmessage コールバック関数を書き換えます。この関数の内容は、新しいコンテンツが追加されたかどうかを判断するために使用できます。返されるか、別のサーバーにこの新しいコンテンツを処理するように要求します。
この記事の client 部分、リアルタイム Web チャット用の PHP を参照して WebSocket を実装し、ニーズに合わせて変更してみてください。 🎜

怪我咯 · Answer

WebSockt クライアントライブラリを見つけて接続するだけです

php 8、私も来ます

ウェブサイトのレイアウトを 30 分で学ぶ

ビデオチュートリアルに精通したOracleの入門

あなたの最初のUNI-APPコード

ゼロからアプリの起動までフラッター

兄弟連新版Linuxビデオチュートリアル

AXURE 9 ビデオチュートリアル (プロダクトマネージャーのインタラクティブな製品設計 UI に適しています)

基礎能力ゼロ PS ビデオチュートリアル

16日間のUIビデオチュートリアル

PS テクニックとスライステクニックのビデオチュートリアル

アリクラウド環境構築およびプロジェクトオンラインビデオチュートリアル

コンピュータネットワークの概要 - プログラマが身につけるべき基礎知識

プログラマーのための基本チュートリアル - HTTP プロトコルの説明

Websocket ビデオチュートリアル

已实现的部分

想要的结果(未实现)

抽象化的问题