------解決策---------PHPがタイムアウトしているのか、それともメモリがいっぱいなのでしょうか?
error.log を開いてエラー ログを表示しますか?
この種の収集プログラムを作成する場合、最も重要なことは、プログラムの実行時にエラーを処理する方法を決定することです。
------解決策----------------------それらのほとんどはコードの問題です...コードがありません真実はありません
-----解決策--------------------------書くファイルを各ファイルに記録し、どのステップが停止したかを確認してください。
------解決策---------
正解
-----解決策--------------------------あなた
一度に 10 個のコードを完成させることはできません
そして
簡単な 1 つずつコード
違いは何ですか?
-----解決策--------- サーバーはどこですか? ?まだ DNS を解析しないでください。
-----解決策--------------------------------サイト A ということですが、これもローカルですか?まだ集めないでください。 siteA の対応するスクリプトを直接実行するにはどのくらい時間がかかりますか?
------解決策---------特定のコードを指定していませんが、指定できます。与えない 具体的な提案をしてください
しかし、たとえコードが与えられたとしても、それを読んでテストする気分ではないかもしれません
このようなアプリケーションに関する兄の個人的な意見:
1. 通常、ページには、ホームページに戻るリンク、コラムに戻るリンクなどがあります。
削除しないと無限ループになりやすいので注意が必要です
2. ページ収集プログラムは単一である必要があります
つまり、一度実行して 1 ページを収集します
3. 収集制御プログラムは、ページ収集プログラム
をスケジュールするために使用されます。
fsockopen を使用してページ収集プログラムを開いてから戻ることができます。ターゲット ページの URL はパラメータとしてページ収集プログラムにのみ渡されます
。
これはマルチプロセス システムをシミュレートします
4. 具体的には、実装時にデータベースを仲介し、ページから抽出したすべてのURLをデータベースに保存します(もちろん重複は排除する必要があります)
収集制御プログラムはデータベースを読み取り、収集を継続するかどうかと各収集の規模を決定します
-----解決策------ --
dedecms 統合クラスは使用せず、クラスを変更してみてください。
同様の関数を持つ関数またはクラスをオンラインで探してください。
------解決策---------
あなたの顔は誇りに満ちています...先輩、あなたは不滅になりました~~
コレクションのカールを自分で書いてカプセル化するのはどれほど難しいことでしょう... コレクションでの問題は、実際にはさまざまな規則性の分析と校正です
-----解決策------。 -------------つまり、二次開発はそれほど難しいものではありません。どのような機能が欲しいですか? URL と要件を投稿してください。関数の作成をお手伝いします。
------解決策------------------収集速度に影響を与える主な原因はネットワークの問題です。
まず ping を実行して、応答時間がどれくらいかを確認します。
dedecms クラスを使用せず、curl を使用して自分で作成します。非常に簡単です。
リクエストごとにタイムアウトを設定します。自分の PC を使用して実行するのではなく、高度な構成を備えたサーバーを見つけて実行し、複数のプロセスを開いてタスクを分類すると、効率が数倍向上します。
------解決策---------
これらのドメイン名を指定して、ヘッダー ジャンプがあるかどうかを確認するか、www を削除してください。