Linuxのwgetとブラウザ(chrome)の「名前を付けてすべて保存」で取得したWebページのサイズが違うことが分かりました。 wget で取得した Web ページは明らかに小さいことがわかりました。後でこのコマンドを使用すると、「名前を付けて保存、Web ページ、HTML のみ」で保存した Web ページと同じであることがわかりました。
現在、プログラムまたはコマンド (Linux または Windows を問わず) を使用して、「名前を付けて、すべて、Web ページを保存」と同じ内容を取得したいと考えています。何か方法はありますか?
ディスカッションへの返信 (解決策)
この Web ページは、ブラウザーの機能として保存され、実際にその中の参照ファイルのパスを変更し、これらすべてのリソース ファイルを保存します。ソフトウェア機能
この Web ページはブラウザ機能として保存され、実際にその Web ページ内の参照ファイルのパスが変更され、これらすべてのリソース ファイルが保存されます。これはソフトウェア機能
-- ---- ------------------------------------------------ ---- ------------------------------------------------ ---
同様の機能を比較的簡単に実現する方法はあるでしょうか?
最初の問題を解決するためにブラウザの操作と保存方法をシミュレートすると、2 番目の問題は模倣のように感じられます。
この Web ページを保存するファイルは、実際にその Web ページ内の参照ファイルのパスを変更し、これらすべてのリソース ファイルを保存します
--- --- ---------------------------------------------- --- ----------------------------------------------- --
同様の機能を比較的簡単に実現する方法はあるでしょうか?
最初の問題を解決するためにブラウザの操作と保存方法をシミュレートすると、2 番目の問題は模倣のように感じられます。
私は、これらのリソースが HTML ファイルに統合されなければならないとは言いません。実際、統合がなくても、これらのリソースが欠落していない限りは可能です。この分野で知識が必要なことがあります。フロントエンドをやったことがないので、それほど難しい要件ではないと思いますが、長い間探しても方法が見つかりませんでした。
この Web ページは、ブラウザの機能として保存され、実際に参照ファイルのパスを変更し、これらすべてのリソース ファイルを保存します
- --- ---------------------------------------------- --- ---------------------------------------------- --- -
同様の機能を実現する比較的簡単な方法はありますか?
最初の問題を解決するためにブラウザの操作と保存方法をシミュレートすると、2 番目の問題は模倣のように感じられます。
私は、これらのリソースが HTML ファイルに統合されなければならないとは言いません。実際、統合がなくても、これらのリソースが欠落していない限りは可能です。この分野で知識が必要なことがあります。フロントエンドをやったことがないので、それほど難しい要件ではないと思いますが、長い間探しても方法が見つかりませんでした。
これまで一度もやったことがありませんが、ページ画像全体、js ファイル、css ファイルをクロールして、その中のパス参照を分析する必要があります。たとえば、画像パスは次のように定義されています。 html であり、画像パスは CSS で定義されています。どの画像パスが実際のものであるかを分析します。