この記事では、Python を使用して WordPress 小説サイトに収集して保存する方法を説明します。使い方は非常に簡単です。必要な友達は参考にしてください。
私は Python と WordPress を使用して小説サイトを構築しました。
以下では主に建設プロセスで使用されるテクノロジーについて説明します。主に以下の部分に分かれます:
WordPressテーマの選択
小説コンテンツの改善
サイトの展開
WeChatパブリックプラットフォームの構築
1 .WordPressテーマ
の選択 私は PHP コードの記述にあまり慣れていないため、Web サイトを直接記述すると、さまざまなセキュリティ上の脆弱性に遭遇する可能性があります。現在人気のブログフレームワークである wordpress、joomla、drupal を比較し、最終的により幅広い読者が利用できる wordpress を選択しました。それから小説テンプレートのセットを選択して始めました~~
2. 小説コンテンツの改善
2.1 データのキャプチャ
小説サイトとして最も重要なことは小説のコンテンツです。従来の市場で人気のある小説コレクション プラグインにはさまざまな欠点がありますが、独自のデータ キャプチャの専門知識により、いくつかの小説サイトに対してターゲットを絞ったクローリングを使用します。数十のフィールドを細分化して MongoDB データベースに保存し、繰り返しのクローリングを防ぐための重み判定を実装します。
2.2 コンテンツのアップロード
WordPress フレームワークを使用しているため、コンテンツのアップロードには当然ながら、WordPress ライブラリ ファイル wordpress_xmlrpc が不可欠です。ただし、ライブラリにはまだ制限があります。記事分類のさまざまなカテゴリを入力することは役に立ちません。そこで、WordPressを自分でシミュレートして、ポストディレクトリの各フィールドを自動分類してみました。同時に、新規情報入力ポストには膨大な量の情報があり、純粋にシミュレートされたログイン ポストにはフィールドが多すぎるため、最終的に MySQL データベースから関連データを直接挿入して更新することを検討しました。要約すると、3 つの更新方法があります:
wordpress_xmlrpc モジュールのアップロード
Python はバックグラウンド ログインとアクティブ アップロードをシミュレートします
フロントエンドの更新を実現するために MySQL データベース関連のコンテンツを直接更新します
3。サイトの展開
このサイトでは、Alibaba Cloud の CentOS サーバーを使用しています。Linux システムに詳しくない私は、wdcp コントロール パネルを使用して wordpress サイトの展開を実装します。この段落は再び繰り返されません。
4. WeChatパブリックプラットフォームの構築
WeChatパブリックプラットフォームは、現時点ではデータベース内の小説名を検索するためのキーワードの入力のみを実装しています。画像とテキストは小説の名前とリンクを返し、いつでもどこでも小説を読める WeChat を実現します。
Python を使用して WeChat パブリック プラットフォームを構築する具体的な手順については、前のコラム「Python を使用した WeChat パブリック プラットフォームの開発」を参照してください。
このようにして、小説サイトの構築が実現します。実際、上記の方法はこのタイプのサイトの構築に限定されず、淘宝網のゲストサイト、エンターテイメントサイトなどの構築にも適用できます。次に、それを掘るのはあなた次第です〜
この小説。このサイトは私が練習するための小さなプロジェクトであり、主に個人的な使用を目的としています。侵害の問題がある場合は、すぐにご連絡ください。関連するコンテンツはすぐに削除します。
以上がPython+Wordpressを使って新規Webサイトを作成する手順の概要の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。