ホームページ バックエンド開発 PHPチュートリアル PHPキャッシングはキーワード関数を自動的に取得して生成します

PHPキャッシングはキーワード関数を自動的に取得して生成します

Jun 13, 2016 pm 01:23 PM
dede discuz gt thinkphp

PHP には、キーワード
を自動的に取得して生成する機能が実装されています。私はこれまで、プログラムを作成する際にこの問題を回避してきました。一部の怠け者のために、プログラムを使用する人は自分でタグを入力する必要があります。同様の機能で記事キーワードを自動生成したり、記事タグを自動取得したりできる機能があると思います。 今回、新しいプロジェクトの準備のため、徹夜でこの機能をいじって勉強しました。
キーワード自動取得機能を実現するには、大きく3つのステップに分かれます
1. 単語分割アルゴリズムを使用して、タイトルと内容をそれぞれ分割し、キーワードと頻度を抽出します。現在、2 つの主要なアルゴリズムは、中国科学院の ICTCLAS と隠れマルコフ モデルです。しかし、どちらもハイエンドすぎるため、一定のしきい値があり、どちらも C++/JAVA のみをサポートしています。現在、PHP ベースの PSCWS と HTTPCWS の 2 つが推奨されています。 SCWS は 2008 年 3 月 8 日に正式バージョン 1.0.0 をリリースし、現在最新バージョンは 1.0.4 です。 PSCWS はその PHP バージョンです。 HTTPCWS は Zhang Yan によって開発され、以前は PHPCWS と呼ばれていました。 PHPCWS が初めて「ICTCLAS 3.0」を使用 最初の単語分割処理には「共通版中国語単語分割アルゴリズム」のAPIを使用し、その後、自作の「逆最大一致アルゴリズム」を使用して単語の分割と結合を行い、句読点フィルタリング機能を追加して単語を取得します。残念ながら、現時点では Linux システムはまだ
に移植されていません。 2. 抽出結果を既存のシソーラスと比較し、処理し、不要な単語を削除して、ルールに最もよく適合するキーワードを取得します。ここで重要なのは、辞書を調べることです。辞書を自分で定義することも、既存の成熟したシソーラスを使用することもできます。たとえば、Sina ブログや NetEase ブログにはこの機能があります。これらはすべて大きな Web サイトなので、単語の分割に適した単語ライブラリが必要です。また、小規模のプログラマーである私にとって、信頼できるシソーラスを入手することは不可能です。そのため、既存のオープンソース プログラムから始めて、見てみるしかありません。 .彼らの辞書。
3. 処理された抽出結果から最終的なキーワードとして適切なものを選択し、現在のコンテンツに最も適合するキーワードを取得することは、いずれにしても、具体的な状況を詳細に分析することは不可能です。人間の知性のレベルに達すること。せいぜい。現在、すべての PHP CMS には独自のキーワード抽出システムがあります。
DEDECMS のワード セグメンテーション ソース コードは現在インターネット上で最も広く流通していますが、テストを行ったところ、非常に鈍く、効果が非常に低いことがわかりました。まずキーワードの長さを設定し、取得するキーワードの数を決定し、タイトルに分割された単語が必要なキーワードであると考えて単語を取得し、設定された長さに達するまでテキストからキーワードを読み取ります。 , 最後のキーワードです。さらに、「we」などの意味のない単語が削除されず、キーワードとしてリストされることが多すぎるため、スペースを含む HTML がキーワードとして抽出されることもあるため、改善が必要です。しかし、補助機能としては、すでに非常に優れています。 Discuz の方がわずかに優れていますが、discuz はソース コードを提供せず、オンライン API のみを提供します。
dede の単語分割にはいくつかのバージョンがありますが、出現頻度がすべてなので、dede5.7 の単語分割の結果と
を比較してみましょう。 テスト例:

  1. $title="THINKPHP は正式にバージョン 2.0 のサポートを停止します";
  2. $body=「ThinkPHP フレームワークの開発、保守、サポートを改善するために、2012 年 5 月 1 日から 2.0 およびそれ以前のバージョンを保守およびサポートすることを公式が発表しました。エネルギーを節約し、低炭素化するために、対応するバージョンもキャンセルします」
  3. 当時一緒に開発した ThinkPHP のバージョンを思い出してみましょう。
  4. ThinkPHP 2.0 のバージョンについて。 🎜>
  5. ThinkPHP は 2006 年に誕生し、WEB アプリケーションの迅速な開発に取り組んでおり、その 2.0 バージョンは 2009 年 10 月 1 日にリリースされ、以前の 1.* バージョンを新たに構築し、飛躍的に進化しました。は当時としては画期的なバージョンであり、新しいバージョンの基礎を築きましたが、同時にフレームワークの急速な更新と新しいバージョンのリリースにより、多くのユーザーグループと Web サイトが蓄積されました。 2.1、2.2、および 3.0 は、ThinkPHP の 3.0 時代の到来を告げるものであり、2.0 のライフサイクルは終わりを迎えました。しかし、基本的に 2.0 の多くの機能はバージョン 2.1 で継続または改良されており、比較的簡単に変更できます。バージョン 2.0 からバージョン 2.1 および 2.2 にアップグレードします。* 最終バージョンでは機能の更新は行われず、バグの修正のみが行われます。";

1. デデ分詞
結果は次のようにソートされます

  1. タイトル配列
  2. (
  3. [THINKPHP] => 1
  4. 【公式】 => 1
  5. [もうすぐ] => 1
  6. [停止] => 1
  7. [はい] => 1
  8. [2.0] => 1
  9. [バージョン] => 1
  10. [の] => 1
  11. [サポート] => 1
  12. )
  13. コンテンツ配列
  14. (
  15. [バージョン] => 12
  16. [の] => 12
  17. [そして] => 8
  18. [ThinkPHP] => 5
  19. [2.0] => 5
  20. [また] => 3
  21. [2.2] => 3
  22. [2.1] => 3
  23. [開発] => 3
  24. [3.0] => 2
  25. [はい] => 2
  26. [クイック] => 2
  27. [to] => 2
  28. [リリース] => 2
  29. [メンテナンス] => 2
  30. [前] => 2
  31. [了] => 2
  32. [新バージョン] => 2
  33. [サポート] => 2
  34. [フレーム] => 2
  35. [同時に] => 2
  36. [から] => 2
  37. *******

最終的に必要なキーワードを抽出するにはどうすればよいですか? 最初のアイデアは、まず「of」と「some」という単語を削除し、次に内容の順序に従ってコンテンツを並べ替え、タイトルに出現するかどうかを確認することです。このようにすると、一定の数の単語が取得できます。を最後のキーワードとして出します。その結果、
を取得できます。
  1. バージョン thinkphp 2.0 サポート 停止

5 つのキーワード。結果は許容範囲内のようです。
2. discuz を見ると、API を使用して取得するのは XML 文書であり、解析後に得られるキーワードは
です。
  1. の、高速、バージョン アップグレード、開発、ユーザー


5 つの単語、最初の単語は「的」....
2 つの方法を比較すると、最初の dede とその後の処理の方が文書の内容に近く、わずかに優れているはずです。一方、discuz は記事の主題からは逸脱しますが、取得される単語には一定の人気があります。 。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

thinkphpプロジェクトの実行方法 thinkphpプロジェクトの実行方法 Apr 09, 2024 pm 05:33 PM

ThinkPHP プロジェクトを実行するには、Composer をインストールし、Composer を使用してプロジェクトを作成し、プロジェクト ディレクトリに入り、php bin/consoleserve を実行し、http://localhost:8000 にアクセスしてようこそページを表示する必要があります。

thinkphp にはいくつかのバージョンがあります thinkphp にはいくつかのバージョンがあります Apr 09, 2024 pm 06:09 PM

ThinkPHP には、さまざまな PHP バージョン向けに設計された複数のバージョンがあります。メジャー バージョンには 3.2、5.0、5.1、および 6.0 が含まれますが、マイナー バージョンはバグを修正し、新機能を提供するために使用されます。最新の安定バージョンは ThinkPHP 6.0.16 です。バージョンを選択するときは、PHP バージョン、機能要件、コミュニティ サポートを考慮してください。最高のパフォーマンスとサポートを得るには、最新の安定バージョンを使用することをお勧めします。

thinkphpの実行方法 thinkphpの実行方法 Apr 09, 2024 pm 05:39 PM

ThinkPHP フレームワークをローカルで実行する手順: ThinkPHP フレームワークをローカル ディレクトリにダウンロードして解凍します。 ThinkPHP ルート ディレクトリを指す仮想ホスト (オプション) を作成します。データベース接続パラメータを構成します。 Webサーバーを起動します。 ThinkPHP アプリケーションを初期化します。 ThinkPHP アプリケーションの URL にアクセスして実行します。

Discuz ユーザーの必需品です。プロップの名前変更を徹底分析! Discuz ユーザーの必需品です。プロップの名前変更を徹底分析! Mar 12, 2024 pm 10:15 PM

Discuz ユーザーの必需品です。プロップの名前変更を徹底分析! Discuz フォーラムでは、名前変更機能が常にユーザーから大きな注目と要望を集めてきました。名前を変更する必要がある一部のユーザーにとって、名前変更プロップを使用するとユーザー名を簡単に変更でき、これも興味深い対話方法です。 Discuz の名前変更プロパティについて、入手方法、使用方法、一般的な問題の解決策などを詳しく見てみましょう。 1. Discuz で名前変更用小道具を入手します。名前変更用小道具は通常、ポイントまたは管理者を通じて購入します。

laravelとthinkphpではどちらが優れていますか? laravelとthinkphpではどちらが優れていますか? Apr 09, 2024 pm 03:18 PM

Laravel フレームワークと ThinkPHP フレームワークのパフォーマンスの比較: ThinkPHP は、最適化とキャッシュに重点を置いて、一般に Laravel よりもパフォーマンスが優れています。 Laravel は優れたパフォーマンスを発揮しますが、複雑なアプリケーションの場合は、ThinkPHP の方が適している可能性があります。

thinkphpのインストール方法 thinkphpのインストール方法 Apr 09, 2024 pm 05:42 PM

ThinkPHP のインストール手順: PHP、Composer、および MySQL 環境を準備します。 Composer を使用してプロジェクトを作成します。 ThinkPHP フレームワークと依存関係をインストールします。データベース接続を構成します。アプリケーションコードを生成します。アプリケーションを起動し、http://localhost:8000 にアクセスします。

thinkphpのパフォーマンスはどうですか? thinkphpのパフォーマンスはどうですか? Apr 09, 2024 pm 05:24 PM

ThinkPHP は、キャッシュ メカニズム、コードの最適化、並列処理、データベースの最適化などの利点を備えた高性能 PHP フレームワークです。公式パフォーマンステストでは、1秒あたり10,000以上のリクエストを処理できることが示されており、実際のアプリケーションではJD.comやCtripなどの大規模なWebサイトやエンタープライズシステムで広く使用されています。

Discuz 登録プロセスの詳細説明: 個人情報を簡単に変更できるようにする Discuz 登録プロセスの詳細説明: 個人情報を簡単に変更できるようにする Mar 13, 2024 pm 12:21 PM

「Discuz 登録プロセスの詳細説明: 個人情報を簡単に変更できるようにするため、具体的なコード例が必要です」 Discuz は、さまざまな Web サイトで広く使用されている強力なコミュニティ フォーラム プログラムであり、豊富なユーザー登録と個人情報変更機能を提供します。そしてインターフェース。この記事では、Discuz の登録プロセスを詳しく紹介し、個人情報を簡単にカスタマイズおよび変更するのに役立つ具体的なコード例を示します。 1. ユーザー登録プロセス Discuz では、ユーザー登録はサイトの重要な機能の 1 つであり、登録プロセスのスムーズさと、

See all articles