ホームページ バックエンド開発 PHPチュートリアル PHPAnalysis 中国語単語分割実践チュートリアル_PHP チュートリアル

PHPAnalysis 中国語単語分割実践チュートリアル_PHP チュートリアル

Jul 13, 2016 am 10:28 AM

PHPAnalysis は現在広く使用されている中国語の単語分割クラスであり、逆マッチング モードの単語分割を使用するため、より広範囲のエンコーディングと互換性があります。その変数と一般的な関数については、次のように詳しく説明します。 1. より重要なメンバー変数

$resultType = 1 生成された単語分割結果のデータ型 (1 はすべて、2 は辞書の語彙と 1 つの中国語、日本語、韓国語、簡体字および繁体字と英語、3 は辞書の語彙と英語)

この変数は一般的に使用されます SetResultType ( $rstype ) このメソッドが設定されます。
$notSplitLen = 5 文を最短の長さに分割します
$toLower = false すべての英単語を小文字に変換します
$differMax = false 最大分割モードを使用して 2 グラム単語の曖昧さを解消します
$unitWord = true 単一の単語を結合してみます (つまり、 , 新しい単語認識)
$differFreq = false 曖昧さ回避のために人気のある単語優先モードを使用します
2. 主要なメンバー関数のリスト
1. public function __construct($source_charset='utf-8', $target_charset='utf-8', $load_all =true, $source='')
関数の説明: コンストラクター
パラメータリスト: (www.jbxue.com)
$source_charset ソース文字列エンコーディング
$target_charset ディレクトリ文字列エンコーディング
$load_all 辞書を完全にロードするかどうか (thisパラメータ すでに廃止されています)
$source ソース文字列
入力と出力が両方とも utf-8 の場合、実際には初期化にパラメータを使用する必要はありませんが、SetSource メソッドを通して操作するテキストを設定します
2。 SetSource( $source, $source_charset='utf-8', $target_charset='utf-8' )
関数の説明: ソース文字列を設定します
パラメータリスト:
$source ソース文字列
$source_charset ソース文字列エンコーディング
$target_charset ディレクトリ文字列エンコーディング
戻り値: bool
3. public function StartAnalysis($optimize=true)
関数の説明: 単語分割操作の実行を開始します
パラメーターリスト:
$optimize 単語分割後の結果の最適化を試みるかどうか
戻り値: void
基本的な単語分割プロセス:
//////////////////////////////////////
$pa = new PhpAnalysis();
$pa ->SetSource('セグメント化する必要がある文字列');
//セグメンテーション属性を設定します
$pa->resultType = 2;
$pa->differMax = true ;
$pa->StartAnalysis() ;
//必要な結果を取得します
$pa->GetFinallyIndex();
//////////////////// /////////// //////////
4. public function SetResultType($rstype)
関数の説明: 戻り結果の型を設定します
実際には、メンバー変数$resultType
パラメータ$rstypeの値は次のとおりです:
1はすべて、2は辞書の語彙と単一の中国語、日本語、韓国語、簡体字および繁体字と英語、3は辞書の語彙と英語です
戻り値: void
5. public function GetFinallyKeywords($num = 10)
関数の説明: 最も高い頻度で指定されたエントリを取得します (通常、ドキュメントのキーワードを抽出するために使用されます)
パラメータリスト:
$num = 10 エントリの数を返します
戻り値: 「,」で区切られたキーワードリスト
6. public function GetFinallyResult($spword=' ')
関数の説明: 最終的な単語分割結果を取得します
パラメータリスト:
$spword エントリ間の区切り文字
戻り値: string
7. function GetSimpleResult()
関数説明: 大まかなセグメンテーション結果を取得
戻り値: 配列

(Script Academy www.jbxue.com)

8. パブリック関数 GetSimpleResultAll()

関数の説明: 属性情報を含む大まかなセグメンテーション結果を取得します
属性 (1 中国語の単語と文章、2 ANSI 語彙 (全角を含む)、3 ANSI句読点(全角含む)、数字4文字(全角含む)、中国語句読点5文字または認識できない文字)
戻り値: 配列
9. public function GetFinallyIndex()
関数説明: ハッシュインデックス配列を取得
Return value: array('word'= >count,...) 出現頻度で並べ替えます
10. public function MakeDict($source_file, $target_file='')
関数の説明: テキストファイルの辞書を辞書にコンパイルします
パラメータリスト:
$source_file ソーステキストファイル
$target_file ターゲットファイル (指定されていない場合、現在の辞書)
戻り値: void
11. public function ExportDict( $targetfile )
関数の説明: 現在の辞書のすべてのエントリをエクスポートします。辞書をテキストファイルとして
パラメータリスト:
$targetfile ターゲットファイル
戻り値: void

http://www.bkjia.com/PHPjc/812980.html

tru​​ehttp://www.bkjia.com/PHPjc/812980.html技術記事 PHPAnalysis は、現在広く使用されている中国語の単語分割クラスです。これは、逆一致モードの単語分割を使用するため、より広範囲のエンコーディングと互換性があります。その変数と共通関数については、次のように詳しく説明します。
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Laravelでフラッシュセッションデータを使用します Laravelでフラッシュセッションデータを使用します Mar 12, 2025 pm 05:08 PM

Laravelは、直感的なフラッシュメソッドを使用して、一時的なセッションデータの処理を簡素化します。これは、アプリケーション内に簡単なメッセージ、アラート、または通知を表示するのに最適です。 データは、デフォルトで次の要求のためにのみ持続します。 $リクエスト -

PHPのカール:REST APIでPHPカール拡張機能を使用する方法 PHPのカール:REST APIでPHPカール拡張機能を使用する方法 Mar 14, 2025 am 11:42 AM

PHPクライアントURL(CURL)拡張機能は、開発者にとって強力なツールであり、リモートサーバーやREST APIとのシームレスな対話を可能にします。尊敬されるマルチプロトコルファイル転送ライブラリであるLibcurlを活用することにより、PHP Curlは効率的なexecuを促進します

Laravelテストでの簡略化されたHTTP応答のモッキング Laravelテストでの簡略化されたHTTP応答のモッキング Mar 12, 2025 pm 05:09 PM

Laravelは簡潔なHTTP応答シミュレーション構文を提供し、HTTP相互作用テストを簡素化します。このアプローチは、テストシミュレーションをより直感的にしながら、コード冗長性を大幅に削減します。 基本的な実装は、さまざまな応答タイプのショートカットを提供します。 Illuminate \ support \ facades \ httpを使用します。 http :: fake([[ 'google.com' => 'hello world'、 'github.com' => ['foo' => 'bar']、 'forge.laravel.com' =>

Codecanyonで12の最高のPHPチャットスクリプト Codecanyonで12の最高のPHPチャットスクリプト Mar 13, 2025 pm 12:08 PM

顧客の最も差し迫った問題にリアルタイムでインスタントソリューションを提供したいですか? ライブチャットを使用すると、顧客とのリアルタイムな会話を行い、すぐに問題を解決できます。それはあなたがあなたのカスタムにより速いサービスを提供することを可能にします

PHPにおける後期静的結合の概念を説明します。 PHPにおける後期静的結合の概念を説明します。 Mar 21, 2025 pm 01:33 PM

記事では、PHP 5.3で導入されたPHPの後期静的結合(LSB)について説明し、より柔軟な継承を求める静的メソッドコールのランタイム解像度を可能にします。 LSBの実用的なアプリケーションと潜在的なパフォーマ

PHPロギング:PHPログ分析のベストプラクティス PHPロギング:PHPログ分析のベストプラクティス Mar 10, 2025 pm 02:32 PM

PHPロギングは、Webアプリケーションの監視とデバッグ、および重要なイベント、エラー、ランタイムの動作をキャプチャするために不可欠です。システムのパフォーマンスに関する貴重な洞察を提供し、問題の特定に役立ち、より速いトラブルシューティングをサポートします

Laravelサービスプロバイダーを登録および使用する方法 Laravelサービスプロバイダーを登録および使用する方法 Mar 07, 2025 am 01:18 AM

Laravelのサービスコンテナとサービスプロバイダーは、そのアーキテクチャの基本です。 この記事では、サービスコンテナ、詳細サービスプロバイダーの作成、登録、および実用的な使用法を例で説明します。 Oveから始めます

フレームワークのカスタマイズ/拡張:カスタム機能を追加する方法。 フレームワークのカスタマイズ/拡張:カスタム機能を追加する方法。 Mar 28, 2025 pm 05:12 PM

この記事では、フレームワークにカスタム機能を追加し、アーキテクチャの理解、拡張ポイントの識別、統合とデバッグのベストプラクティスに焦点を当てています。

See all articles