ホームページ バックエンド開発 PHPチュートリアル PHPAnarise中国語単語分割の詳しい説明_PHPチュートリアル

PHPAnarise中国語単語分割の詳しい説明_PHPチュートリアル

Jul 13, 2016 am 10:28 AM
中国語の単語の分割

PHPAnalysis は現在広く使用されている中国語の単語分割クラスであり、逆一致モードの単語分割を使用するため、より広範囲のエンコーディングと互換性があります。その変数と一般的な関数については、次のように詳しく説明します。

1. さらに重要なメンバー変数

L$Resulttype = 1 単語生成データ型によって生成される単語タイプ (1 はすべて、2 は辞書語彙と 1 つの中国語、日本語、韓国語の単純な文字と英語、3 は辞書語彙と英語)。

$notSplitLen = 5 文を最短の長さに分割します

$toLower = false すべての英単語を小文字に変換します
$differMax = false 最大分割モードを使用してバイグラムを曖昧さなくします
$unitWord = true 単語を結合してみます (つまり、新しい単語認識)
$differFreq = false 曖昧さ回避のためにホットワード優先モードを使用します

2.主なメンバー機能一覧

1. public function __construct($source_charset='utf-8', $target_charset='utf-8', $load_all=true, $source='')

関数の説明: コンストラクター

パラメータリスト:

$source_charset ソース文字列エンコード
$target_charset ディレクトリ文字列エンコード
$load_all 辞書を完全にロードするかどうか (このパラメータは無効になっています)
$source ソース文字列
入力と出力が両方とも utf-8 の場合、実際にはパラメータを使用する必要はありません初期化用に操作対象のテキストをSetSourceメソッドで設定します

2. public function SetSource( $source, $source_charset='utf-8', $target_charset='utf-8' )
関数の説明: ソース文字列を設定します

パラメータリスト:

$source ソース文字列
$source_charset 文字列エンコーディング
$target_charset ディレクトリ文字列エンコーディング
戻り値: bool
I3, Public Function Startanalysis ($ Optimize = TRUE)
関数: 単語分割演算の実行開始
パラメータリスト:

$ Optimize 単語分割後の結果を最適化するかどうか: void

基本的な単語分割処理:
///// //////////////////////////////////////////////// ///////////////////////////////////// /////////// ///////////////////////
$pa = new PhpAnalysis();

$pa->SetSource('セグメント化する必要がある文字列');

//単語分割属性を設定します
$pa->resultType = 2;

$pa->differMax = true;

$pa->分析開始();


//必要な結果を取得します
$pa->GetFinallyIndex();

/////////////////////////////// / //////////

4. パブリック関数 SetResultType( $rstype )

関数の説明: 戻り結果の型を設定します
これは実際にはメンバー変数 $resultType に対する操作です
パラメーター $rstype の値は次のとおりです:

1 はすべて、2 は辞書です語彙と単一の中国語、日本語、韓国語、簡体字および繁体字と英語、3 は辞書の語彙と英語

戻り値: void

5. public function GetFinallyKeywords( $num = 10 )
関数の説明: 最も頻繁に出現する指定された用語の数を取得します (通常、ドキュメントのキーワードを抽出するために使用されます)
パラメーター リスト:
$num = 10 用語の数を返します

Return値: 「,」で区切られたキーワードのリスト


6. public function GetFinallyResult($spword=' ')
関数の説明: 最終的な単語分割結果を取得します
パラメータリスト:
$spword エントリ間の区切り文字

戻り値: string


7. パブリック関数 GetSimpleResult()
関数説明: 大まかなセグメンテーション結果を取得します
戻り値: 配列

8. パブリック関数 GetSimpleResultAll()

関数の説明: 属性情報を含む大まかなセグメンテーション結果を取得します
属性 (1 つの中国語の単語と文章、2 つの ANSI 語彙 (全角を含む)、3 つの ANSI 句読点 (全角を含む)、数字4文字(全角含む)、中国語の句読点や認識できない文字5文字)
戻り値:配列

9. パブリック関数 GetFinallyIndex()
関数説明: ハッシュインデックス配列を取得
戻り値: array('word'=>count,...) 出現頻度で並べ替えます

10. パブリック関数 MakeDict($source_file, $target_file='')

関数の説明: テキスト ファイル辞書を辞書にコンパイルします
パラメータ リスト:
$source_file ソース テキスト ファイル

$target_file ターゲット ファイル (指定されていない場合は、Current辞書)

戻り値: void

11. パブリック関数 ExportDict($targetfile)
関数の説明: 現在の辞書のすべてのエントリをテキスト ファイルとしてエクスポートします
パラメーター リスト:
$targetfile ターゲット ファイル

戻り値: void


www.bkjia.comtru​​ehttp://www.bkjia.com/PHPjc/802211.html技術記事 PHPAnalysis は現在広く使用されている中国語の単語分割クラスであり、逆一致モードの単語分割を使用するため、より広範囲のエンコーディングと互換性があります。その変数と一般的な関数については、次のように詳しく説明します。
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

PHPのカール:REST APIでPHPカール拡張機能を使用する方法 PHPのカール:REST APIでPHPカール拡張機能を使用する方法 Mar 14, 2025 am 11:42 AM

PHPクライアントURL(CURL)拡張機能は、開発者にとって強力なツールであり、リモートサーバーやREST APIとのシームレスな対話を可能にします。尊敬されるマルチプロトコルファイル転送ライブラリであるLibcurlを活用することにより、PHP Curlは効率的なexecuを促進します

Codecanyonで12の最高のPHPチャットスクリプト Codecanyonで12の最高のPHPチャットスクリプト Mar 13, 2025 pm 12:08 PM

顧客の最も差し迫った問題にリアルタイムでインスタントソリューションを提供したいですか? ライブチャットを使用すると、顧客とのリアルタイムな会話を行い、すぐに問題を解決できます。それはあなたがあなたのカスタムにより速いサービスを提供することを可能にします

PHPにおける後期静的結合の概念を説明します。 PHPにおける後期静的結合の概念を説明します。 Mar 21, 2025 pm 01:33 PM

記事では、PHP 5.3で導入されたPHPの後期静的結合(LSB)について説明し、より柔軟な継承を求める静的メソッドコールのランタイム解像度を可能にします。 LSBの実用的なアプリケーションと潜在的なパフォーマ

JSON Web Tokens(JWT)とPHP APIでのユースケースを説明してください。 JSON Web Tokens(JWT)とPHP APIでのユースケースを説明してください。 Apr 05, 2025 am 12:04 AM

JWTは、JSONに基づくオープン標準であり、主にアイデンティティ認証と情報交換のために、当事者間で情報を安全に送信するために使用されます。 1。JWTは、ヘッダー、ペイロード、署名の3つの部分で構成されています。 2。JWTの実用的な原則には、JWTの生成、JWTの検証、ペイロードの解析という3つのステップが含まれます。 3. PHPでの認証にJWTを使用する場合、JWTを生成および検証でき、ユーザーの役割と許可情報を高度な使用に含めることができます。 4.一般的なエラーには、署名検証障害、トークンの有効期限、およびペイロードが大きくなります。デバッグスキルには、デバッグツールの使用とロギングが含まれます。 5.パフォーマンスの最適化とベストプラクティスには、適切な署名アルゴリズムの使用、有効期間を合理的に設定することが含まれます。

フレームワークセキュリティ機能:脆弱性から保護します。 フレームワークセキュリティ機能:脆弱性から保護します。 Mar 28, 2025 pm 05:11 PM

記事では、入力検証、認証、定期的な更新など、脆弱性から保護するためのフレームワークの重要なセキュリティ機能について説明します。

フレームワークのカスタマイズ/拡張:カスタム機能を追加する方法。 フレームワークのカスタマイズ/拡張:カスタム機能を追加する方法。 Mar 28, 2025 pm 05:12 PM

この記事では、フレームワークにカスタム機能を追加し、アーキテクチャの理解、拡張ポイントの識別、統合とデバッグのベストプラクティスに焦点を当てています。

PHPのCurlライブラリを使用してJSONデータを含むPOSTリクエストを送信する方法は? PHPのCurlライブラリを使用してJSONデータを含むPOSTリクエストを送信する方法は? Apr 01, 2025 pm 03:12 PM

PHP開発でPHPのCurlライブラリを使用してJSONデータを送信すると、外部APIと対話する必要があることがよくあります。一般的な方法の1つは、Curlライブラリを使用して投稿を送信することです。

See all articles