PHPAnalysis 中国語単語分割実践チュートリアル_PHP チュートリアル
PHPAnalysis は現在広く使用されている中国語の単語分割クラスであり、逆マッチング モードの単語分割を使用するため、より広範囲のエンコーディングと互換性があります。その変数と一般的な関数については、次のように詳しく説明します。 1. より重要なメンバー変数
$resultType = 1 生成された単語分割結果のデータ型 (1 はすべて、2 は辞書の語彙と 1 つの中国語、日本語、韓国語、簡体字および繁体字と英語、3 は辞書の語彙と英語) この変数は一般的に使用されます SetResultType ( $rstype ) このメソッドが設定されます。
$notSplitLen = 5 文を最短の長さに分割します
$toLower = false すべての英単語を小文字に変換します
$differMax = false 最大分割モードを使用して 2 グラム単語の曖昧さを解消します
$unitWord = true 単一の単語を結合してみます (つまり、 , 新しい単語認識)
$differFreq = false 曖昧さ回避のために人気のある単語優先モードを使用します
2. 主要なメンバー関数のリスト
1. public function __construct($source_charset='utf-8', $target_charset='utf-8', $load_all =true, $source='')
関数の説明: コンストラクター
パラメータリスト: (www.jbxue.com)
$source_charset ソース文字列エンコーディング
$target_charset ディレクトリ文字列エンコーディング
$load_all 辞書を完全にロードするかどうか (thisパラメータ すでに廃止されています)
$source ソース文字列
入力と出力が両方とも utf-8 の場合、実際には初期化にパラメータを使用する必要はありませんが、SetSource メソッドを通して操作するテキストを設定します
2。 SetSource( $source, $source_charset='utf-8', $target_charset='utf-8' )
関数の説明: ソース文字列を設定します
パラメータリスト:
$source ソース文字列
$source_charset ソース文字列エンコーディング
$target_charset ディレクトリ文字列エンコーディング
戻り値: bool
3. public function StartAnalysis($optimize=true)
関数の説明: 単語分割操作の実行を開始します
パラメーターリスト:
$optimize 単語分割後の結果の最適化を試みるかどうか
戻り値: void
基本的な単語分割プロセス:
//////////////////////////////////////
$pa = new PhpAnalysis();
$pa ->SetSource('セグメント化する必要がある文字列');
//セグメンテーション属性を設定します
$pa->resultType = 2;
$pa->differMax = true ;
$pa->StartAnalysis() ;
//必要な結果を取得します
$pa->GetFinallyIndex();
//////////////////// /////////// //////////
4. public function SetResultType($rstype)
関数の説明: 戻り結果の型を設定します
実際には、メンバー変数$resultType
パラメータ$rstypeの値は次のとおりです:
1はすべて、2は辞書の語彙と単一の中国語、日本語、韓国語、簡体字および繁体字と英語、3は辞書の語彙と英語です
戻り値: void
5. public function GetFinallyKeywords($num = 10)
関数の説明: 最も高い頻度で指定されたエントリを取得します (通常、ドキュメントのキーワードを抽出するために使用されます)
パラメータリスト:
$num = 10 エントリの数を返します
戻り値: 「,」で区切られたキーワードリスト
6. public function GetFinallyResult($spword=' ')
関数の説明: 最終的な単語分割結果を取得します
パラメータリスト:
$spword エントリ間の区切り文字
戻り値: string
7. function GetSimpleResult()
関数説明: 大まかなセグメンテーション結果を取得
戻り値: 配列
(Script Academy www.jbxue.com)
関数の説明: 属性情報を含む大まかなセグメンテーション結果を取得します
属性 (1 中国語の単語と文章、2 ANSI 語彙 (全角を含む)、3 ANSI句読点(全角含む)、数字4文字(全角含む)、中国語句読点5文字または認識できない文字)
戻り値: 配列
9. public function GetFinallyIndex()
関数説明: ハッシュインデックス配列を取得
Return value: array('word'= >count,...) 出現頻度で並べ替えます
10. public function MakeDict($source_file, $target_file='')
関数の説明: テキストファイルの辞書を辞書にコンパイルします
パラメータリスト:
$source_file ソーステキストファイル
$target_file ターゲットファイル (指定されていない場合、現在の辞書)
戻り値: void
11. public function ExportDict( $targetfile )
関数の説明: 現在の辞書のすべてのエントリをエクスポートします。辞書をテキストファイルとして
パラメータリスト:
$targetfile ターゲットファイル
戻り値: void
http://www.bkjia.com/PHPjc/812980.html

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











Laravelは、直感的なフラッシュメソッドを使用して、一時的なセッションデータの処理を簡素化します。これは、アプリケーション内に簡単なメッセージ、アラート、または通知を表示するのに最適です。 データは、デフォルトで次の要求のためにのみ持続します。 $リクエスト -

PHPクライアントURL(CURL)拡張機能は、開発者にとって強力なツールであり、リモートサーバーやREST APIとのシームレスな対話を可能にします。尊敬されるマルチプロトコルファイル転送ライブラリであるLibcurlを活用することにより、PHP Curlは効率的なexecuを促進します

Laravelは簡潔なHTTP応答シミュレーション構文を提供し、HTTP相互作用テストを簡素化します。このアプローチは、テストシミュレーションをより直感的にしながら、コード冗長性を大幅に削減します。 基本的な実装は、さまざまな応答タイプのショートカットを提供します。 Illuminate \ support \ facades \ httpを使用します。 http :: fake([[ 'google.com' => 'hello world'、 'github.com' => ['foo' => 'bar']、 'forge.laravel.com' =>

顧客の最も差し迫った問題にリアルタイムでインスタントソリューションを提供したいですか? ライブチャットを使用すると、顧客とのリアルタイムな会話を行い、すぐに問題を解決できます。それはあなたがあなたのカスタムにより速いサービスを提供することを可能にします

記事では、PHP 5.3で導入されたPHPの後期静的結合(LSB)について説明し、より柔軟な継承を求める静的メソッドコールのランタイム解像度を可能にします。 LSBの実用的なアプリケーションと潜在的なパフォーマ

PHPロギングは、Webアプリケーションの監視とデバッグ、および重要なイベント、エラー、ランタイムの動作をキャプチャするために不可欠です。システムのパフォーマンスに関する貴重な洞察を提供し、問題の特定に役立ち、より速いトラブルシューティングをサポートします

Laravelのサービスコンテナとサービスプロバイダーは、そのアーキテクチャの基本です。 この記事では、サービスコンテナ、詳細サービスプロバイダーの作成、登録、および実用的な使用法を例で説明します。 Oveから始めます

この記事では、フレームワークにカスタム機能を追加し、アーキテクチャの理解、拡張ポイントの識別、統合とデバッグのベストプラクティスに焦点を当てています。
