テキスト文字列からの特定の単語の抽出
質問:
どのように制限できますか?テキスト文字列から返される単語の数?たとえば、最初の 10 単語だけを取得したいとします。
答え:
文字列から最初の N 単語だけを取得するには、次のさまざまなメソッドを使用できます。 PHP。いくつかのオプションを検討してみましょう:
配列スライスを使用した Implode:
このアプローチでは、implode() 関数と array_slice() 関数を利用して、目的の結果を達成します:
<code class="php">$sentence = "Lorem ipsum dolor sit amet, consectetur adipiscing elit."; $words = implode(' ', array_slice(explode(' ', $sentence), 0, 10)); echo $words; // Output: "Lorem ipsum dolor sit amet consectetur adipiscing elit"</code>
Preg_match メソッド:
preg_match() 関数は、より柔軟なソリューションを提供し、カンマやダッシュなどの他の単語区切りのサポートを有効にします:
<code class="php">function get_words($sentence, $count = 10) { preg_match("/(?:\w+(?:\W+|$)){0,$count}/", $sentence, $matches); return $matches[0]; } $sentence = "Lorem ipsum, dolor sit-amet, consectetur adipiscing elit."; echo get_words($sentence); // Output: "Lorem ipsum dolor sit-amet"</code>
Unicode と UTF-8 の処理:
PHP のデフォルトの単語区切り文字パターンでは UTF-8 文字が考慮されないことに注意してください。 Unicode および UTF-8 文字が文字列に含まれることが予想される場合は、必要に応じてパターンをカスタマイズできます:
<code class="php">$pattern = "/[^\s,\.;\?\!]+([\s,\.;\?\!])?{0,$count}/u";</code>
以上がPHPでテキスト文字列から特定の数の単語を抽出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。