PHPで文字列から特定の単語を抽出するにはどうすればよいですか?

Patricia Arquette
リリース: 2024-10-31 07:29:01
オリジナル
814 人が閲覧しました

How to Extract Specific Words from a String in PHP?

文字列から特定の単語を抽出する

プログラミングでテキスト データを扱う場合、多くの場合、指定されたテキスト データから特定の単語や語句を抽出する必要があります。弦。たとえば、記事の最初の数単語のプレビューを表示したり、大量のテキスト本文からワード クラウドを作成したりすることができます。

文字列から最初の N 単語を取得

「足の速い茶色のキツネは怠惰な犬を飛び越えた。」という文から最初の 10 単語だけを取得したいとします。制限がある可能性のある組み込みの文字列関数に依存せずに、配列操作と正規表現を組み合わせてこれを実現できます。

<code class="php">// Split the string into individual words
$words = explode(' ', $sentence);

// Slice the array to select the first N words
$first_n_words = array_slice($words, 0, 10);

// Implode the array back into a string
$excerpt = implode(' ', $first_n_words);

echo $excerpt; // "The quick brown fox jumped over"</code>
ログイン後にコピー

このアプローチでは、目的の単語を効果的に抽出し、$ に保存します。 excerpt variable.

他の単語区切りのサポート

上記の解決策は、空白で区切られた単純な単語に対してはうまく機能します。ただし、文字列にカンマやダッシュなどの異なる単語区切りが含まれている場合は、正規表現を使用してそれらを処理できます。

<code class="php">function get_words($sentence, $count = 10) {
  preg_match("/(?:\w+(?:\W+|$)){0,$count}/", $sentence, $matches);
  return $matches[0];
}

$words = get_words($sentence, 10);
echo $words; // "The, quick, brown, fox, jumped, over, the, lazy"</code>
ログイン後にコピー

Unicode に関する考慮事項

PHP のデフォルトの正規表現式関数は Unicode 文字を適切に処理できない可能性があります。 UTF-8 または Unicode をサポートするには、上記の式の w と W を適切な Unicode 対応文字クラスに置き換えることができます。

結論

これらの手法を使用すると、単語の区切りや Unicode の考慮事項に関係なく、指定された文字列から特定の単語を抽出できます。

以上がPHPで文字列から特定の単語を抽出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!