Python の len 関数を使用してテキスト内の単語数をカウントする例
Python での len 関数の応用例: テキスト内の単語数をカウントするために使用する方法
Python プログラミングでは、len 関数は非常に便利な関数です。 . オブジェクトの長さまたは要素の数を返すために使用されます。この記事では、len関数を使ってテキスト内の単語数をカウントする方法と具体的なコード例を紹介します。
コードを書き始める前に、単語の定義方法を理解する必要があります。この記事では、単語の区切り文字としてスペースを使用します。つまり、2 つのスペースの間にある文字列はすべて単語とみなされます。
以下は、len 関数を使用してテキスト内の単語数をカウントする方法を示す簡単なコード例です。
def count_words(text): word_count = len(text.split()) return word_count text = "Python是一种简单易学但功能强大的编程语言。它被广泛应用于各种领域,包括软件开发、数据分析和人工智能等。" word_count = count_words(text) print("文本中的单词数量为:", word_count)
上記のコードでは、count_words という名前の関数が最初に定義されています。文字列パラメータテキストを受け取ります。関数の実装アイデアは、split メソッドを通じてテキスト文字列 text を 1 つずつ単語に分割し、len 関数を使用して単語リストの長さ、つまり単語数を取得することです。最後に単語数が返されます。
サンプル コードでは、複数の文を含むテキストを変数 text に代入し、count_words 関数を呼び出してテキスト内の単語数をカウントし、結果を出力します。
上記のコードを実行すると、出力テキストの単語数は 17 になります。これは、テキスト内に 17 個のスペースで区切られた文字列があり、17 個の単語を構成しているためです。
もちろん、実際のアプリケーションでは、句読点や改行の削除など、テキストに対して何らかの前処理を実行する必要がある場合があります。以下は、単語数をカウントする前にテキストを前処理する方法を示す改良されたコード例です:
import re def count_words(text): text = re.sub(r'[^ws]', '', text) # 去除标点符号 text = text.replace(' ', '') # 去除换行符 word_count = len(text.split()) return word_count text = """Python是一种简单易学但功能强大的编程语言。 它被广泛应用于各种领域,包括软件开发、数据分析和人工智能等。""" word_count = count_words(text) print("文本中的单词数量为:", word_count)
改良されたコードでは、最初に、re.sub メソッドを使用して、すべての句読点を正規表現に置き換えました。 。次に、.replace メソッドを使用して改行を削除しました。最後に、前の方法に従って単語数を数えます。
改善されたコードを実行すると、出力テキストの単語数は 18 になります。句読点と改行を削除することでテキストが整理され、より正確な単語数が得られました。
要約すると、上記は、len 関数を使用してテキスト内の単語数をカウントし、split メソッドで文字列を単語に分割し、len 関数を使用してテキストの長さを取得する例です。単語リスト。実際のアプリケーションでは、必要に応じてテキストの前処理を実行して、より正確な結果を得ることができます。この記事が len 関数の理解と使用に役立つことを願っています。
以上がPython の len 関数を使用してテキスト内の単語数をカウントする例の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











Python の len() 関数は、オブジェクトの長さまたは要素の数を取得するために使用される一般的に使用される組み込み関数です。日々の Python 開発では、len() 関数に関するいくつかの問題に遭遇することがよくありますが、この記事では、いくつかの一般的な問題と解決策を紹介し、具体的なコード例を示します。 TypeError: objectoftype'XXX'hasnolen() この問題は通常、長さの演算をサポートしていないオブジェクトに対して len() を使用しようとしたときに発生します。

lenb 関数と len 関数の違いを詳しく分析するには、具体的なコード例が必要です。Python プログラミング言語では、文字列は一般的なデータ型であり、文字列関連の操作や処理が必要になることがよくあります。文字列処理の過程では、文字列の長さを取得する関数をよく使います。 Python には、文字列の長さを取得するための 2 つの組み込み関数、つまり lenb 関数と len 関数が用意されています。これらの関数名は非常に似ていますが、実際には文字列の長さの処理方法に重要な違いがあります。

Excel ブックから先頭のゼロを自動的に削除するのはイライラしますか?セルに数値を入力すると、Excel では数値の前の先頭のゼロが削除されることがよくあります。デフォルトでは、明示的な書式設定が欠如しているセルエントリは数値として処理されます。一般に、先頭のゼロは数値形式では無関係であるとみなされ、省略されます。さらに、先行ゼロは特定の数値演算で問題を引き起こす可能性があります。したがって、ゼロは自動的に削除されます。この記事では、口座番号、郵便番号、電話番号などの入力された数値データが正しい形式であることを確認するために、Excel で先頭のゼロを保持する方法を説明します。 Excel で、数値の前にゼロを付けるにはどうすればよいですか? Excel ブック内の数値の先頭のゼロを保持できます。いくつかの方法から選択できます。セルを設定するには、

iOS 17 では、Apple は着信音とテキスト トーンの選択全体を全面的に見直し、通話、テキスト メッセージ、アラームなどに使用できる 20 以上の新しいサウンドを提供します。それらを確認する方法は次のとおりです。新しい着信音の多くは、古い着信音よりも長く、より現代的に聞こえます。アルペジオ、ブロークン、キャノピー、キャビン、チャープ、夜明け、出発、ドロップ、旅、やかん、水銀、銀河、クワッド、ラジアル、スカベンジャー、苗木、シェルター、スプリンクル、ステップ、ストーリータイム、からかう、傾ける、展開する、谷が含まれます。 。リフレクションは引き続きデフォルトの着信音オプションです。また、テキスト メッセージの受信、ボイスメール、メールの受信アラート、リマインダー アラートなどに使用できる 10 種類以上の新しいテキスト トーンも用意されています。新しい着信音やテキスト トーンにアクセスするには、まず iPhone が

win7 システムで txt テキストを開けない場合はどうすればよいですか? コンピュータ上でテキスト ファイルを編集する必要がある場合、最も簡単な方法はテキスト ツールを使用することです。しかし、一部のユーザーは自分のコンピュータで txt テキスト ファイルを開けないことに気づきます。 win7システムでtxtテキストを開けない問題を解決するための詳細なチュートリアルを見てみましょう。 win7 システムでテキスト テキストを開けない問題を解決するためのチュートリアル 1. デスクトップ上の任意の txt ファイルを右クリックします。txt ファイルがない場合は、右クリックして新しいテキスト ドキュメントを作成し、プロパティを選択します。 2. 以下の図に示すように、開いた txt プロパティ ウィンドウで、一般オプションの下にある変更ボタンを見つけます。 3. ポップアップ オープン モード設定で

このチュートリアルでは、Windows の Chrome または Edge で開いているすべてのタブで特定のテキストまたは語句を検索する方法を説明します。 Chrome で開いているすべてのタブでテキスト検索を行う方法はありますか?はい。Chrome で無料の外部 Web 拡張機能を使用すると、タブを手動で切り替えることなく、開いているすべてのタブでテキスト検索を実行できます。 TabSearch や Ctrl-FPlus などの一部の拡張機能を使用すると、これを簡単に実現できます。 Google Chrome のすべてのタブでテキストを検索するにはどうすればよいですか? Ctrl-FPlus は、ユーザーがブラウザ ウィンドウのすべてのタブで特定の単語、語句、またはテキストを簡単に検索できるようにする無料の拡張機能です。この展開は

1. テキスト タスク この記事では主に、生成テキスト要約の方法と、最新の生成テキスト要約トレーニング パラダイムを実装するために対照学習と大規模モデルを使用する方法について説明します。これには主に 2 つの記事が含まれており、1 つは対照学習を使用して生成モデルにランキング タスクを導入する BRIO: Bringing Order to Abstractive Summarization (2022)、もう 1 つは OnLearning to Summarize with Large Language Models as References (2023) です。 BRIO に基づいて高品質のトレーニング データを生成するための大規模なモデルを導入しています。 2. 生成テキスト要約トレーニング方法と

Go言語の「len()」関数は、文字列、配列、スライス、辞書、チャネルなどの要素の長さや数を取得するために使用されます。具体的な使い方は「len(取得する要素の名前)」です。ただし、文字列の場合、たとえば、「len()」関数は文字数ではなく、文字列内のバイト数を返します。
