質問は、正規表現を使用した大量の文内の単語の置換の高速化についてです。このタスクでは、単語が大きな文字列の一部ではなく、完全な単語である場合にのみ単語を置換する必要があります。
考えられる解決策の 1 つは、一般に re.sub よりも効率的であると考えられている str.replace メソッドを使用することです。ただし、このアプローチが機能するには、置換が単語境界でのみ実行されるようにする必要があります。これを実現する簡単な方法は、b などの単語境界文字を置換パターンに追加することです。
代わりに、re.sub メソッド自体を最適化する方法を検討することは、確かに検討する価値があります。 1 つのアプローチは、置換される単語の長さが問題の文の長さを超える場合に置換をスキップすることです。この戦略は大幅な最適化を提供しませんが、それでもテストする価値はあります。
以上がPython 3 で正規表現の単語置換を高速化するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。