Python中的字串分詞
在Python中,您可以使用str.split()方法將字串依照分隔符號或正規表示式進行分詞。預設情況下,str.split()會將字串依照空白字元(包括空格、製表符和換行符)進行分詞。
使用預設分隔符號
以下程式碼示範如何使用預設分隔符號將字串拆分為一個單字清單:
text = "many fancy word \nhello \thi" words = text.split() print(words) # 输出:['many', 'fancy', 'word', 'hello', 'hi']
在此範例中,字串text被拆分為以下單字清單:['many', 'fancy', 'word', 'hello', 'hi']。
使用正規表示式分隔符號
您也可以指定一個正規表示式作為分隔符號。這可讓您根據更複雜的模式進行字串分詞。
以下程式碼示範如何使用正規表示式將字串拆分為一個單字列表,其中將空白字元或多個連續空格視為分隔符號:
import re text = "many fancy word \nhello \thi" white_space_regex = r"\s+" words = re.split(white_space_regex, text) print(words) # 输出:['many', 'fancy', 'word', 'hello', 'hi']
在這種情況下,正規表示式r"s "符合一個或多個空白字符,因此它會將字串拆分為一個單字列表,其中每個單字之間都至少有一個空白字符。
注意事項
以上是如何使用 Python 將字串拆分為單字?的詳細內容。更多資訊請關注PHP中文網其他相關文章!