1. NLTK 簡介
NLTK是python程式語言的一個自然語言處理工具套件,由Steven Bird和Edward Loper於2001年創建。 NLTK提供了廣泛的文本處理工具,包括文本預處理、分詞、詞性標註、句法分析、語義分析等,可以幫助開發者輕鬆地處理自然語言資料。
2. NLTK 安裝
NLTK可以透過以下命令安裝:
from nltk.tokenize import Word_tokenize text = "Hello, world! This is a sample text." tokens = word_tokenize(text) print(tokens)
輸出:
from nltk.tokenize import sent_tokenize text = "Hello, world! This is a sample text. This is another sentence." sentences = sent_tokenize(text) print(sentences)
輸出:
from nltk.tag import pos_tag text = "The cat sat on the mat." tagged_text = pos_tag(text) print(tagged_text)
輸出:
from nltk.parse import CoreNLPParser parser = CoreNLPParser() text = "The cat sat on the mat." tree = parser.parse(text) print(tree)
輸出:
from nltk.corpus import wordnet text = "The cat sat on the mat." # 查找"cat"的同义词 synsets = wordnet.synsets("cat") for synset in synsets: print(synset) # 查找"sat"的反义词 antonyms = wordnet.antonyms("sat") for antonym in antonyms: print(antonym)
輸出:
Synset("cat.n.01") Synset("big_cat.n.01") Synset("domestic_cat.n.01") ... Antonym("sit.v.01")
4. 結語
#Python NLTK是一款功能強大、易於使用的自然語言處理工具包,可協助您輕鬆分析和處理自然語言資料。本文介紹了NLTK的基本用法,並透過示範程式碼讓您快速掌握自然語言處理的技巧。如果您對自然語言處理感興趣,不妨嘗試NLTK,相信您會發現它的強大功能。
以上是【Python NLTK】教學:輕鬆入門,玩玩自然語言處理的詳細內容。更多資訊請關注PHP中文網其他相關文章!