1. Pengenalan kepada NLTK
NLTK ialah pakej pemprosesan bahasa semula jadialat untuk pythonbahasa pengaturcaraan, dicipta pada tahun 2001 oleh Steven Bird dan Edward Loper. NLTK menyediakan pelbagai alat pemprosesan teks, termasuk prapemprosesan teks, pembahagian perkataan, pengetegan sebahagian daripada pertuturan, analisis sintaksis, analisis semantik, dsb., yang boleh membantu pembangun memproses data bahasa semula jadi dengan mudah.
2. Pemasangan NLTKNLTK boleh dipasang melalui arahan berikut:
from nltk.tokenize import Word_tokenize text = "Hello, world! This is a sample text." tokens = word_tokenize(text) print(tokens)
Keluaran:
from nltk.tokenize import sent_tokenize text = "Hello, world! This is a sample text. This is another sentence." sentences = sent_tokenize(text) print(sentences)
Keluaran:
from nltk.tag import pos_tag text = "The cat sat on the mat." tagged_text = pos_tag(text) print(tagged_text)
Keluaran:
from nltk.parse import CoreNLPParser parser = CoreNLPParser() text = "The cat sat on the mat." tree = parser.parse(text) print(tree)
Keluaran:
from nltk.corpus import wordnet text = "The cat sat on the mat." # 查找"cat"的同义词 synsets = wordnet.synsets("cat") for synset in synsets: print(synset) # 查找"sat"的反义词 antonyms = wordnet.antonyms("sat") for antonym in antonyms: print(antonym)
Keluaran:
Synset("cat.n.01") Synset("big_cat.n.01") Synset("domestic_cat.n.01") ... Antonym("sit.v.01")
Python NLTK ialah kit pemprosesan bahasa semula jadi yang berkuasa dan mudah digunakan yang boleh membantu anda menganalisis dan memproses data bahasa semula jadi dengan mudah. Artikel ini memperkenalkan penggunaan asas NLTK dan membolehkan anda menguasai kemahiran pemprosesan bahasa semula jadi dengan cepat melalui kod demonstrasi. Jika anda berminat dalam pemprosesan bahasa semula jadi, anda juga boleh mencuba NLTK. Saya percaya anda akan menemui keupayaannya yang hebat.
Atas ialah kandungan terperinci [Python NLTK] Tutorial: Bermula dengan mudah dan berseronok dengan pemprosesan bahasa semula jadi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!