Heim > Backend-Entwicklung > Python-Tutorial > Der Schneeball von nltk extrahiert Stängel

Der Schneeball von nltk extrahiert Stängel

高洛峰
Freigeben: 2016-10-18 10:12:57
Original
4563 Leute haben es durchsucht

Ein sehr wichtiges Anwendungsszenario beim maschinellen Lernen ist die automatische maschinelle Klassifizierung, und der Schlüssel zur Klassifizierung liegt im Stemmen. Wir müssen also Schneeball verwenden. Lassen Sie uns über die zwei Möglichkeiten sprechen, wie der Schneeball Stängel extrahiert.

Zwei Methoden:

Methode eins:

>>> from nltk import SnowballStemmer
>>> SnowballStemmer.sprachen ​​# Sehen Sie, welche Sprachen unterstützt werden
('dänisch', 'niederländisch', 'englisch', 'finnisch', 'französisch', 'deutsch', 'ungarisch',
'italienisch', 'norwegisch', 'porter', 'portugiesisch" , 'rumänisch',
'russisch', 'spanisch', 'schwedisch')
>>> stemmer = SnowballStemmer("german") # Wähle eine Sprache
>>> stemmer.stem(u" Autobahnen") # Stammen Sie ein Wort
u'autobahn'
Aber wenn Sie das von Ihnen verwendete Sprachszenario kennen, können Sie es mit der folgenden Methode direkt aufrufen:
Methode 2:
>> > ps = nltk.stem .snowball.PortugueseStemmer()
>>> ps.stem('celular')
u'celul'
>>> ps.stem('celular')
u'celul'


Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage