Dalam Python, kita boleh mengumpulkan perkataan dengan stat dan aksara akhir yang serupa menggunakan kaedah seperti kamus dan gelung, menggunakan ungkapan biasa dan melaksanakan pemahaman senarai. Tugas ini melibatkan menganalisis koleksi perkataan dan mengenal pasti kumpulan perkataan yang berkongsi permulaan yang sama dan watak penamat. Ini boleh menjadi teknik yang berguna dalam pelbagai aplikasi pemprosesan bahasa semula jadi, seperti klasifikasi teks, perolehan maklumat dan semakan ejaan. Dalam artikel ini, kami akan meneroka kaedah ini untuk mengumpulkan perkataan aksara permulaan dan akhir yang serupa dalam Python.
Kaedah ini menggunakan kamus untuk mengumpulkan perkataan berdasarkan aksara permulaan dan akhir yang serupa. Dengan mengulangi senarai perkataan dan mengekstrak aksara permulaan dan akhir setiap perkataan, kita boleh mencipta kunci untuk kamus. Perkataan itu kemudiannya dilampirkan pada senarai yang sepadan dalam kamus, membentuk kumpulan berdasarkan aksara permulaan dan akhir mereka.
list_name.append(element)
Di sini, fungsi append() ialah kaedah senarai yang digunakan untuk menambah elemen pada penghujung list_name. List_name ialah senarai di mana kaedah tambah digunakan.
在下面的示例中,我们定义了一个名为group_words的函数,它以一个单词列个单词列一表。化一个空字典groups来存储单词组。对于输入列表中的每个单词,我们提取其起始字符(perkataan[0])和结束字符(perkataan[−1])。然后我们使用这些字符创建一个锃。
如果字典中已经存在该键,则将当前单词添加到相应的列表中。否则,我店们廬廬词为第一个元素的新列表。最后,我们返回分组的结果字典。
def group_words(words): groups = {} for word in words: start_char = word[0] end_char = word[-1] key = (start_char, end_char) if key in groups: groups[key].append(word) else: groups[key] = [word] return groups words = ['apple', 'banana', 'ant', 'cat', 'dog', 'elephant','amazon grape'] result = group_words(words) print(result)
{('a', 'e'): ['apple', 'amazon grape'], ('b', 'a'): ['banana'], ('a', 't'): ['ant'], ('c', 't'): ['cat'], ('d', 'g'): ['dog'], ('e', 't'): ['elephant']}
语法
import re result = re.split(pattern, string)
Contoh
group_words的函数,它接受一个单词列表作为输入。在循环中, 3组。
import re def group_words(words): groups = {} for word in words: match = re.match(r'^(.)(.*)(.)$', word) if match: start_char = match.group(1) end_char = match.group(3) key = (start_char, end_char) if key in groups: groups[key].append(word) else: groups[key] = [word] return groups words = ['apple', 'banana', 'ant', 'cat', 'dog', 'elephant','amazon grape'] result = group_words(words) print(result)
{('a', 'e'): ['apple', 'amazon grape'], ('b', 'a'): ['banana'], ('a', 't'): ['ant'], ('c', 't'): ['cat'], ('d', 'g'): ['dog'], ('e', 't'): ['elephant']}
语法
[expression for item in list if condition]
def group_words(words): groups = {(word[0], word[-1]): [] for word in words} [groups[(word[0], word[-1])].append(word) for word in words] return groups words = ['apple', 'banana', 'ant', 'cat', 'dog', 'elephant','amazon grape'] result = group_words(words) print(result)
{('a', 'e'): ['apple', 'amazon grape'], ('b', 'a'): ['banana'], ('a', 't'): ['ant'], ('c', 't'): ['cat'], ('d', 'g'): ['dog'], ('e', 't'): ['elephant']}
在本文中,我们讨论了如何使用Python中的各种方法将具有相似起始和结束字绬束字物们使用了三种不同的方法来对单词进行分组:使用字典和循环、使用正则表达式和使用列表推导式。通过使用这些技术,您可以高效地对单词进軌,分物进軌,分物些得有价值的见解,为各种自然语言处理应用打开了可能性。
Atas ialah kandungan terperinci Kumpulan perkataan dengan aksara permulaan dan akhir yang serupa menggunakan Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!