我有三万多个词汇和它们的词性(就是动词,名词,形容词或者副词之类的),我想写个函数把以参数的方式传递进来的单词进行词性分析,然后返回它的词性。
public int analyze(String word){
// 这个地方应该用什么来保存那三万个词汇
// 这个地方应该用怎样的数据结构或算法来判断word到底在不在我那个三万个词汇里面
// 怎么做才能功效地判断出word的词性
return wordType;
}
词汇-词性表目前是单纯的以行为单位的txt文件
word1 t
word2 n
word3 a
就这样,我该怎么做呢,应该用什么来存储我的三万行数据,txt,json,xml,或者写到代码里面放到数组里面去呢?哪一个循环起来快一些,有什么好的建议?
Apakah kegunaan khusus anda Adakah anda kerap menggunakannya dan menumpukan pada kecekapan pertanyaan? Anda boleh menggunakan peta untuk menyimpan memori
Jika anda tidak kerap menggunakannya, anda boleh membahagikan perkataan itu kepada beberapa fail mengikut huruf pertama dan setiap pertanyaan boleh mencari fail tertentu, yang lebih pantas. Sejujurnya, 30,000 sebenarnya agak kecil, dan ia tidak sepatutnya lambat untuk dibaca Jika ia lebih dibesar-besarkan, anda boleh memasukkannya ke dalam pangkalan data.
Saya akan membalas kepada anda jika saya mempunyai idea yang lebih baik
Anda boleh mencuba pengurangan peta hadoop