Langkah pertama yang anda berikan ialah membahagikan artikel ke dalam perkataan Cina, dan kemudian mengira nilai tf-idf bagi setiap perkataan dalam dua artikel. Kemudian hitung persamaan kosinus kedua-dua artikel, yang boleh dilaksanakan menggunakan gensim dalam Python.
Jika anda mempunyai sebarang pertanyaan, sila teruskan bertanya.
Tambahkan pada jawapan di tingkat satu Apabila menggunakan persamaan kosinus atau TF-IDF, perkataan henti hendaklah dialih keluar dahulu.
Kata henti diterjemahkan daripada perkataan Inggeris: stopword Ternyata dalam bahasa Inggeris, anda akan menemui banyak perkataan atau perkataan yang kerap digunakan seperti a, the, or, etc., yang selalunya merupakan artikel, preposisi. , adverba atau Kata Hubung dll. Kerana perkataan seperti adverba dan kata sendi tidak banyak mempengaruhi pertimbangan semantik kita.
Tetapi persamaan kosinus mudah dan TF-IDF tidak begitu boleh dipercayai dalam keadaan tertentu. Tekan pautan anda sendiri 2333 di sini
Adalah disyorkan untuk menggunakan textrank dalam kombinasi dengan algoritma di atas
Langkah pertama yang anda berikan ialah membahagikan artikel ke dalam perkataan Cina, dan kemudian mengira nilai tf-idf bagi setiap perkataan dalam dua artikel. Kemudian hitung persamaan kosinus kedua-dua artikel, yang boleh dilaksanakan menggunakan gensim dalam Python.
Jika anda mempunyai sebarang pertanyaan, sila teruskan bertanya.
Tambahkan pada jawapan di tingkat satu
Apabila menggunakan persamaan kosinus atau TF-IDF, perkataan henti hendaklah dialih keluar dahulu.
Tetapi persamaan kosinus mudah dan TF-IDF tidak begitu boleh dipercayai dalam keadaan tertentu.
Tekan pautan anda sendiri 2333 di sini
Adalah disyorkan untuk menggunakan textrank dalam kombinasi dengan algoritma di atas