python - Utiliser Sklearn pour trouver les fonctionnalités Tfidf d'un texte volumineux?
大家讲道理
大家讲道理 2017-06-28 09:23:35
0
1
841


Les données ci-dessus sont obtenues à partir de l'ensemble de formation 7303 de l'ensemble de données Reuters, et sklearn est utilisé pour prendre la fonctionnalité tfidf. Les résultats obtenus sont tous 0. Que se passe-t-il ?

Lorsque je prends une partie de ces données, je peux obtenir les résultats tfidf corrects pour ces petites parties des données.

大家讲道理
大家讲道理

光阴似箭催人老,日月如移越少年。

répondre à tous(1)
扔个三星炸死你

Le code ci-dessus peut être dû à une précision trop faible ou à min_count

Par exemple, si la fréquence des mots est de 1 et que le nombre total de mots est de 1e9, le tf correspondant est de 1e-9, qui est ignoré.

Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal