上面的資料是從reuters資料集中取得7303個訓練集,用sklearn對其取tfidf特徵,得到的結果都是0,這是怎麼回事?
#當我從這些資料中取一部分時,對於這些少部分資料能夠得到正確的tfidf結果。
光阴似箭催人老,日月如移越少年。
上程式碼,可能是你精確度太低或是min_count導致的
例如詞頻是1,總詞數1e9,對應的tf就是1e-9,被忽略了。
上程式碼,可能是你精確度太低或是min_count導致的
例如詞頻是1,總詞數1e9,對應的tf就是1e-9,被忽略了。