對於缺失值基本上有刪除、填充和重構變數等做法,但是具體的操作是怎麼進行的呢?比方說你當你不清楚各個欄位的意思時:
1.如何認定該欄位與模型無關、缺失值的比例達到多少就可以刪除?
2.什麼時候會認為缺失值也是一種有用的狀態?
3.什麼時候需要進行資料填充?
业精于勤,荒于嬉;行成于思,毁于随。
方法還挺多的。 我找到幾個鏈接,附在下面,應該對你有幫助。
訓練集中有的特徵含有缺失值,一般怎麼處理如何判斷缺失值是否為隨機的缺失?
請問怎麼用。
方法還挺多的。
我找到幾個鏈接,附在下面,應該對你有幫助。
訓練集中有的特徵含有缺失值,一般怎麼處理
如何判斷缺失值是否為隨機的缺失?
請問怎麼用。