数据预处理的方法有哪些
Apr 22, 2021 pm 05:06 PM数据预处理的方法有:1、数据清理,通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来“清理”数据;2、数据集成,将多个数据源中的数据结合起来并统一存储,建立数据仓库的过程实际上就是数据集成;3、数据变换;4、数据归约。
本教程操作环境:windows7系统、Dell G3电脑。
数据预处理(data preprocessing)是指在主要的处理以前对数据进行的一些处理。如对大部分地球物理面积性观测数据在进行转换或增强处理之前,首先将不规则分布的测网经过插值转换为规则网的处理,以利于计算机的运算。另外,对于一些剖面测量数据,如地震资料预处理有垂直叠加、重排、加道头、编辑、重新取样、多路编辑等。
数据预处理的方法
1、数据清理
通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来“清理”数据。主要是达到如下目标:格式标准化,异常数据清除,错误纠正,重复数据的清除。
2、数据集成
数据集成例程将多个数据源中的数据结合起来并统一存储,建立数据仓库的过程实际上就是数据集成。
3、数据变换
通过平滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。
4、数据归约
数据挖掘时往往数据量非常大,在少量数据上进行挖掘分析需要很长的时间,数据归约技术可以用来得到数据集的归约表示,它小得多,但仍然接近于保持原数据的完整性,并结果与归约前结果相同或几乎相同。
数据预处理是数据挖掘一个热门的研究方面,毕竟这是由数据预处理的产生背景所决定的--现实世界中的数据几乎都脏数据。
更多相关知识,请访问常见问题栏目!
Atas ialah kandungan terperinci 数据预处理的方法有哪些. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Artikel Panas

Alat panas Tag

Artikel Panas

Tag artikel panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Bagaimana untuk menggunakan fungsi PHP untuk prapemprosesan data?

Buka kunci kod analisis data dengan Python

Apakah teknik prapemprosesan data dalam Python?

Bagaimana untuk menggunakan Penghala Vue untuk melaksanakan prapemprosesan data sebelum lompat halaman?

Cara menggunakan pemprosesan borang Vue untuk melaksanakan prapemprosesan data sebelum penyerahan borang

Bahasa Go dan pangkalan data MySQL: bagaimana untuk melaksanakan prapemprosesan data?

Prapemprosesan data untuk pengesanan sasaran dalam penglihatan komputer

Cara melaksanakan pemaparan sebelah pelayan dan prapemprosesan data dalam JavaScript