Sumber data besar termasuk penderia dan peranti IoT, media sosial dan Internet, data korporat dan kerajaan. Pengenalan terperinci: 1. Penderia dan peranti IoT Dengan perkembangan pesat Internet of Things, semakin banyak penderia digunakan dalam pelbagai bidang dan mempunyai keupayaan masa nyata 2. Media sosial dan Internet Dengan populariti Internet dan peningkatan media sosial, pengguna telah menghasilkan sejumlah besar data di Internet dan sebagainya.
Sistem pengendalian tutorial ini: sistem Windows 10, komputer Dell G3.
Sumber data besar boleh dibahagikan terutamanya kepada tiga aspek berikut:
Sensor dan peranti IoT: Dengan perkembangan pesat Internet Perkara, semakin banyak penderia digunakan dalam pelbagai bidang, termasuk industri, pertanian, pengangkutan , dan rawatan perubatan tunggu. Penderia ini boleh mengesan dan merekodkan pelbagai kuantiti fizikal, seperti suhu, kelembapan, tekanan, cahaya, dsb. Jumlah data yang dijana oleh penderia adalah besar dan masa nyata, menyediakan sumber penting untuk penjanaan data besar. Sebagai contoh, semasa pengeluaran kilang, pelbagai penderia boleh memantau status peralatan, kualiti produk dan maklumat lain dalam masa nyata dan menghantarnya ke pusat data untuk analisis dan pengoptimuman proses pengeluaran.
Media Sosial dan Internet: Dengan populariti Internet dan peningkatan media sosial, pengguna telah menjana sejumlah besar data di Internet. Platform media sosial seperti Facebook, Twitter, Instagram, dsb. mempunyai ratusan juta pengguna menyiarkan teks, gambar, video dan kandungan lain padanya setiap hari. Data yang dijana pengguna ini mengandungi maklumat yang kaya, seperti minat pengguna, hubungan sosial, tingkah laku penggunaan, dsb. Pada masa yang sama, terdapat sejumlah besar halaman web, blog, forum dan tapak web lain di Internet, dan klik, ulasan, koleksi dan gelagat lain pengguna yang dihasilkan semasa menyemak imbas dan carian juga akan menjana sejumlah besar data. Data media sosial dan Internet ini dicirikan oleh kepelbagaian, pelbagai sumber dan sifat masa nyata yang tinggi, menyediakan sumber yang kaya untuk analisis data besar.
Data perusahaan dan kerajaan: Perusahaan dan agensi kerajaan menjana sejumlah besar data dalam operasi dan proses pengurusan harian mereka. Data yang dijana oleh perusahaan dalam jualan, pengeluaran, perolehan, kewangan, dsb., seperti jualan, inventori, rekod transaksi, dsb., boleh digunakan untuk analisis perniagaan dan sokongan keputusan perusahaan. Data yang dijana oleh jabatan kerajaan dalam demografi, pembangunan ekonomi, pemantauan alam sekitar, dsb., seperti data banci, data KDNK, data pencemaran alam sekitar, dsb., boleh digunakan untuk pengurusan sosial dan penggubalan dasar. Data korporat dan kerajaan ini mempunyai kredibiliti dan integriti yang tinggi, menyediakan asas yang boleh dipercayai untuk analisis data besar.
Ringkasnya, sumber data besar terutamanya termasuk data yang dijana oleh penderia dan peranti IoT, data yang dijana oleh media sosial dan pengguna Internet, dan data yang dijana oleh perusahaan dan agensi kerajaan. Sumber data ini kaya dan pelbagai, meliputi pelbagai bidang, menyediakan ruang yang luas dan kemungkinan untuk analisis data besar. Pada masa yang sama, sumber data ini juga membawa cabaran dalam pengurusan data, privasi data, keselamatan data, dll., yang perlu dipertimbangkan dan diselesaikan oleh pengaturcara semasa proses pemprosesan dan analisis data besar.
Atas ialah kandungan terperinci Apakah tiga sumber data besar?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!