Data besar dalam buku "Era Data Besar" merujuk kepada "semua data atau semua data", juga dikenali sebagai "data besar", yang merujuk kepada jumlah data yang terlibat yang sangat besar sehingga tidak boleh melalui arus perdana alatan Perisian semasa boleh menangkap, mengurus, memproses dan menyusun maklumat dalam masa yang munasabah untuk membantu perusahaan membuat keputusan perniagaan yang lebih positif.
Persekitaran pengendalian tutorial ini: sistem Windows 7, komputer Dell G3.
Data besar dalam buku "Era Data Besar" merujuk kepada "semua data atau semua data".
Data besar, atau data besar, merujuk kepada jumlah data yang terlibat yang sangat besar sehingga tidak dapat ditangkap, diurus dan diurus dalam masa yang munasabah oleh alat perisian arus perdana semasa maklumat untuk membantu syarikat membuat keputusan perniagaan yang lebih positif.
Dalam "The Age of Big Data" yang ditulis oleh Victor Meier-Schoenberg dan Kenneth Cukier, big data merujuk kepada penggunaan semua data tanpa pintasan seperti analisis rawak (kaedah persampelan) ciri-ciri 4V yang besar data: Isipadu, Halaju, Kepelbagaian dan Nilai.
Sejarah perkembangan konsep data besar:
Rujukan terawal kepada istilah "data besar" boleh dikesan kembali kepada projek sumber terbuka Nutch of apache org. Pada masa itu, data besar digunakan untuk menerangkan set data besar yang perlu diproses secara kelompok atau dianalisis secara serentak untuk mengemas kini indeks carian web. Dengan keluaran Google MapReduce dan Sistem Fail Google (GFS), data besar bukan lagi hanya digunakan untuk menerangkan jumlah data yang besar, tetapi juga meliputi kelajuan pemprosesan data.
Seawal tahun 1980, futuris terkenal Alvin Toffler dengan penuh semangat memuji data besar sebagai "cadenza gelombang ketiga" dalam bukunya "The Third Wave" .
Walau bagaimanapun, bermula sekitar tahun 2009, "163 data besar" menjadi bualan dalam industri teknologi maklumat Internet. Pusat Data Internet A.S. menyatakan bahawa data di Internet akan berkembang sebanyak 50% setiap tahun dan dua kali ganda setiap dua tahun Pada masa ini, lebih daripada 90% data dunia telah dihasilkan dalam beberapa tahun kebelakangan ini. Selain itu, data tidak hanya merujuk kepada maklumat yang diterbitkan oleh orang ramai di Internet Terdapat banyak penderia digital pada peralatan industri, kereta dan meter elektrik di seluruh dunia, mengukur dan menghantar maklumat tentang kedudukan, pergerakan, getaran, suhu, kelembapan, dan juga kimia di udara pada bila-bila masa Perubahan dalam jirim juga menjana sejumlah besar maklumat data.
Struktur konseptual data besar:
Data besar hanyalah manifestasi atau ciri perkembangan Internet hingga ke peringkat sekarang atau mengekalkan rasa kagum dengannya , di bawah latar belakang inovasi teknologi yang diwakili oleh pengkomputeran awan, data yang pada asalnya sukar untuk dikumpulkan dan digunakan telah mula digunakan dengan mudah Melalui inovasi berterusan dalam semua lapisan masyarakat, data besar secara beransur-ansur akan mencipta lebih banyak lagi untuk nilai manusia.
Kedua, jika anda ingin memahami data besar secara sistematik, anda mesti menguraikannya secara menyeluruh dan berhati-hati adalah satu-satunya cara untuk mengetahui, dan ia juga merupakan garis dasar yang diiktiraf dan disebarkan secara meluas. Saya akan memahami penerangan keseluruhan industri dan pencirian data besar daripada definisi ciri-ciri data besar secara mendalam menganalisis nilai data besar daripada perbincangan tentang nilai data besar; bermula dari isu privasi data besar yang istimewa dan penting Periksa permainan jangka panjang antara orang dan data dari perspektif.
Tahap kedua ialah teknologi ialah cara untuk menjelmakan nilai data besar dan asas kemajuan. Saya akan menerangkan keseluruhan proses data besar daripada pengumpulan, pemprosesan, penyimpanan hingga pembentukan hasil daripada pembangunan pengkomputeran awan, teknologi pemprosesan teragih, teknologi storan dan teknologi persepsi masing-masing.
Tahap ketiga ialah amalan, dan amalan ialah manifestasi nilai muktamad data besar. Saya akan menerangkan pemandangan indah yang telah ditunjukkan oleh data besar dan pelan tindakan untuk merealisasikannya yang akan datang dari empat aspek: data besar Internet, data besar kerajaan, data besar perusahaan dan data besar peribadi.
Ciri-ciri konsep data besar:Berbanding dengan aplikasi gudang data tradisional, analisis data besar mempunyai ciri volum data yang besar dan analisis pertanyaan yang kompleks. Artikel "Mengarkitek Data Besar: Cabaran, Situasi Semasa dan Prospek" yang diterbitkan dalam "Jurnal Sains Komputer" menyenaraikan beberapa ciri penting yang perlu ada pada platform analisis data besar, dan menganalisis platform pelaksanaan arus perdana semasa - pangkalan data selari, MapReduce dan hibrid. berdasarkan kedua-dua seni bina dianalisis dan diringkaskan, dan kelebihan dan kekurangan masing-masing pada masa yang sama, status penyelidikan semasa setiap arah dan usaha penulis dalam analisis data besar, dan penyelidikan masa depan diprospek. .
Empat "V" atau ciri data besar mempunyai empat tahap: Pertama, volum data adalah besar. Dari tahap TB ke tahap PB kedua, terdapat banyak jenis data. Log web, video, gambar, maklumat lokasi geografi, dsb. yang dinyatakan di atas. Ketiga, kelajuan pemprosesan adalah pantas dan peraturan 1 saat boleh dengan cepat mendapatkan maklumat bernilai tinggi daripada pelbagai jenis data Ini juga pada asasnya berbeza daripada teknologi perlombongan data tradisional. Keempat, selagi data itu digunakan dengan betul dan dianalisis dengan betul dan tepat, ia akan membawa pulangan yang bernilai tinggi. Industri meringkaskannya kepada empat "V" - Isipadu, Kepelbagaian, Halaju dan Nilai.
Pada tahap tertentu, data besar ialah teknologi canggih analisis data. Ringkasnya, keupayaan untuk mendapatkan maklumat berharga dengan cepat daripada pelbagai jenis data adalah teknologi data besar. Memahami perkara ini adalah penting, dan inilah yang mendorong potensi teknologi ini untuk menjangkau banyak perniagaan.
Penggunaan konsep data besar:
Data besar boleh dibahagikan kepada bidang seperti teknologi data besar, kejuruteraan data besar, sains data besar dan aplikasi data besar. Perkara yang paling ramai diperkatakan sekarang ialah teknologi data besar dan aplikasi data besar. Isu kejuruteraan dan saintifik masih belum diambil serius. Kejuruteraan data besar merujuk kepada kejuruteraan sistematik perancangan, pembinaan, operasi dan pengurusan data besar yang menumpukan pada penemuan dan pengesahan undang-undang data besar dan hubungannya dengan aktiviti semula jadi dan sosial semasa pembangunan dan pengendalian rangkaian data besar.
Internet Perkara, pengkomputeran awan, Internet mudah alih, Internet Kenderaan, telefon mudah alih, tablet, PC dan pelbagai penderia yang tersebar di setiap sudut bumi adalah semua sumber data atau kaedah pembawa.
Sesetengah contoh termasuk weblog, RFID, rangkaian penderia, rangkaian sosial, data sosial (terima kasih kepada revolusi data dalam masyarakat), teks Internet dan indeks carian Internet, pengelogan butiran panggilan, astronomi, sains atmosfera, genomik; , biogeokimia, biologi, dan lain-lain penyelidikan saintifik dan/atau antara disiplin, peninjauan ketenteraan, rekod perubatan, arkib video dan perdagangan elektronik berskala besar;
Peranan data besar
Bagi perusahaan am, peranan data besar dicerminkan terutamanya dalam dua aspek, iaitu analisis dan penggunaan data dan pembangunan pemprosesan sekunder projek. Dengan menganalisis data besar Maklumat Xijin, kami bukan sahaja boleh mencungkil data tersembunyi, tetapi juga menggunakan mesej tersembunyi ini untuk meningkatkan pangkalan pelanggan kami melalui jualan fizikal. Bagi pembangunan sekunder data, ia sering digunakan dalam projek perkhidmatan rangkaian Dengan meringkaskan dan menganalisis maklumat ini, kami boleh membangunkan pelan peribadi yang memenuhi keperluan pelanggan dan mencipta kaedah pengiklanan dan pemasaran baharu menggabungkan produk dan perkhidmatan melalui analisis data besar bukanlah suatu kebetulan. Mereka yang menyedari ini sering menjadi pemimpin dalam era data.
Ringkasnya, aplikasi data besar bukan sahaja menandakan kemajuan zaman, tetapi juga memberi inspirasi kepada orang ramai untuk menjalankan penerokaan yang lebih mendalam. Di samping itu, untuk penyelidikan data besar, selain kandungan di atas, ia juga perlu memahami tiga ciri data besar, iaitu skala besar, kelajuan operasi pantas dan kepelbagaian data. Dengan mengkaji ketiga-tiga aspek ini, ia bukan sahaja lebih mudah untuk memerhatikan sifat data, tetapi juga kondusif untuk operasi berkesan platform pemprosesan perisian.
Untuk lebih banyak pengetahuan berkaitan, sila lawati ruangan Soalan Lazim!
Atas ialah kandungan terperinci Apakah maksud data besar dalam buku 'Era Data Besar'?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!