


Pembangunan Java: Cara mengendalikan pengkomputeran teragih bagi data berskala besar
Pembangunan Java: Cara memproses pengkomputeran teragih bagi data berskala besar, contoh kod khusus diperlukan
Dengan kemunculan era data besar, permintaan untuk memproses data berskala besar juga semakin meningkat. Dalam persekitaran pengkomputeran bersendirian tradisional, sukar untuk memenuhi permintaan ini. Oleh itu, pengkomputeran teragih telah menjadi cara penting untuk memproses data besar Java, sebagai bahasa pengaturcaraan yang popular, memainkan peranan penting dalam pengkomputeran teragih.
Dalam artikel ini, kami akan memperkenalkan cara menggunakan Java untuk pengkomputeran teragih data berskala besar dan memberikan contoh kod khusus. Pertama, kita perlu membina persekitaran pengkomputeran teragih berdasarkan Hadoop. Kemudian, kami akan menunjukkan cara mengendalikan pengkomputeran teragih data berskala besar melalui contoh WordCount yang mudah.
- Membina persekitaran pengkomputeran teragih (berdasarkan Hadoop)
Untuk melaksanakan pengkomputeran teragih, anda perlu membina persekitaran pengkomputeran teragih terlebih dahulu. Di sini kami memilih untuk menggunakan Hadoop, rangka kerja pengkomputeran teragih sumber terbuka yang digunakan secara meluas.
Pertama, kita perlu memuat turun dan memasang Hadoop. Versi keluaran terkini boleh didapati daripada laman web rasmi Hadoop (https://hadoop.apache.org/). Selepas memuat turun, ikut arahan dalam dokumentasi rasmi untuk memasang dan mengkonfigurasi.
Selepas pemasangan selesai, kita perlu memulakan kluster Hadoop. Buka terminal baris arahan, tukar ke direktori sbin bagi direktori pemasangan Hadoop, dan laksanakan arahan berikut untuk memulakan kluster Hadoop:
./start-dfs.sh // 启动HDFS ./start-yarn.sh // 启动YARN
Selepas permulaan selesai, anda boleh melihat status kluster Hadoop dengan melawati http:// localhost:50070 dan http://localhost: 8088 untuk mengakses pengurus sumber YARN.
- Contoh: Pengkomputeran teragih WordCount
WordCount ialah program contoh klasik yang digunakan untuk mengira bilangan kejadian setiap perkataan dalam teks. Di bawah ini kami akan menggunakan Java untuk melakukan pengiraan diedarkan WordCount.
Mula-mula, buat projek Java dan perkenalkan pakej balang Hadoop.
Buat kelas WordCount dalam projek dan tulis pelaksanaan Map dan Reduce di dalamnya.
import java.io.IOException; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; import org.apache.hadoop.mapreduce.Reducer; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.fs.Path; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; public class WordCount { public static class WordCountMapper extends Mapper<Object, Text, Text, IntWritable>{ private final static IntWritable one = new IntWritable(1); private Text word = new Text(); public void map(Object key, Text value, Context context) throws IOException, InterruptedException { String[] words = value.toString().split(" "); for (String word : words) { this.word.set(word); context.write(this.word, one); } } } public static class WordCountReducer extends Reducer<Text, IntWritable, Text, IntWritable>{ private IntWritable result = new IntWritable(); public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException { int sum = 0; for (IntWritable val : values) { sum += val.get(); } result.set(sum); context.write(key, result); } } public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "word count"); job.setJarByClass(WordCount.class); job.setMapperClass(WordCountMapper.class); job.setCombinerClass(WordCountReducer.class); job.setReducerClass(WordCountReducer.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(IntWritable.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } }
Seterusnya, kita perlu menyediakan data input. Buat direktori input pada kelompok Hadoop dan letakkan fail teks yang memerlukan statistik ke dalam direktori.
Akhirnya, kami boleh menyerahkan tugas WordCount untuk dijalankan pada kelompok Hadoop menggunakan arahan berikut:
hadoop jar WordCount.jar WordCount <input-directory> <output-directory>
Ganti
Selepas operasi selesai, kami boleh melihat fail hasil dalam direktori output, yang mengandungi setiap perkataan dan bilangan kejadian yang sepadan.
Artikel ini memperkenalkan langkah asas untuk pengkomputeran teragih data berskala besar menggunakan Java dan menyediakan contoh WordCount khusus. Diharapkan pembaca dapat lebih memahami dan mengaplikasikan teknologi pengkomputeran teragih melalui pengenalan dan contoh artikel ini, supaya dapat memproses data berskala besar dengan lebih cekap.
Atas ialah kandungan terperinci Pembangunan Java: Cara mengendalikan pengkomputeran teragih bagi data berskala besar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Terdapat lima arah pekerjaan dalam industri Java, yang manakah sesuai untuk anda? Java, sebagai bahasa pengaturcaraan yang digunakan secara meluas dalam bidang pembangunan perisian, sentiasa popular. Disebabkan sifat merentas platform yang kukuh dan rangka kerja pembangunan yang kaya, pembangun Java mempunyai pelbagai peluang pekerjaan dalam pelbagai industri. Dalam industri Java, terdapat lima arah pekerjaan utama, termasuk pembangunan JavaWeb, pembangunan aplikasi mudah alih, pembangunan data besar, pembangunan terbenam dan pembangunan pengkomputeran awan. Setiap arah mempunyai ciri-ciri dan kelebihannya Lima arah akan dibincangkan di bawah.

Penting untuk pembangun Java: Mengesyorkan alat penyahkompilasi terbaik, contoh kod khusus diperlukan Pengenalan: Semasa proses pembangunan Java, kita sering menghadapi situasi di mana kita perlu menyahkompilasi kelas Java sedia ada. Nyahkompilasi boleh membantu kami memahami dan mempelajari kod orang lain, atau membuat pembaikan dan pengoptimuman. Artikel ini akan mengesyorkan beberapa alat penyahkompilasi Java yang terbaik dan menyediakan beberapa contoh kod khusus untuk membantu pembaca mempelajari dan menggunakan alat ini dengan lebih baik. 1. JD-GUIJD-GUI ialah sumber terbuka yang sangat popular

Kemahiran pembangunan Java didedahkan: Melaksanakan fungsi penyulitan dan penyahsulitan data Dalam era maklumat semasa, keselamatan data telah menjadi isu yang sangat penting. Untuk melindungi keselamatan data sensitif, banyak aplikasi menggunakan algoritma penyulitan untuk menyulitkan data. Sebagai bahasa pengaturcaraan yang sangat popular, Java juga menyediakan perpustakaan yang kaya dengan teknologi dan alatan penyulitan. Artikel ini akan mendedahkan beberapa teknik untuk melaksanakan fungsi penyulitan dan penyahsulitan data dalam pembangunan Java untuk membantu pembangun melindungi keselamatan data dengan lebih baik. 1. Pemilihan algoritma penyulitan data Java menyokong banyak

Dengan perkembangan teknologi IoT, semakin banyak peranti dapat menyambung ke Internet dan berkomunikasi serta berinteraksi melalui Internet. Dalam pembangunan aplikasi IoT, Protokol Pengangkutan Telemetri Beratur Mesej (MQTT) digunakan secara meluas sebagai protokol komunikasi ringan. Artikel ini akan memperkenalkan cara menggunakan pengalaman praktikal pembangunan Java untuk melaksanakan fungsi IoT melalui MQTT. 1. Apakah MQT? QTT ialah protokol penghantaran mesej berdasarkan model terbitkan/langgan. Ia mempunyai reka bentuk yang ringkas dan overhed yang rendah, dan sesuai untuk senario aplikasi yang menghantar sejumlah kecil data dengan cepat.

Java ialah bahasa pengaturcaraan yang digunakan secara meluas dalam bidang pembangunan perisian yang kaya dengan perpustakaan dan fungsi yang berkuasa boleh digunakan untuk membangunkan pelbagai aplikasi. Pemampatan dan pemangkasan imej adalah keperluan biasa dalam pembangunan aplikasi web dan mudah alih. Dalam artikel ini, kami akan mendedahkan beberapa teknik pembangunan Java untuk membantu pembangun melaksanakan fungsi pemampatan dan pemangkasan imej. Mula-mula, mari kita bincangkan pelaksanaan pemampatan imej. Dalam aplikasi web, gambar selalunya perlu dihantar melalui rangkaian. Jika imej terlalu besar, ia akan mengambil masa yang lebih lama untuk memuatkan dan menggunakan lebih lebar jalur. Oleh itu, kami

Sebagai bahasa pengaturcaraan yang sangat popular, Java sentiasa digemari oleh semua orang. Apabila saya mula belajar pembangunan Java, saya pernah menghadapi masalah-bagaimana untuk membina sistem langganan mesej. Dalam artikel ini, saya akan berkongsi pengalaman saya dalam membina sistem langganan mesej dari awal, dengan harapan dapat membantu pemula Java yang lain. Langkah 1: Pilih baris gilir mesej yang sesuai Untuk membina sistem langganan mesej, anda perlu memilih baris gilir mesej yang sesuai. Barisan mesej yang lebih popular pada masa ini di pasaran termasuk ActiveMQ,

Panduan langkah demi langkah untuk melaksanakan pengkomputeran teragih dengan GoLang: Pasang rangka kerja pengkomputeran teragih (seperti Celery atau Luigi) Cipta fungsi GoLang yang merangkum logik tugasan Tentukan baris gilir tugasan Serahkan tugas ke baris gilir Sediakan fungsi pengendali tugas

Berkongsi pengalaman praktikal dalam pembangunan Java: Membina fungsi pengumpulan log teragih Pengenalan: Dengan perkembangan pesat Internet dan kemunculan data berskala besar, aplikasi sistem teragih menjadi semakin meluas. Dalam sistem teragih, pengumpulan dan analisis log adalah bahagian yang sangat penting. Artikel ini akan berkongsi pengalaman membina fungsi pengumpulan log teragih dalam pembangunan Java, dengan harapan dapat membantu pembaca. 1. Pengenalan latar belakang Dalam sistem teragih, setiap nod menjana sejumlah besar maklumat log. Maklumat log ini berguna untuk pemantauan prestasi sistem, penyelesaian masalah dan analisis data.
