Cara mengkonfigurasi pangkalan data teragih di Linux
Dengan peningkatan jumlah data dan keperluan data, pangkalan data nod tunggal tradisional tidak lagi dapat memenuhi keperluan aplikasi moden. Kemunculan pangkalan data teragih menyediakan penyelesaian untuk pengurusan dan pertanyaan data besar-besaran. Artikel ini akan memberi tumpuan kepada cara mengkonfigurasi pangkalan data teragih di Linux dan menyediakan beberapa contoh kod klasik.
Pertama sekali, kita perlu memilih perisian pangkalan data teragih yang sesuai. Perisian pangkalan data teragih biasa termasuk Hadoop, Cassandra, MongoDB, dll. Artikel ini menggunakan Cassandra sebagai contoh untuk demonstrasi.
Memasang Cassandra pada Linux adalah sangat mudah. Kita boleh memasangnya melalui pengurus pakej seperti apt atau yum.
Sebagai contoh, pada Ubuntu, anda boleh menggunakan arahan berikut untuk memasang:
sudo apt-get install cassandra
Dalam pangkalan data teragih, biasanya terdapat berbilang nod yang membentuk kluster. Setiap nod bertanggungjawab untuk menyimpan sebahagian daripada data dan menyediakan perkhidmatan pertanyaan. Untuk mengkonfigurasi kluster pangkalan data yang diedarkan, kita perlu menyediakan nod induk, dan nod lain akan menyertai kluster sebagai nod hamba.
Pertama, kita perlu mengedit fail konfigurasi Cassandra cassandra.yaml, yang biasanya terdapat dalam direktori /etc/cassandra. Kita boleh menggunakan editor teks untuk membuka fail dan membuat pengubahsuaian berikut:
cluster_name: 'my_cluster' seed_provider: - class_name: org.apache.cassandra.locator.SimpleSeedProvider parameters: - seeds: "主节点IP地址"
Antaranya, cluster_name mewakili nama cluster dan boleh dinamakan sewenang-wenangnya. seed_provider mewakili pembekal nod benih (nod induk), kita perlu menggantikan alamat IP nod induk dengan alamat IP sebenar.
Seterusnya, kita perlu mengkonfigurasi perkara yang sama pada setiap nod. Hanya konfigurasikan alamat IP nod induk sebagai pembekal_benih untuk nod lain. Simpan fail konfigurasi pada setiap nod dan mulakan semula perkhidmatan Cassandra.
Dalam pangkalan data teragih, data biasanya disusun dan disimpan dalam bentuk jadual. Untuk mencipta jadual, laksanakan arahan berikut dalam antara muka baris arahan Cassandra (cqlsh):
CREATE KEYSPACE my_keyspace WITH replication = {'class': 'SimpleStrategy', 'replication_factor': 1}; USE my_keyspace; CREATE TABLE my_table ( id INT PRIMARY KEY, name TEXT, age INT );
Perintah di atas akan mencipta ruang kekunci bernama my_keyspace dan mencipta jadual bernama my_table di bawah ruang kekunci ini. Jadual mengandungi tiga lajur: id, nama dan umur, dengan lajur id ditakrifkan sebagai kunci utama.
Dengan contoh kod berikut, kita boleh memasukkan dan bertanya data:
from cassandra.cluster import Cluster cluster = Cluster(['节点IP地址']) session = cluster.connect('my_keyspace') # 插入数据 insert_query = "INSERT INTO my_table (id, name, age) VALUES (?, ?, ?)" session.execute(insert_query, (1, 'Alice', 25)) # 查询数据 select_query = "SELECT * FROM my_table WHERE id = ?" result = session.execute(select_query, (1,)) for row in result: print(row.name, row.age)
Contoh kod di atas menggunakan perpustakaan pemacu cassandra Python untuk manipulasi data. Pertama, kita perlu mencipta objek Kluster yang mengandungi alamat IP semua nod. Kemudian, cipta objek Sesi melalui objek Kluster dan nyatakan ruang kekunci yang digunakan (my_keyspace). Seterusnya, kita boleh menggunakan kaedah laksana untuk melaksanakan pernyataan pertanyaan CQL.
Pangkalan data yang diedarkan akan mengedarkan data ke nod yang berbeza untuk mencapai pengimbangan beban dan ketersediaan yang tinggi. Dalam Cassandra, pengedaran data adalah berdasarkan pembahagian cincang, yang mengagihkan data secara sama rata ke nod yang berbeza.
Untuk meningkatkan prestasi pertanyaan, kami boleh mencipta indeks komposit atau menggunakan kekunci partition untuk pertanyaan. Indeks komposit mencipta indeks pada berbilang lajur untuk mempercepatkan pertanyaan. Kunci partition menentukan pengagihan data antara nod Pemilihan munasabah kunci partition boleh meningkatkan kesan pengimbangan beban.
Ringkasan
Artikel ini menerangkan cara mengkonfigurasi pangkalan data teragih di Linux dan menyediakan Cassandra sebagai contoh. Dengan mengkonfigurasi kluster pangkalan data teragih, mencipta jadual, memasukkan dan menyoal data, kami boleh menggunakan sepenuhnya kelebihan pangkalan data teragih untuk memenuhi keperluan penyimpanan dan pertanyaan data berskala besar. Berikut ialah langkah utama dan kod contoh yang terlibat dalam artikel ini:
sudo apt-get install cassandra
Edit fail konfigurasi Cassandra parameter pembekal_benih .
Laksanakan kenyataan CREATE KEYSPACE dan CREATE TABLE dalam antara muka baris arahan Cassandra.
Gunakan perpustakaan pemacu cassandra untuk melaksanakan operasi data.
Saya harap artikel ini dapat membantu pembaca memahami konfigurasi dan penggunaan pangkalan data teragih, dan berjaya membina kluster pangkalan data teragih dalam persekitaran Linux.
Atas ialah kandungan terperinci Bagaimana untuk mengkonfigurasi pangkalan data yang diedarkan di Linux. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!