Cara mengkonfigurasi sistem fail teragih di Linux
Pengenalan:
Dengan pertumbuhan berterusan volum data dan keperluan perniagaan yang berubah-ubah, sistem fail bersendirian tradisional tidak lagi dapat memenuhi keperluan pemprosesan data berskala besar moden. Sistem fail yang diedarkan telah menjadi pilihan pertama untuk pusat data yang besar kerana kebolehpercayaan, prestasi dan kebolehskalaan yang tinggi. Artikel ini akan memperkenalkan cara mengkonfigurasi sistem fail teragih biasa pada Linux, dengan contoh kod.
1. Pengenalan kepada sistem fail teragih
Sistem fail teragih ialah sistem fail yang menyimpan data secara berselerak pada berbilang nod dan berkongsi serta mengakses data melalui rangkaian. Ia menggunakan sumber storan dan kuasa pengkomputeran berbilang mesin untuk menyediakan keupayaan pengembangan mendatar untuk menampung jumlah data berskala besar dan keperluan serentak pengguna.
Sistem fail edaran biasa termasuk Hadoop HDFS, Google GFS, Ceph, dsb. Mereka mempunyai ciri sendiri dan senario yang boleh digunakan, tetapi mereka mempunyai banyak persamaan dalam konfigurasi dan penggunaan.
2. Pasang dan konfigurasikan sistem fail yang diedarkan
Mengambil Hadoop HDFS sebagai contoh, berikut ialah langkah-langkah untuk mengkonfigurasi sistem fail yang diedarkan di Linux:
Muat turun dan pasang Hadoop
Mula-mula, muat turun Hadoop terkini daripada Pakej binari tapak web rasmi Apache Hadoop dan ekstrak ke direktori yang sesuai.
$ tar -xzvf hadoop-3.x.x.tar.gz $ cd hadoop-3.x.x
Konfigurasikan pembolehubah persekitaran
Edit fail ~/.bashrc
dan tetapkan pembolehubah persekitaran Hadoop. ~/.bashrc
文件,设置Hadoop的环境变量。
$ vi ~/.bashrc
在文件末尾添加以下内容:
export HADOOP_HOME=/path/to/hadoop-3.x.x export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
保存并退出,然后执行以下命令使环境变量生效:
$ source ~/.bashrc
修改Hadoop配置文件
进入Hadoop的配置目录,编辑hadoop-env.sh
文件,配置JAVA_HOME环境变量。
$ cd $HADOOP_HOME/etc/hadoop $ vi hadoop-env.sh
将以下行修改为对应的Java安装路径:
export JAVA_HOME=/path/to/java
然后,编辑core-site.xml
文件,配置HDFS的默认文件系统和数据存储位置。
$ vi core-site.xml
添加以下配置:
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/path/to/tmp</value> </property> </configuration>
最后,编辑hdfs-site.xml
$ vi hdfs-site.xml
<configuration> <property> <name>dfs.replication</name> <value>3</value> </property> </configuration>
$ hdfs namenode -format
Ubah suai fail konfigurasi Hadoop
hadoop-env.sh
untuk mengkonfigurasi pembolehubah persekitaran JAVA_HOME. $ start-dfs.sh
rrreee
Kemudian, edit fail core-site.xml
untuk mengkonfigurasi sistem fail lalai dan lokasi storan data HDFS.
Akhir sekali, edit fail hdfs-site.xml
dan konfigurasikan parameter berkaitan HDFS.
Tambahkan konfigurasi berikut:
rrreee
Atas ialah kandungan terperinci Bagaimana untuk mengkonfigurasi sistem fail yang diedarkan pada Linux. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!