环境: centos6.5 mysql5.6 gearman简介: Gearman是一个支持分布式的任务分发框架。设计简洁,获得了非常广泛的支持。一个典型的Gearman应用包括以下这些部分: Gearman Job Server:Gearman核心程序,以守护进程形式运行在后台 Gearman Client:可以理解为
环境:
centos6.5
mysql5.6
gearman简介:
Gearman是一个支持分布式的任务分发框架。设计简洁,获得了非常广泛的支持。一个典型的Gearman应用包括以下这些部分:
Gearman Job Server:Gearman核心程序,以守护进程形式运行在后台
Gearman Client:可以理解为任务的收件员,比如我要在后台执行一个发送邮件的任务,可以在程序中调用一个Gearman Client并传入邮件的信息,然后就可以将执行结果立即展示给用户,而任务本身会慢慢在后台运行。
Gearman Worker:任务的真正执行者,一般需要自己编写具体逻辑并通过守护进程方式运行,Gearman Worker接收到Gearman Client传递的任务内容后,会按顺序处理。
设计思路:
首先利用mysql UDF(通过了lib_mysqludf_json和gearman-mysql-udf的组合实现)在mysql中的数据发生改变时触动触发器将数据传入Gearman中,这时的mysql相当于Gearman的clinet。然后运行自己编写的php程序作为worker,将Gearman中的数据传到Redis中去,这时的Redis相当于是Gearman的consumer。
1、安装gearman
实验中的系统yum源在centos6.5自带的网络yum源的基础上,增加了epel的源,EPEL (Extra Packages for Enterprise Linux,企业版Linux的额外软件包) 是Fedora小组维护的一个软件仓库项目,为RHEL/CentOS提供他们默认不提供的软件包。使用这个源可以免去很多麻烦,省去源码编译的麻烦,需要注意的是,不论是使用centos自带的网络yum源还是epel扩展源,都需要你的IP能够访问到公网。
安装gearman、php、php的gearman扩展、nc工具
yum install -y php-pecl-gearman libgearman libgearman-devel gearmand nc
启动gearman服务
/etc/init.d/gearmand start
验证gearman是否成功启动,如果返回的结果中有4730端口,那么表示服务已经正常启动了
[root@hadoop1 ~]# netstat -alnutp |grep gearman
2、模拟Gearman的工作原理:
使用下列命令查看Gearman的队列
watch -n 1 "(echo status; sleep 0.1) | nc 127.0.0.1 4730"
结果如下
writeLog 0 0 0
四列含义:1-任务名称;2-等待队列任务数;3-运行中的任务数;4-正在运行的worker进程数;
编译一段php代码模拟Gearman的Client:client.php
<?php $client = new GearmanClient(); $client->addServer(); $client->doBackground('writeLog', 'Log content'); echo '文件已经在后台操作'; echo "\n";
执行client.php
php client.php
这时,再次查看Gearman的队列,发现等待队列中有一个任务
writeLog 1 0 0
编写一段php代码模拟Gearman的Worker:worker.php
该worker的作用是将客户端传递给Gearman的字符串'Log content'写入到当前目录下的gearman.log文件中
<?php $worker = new GearmanWorker(); $worker->addServer(); $worker->addFunction('writeLog', 'writeLog'); while($worker->work()); function writeLog($job) { $log = $job->workload(); file_put_contents(__DIR__ . '/gearman.log', $log . "\n", FILE_APPEND | LOCK_EX); }
以nohup的方式后台启动worker.php
nohup php worker.php &
再次查看Gearman的队列,发现等待的任务变成0,worker进程变成了1,gearman.log有了内容
writeLog 0 0 1
[root@hadoop1 ~]# cat gearman.log Log content
3、安装mysql-server、mysql、php-mysql(php连接mysql的驱动,非必须,这里是为了稍后用程序比较从Redis和Mysql中分别读取数据的效率)。实验中,由于我的机子上之前已将安装了mysql5.6,所以就直接使用mysql5.6做实验了。当然也可以使用yum开安装mysql,可能安装的mysql版本不是5.6,但是完全没有关系。
安装mysql相关软件
yum install -y mysql-server mysql php-mysql
启动mysql
/etc/init.d/mysql start
4、安装lib_mysqludf_json
wget https://github.com/mysqludf/lib_mysqludf_json/archive/master.zip mv master master.zip unzip master.zip cd lib_mysqludf_json-master rm -rf lib_mysqludf_json.so gcc $(mysql_config --cflags) -shared -fPIC -o lib_mysqludf_json.so lib_mysqludf_json.c
这时重新编译生成了lib_mysqludf_json.so,然后需要把lib_mysqludf_json.so拷贝到mysql的插件目录下,查看mysql的插件目录:
[root@hadoop1 ~]# mysql -u root -pupbjsxt --execute="show variables like '%plugin%';" +---------------+--------------------------+ | Variable_name | Value | +---------------+--------------------------+ | plugin_dir | /usr/lib64/mysql/plugin/ | +---------------+--------------------------+
[root@hadoop1 lib_mysqludf_json-master]# cp lib_mysqludf_json.so /usr/lib64/mysql/plugin/
5、安装gearman-mysql-udf
wget https://launchpad.net/gearman-mysql-udf/trunk/0.6/+download/gearman-mysql-udf-0.6.tar.gz tar xf gearman-mysql-udf-0.6.tar.gz -C ./ cd gearman-mysql-udf-0.6 ./configure --with-mysql=/usr/bin/mysql_config --libdir=/usr/lib64/mysql/plugin/ make && make install
该插件直接安装到了mysql的插件目录下。
6、连入mysql,创建对应的function、trigger及设置gearman server信息
[root@hadoop1 ~]# mysql -u root -p****** mysql> CREATE FUNCTION json_object RETURNS STRING SONAME 'lib_mysqludf_json.so'; mysql> CREATE FUNCTION gman_do_background RETURNS STRING SONAME 'libgearman_mysql_udf.so'; mysql> CREATE FUNCTION gman_servers_set RETURNS STRING SONAME 'libgearman_mysql_udf.so' ## 为javashop中的test表建立触发器 mysql> use javashop; mysql> describe test; +-------+----------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +-------+----------+------+-----+---------+-------+ | id | int(11) | YES | | NULL | | | name | char(20) | YES | | NULL | | +-------+----------+------+-----+---------+-------+ 2 rows in set (0.00 sec) mysql> source trigger.sql ## 设置gearman server信息 mysql>SELECT gman_servers_set('127.0.0.1:4730');
trigger.sql脚本文件内容如下
DELIMITER $$ CREATE TRIGGER datatoredis AFTER UPDATE ON test FOR EACH ROW BEGIN SET @ret=gman_do_background('syncToRedis', json_object(NEW.id as `id`, NEW.name as `name`)); END$$ DELIMITER ;
7、在mysql中更新一条数据,然后查看gearman的队列
mysql> update test set name='redis' where id=10; Query OK, 1 row affected (0.03 sec) Rows matched: 1 Changed: 1 Warnings: 0
writeLog 0 0 1 syncToRedis 1 0 0
可见mysql触发器已经成功的将数据传入到gearman中了。
8、安装redis、php-pecl-redis(php连接redis的驱动)
yum install php-pecl-redis redis -y
启动redis
/etc/init.d/redis start
登录redis客户端,查看当前内存中的数据
[root@hadoop1 ~]# redis-cli redis 127.0.0.1:6379> keys * (empty list or set)
这时,redis中并没有数据。
9、编写一个worker程序,负责将gearman中的数据传入到redis中去:redis_worker.php
<?php $worker = new GearmanWorker(); $worker->addServer(); $worker->addFunction('syncToRedis', 'syncToRedis'); $redis = new Redis(); $redis->connect('127.0.0.1'); while($worker->work()); function syncToRedis($job) { global $redis; $workString = $job->workload(); $work = json_decode($workString); if(!isset($work->id)){ return false; } $redis->set($work->id, $workString); }
10、以nohup的方式后台运行redis_worker.php
nohup php redis_worker.php &
这时,再查看gearman的队列
writeLog 0 0 1 syncToRedis 0 0 1
发现syncToRedis任务之前等待的任务数变为了0,正在运行的worker进程数变为了1。
检查redis中是否缓存了数据
[root@hadoop1 ~]# redis-cli redis 127.0.0.1:6379> keys * 1) "10" redis 127.0.0.1:6379> get 10 "{\"id\":10,\"name\":\"redis\"}"
发现redis中已经成功的缓存了mysql中更新的数据,至此功能实现。
11、从redis中读取数据和从mysql中读取数据性能比较
编写php代码,从redis中读取数据:php_redis.php
<?php $stime=microtime(true); //获取程序开始执行的时间 $redis = new Redis(); $redis->connect('127.0.0.1'); echo $redis->get('10'); echo "\n"; $redis->close(); $etime=microtime(true);//获取程序执行结束的时间 $total=$etime-$stime; //计算差值 echo "$total".'秒'; echo "\n"; ?>
编写php代码,从mysql中读取数据:php_mysql.php
<?php $stime=microtime(true); //获取程序开始执行的时间 $con = mysql_connect("127.0.0.1","root","******"); $r2 = mysql_select_db("javashop"); $result = mysql_query("SELECT * FROM test limit 1"); while ($row = mysql_fetch_array($result)) { echo $row['id'] . " --> " . $row['name']; echo "\n"; } mysql_close($con); $etime=microtime(true);//获取程序执行结束的时间 $total=$etime-$stime; //计算差值 echo "$total".'秒'; echo "\n" ?>
分别运行两个php程序
[root@hadoop1 ~]# php php_redis.php {"id":10,"name":"redis"} 0.00059199333190918秒 [root@hadoop1 ~]# php php_mysql.php 10 --> redis 0.0043718814849854秒 [root@hadoop1 ~]# bc <<< 0.0043718814849854/0.00059199333190918 7
通过对一条记录的查询,可以发现,从mysql中获取数据的时长是redis中获取数据时长的7倍,可见性能的提升几乎达一个数量级。
注意点:
亲测印证了mysql在重启后会丢失之前设置的gearman server的信息,解决办法如下:
在mysql的datadir目录下创建init_file.sql文件,内容为gearman server的信息的设置
echo "SELECT gman_servers_set('127.0.0.1:4730');" > /var/lib/mysql/init_file.sql
然后在mysql的配置文件的[mysqld]项中添加如下内容
init-file=/var/lib/mysql/init_file.sql
然后重启mysql,更新一条记录再试试看!
参考:http://avnpc.com/pages/mysql-replication-to-redis-by-gearman
PS:完成了第一篇博客,希望大家多多指教,祝生活愉快!