這篇文章帶給大家的內容是關於php如何使用命令列實現異步多進程模式的任務處理(程式碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。
用PHP來實現非同步任務一直是個難題,現有的解決方案中:PHP知名的非同步框架有 swoole 和 Workerman,但都是無法在 web 環境中直接使用的,即便強行搭建 web 環境,非同步呼叫也是使用多進程模式實現的。但有時真的不需要用啟動服務的方式,讓服務端一直等待客戶端訊息,何況中間還不能改動服務端程式碼。本文就介紹一下不使用任何框架和第三方函式庫的情況下,在 CLI 環境中如何實現多進程以及在web環境中的非同步呼叫。
在 web 環境的非同步呼叫
#常用的方式有兩種
1. 使用 socket 連結
這種方式就是典型的C/S架構,需要有服務端支援。
// 1. 创建socket套接字
$socket = socket_create(AF_INET, SOCK_STREAM, SOL_TCP);
// 2. 进行socket连接
socket_connect($socket, '127.0.0.1', '3939');
//socket_set_nonblock($socket); // 以非阻塞模式运行,由于在客户端不实用,所以这里不考虑
// 3. 向服务端发送请求
socket_write($socket, $request, strlen($request));
// 4. 接受服务端的回应消息(忽略非阻塞的情况,如果服务端不是提供异步服务,那这一步可以省略)
$recv = socket_read($socket, 2048);
// 5. 关闭socket连接
socket_close($socket);
登入後複製
2. 使用 popen 開啟進程管道
這種方式是使用作業系統指令,由作業系統直接執行。
本文討論的非同步呼叫就是使用這種方式。
$sf = '/path/to/cli_async_task.php'; //要执行的脚本文件
$op = 'call'; //脚本文件接收的参数1
$data = base64_encode(serialize(['TestTask', 'arg1', 'arg2'])); //脚本文件接收的参数2
pclose(popen("php '$sf' --op $op --data $data &", 'r')); //打开之后接着就关闭进程管道,让该进程以守护模式运行
echo PHP_EOL.'异步任务已执行。'.PHP_EOL;
登入後複製
這種方式的優點就是:一步解決,目前程序不需要任何開銷。
缺點也很明顯:無法追蹤任務腳本的運作狀態。
所以重頭戲會是在執行任務的腳本檔案上,以下就介紹任務處理和多進程的實作方式。
在CLI
環境的多進程任務處理
注意:多進程模式只支援Linux,不支援Windows! !
這裡會從0開始(未使用任何框架和類別庫)介紹每一個步驟,最後會附帶一份完整的程式碼。
1. 建立腳本
在PHP就是呼叫 set_exception_handler set_error_handler register_shutdown_function 這三個函數,然後寫上自訂的處理方法。
2. 多進程處理
PHP 建立多進程是使用 pcntl_fork 函數,該函數會 fork 一份當前進程(影分身術),所以就有了兩個進程,目前進程是主進程(本體),fork 出的進程是子進程(影分身)。要注意的是兩個行程程式碼環境是一樣的,兩個行程都執行到了 pcntl_fork 函數位置。差別就是 getmypid 所獲得的進程號不一樣,最重要的區分是當呼叫 pcntl_fork函數時,子程序所獲得的回傳值是 0,而主程序獲得的是子程序的程序號 pid。
好了,當我們知道誰是子行程後,就可以讓該子行程執行任務了。
那麼主程序是如何得知子程序的狀態呢?
使用 pcntl_wait。此函數有兩個參數 $status 和 $options ,$status 是引用類型,用來儲存子進程的狀態,$options 有兩個可選常數WNOHANG| WUNTRACED,分別表示不等待子進程結束立即返回和等待子進程結束。很明顯使用WUNTRACED會阻塞主進程。 (也可以使用 pcntl_waitpid 函數取得特定 pid 子程序狀態)
在多重行程中,主行程要做的就是管理每個子程序的狀態,否則子程序很可能無法退出而變成殭屍行程。
關於多進程間的訊息通訊
這一塊需要涉及具體的業務邏輯,所以只能簡單的提一下。不考慮使用第三方例如 redis
等服務的情況下,PHP原生可以實現就是管道通訊和共享記憶體等方式。實作起來都比較簡單,缺點就是可使用的資料容量有限,只能用簡單文字協定交換資料。
如何手動結束所有行程任務
如果多进程处理不当,很可能导致进程任务卡死,甚至占用过多系统资源,此时只能手动结束进程。
除了一个个的根据进程号来结束,还有一个快速的方法是首先在任务脚本里自定义进程名称,就是调用cli_set_process_title函数,然后在命令行输入:ps aux|grep cli_async_worker |grep -v grep|awk '{print $2}'|xargs kill -9 (里面的 cli_async_worker 就是自定义的进程名称),这样就可以快速结束多进程任务了。
以下是完整的任务执行脚本代码:
可能无法直接使用,需要修改的地方有:
脚本目录和日志目录常量
自动加载任务类的方法(默认是加载脚本目录中以Task
结尾的文件)
其他的如:错误和日志处理方式和文本格式就随意吧...
如果命名管道文件设置有错误,可能导致进程假死,你可能需要手动删除进程管道通信的代码。
多进程的例子:execAsyncTask('multi', [ 'test' => ['a', 'b', 'c'], 'grab' => [['url' => 'https://www.baidu.com', 'callback' => 'http://localhost']] ]);。执行情况可以在日志文件中查看。execAsyncTask函数参考【__使用popen打开进程管道__】。
<?php
error_reporting(E_ALL ^ E_NOTICE ^ E_USER_WARNING);
@ini_set('display_errors', 0);
@ini_set('date.timezone', 'PRC');
chdir(__DIR__);
/* 任务脚本目录 */
defined('TASK_PATH') or define('TASK_PATH', realpath(__DIR__ .'/tasks'));
/* 任务日志目录 */
defined('TASK_LOGS_PATH') or define('TASK_LOGS_PATH', __DIR__ .'/tasks/logs');
if (!is_dir(TASK_LOGS_PATH)) @mkdir(TASK_LOGS_PATH, 0777, true);
set_exception_handler(function($e) {
$time = date('H:i:s', time());
$msg = sprintf(''. '<h3>[%s] %s (%s)</h3>'. "\n". '<pre class="brush:php;toolbar:false">%s
',
$time, $e->getMessage(), $e->getCode(), $e->getTraceAsString()
);
file_put_contents(TASK_LOGS_PATH .'/exception-'.date('Ymd').'.log', $msg.PHP_EOL, FILE_APPEND|LOCK_EX);
});
set_error_handler(function($errno, $errmsg, $filename, $line) {
if (!(error_reporting() & $errno)) return;
ob_start();
debug_print_backtrace();
$backtrace = ob_get_contents(); ob_end_clean();
$datetime = date('Y-m-d H:i:s', time());
$msg = <<
$header) {
if (!is_numeric($_k))
$header = sprintf('%s: %s', $_k, $header);
$_headers .= $header . "\r\n";
}
}
$headers = "Connection: close\r\n" . $_headers;
$opts = array(
'http' => array(
'method' => strtoupper(@$job['method'] ?: 'get'),
'content' => @$job['data'] ?: null,
'header' => $headers,
'user_agent' => @$job['args']['user_agent'] ?: 'HTTPGRAB/1.0 (compatible)',
'proxy' => @$job['args']['proxy'] ?: null,
'timeout' => intval(@$job['args']['timeout'] ?: 120),
'protocol_version' => @$job['args']['protocol_version'] ?: '1.1',
'max_redirects' => 3,
'ignore_errors' => true
)
);
$ret = @file_get_contents($url, false, stream_context_create($opts));
//debug_log($url.' -->'.strlen($ret));
if ($ret and isset($job['callback'])) {
$postdata = http_build_query(array(
'msg_id' => @$job['msg_id'] ?: 0,
'url' => @$job['url'],
'result' => $ret
));
$opts = array(
'http' => array(
'method' => 'POST',
'header' => 'Content-type:application/x-www-form-urlencoded'. "\r\n",
'content' => $postdata,
'timeout' => 30
)
);
file_get_contents($job['callback'], false, stream_context_create($opts));
//debug_log(json_encode(@$http_response_header));
//debug_log($job['callback'].' -->'.$ret2);
}
return $ret;
}
function clean($tmpdirs, $expires=3600*24*7) {
$ret = [];
foreach ((array)$tmpdirs as $tmpdir) {
$ret[$tmpdir] = 0;
foreach (glob($tmpdir.DIRECTORY_SEPARATOR.'*') as $_file) {
if (fileatime($_file) < (time()-$expires)) {
if (@unlink($_file)) $ret[$tmpdir]++;
}
}
}
return $ret;
}
function backup($file, $dest) {
$zip = new \ZipArchive();
if (!$zip->open($file, \ZipArchive::CREATE)) {
return false;
}
_backup_dir($zip, $dest);
$zip->close();
return $file;
}
function _backup_dir($zip, $dest, $sub='') {
$dest = rtrim($dest, DIRECTORY_SEPARATOR) . DIRECTORY_SEPARATOR;
$sub = rtrim($sub, DIRECTORY_SEPARATOR) . DIRECTORY_SEPARATOR;
$dir = opendir($dest);
if (!$dir) return false;
while (false !== ($file = readdir($dir))) {
if (is_file($dest . $file)) {
$zip->addFile($dest . $file, $sub . $file);
} else {
if ($file != '.' and $file != '..' and is_dir($dest . $file)) {
//$zip->addEmptyDir($sub . $file . DIRECTORY_SEPARATOR);
_backup_dir($zip, $dest . $file, $file);
}
}
}
closedir($dir);
return true;
}
function execute_task($op, $data) {
debug_log('Start...');
$t1 = microtime(true);
switch($op) {
case 'call': //执行任务脚本类
$cmd = $data;
if (is_string($cmd) and class_exists($cmd)) $cmd = new $cmd;
elseif (is_array($cmd)) {
if (is_string($cmd[0]) and class_exists($cmd[0])) $cmd[0] = new $cmd[0];
}
$ret = call($cmd);
break;
case 'grab': //抓取网页
if (is_string($data)) $data = ['url' => $data];
if (is_array($data)) $ret = grab($data);
else throw new \Exception('无效的命令参数!');
break;
case 'clean': //清理缓存文件夹:dirs 需要清理的文件夹列表,expires 过期时间(秒,默认7天)
if (isset($data['dirs'])) {
$ret = clean($data['dirs'], @$data['expires']);
} else {
$ret = clean($data);
}
break;
case 'backup': //备份文件:zip 备份到哪个zip文件,dest 需要备份的文件夹
if (isset($data['zip']) and is_dir($data['dest']))
$ret = backup($data['zip'], $data['dest']);
else
throw new \Exception('没有指定需要备份的文件!');
break;
case 'require': //加载脚本文件
if (is_file($data)) $ret = require($data);
else throw new \Exception('不是可请求的文件!');
break;
case 'test':
sleep(rand(1, 5));
$ret = ucfirst(strval($data)). '.PID:'. getmypid();
break;
case 'multi': //多进程处理模式
$results = $childs = [];
$fifo = TASK_LOGS_PATH . DIRECTORY_SEPARATOR . 'pipe.'. posix_getpid();
if (!file_exists($fifo)) {
if (!posix_mkfifo($fifo, 0666)) { //开启进程数据通信管道
throw new Exception('make pipe failed!');
}
}
//$shmid = shmop_open(ftok(__FILE__, 'h'), 'c', 0644, 4096); //共享内存
//shmop_write($shmid, serialize([]), 0);
//$data = unserialize(shmop_read($shmid, 0, 4096));
//shmop_delete($shmid);
//shmop_close($shmid);
foreach($data as $_op => $_datas) {
$_datas = (array)$_datas; //data 格式为数组表示一个 op 有多个执行数据
foreach($_datas as $_data) {
$pid = pcntl_fork();
if ($pid == 0) { //子进程中执行任务
$_ret = execute_task($_op, $_data);
$_pid = getmypid();
$pipe = fopen($fifo, 'w'); //写
//stream_set_blocking($pipe, false);
$_ret = serialize(['pid' => $_pid, 'op' => $_op, 'args' => $_data, 'result' => $_ret]);
if (strlen($_ret) > 4096) //写入管道的数据最大4K
$_ret = serialize(['pid' => $_pid, 'op' => $_op, 'args' => $_data, 'result' => '[RESPONSE_TOO_LONG]']);
//debug_log('write pipe: '.$_ret);
fwrite($pipe, $_ret.PHP_EOL);
fflush($pipe);
fclose($pipe);
exit(0); //退出子进程
} elseif ($pid > 0) { //主进程中记录任务
$childs[] = $pid;
$results[$pid] = 0;
debug_log('fork by child: '.$pid);
//pcntl_wait($status, WNOHANG);
} elseif ($pid == -1) {
throw new Exception('could not fork at '. getmygid());
}
}
}
$pipe = fopen($fifo, 'r+'); //读
stream_set_blocking($pipe, true); //阻塞模式,PID与读取的管道数据可能会不一致。
$n = 0;
while(count($childs) > 0) {
foreach($childs as $i => $pid) {
$res = pcntl_waitpid($pid, $status, WNOHANG);
if (-1 == $res || $res > 0) {
$_ret = @unserialize(fgets($pipe)); //读取管道数据
$results[$pid] = $_ret;
unset($childs[$i]);
debug_log('read child: '.$pid . ' - ' . json_encode($_ret, 64|256));
}
if ($n > 1000) posix_kill($pid, SIGTERM); //超时(10分钟)结束子进程
}
usleep(200000); $n++;
}
debug_log('child process completed.');
@fclose($pipe);
@unlink($fifo);
$ret = json_encode($results, 64|256);
break;
default:
throw new \Exception('没有可执行的任务!');
break;
}
$t2 = microtime(true);
$times = round(($t2 - $t1) * 1000, 2);
$log = sprintf('[%s] %s --> (%s) %sms', strtoupper($op),
@json_encode($data, 64|256), @strlen($ret)<65?$ret:@strlen($ret), $times);
debug_log($log);
return $ret;
}
// 读取 CLI 命令行参数
$params = getopt('', array('op:', 'data:'));
$op = $params['op'];
$data = unserialize(base64_decode($params['data']));
// 开始执行任务
execute_task($op, $data);
function __autoload($classname) {
$parts = explode('\\', ltrim($classname, '\\'));
if (false !== strpos(end($parts), '_')) {
array_splice($parts, -1, 1, explode('_', current($parts)));
}
$filename = implode(DIRECTORY_SEPARATOR, $parts) . '.php';
if ($filename = stream_resolve_include_path($filename)) {
include $filename;
} else if (preg_match('/.*Task$/', $classname)) { //查找以Task结尾的任务脚本类
include TASK_PATH . DIRECTORY_SEPARATOR . $classname . '.php';
} else {
return false;
}
}登入後複製
以上是php如何使用命令列實現非同步多進程模式的任務處理(程式碼)的詳細內容。更多資訊請關注PHP中文網其他相關文章!