이 글은 주로 MySQL의 PHP 동시 쿼리 예제 코드를 소개하고 있습니다. 편집자는 꽤 좋다고 생각해서 지금 공유하고 참고용으로 제공하겠습니다. 에디터를 따라가서 살펴볼까요
저는 최근 PHP를 공부하고 있는데 PHP에서 MySQL의 동시 쿼리 문제를 발견했습니다. 그런데 공부하고 메모를 남겼습니다:
Synchronous. query
가장 일반적인 호출 모드에서는 클라이언트가 Query[함수]를 호출하고 쿼리 명령을 시작하고 결과가 반환될 때까지 기다린 다음 결과를 읽은 다음 두 번째 쿼리 명령을 보내고 결과를 반환하고 결과를 읽습니다. 소요된 총 시간은 두 쿼리 시간의 합입니다. 예를 들어 아래와 같이 프로세스를 단순화합니다.
예제 다이어그램, 1.1에서 1.3은 쿼리 [함수]를 호출하는 것입니다. 두 쿼리는 1.1, 1.2, 1.3, 2.1, 2.2, 2.3을 거치게 됩니다. 특히 1.2와 2.2에서는 차단하고 대기하며 프로세스가 다른 작업을 수행할 수 없습니다.
동기 호출의 장점은 우리의 직관적 사고에 부합하고 호출 및 처리가 간단하다는 것입니다. 단점은 결과가 반환될 때까지 프로세스가 차단되어 추가 실행 시간이 추가된다는 것입니다.
쿼리 요청이 여러 개 있거나 프로세스에 처리할 다른 작업이 있는 경우 대기 시간을 합리적으로 사용하여 프로세스의 처리 용량을 향상시킬 수 있습니까?
Split
이제 쿼리 [함수]를 여러 조각으로 나눕니다. 클라이언트는 1.1 이후에 즉시 반환되며 1.3에서 데이터가 도착한 후 데이터를 읽습니다. 이런 방식으로 프로세스는 원래의 1.2 단계에서 벗어나...다른 SQL 쿼리 시작 [2.1]과 같은 더 많은 작업을 수행할 수 있습니다. 동시 쿼리 프로토타입을 보셨나요?
동시 쿼리
동기 쿼리에 비해 이전 쿼리가 완료된 후 다음 쿼리가 시작되는 경우 동시 쿼리에서는 이전 쿼리 요청이 시작된 후 즉시 다음 쿼리 요청이 시작될 수 있습니다. 아래와 같이 프로세스를 단순화합니다.
예시 그림, 1.1.1에서 요청을 성공적으로 보낸 후 즉시 [1.1.2]를 반환하고, 최종 쿼리 결과는 먼 1.2에서 반환됩니다. 그러나 1.1.1과 1.2 사이에는 또 다른 쿼리 요청이 시작된 기간 동안 2.2는 1.2 이전에 동시에 두 개의 쿼리 요청이 시작되었으므로 두 쿼리의 총 시간은 다음과 같습니다. 첫 번째 쿼리.
동시 쿼리의 장점은 프로세스의 활용률을 높이고 서버가 쿼리를 처리할 때까지 차단 및 대기를 방지하며 다중 쿼리 시간을 단축할 수 있다는 것입니다. 그러나 단점도 분명합니다. N개의 동시 쿼리를 시작하려면 N개의 데이터베이스 링크를 설정해야 합니다. 데이터베이스 연결 풀이 있는 애플리케이션의 경우 이러한 상황을 피할 수 있습니다.
De Generation
이상적으로는 N개의 쿼리를 동시에 실행하고 총 시간 소모는 쿼리 시간이 가장 긴 쿼리와 같습니다. 그러나 동시 쿼리가 [동기 쿼리]로 [퇴화]될 수도 있습니다. 무엇? 예시 그림에서 2.1.1 이전에 1.2를 반환하면 동시 쿼리가 [동기 쿼리]로 [퇴화]되지만 비용은 동기 쿼리보다 높아집니다.
멀티플렉싱
쿼리 시작1
쿼리 시작2
쿼리 시작3
…
쿼리 시작 1을 기다리는 중입니다. 쿼리 2. Query3
이 query2 Result
쿼리1 결과 읽기
쿼리3 결과 읽기
그렇다면 쿼리 결과가 언제 반환되는지, 어떤 쿼리 결과가 반환되는지 알기 위해 어떻게 기다리나요?
모든 쿼리 IO에서 읽기를 호출하시겠습니까? 차단 IO가 발생하면 하나의 IO에서 차단되고 다른 IO에서는 결과가 반환되어 처리할 수 없습니다. 따라서 비차단 IO라면 IO 중 하나가 차단될까 봐 걱정할 필요가 없습니다. 하지만 계속해서 폴링과 판단이 발생하고 CPU 리소스가 낭비됩니다.
이 상황에서는 멀티플렉싱을 사용하여 여러 IO를 폴링할 수 있습니다.
PHP는 동시 쿼리를 구현합니다. MySQL
PHP의 mysqli(mysqlnd 드라이버)는 다중 폴링 IO(mysqli_poll)와 비동기 쿼리(MYSQLI_ASYNC, mysqli_reap_async_query)를 제공합니다. 동시 쿼리를 구현하려면 다음 두 가지 기능을 사용하세요. 샘플 코드:
<?php $sqls = array( 'SELECT * FROM `mz_table_1` LIMIT 1000,10', 'SELECT * FROM `mz_table_1` LIMIT 1010,10', 'SELECT * FROM `mz_table_1` LIMIT 1020,10', 'SELECT * FROM `mz_table_1` LIMIT 10000,10', 'SELECT * FROM `mz_table_2` LIMIT 1', 'SELECT * FROM `mz_table_2` LIMIT 5,1' ); $links = []; $tvs = microtime(); $tv = explode(' ', $tvs); $start = $tv[1] * 1000 + (int)($tv[0] * 1000); // 链接数据库,并发起异步查询 foreach ($sqls as $sql) { $link = mysqli_connect('127.0.0.1', 'root', 'root', 'dbname', '3306'); $link->query($sql, MYSQLI_ASYNC); // 发起异步查询,立即返回 $links[$link->thread_id] = $link; } $llen = count($links); $process = 0; do { $r_array = $e_array = $reject = $links; // 多路复用轮询IO if(!($ret = mysqli_poll($r_array, $e_array, $reject, 2))) { continue; } // 读取有结果返回的查询,处理结果 foreach ($r_array as $link) { if ($result = $link->reap_async_query()) { print_r($result->fetch_row()); if (is_object($result)) mysqli_free_result($result); } else { } // 操作完后,把当前数据链接从待轮询集合中删除 unset($links[$link->thread_id]); $link->close(); $process++; } foreach ($e_array as $link) { die; } foreach ($reject as $link) { die; } }while($process < $llen); $tvs = microtime(); $tv = explode(' ', $tvs); $end = $tv[1] * 1000 + (int)($tv[0] * 1000); echo $end - $start,PHP_EOL;
mysqli_poll 소스 code:
#ifndef PHP_WIN32 #define php_select(m, r, w, e, t) select(m, r, w, e, t) #else #include "win32/select.h" #endif /* {{{ mysqlnd_poll */ PHPAPI enum_func_status mysqlnd_poll(MYSQLND **r_array, MYSQLND **e_array, MYSQLND ***dont_poll, long sec, long usec, int * desc_num) { struct timeval tv; struct timeval *tv_p = NULL; fd_set rfds, wfds, efds; php_socket_t max_fd = 0; int retval, sets = 0; int set_count, max_set_count = 0; DBG_ENTER("_mysqlnd_poll"); if (sec < 0 || usec < 0) { php_error_docref(NULL, E_WARNING, "Negative values passed for sec and/or usec"); DBG_RETURN(FAIL); } FD_ZERO(&rfds); FD_ZERO(&wfds); FD_ZERO(&efds); // 从所有mysqli链接中获取socket链接描述符 if (r_array != NULL) { *dont_poll = mysqlnd_stream_array_check_for_readiness(r_array); set_count = mysqlnd_stream_array_to_fd_set(r_array, &rfds, &max_fd); if (set_count > max_set_count) { max_set_count = set_count; } sets += set_count; } // 从所有mysqli链接中获取socket链接描述符 if (e_array != NULL) { set_count = mysqlnd_stream_array_to_fd_set(e_array, &efds, &max_fd); if (set_count > max_set_count) { max_set_count = set_count; } sets += set_count; } if (!sets) { php_error_docref(NULL, E_WARNING, *dont_poll ? "All arrays passed are clear":"No stream arrays were passed"); DBG_ERR_FMT(*dont_poll ? "All arrays passed are clear":"No stream arrays were passed"); DBG_RETURN(FAIL); } PHP_SAFE_MAX_FD(max_fd, max_set_count); // select轮询阻塞时间 if (usec > 999999) { tv.tv_sec = sec + (usec / 1000000); tv.tv_usec = usec % 1000000; } else { tv.tv_sec = sec; tv.tv_usec = usec; } tv_p = &tv; // 轮询,等待多个IO可读,php_select是select的宏定义 retval = php_select(max_fd + 1, &rfds, &wfds, &efds, tv_p); if (retval == -1) { php_error_docref(NULL, E_WARNING, "unable to select [%d]: %s (max_fd=%d)", errno, strerror(errno), max_fd); DBG_RETURN(FAIL); } if (r_array != NULL) { mysqlnd_stream_array_from_fd_set(r_array, &rfds); } if (e_array != NULL) { mysqlnd_stream_array_from_fd_set(e_array, &efds); } // 返回可操作的IO数量 *desc_num = retval; DBG_RETURN(PASS); }
동시 쿼리 연산 결과
효과를 좀 더 직관적으로 보기 위해 1억 3천만 개의 데이터 볼륨이 있고 연산에 최적화되지 않은 테이블을 찾았습니다.
동시 쿼리 결과:
동기 쿼리 결과:
결과에서 동기 쿼리의 총 시간 소모는 모든 쿼리 시간의 누적입니다. 동시 쿼리 소비는 실제로 쿼리 시간이 가장 긴 쿼리이며(동기 쿼리의 네 번째 쿼리는 몇 초 정도 소요되며 이는 동시 쿼리의 총 시간과 일치함) 동시 쿼리의 쿼리 순서는 다음과 같습니다. 결과가 나오는 순서와 다릅니다.
쿼리 시간이 더 짧은 여러 쿼리 비교
쿼리 시간이 더 짧은 여러 SQL 쿼리를 사용하여 비교
동시 쿼리 결과 1개 테스트(데이터베이스 링크 시간도 계산됨):
동기화 결과 쿼리(데이터베이스 링크 시간도 계산됨):
동시 쿼리 테스트 2 결과(데이터베이스 링크 시간은 계산되지 않음):
결과로 판단하면 동시 쿼리 테스트 1 혜택을 받지 못했습니다. 동기 쿼리의 관점에서 각 쿼리에는 약 3-4ms가 소요됩니다. 그러나 데이터베이스 연결 시간이 통계에 포함되지 않는 경우(동기 쿼리에는 데이터베이스 연결이 하나만 있음) 동시 쿼리의 장점이 다시 반영될 수 있습니다.
결론
여기에서는 PHP에서 동시 쿼리 MySQL의 구현에 대해 논의했으며, 실험 결과를 통해 동시 쿼리의 장점과 단점을 직관적으로 이해했습니다. 데이터베이스 연결을 설정하는 시간은 여전히 최적화된 SQL 쿼리의 큰 부분을 차지합니다. #접속풀도 없는데 무슨 소용이 있나요
위 내용은 MySQL 쿼리에 대한 PHP 동시성 예(그림)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!