PHP에서는 문자열을 배열로 변환해야 하는 경우가 있습니다. 문자열에 영어 단어나 중국어 문자가 포함되어 있으면 이를 배열 요소로 분할해야 할 수도 있습니다. 이번 글에서는 중국어, 영어 문자열을 배열로 변환하는 방법을 자세히 소개하겠습니다.
먼저 PHP에서 문자열을 배열 요소로 나누는 방법을 살펴보겠습니다. PHP에서Explode() 함수를 사용하면 다음을 달성할 수 있습니다.
$str = "Hello World"; $arr = explode(" ", $str); print_r($arr);
이 프로그램의 출력 결과는 다음과 같습니다.
Array ( [0] => Hello [1] => World )
위 프로그램에서 공백은 문자열을 배열 요소로 나누는 구분 기호로 사용됩니다. 그 중explod() 함수의 첫 번째 매개변수는 구분자를 지정하고, 두 번째 매개변수는 분해할 문자열 변수이다.
다음으로 중국어와 영어가 혼합된 문자열을 배열로 변환하는 방법을 고려합니다. 여기서는 문자열을 분할하기 위해 PHP의 정규 표현식을 사용해야 합니다. 중국어와 영어가 혼합된 문장을 예로 들면 다음 프로그램을 사용하여 문자열을 배열로 변환할 수 있습니다.
$str = "Hello,世界"; preg_match_all("/./u", $str, $matches); print_r($matches[0]);
위 프로그램의 출력은 다음과 같습니다.
Array ( [0] => H [1] => e [2] => l [3] => l [4] => o [5] => , [6] => 世 [7] => 界 )
여기에서는 preg_match_all() 함수를 사용합니다. 정규식을 기반으로 문자열을 배열로 분할합니다. 그 중 정규식 "/./u"는 모든 문자(중국어 포함)와 일치한다는 의미이고, u는 UTF-8 인코딩으로 구문 분석하여 한자를 올바르게 처리할 수 있다는 의미입니다.
위 프로그램은 preg_match_all() 함수를 사용하여 문자열을 배열 요소로 분해합니다. 문자열에 한자가 있으면 정상적으로 문자로 분할됩니다. 출력 결과에서 프로그램이 흩어진 모든 문자를 배열 변수 $matches[0]에 저장하는 것을 볼 수 있습니다.
문자열의 영어와 중국어 문자를 서로 다른 배열 요소에 별도로 저장하려면 다음 프로그램을 사용할 수 있습니다.
$str = "Hello,世界"; preg_match_all("/[x{4e00}-x{9fa5}]+|[A-Za-z]+/u", $str, $matches); print_r($matches[0]);
프로그램의 출력은 다음과 같습니다.
Array ( [0] => Hello [1] => 世界 )
위 프로그램에서 정규식 여기서 [x{4e00}-x{9fa5}]는 한자 일치를 의미하고, [A-Za-z]는 영어 문자 일치를 의미합니다. "/[x{4e00}-x{9fa5}]+|[A-Za-z]+/u"
$str = "你好,世界"; preg_match_all("/[x{4e00}-x{9fa5}]+|[A-Za-z]+/u", $str, $matches); for($i=0; $i<count($matches[0]); $i++){ $str = $matches[0][$i]; if (preg_match("/[x{4e00}-x{9fa5}]/u", $str)) { $pinyin = PinYin($str); $arr[] = $pinyin[0]; } else { $arr[] = $str; } } print_r($arr);
Array ( [0] => ni [1] => hao [2] => shi [3] => jie )
위 내용은 PHP 중국어 및 영어 문자열을 배열로의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!