> 백엔드 개발 > PHP 문제 > PHP 중국어 및 영어 문자열을 배열로

PHP 중국어 및 영어 문자열을 배열로

王林
풀어 주다: 2023-05-19 19:13:05
원래의
609명이 탐색했습니다.

PHP에서는 문자열을 배열로 변환해야 하는 경우가 있습니다. 문자열에 영어 단어나 중국어 문자가 포함되어 있으면 이를 배열 요소로 분할해야 할 수도 있습니다. 이번 글에서는 중국어, 영어 문자열을 배열로 변환하는 방법을 자세히 소개하겠습니다.

먼저 PHP에서 문자열을 배열 요소로 나누는 방법을 살펴보겠습니다. PHP에서Explode() 함수를 사용하면 다음을 달성할 수 있습니다.

$str = "Hello World";
$arr = explode(" ", $str);
print_r($arr);
로그인 후 복사

이 프로그램의 출력 결과는 다음과 같습니다.

Array
(
    [0] => Hello
    [1] => World
)
로그인 후 복사

위 프로그램에서 공백은 문자열을 배열 요소로 나누는 구분 기호로 사용됩니다. 그 중explod() 함수의 첫 번째 매개변수는 구분자를 지정하고, 두 번째 매개변수는 분해할 문자열 변수이다.

다음으로 중국어와 영어가 혼합된 문자열을 배열로 변환하는 방법을 고려합니다. 여기서는 문자열을 분할하기 위해 PHP의 정규 표현식을 사용해야 합니다. 중국어와 영어가 혼합된 문장을 예로 들면 다음 프로그램을 사용하여 문자열을 배열로 변환할 수 있습니다.

$str = "Hello,世界";
preg_match_all("/./u", $str, $matches);
print_r($matches[0]);
로그인 후 복사

위 프로그램의 출력은 다음과 같습니다.

Array
(
    [0] => H
    [1] => e
    [2] => l
    [3] => l
    [4] => o
    [5] => ,
    [6] => 世
    [7] => 界
)
로그인 후 복사

여기에서는 preg_match_all() 함수를 사용합니다. 정규식을 기반으로 문자열을 배열로 분할합니다. 그 중 정규식 "/./u"는 모든 문자(중국어 포함)와 일치한다는 의미이고, u는 UTF-8 인코딩으로 구문 분석하여 한자를 올바르게 처리할 수 있다는 의미입니다.

위 프로그램은 preg_match_all() 함수를 사용하여 문자열을 배열 요소로 분해합니다. 문자열에 한자가 있으면 정상적으로 문자로 분할됩니다. 출력 결과에서 프로그램이 흩어진 모든 문자를 배열 변수 $matches[0]에 저장하는 것을 볼 수 있습니다.

문자열의 영어와 중국어 문자를 서로 다른 배열 요소에 별도로 저장하려면 다음 프로그램을 사용할 수 있습니다.

$str = "Hello,世界";
preg_match_all("/[x{4e00}-x{9fa5}]+|[A-Za-z]+/u", $str, $matches);
print_r($matches[0]);
로그인 후 복사

프로그램의 출력은 다음과 같습니다.

Array
(
    [0] => Hello
    [1] => 世界
)
로그인 후 복사

위 프로그램에서 정규식 여기서 [x{4e00}-x{9fa5}]는 한자 일치를 의미하고, [A-Za-z]는 영어 문자 일치를 의미합니다. "/[x{4e00}-x{9fa5}]+|[A-Za-z]+/u"

한자를 병음으로 변환해야 하고 병음도 배열 요소로 저장되어 있는 경우 다음 프로그램을 사용할 수 있습니다.

$str = "你好,世界";
preg_match_all("/[x{4e00}-x{9fa5}]+|[A-Za-z]+/u", $str, $matches);
for($i=0; $i<count($matches[0]); $i++){
    $str = $matches[0][$i];
    if (preg_match("/[x{4e00}-x{9fa5}]/u", $str)) {
        $pinyin = PinYin($str);
        $arr[] = $pinyin[0];
    } else {
        $arr[] = $str;
    }
}
print_r($arr);
로그인 후 복사

이 프로그램의 결과는 다음과 같습니다.

Array
(
    [0] => ni
    [1] => hao
    [2] => shi
    [3] => jie
)
로그인 후 복사
위 프로그램에서, PinYin() 함수를 캡슐화합니다. 이 함수는 한자를 병음으로 변환하는 데 사용됩니다. 프로그램에서 문자열에 중국어 문자가 포함되어 있는 한 이 함수는 중국어 문자를 병음으로 변환하고 배열 변수 $arr에 저장하기 위해 호출됩니다.

이제 중국어와 영어 문자열을 배열로 변환하는 데 성공했습니다. 문자 처리 및 텍스트 분석을 수행해야 하는 경우 문자열을 배열로 변환하는 것이 일반적으로 사용되는 PHP 함수 중 하나가 됩니다.

위 내용은 PHP 중국어 및 영어 문자열을 배열로의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿