백엔드 개발 PHP 튜토리얼 PHP 멀티바이트 문자열

PHP 멀티바이트 문자열

Nov 21, 2016 pm 05:58 PM
php PHP 문자열

소개

많은 언어가 필요한 각 문자를 8비트 값으로 일대일 매핑하는 반면, 서면 의사소통을 위해 너무 많은 문자가 필요한 언어도 있습니다. 인코딩 범위는 1바이트에만 포함될 수 없습니다. (1바이트 바이트는 8비트로 구성됩니다. 각 비트는 1 또는 0의 두 가지 값만 포함할 수 있습니다. 따라서 1바이트는 256개의 서로 다른 값만 나타낼 수 있습니다. 값, 즉 2 8승). 멀티바이트 문자 인코딩 방식은 기존 바이트 기반 인코딩 시스템에서 256개 이상의 문자를 표현하기 위해 개발되었습니다.

멀티바이트로 인코딩된 문자열을 연산(트림, 분할, 스플라이스 등)할 때 이 인코딩 방식으로 인해 두 개 이상의 연속 바이트는 하나의 문자만 표현할 수 있으므로 특수 기능을 사용해야 합니다. 그렇지 않으면 이 문자열에 멀티바이트 문자열을 감지할 수 없는 함수를 적용할 때 멀티바이트 문자의 시작 위치를 감지하지 못하고 왜곡된 문자열로 끝나서 기본적으로 원래 의미를 잃을 수 있습니다.

mbstring은 PHP에서 멀티바이트 인코딩을 처리하는 데 도움이 되는 멀티바이트 문자열용 함수를 제공합니다. 또한 mbstring은 가능한 문자 인코딩 간에 변환할 수 있습니다. 편의를 위해 mbstring은 UTF-8, UCS-2 및 많은 단일 바이트 인코딩과 같은 유니코드 기반 인코딩을 처리하도록 설계되었습니다.

mbstring은 기본 확장자가 아닙니다. 즉, 기본적으로 활성화되어 있지 않습니다. 구성 옵션에서 이 모듈을 명시적으로 활성화해야 합니다.

HTTP 입력 및 출력

HTTP 입력/출력 문자 인코딩 변환은 바이너리 데이터에도 작동합니다. HTTP 입/출력에 바이너리 데이터가 사용되는 경우 사용자는 문자 인코딩 변환을 제어해야 합니다.

PHP 4.3.3부터 HTML 폼의 enctype 속성이 multipart/form-data로 설정되어 있고 php.ini의 mbstring.encoding_translation이 On으로 설정되어 있으면 POST 변수와 업로드된 파일도 내부 문자 인코딩으로 변환됩니다. 그러나 쿼리 키에는 변환이 적용되지 않습니다.

HTTP 입력 PHP 스크립트에서는 HTTP 입력 문자의 변환을 제어할 수 있는 방법이 없습니다. HTTP 입력 문자 변환을 비활성화하려면 php.ini에서 설정해야 합니다.

예제 #1 php.ini에서 HTTP 입력 변환 비활성화

;; 禁用 HTTP 输入转换
mbstring.http_input = pass
;;禁用 HTTP 输入转换 (PHP 4.3.0 或更高版本)
mbstring.encoding_translation = Off
로그인 후 복사

PHP가 Apache 모듈로 실행되는 경우. 이러한 설정은 각 디렉토리의 httpd.conf 또는 .htaccess에 있는 각 가상 호스트(가상 호스트) 지시문을 통해 재정의될 수도 있습니다.
HTTP 출력 문자 인코딩 변환을 사용하는 방법에는 여러 가지가 있습니다. 하나는 php.ini를 사용하는 것이고, 다른 하나는 ob_start의 콜백 함수로 mb_output_handler()를 사용하여 ob_start()를 사용하는 것입니다.

예시 #2 php.ini 설정 예

;; 为所有 PHP 页面启用输出字符编码的转换
;; 启用输出缓冲
output_buffering    = On
;; 设置 mb_output_handler 来进行输出的转换
output_handler      = mb_output_handler
로그인 후 복사

예시 #3 스크립트 예

<?php
    // 仅为此页面启用输出字符编码的转换
    // 设置 HTTP 输出字符编码为 SJIS
    mb_http_output(&#39;SJIS&#39;);
    // 开始缓冲并指定 "mb_output_handler" 为回调函数
    ob_start(&#39;mb_output_handler&#39;);
?>
로그인 후 복사

멀티바이트 문자열 함수

mb_check_encoding — 지정된 인코딩에서 문자열이 유효한지 확인

mb_convert_case — 문자열을 대문자와 소문자로 변환

mb_convert_encoding — 문자 인코딩 변환

mb_convert_kana — "가나"로 변환 from another ("zen-kaku", "han-kaku" 등)

mb_convert_variables — 하나 이상의 변수의 문자 인코딩을 변환합니다.

mb_decode_mimeheader — MIME 헤더 필드의 문자 디코딩 String

mb_decode_numericentity — HTML 숫자 문자열을 문자로 디코딩

mb_Detect_encoding — 문자 인코딩 감지

mb_Detect_order — 문자 인코딩 감지 순서 설정/가져오기

mb_encode_mimeheader — 멀티바이트 문자열에 대한 문자를 HTML 숫자 문자열 참조로 인코딩

mb_ereg_replace_callback — 정규식 검색을 수행하고 콜백을 사용하여 멀티바이트 지원으로 바꿉니다

mb_ereg_replace — 멀티바이트 지원으로 정규식 교체

mb_ereg_search_getpos — 다음 정규식 일치의 시작점 반환

mb_ereg_search_getregs — 마지막 멀티바이트 정규식 일치에서 결과 검색

mb_ereg_search_init — 멀티바이트 정규식 일치를 위한 문자열 및 정규식 설정

mb_ereg_search_pos — 미리 정의된 멀티바이트 문자열에 대해 멀티바이트 정규 표현식에서 일치하는 부분의 위치와 길이를 반환합니다

mb_ereg_search_regs — 멀티바이트 정규식에서 일치하는 부분을 반환합니다

mb_ereg_search_setpos — 다음 정규식 일치의 시작점 설정

mb_ereg_search — 미리 정의된 멀티바이트 문자열에 대한 멀티바이트 정규식 일치

mb_ereg — 멀티바이트를 지원하는 정규식 일치

mb_eregi_replace — 대소문자를 무시하고 멀티바이트 지원으로 정규식 교체

mb_eregi — 멀티바이트를 지원하는 대소문자를 무시하는 정규식 일치

mb_get_info — mbstring의 내부 설정 가져오기

mb_http_input — HTTP 입력 문자 인코딩 감지

mb_http_output — HTTP 출력 문자 인코딩 설정/가져오기

mb_internal_encoding — 내부 문자 인코딩 설정/가져오기

mb_언어 — 현재 언어 설정/가져오기

mb_list_encodings — 지원되는 모든 인코딩의 배열 반환

mb_output_handler — 출력 버퍼에서 문자 인코딩을 변환하는 콜백 함수

mb_parse_str — GET/POST/COOKIE 데이터 구문 분석 및 전역 변수 설정

mb_preferred_mime_name — MIME 문자열 가져오기

mb_regex_encoding — 멀티바이트 정규식에 대한 문자 인코딩 설정/가져오기

mb_regex_set_options — 설정 / mbregex 함수에 대한 기본 옵션 가져오기

mb_send_mail — 인코딩된 이메일 보내기

mb_split — 정규 표현식을 사용하여 멀티바이트 문자열 분할

mb_strcut — 이메일의 일부 가져오기 문자

mb_strimwidth — 지정된 너비만큼 잘린 문자열을 가져옵니다.

mb_stripos — 대소문자를 구분하지 않고 다른 문자열에서 처음 나타나는 문자열을 찾습니다.

mb_stristr — 대소문자 -insensitively는 다른 문자열에서 처음으로 나타나는 문자열을 찾습니다.

mb_strlen — 문자열의 길이를 가져옵니다.

mb_strpos — 다른 문자열에서 처음으로 나타나는 문자열을 찾습니다. 위치

mb_strrchr — 다른 문자열에서 지정된 문자의 마지막 발생을 찾습니다.

mb_strrichr — 대소문자를 구분하지 않고 다른 문자열에서 지정된 문자의 마지막 발생을 찾습니다.

mb_strripos — 다음의 마지막 발생을 찾습니다. 문자열의 문자열, 대소문자 구분

mb_strrpos — 문자열에서 마지막으로 나타나는 문자열 찾기

mb_strstr — 다른 문자열에서 처음으로 나타나는 문자열 찾기

mb_strtolower — 문자열을 소문자로 만듭니다

mb_strtoupper — 문자열을 대문자로 만듭니다

mb_strwidth — 문자열의 너비를 반환합니다

mb_substitute_character — 대체 문자 설정/가져오기

mb_substr_count — 문자열 발생 횟수 계산

mb_substr — 문자열 부분 가져오기


본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Ubuntu 및 Debian용 PHP 8.4 설치 및 업그레이드 가이드 Ubuntu 및 Debian용 PHP 8.4 설치 및 업그레이드 가이드 Dec 24, 2024 pm 04:42 PM

PHP 8.4는 상당한 양의 기능 중단 및 제거를 통해 몇 가지 새로운 기능, 보안 개선 및 성능 개선을 제공합니다. 이 가이드에서는 Ubuntu, Debian 또는 해당 파생 제품에서 PHP 8.4를 설치하거나 PHP 8.4로 업그레이드하는 방법을 설명합니다.

JWT (JSON Web Tokens) 및 PHP API의 사용 사례를 설명하십시오. JWT (JSON Web Tokens) 및 PHP API의 사용 사례를 설명하십시오. Apr 05, 2025 am 12:04 AM

JWT는 주로 신분증 인증 및 정보 교환을 위해 당사자간에 정보를 안전하게 전송하는 데 사용되는 JSON을 기반으로 한 개방형 표준입니다. 1. JWT는 헤더, 페이로드 및 서명의 세 부분으로 구성됩니다. 2. JWT의 작업 원칙에는 세 가지 단계가 포함됩니다. JWT 생성, JWT 확인 및 Parsing Payload. 3. PHP에서 인증에 JWT를 사용하면 JWT를 생성하고 확인할 수 있으며 사용자 역할 및 권한 정보가 고급 사용에 포함될 수 있습니다. 4. 일반적인 오류에는 서명 검증 실패, 토큰 만료 및 대형 페이로드가 포함됩니다. 디버깅 기술에는 디버깅 도구 및 로깅 사용이 포함됩니다. 5. 성능 최적화 및 모범 사례에는 적절한 시그니처 알고리즘 사용, 타당성 기간 설정 합리적,

PHP에서 HTML/XML을 어떻게 구문 분석하고 처리합니까? PHP에서 HTML/XML을 어떻게 구문 분석하고 처리합니까? Feb 07, 2025 am 11:57 AM

이 튜토리얼은 PHP를 사용하여 XML 문서를 효율적으로 처리하는 방법을 보여줍니다. XML (Extensible Markup Language)은 인간의 가독성과 기계 구문 분석을 위해 설계된 다목적 텍스트 기반 마크 업 언어입니다. 일반적으로 데이터 저장 AN에 사용됩니다

PHP에서 늦은 정적 결합을 설명하십시오 (정적 : :). PHP에서 늦은 정적 결합을 설명하십시오 (정적 : :). Apr 03, 2025 am 12:04 AM

정적 바인딩 (정적 : :)는 PHP에서 늦은 정적 바인딩 (LSB)을 구현하여 클래스를 정의하는 대신 정적 컨텍스트에서 호출 클래스를 참조 할 수 있습니다. 1) 구문 분석 프로세스는 런타임에 수행됩니다. 2) 상속 관계에서 통화 클래스를 찾아보십시오. 3) 성능 오버 헤드를 가져올 수 있습니다.

문자열로 모음을 계산하는 PHP 프로그램 문자열로 모음을 계산하는 PHP 프로그램 Feb 07, 2025 pm 12:12 PM

문자열은 문자, 숫자 및 기호를 포함하여 일련의 문자입니다. 이 튜토리얼은 다른 방법을 사용하여 PHP의 주어진 문자열의 모음 수를 계산하는 방법을 배웁니다. 영어의 모음은 A, E, I, O, U이며 대문자 또는 소문자 일 수 있습니다. 모음이란 무엇입니까? 모음은 특정 발음을 나타내는 알파벳 문자입니다. 대문자와 소문자를 포함하여 영어에는 5 개의 모음이 있습니다. a, e, i, o, u 예 1 입력 : String = "Tutorialspoint" 출력 : 6 설명하다 문자열의 "Tutorialspoint"의 모음은 u, o, i, a, o, i입니다. 총 6 개의 위안이 있습니다

PHP 및 Python : 두 가지 인기있는 프로그래밍 언어를 비교합니다 PHP 및 Python : 두 가지 인기있는 프로그래밍 언어를 비교합니다 Apr 14, 2025 am 12:13 AM

PHP와 Python은 각각 고유 한 장점이 있으며 프로젝트 요구 사항에 따라 선택합니다. 1.PHP는 웹 개발, 특히 웹 사이트의 빠른 개발 및 유지 보수에 적합합니다. 2. Python은 간결한 구문을 가진 데이터 과학, 기계 학습 및 인공 지능에 적합하며 초보자에게 적합합니다.

php magic 방법 (__construct, __destruct, __call, __get, __set 등)이란 무엇이며 사용 사례를 제공합니까? php magic 방법 (__construct, __destruct, __call, __get, __set 등)이란 무엇이며 사용 사례를 제공합니까? Apr 03, 2025 am 12:03 AM

PHP의 마법 방법은 무엇입니까? PHP의 마법 방법은 다음과 같습니다. 1. \ _ \ _ Construct, 객체를 초기화하는 데 사용됩니다. 2. \ _ \ _ 파괴, 자원을 정리하는 데 사용됩니다. 3. \ _ \ _ 호출, 존재하지 않는 메소드 호출을 처리하십시오. 4. \ _ \ _ get, 동적 속성 액세스를 구현하십시오. 5. \ _ \ _ Set, 동적 속성 설정을 구현하십시오. 이러한 방법은 특정 상황에서 자동으로 호출되어 코드 유연성과 효율성을 향상시킵니다.

PHP : 웹 개발의 핵심 언어 PHP : 웹 개발의 핵심 언어 Apr 13, 2025 am 12:08 AM

PHP는 서버 측에서 널리 사용되는 스크립팅 언어이며 특히 웹 개발에 적합합니다. 1.PHP는 HTML을 포함하고 HTTP 요청 및 응답을 처리 할 수 ​​있으며 다양한 데이터베이스를 지원할 수 있습니다. 2.PHP는 강력한 커뮤니티 지원 및 오픈 소스 리소스를 통해 동적 웹 컨텐츠, 프로세스 양식 데이터, 액세스 데이터베이스 등을 생성하는 데 사용됩니다. 3. PHP는 해석 된 언어이며, 실행 프로세스에는 어휘 분석, 문법 분석, 편집 및 실행이 포함됩니다. 4. PHP는 사용자 등록 시스템과 같은 고급 응용 프로그램을 위해 MySQL과 결합 할 수 있습니다. 5. PHP를 디버깅 할 때 error_reporting () 및 var_dump ()와 같은 함수를 사용할 수 있습니다. 6. 캐싱 메커니즘을 사용하여 PHP 코드를 최적화하고 데이터베이스 쿼리를 최적화하며 내장 기능을 사용하십시오. 7

See all articles