> 백엔드 개발 > PHP 튜토리얼 > 다양한 인코딩의 문자열에서 인쇄할 수 없는 문자를 효율적으로 제거하려면 어떻게 해야 합니까?

다양한 인코딩의 문자열에서 인쇄할 수 없는 문자를 효율적으로 제거하려면 어떻게 해야 합니까?

Linda Hamilton
풀어 주다: 2024-12-28 15:04:10
원래의
304명이 탐색했습니다.

How Can I Efficiently Remove Non-Printable Characters from Strings in Different Encodings?

문자열에서 인쇄할 수 없는 문자 이스케이프

소개:

텍스트 데이터를 처리할 때, 저장, 표시 또는 작업 중에 문제를 일으킬 수 있는 인쇄할 수 없는 특정 문자를 제거해야 하는 경우가 많습니다. 처리. 이러한 문자를 효율적으로 제거하는 방법을 이해하는 것이 중요합니다.

해결책:

인쇄할 수 없는 문자(0-31 및 127)를 제거하려면 다음 옵션을 고려하십시오. 문자열 인코딩:

1. 7비트 ASCII:

$string = preg_replace('/[\x00-\x1F\x7F-\xFF]/', '', $string);
로그인 후 복사

2. 8비트 확장 ASCII:

$string = preg_replace('/[\x00-\x1F\x7F]/', '', $string);
로그인 후 복사

3. UTF-8:

$string = preg_replace('/[\x00-\x1F\x7F]/u', '', $string);
로그인 후 복사

4. str_replace를 사용하는 대안:

$badchar = [...]; // Array of non-printable characters
$string2 = str_replace($badchar, '', $str);
로그인 후 복사

벤치마킹:

preg_replace와 str_replace의 성능은 문자열 길이와 유형에 따라 다릅니다. 특정 사례에 대한 최적의 접근 방식을 결정하려면 자체 데이터를 벤치마킹하는 것이 좋습니다.

유니코드는 어떻습니까?

인쇄할 수 없는 특정 유니코드 문자(예: NO-Break Space), 문자 클래스 내에서 xA0을 사용하십시오:

$string = preg_replace('/[\x00-\x1F\x7F\xA0]/u', '', $string);
로그인 후 복사

위 내용은 다양한 인코딩의 문자열에서 인쇄할 수 없는 문자를 효율적으로 제거하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿