> 백엔드 개발 > PHP 튜토리얼 > 실제 사례와 함께 Regex를 탈취합니다

실제 사례와 함께 Regex를 탈취합니다

Jennifer Aniston
풀어 주다: 2025-02-16 12:49:10
원래의
958명이 탐색했습니다.

실제 사례와 함께 Regex를 탈취합니다 키 테이크 아웃

정규식 (Regex)은 로그 분석, 양식 제출 유효성 검사 및 운영 및 교체와 같은 작업에 사용되는 개발자에게 유용한 도구입니다. REGEX를 효과적으로 구축하고 사용하는 방법을 이해하면 생산성과 효율성을 크게 향상시킬 수 있습니다. 좋은 정수를 구축하려면 시나리오 정의, 계획 개발, 구현/테스트/리팩토링이 포함됩니다. 허용 된 문자 유형, 캐릭터가 나타나야하는 횟수 및 따라야 할 제약을 이해하는 것이 중요합니다.

REGEX 사용의 실제 예에는 비밀번호, URL, 특정 HTML 태그 및 복제 된 단어 일치가 포함됩니다. 이 예는 문자 범위, 주장, 조건, 그룹 등의 사용을 보여줍니다. Regex는 강력한 도구이지만 복잡하고 관리하기 어려울 수도 있습니다. 따라서 때로는 큰 규모가 대신 몇 가지 작은 성록을 사용하는 것이 더 효과적입니다. 그룹 캡처에주의를 기울이면 추가 처리에 더 유용 할 수 있습니다. 2. 계획을 개발하십시오 문제를 잘 정의한 후, 우리는 정규 표현에 관여하는 요소의 종류를 이해할 수 있습니다.
    허용 된 문자 유형은 무엇입니까 (단어, 숫자, 새 선, 범위…)?
  • 캐릭터가 몇 번이나 나타나야하는지 (한 명 이상, 한 번…) 따라야 할 몇 가지 제약 조건이 있습니까 (선택 사항, Lookahead/Behind, If-then-Else,…)?
  • 3. 구현/테스트/refactor
  • 정규 표현을 테스트하고 개선하기 위해 실시간 테스트 환경을 갖추는 것이 매우 중요합니다. regex101.com, regexr.com 및 debuggex.com과 같은 웹 사이트는 최고의 환경을 제공합니다. Regex의 효율성을 향상시키기 위해 다음과 같은 추가 질문에 답변 할 수 있습니다.
  • 는 특정 도메인에 대해 문자 클래스가 올바르게 정의되어 있습니까? 더 많은 사용 사례를 다루기 위해 더 많은 테스트 문자열을 작성해야합니까?

    몇 가지 문제를 찾고 분리하여 별도로 테스트 할 수 있습니까?

    더 작고 선명하며 유연하게 만들기 위해 서브 패턴, 그룹, 조건 등으로 표현식을 리팩터링해야합니까?
      실제 예 다음 예제의 목표는 문제를 해결할 수있는 표현을 작성하는 것이 아니라 문자 범위, 주장, 조건, 그룹 등과 같은 중요한 요소를 사용하여 특정 사용 사례에 가장 효과적인 표현을 작성하는 것입니다. 비밀번호 일치
    대본:
  • 6 ~ 12 문자 길이 에는 최소한 하나 이상의 대문자 가 있어야합니다 에는 적어도 하나의 소문자가 있어야합니다 에는 하나 이상의 자리가 있어야합니다 에는 다른 문자가 포함되어야합니다
  • 무늬: ^(? =.*[a-z]) (? =.*[a-z]) (? =.*d). {6,12} $ 이 표현은 다중 긍정적 인 감시대 (? = (regex))를 기반으로합니다. 전망대는 선언 된 (Regex)가 뒤 따르는 무언가와 일치합니다. 조건의 순서는 결과에 영향을 미치지 않습니다. 룩 어라운드 표현식은 여러 조건이있을 때 매우 유용합니다. 우리는 또한 부정적인 Lookahead (?! (regex))을 사용하여 일부 문자 범위를 배제 할 수 있습니다. 예를 들어 (?!.*#)로 %를 제외 할 수 있습니다. 위의 표현의 각 패턴을 설명해 봅시다.
  • ^ 문자열의 시작시 위치를 주장합니다 <..> (? =.*[a-z]) 긍정적 인 룩 그는 regex.*[a-z]가 일치 할 수 있다고 주장합니다.
  • .*. [a-z]는 A와 Z (Case Sensitive)의 범위에서 단일 문자와 일치합니다.
  • <..> (? =.*[a-z]) 긍정적 인 룩 그는 regex.*[a-z]가 일치 할 수 있다고 주장합니다.
.*. [a-z]는 A와 Z (Case Cintitive) 사이의 단일 문자와 일치합니다.

<..> (? =. *d) 긍정적 인 룩 그는 regex *dcan이 일치한다고 주장합니다.

.*. d는 숫자와 일치합니다 [0-9]

실제 사례와 함께 Regex를 탈취합니다 . {6,12}6 ~ 12 배 사이의 모든 캐릭터 (Newline 제외)와 일치합니다. $ 문자열 끝에서 위치를 주장합니다 일치하는 url
  • 대본: 는 http 또는 https 또는 ftp로 시작한 다음 다음을 시작해야합니다. 는 유효한 도메인 이름 와 일치해야합니다 에는 포트 사양 (http://www.sitepoint.com:80)을 포함 할 수 있습니다 는 숫자, 문자, 점, 하이픈, 전방 슬래시, 여러 번 를 포함 할 수 있습니다. 실제 사례와 함께 Regex를 탈취합니다 무늬: ^(http | https | ftp) : [/] {2} ([a-za-z0-9-.]. [a-za-z] {2,4}) (: [0-9])? /? 첫 번째 시나리오는 ^(http | https | ftp) : [/] {2}로 해결하기가 매우 쉽습니다. 도메인 이름과 일치하려면 유효하려면 문자, 자리, 하이픈 및 도트 만 포함 할 수 있습니다. 내 예에서는 구두점 후 문자 수를 2에서 4로 제한했지만 .rocks 또는 .codes와 같은 새로운 도메인에 대해 확장 될 수 있습니다. 도메인 이름은 ([a-za-z0-9-]. [a-za-z] {2,4})와 일치합니다. 옵션 포트 사양은 단순 (: [0-9])와 일치합니다. URL에는 여러 번의 슬래시와 여러 문자가 여러 번 반복 될 수 있으며 (RFC3986 참조) 그룹에서 다양한 문자를 사용하여 일치합니다 ([a-za-z0-9 -.__?, '/\ & amp;%$. #= ~]*). 모든 중요한 요소를 Group Capture ()와 일치시키는 것이 유용합니다. 필요한 경기 만 반환하기 때문입니다. 특정 캐릭터는 탈출해야한다는 것을 기억하십시오. 아래에서 모든 단일 소환자가 설명했습니다.
      ^ 문자열의 시작시 위치를 주장합니다 캡처 그룹 (http | https | ftp), http 또는 https 또는 ftp
    • 캡처 : 탈출 된 캐릭터, 문자 그대로 와 일치합니다 [ /] {2}는 탈출 된 문자 /
    • 의 정확히 2 배와 일치합니다 캡처 그룹 ([a-za-z0-9-.]. [a-za-z] {2,4}) :
    • [a-za-z0-9-.]는 A와 Z, A와 Z, 0과 9의 범위에서 하나의 무제한 시간과 일치합니다. 문자 그대로 캐릭터와 캐릭터. 말 그대로 <.>
    • . 캐릭터와 일치합니다. 말 그대로 <.> [a-za-z] {2,4}A와 z 또는 a와 z 사이에서 2 ~ 4 회 사이의 단일 문자와 일치합니다 (케이스 민감성) .
    캡처 그룹 (: [0-9])? : > Quantifier? 그룹을 0 이상
  • 사이에서 일치시킵니다 : 문자 그대로 와 일치합니다 [0-9]는 0과 9 사이의 단일 문자와 일치합니다.
  • /? 문자 그대로 0 또는 한 번에 문자와 일치합니다 캡처 그룹 ([a-za-z0-9 -._?, '/\ & amp;%$#= ~]*) :
  • [a-za-z0-9 -.__?, '/\ & amp;%$#= ~]* 0과 무제한 시간 사이에서 A-Z, A-Z, 0-9, 캐릭터의 단일 문자 일치 : -._?, '/ & amp;%$#= ~
  • 일치하는 HTML 태그
    대본:
  • 시작 태그는
  • 로 끝나야합니다. 끝 태그는 다음으로 시작하고 하나 이상의 문자로 시작하고> 로 끝나야합니다. 태그 요소 내부의 내용과 일치해야합니다
  • 무늬: (.*?) 1> 시작 태그와 내부의 내용을 일치 시키면 및 (.*?)와 매우 쉽지만 위의 패턴에서 유용한 것을 추가했습니다 : 캡처 그룹에 대한 참조. 괄호 ()로 정의 된 모든 캡처 그룹은 위치 번호 (첫 번째) (두 번째) (세 번째)을 사용하여 추가 작업을 허용 할 수 있습니다. 위의 표현은 다음과 같이 설명 할 수 있습니다.
      로 시작하십시오 태그 이름을 캡처하십시오 그 다음에 하나 이상의 숯이 입니다 태그 내부의 내용을 캡처합니다 닫는 태그는 태그 이름이 이전에 캡처되어야합니다
    표현식에 두 개의 캡처 그룹 만 포함하여 태그 이름과 컨텐츠는 관련 컨텐츠가있는 태그 이름 목록 인 매우 명확한 일치를 반환합니다. 조금 더 깊이 파고 서브 패턴을 설명해 봅시다.
  • 캡처 그룹 ([W])는 모든 단어 문자 A-Za-Z0-9_ 와 일치합니다. .*. > 문자 그대로

    와 일치합니다 캡처 그룹 (.*?), 모든 캐릭터 (Newline 제외), 0 및 더 많은 시간 와 일치합니다. / / 문자 그대로 문자와 일치합니다 1은 첫 번째 캡처 그룹과 일치하는 동일한 텍스트와 일치합니다. > 문자 그대로 실제 사례와 함께 Regex를 탈취합니다와 일치합니다
      일치하는 복제 된 단어
    • 대본:
    • 단어는 공간이 분리되어 있습니다
    • 우리는 모든 복제를 일치시켜야합니다.
    무늬: b (w) b (? =.*1) 이 정규 표현은 도전적인 것처럼 보이지만 이전에 보여준 일부 개념을 사용합니다. 패턴은 단어 경계의 개념을 소개합니다. 단어 경계 B는 주로 위치를 점검합니다. 단어 캐릭터 (즉, ABCDE)에이어서 비 단어 문자 (예 : -~,!)가 이어질 때 일치합니다. 아래에서 단어 경계의 사용을 더 명확하게 할 수 있습니다. - 정규 표현이라는 문구가 주어지면 대단합니다 - 패턴 Bareb 일치는입니다 - 패턴 w {3} b는 단어의 마지막 세 글자와 일치 할 수 있습니다. lar, ion, is, ome 위의 표현은 다음과 같이 설명 할 수 있습니다.
      모든 단어 문자와 비 단어 문자 (우리의 경우 공간에서) 와 일치합니다. 일치하는 단어가 이미 존재하는지 확인하십시오. 아래에는 각 하위 패턴에 대한 설명이 있습니다.
    • b 단어 경계 캡처 그룹 ([W])는 모든 단어 문자 A-ZA-Z0-9_ 와 일치합니다 b 단어 경계 <..> (? =.*1) 긍정적 인 룩 그는 다음과 일치 할 수 있다고 주장합니다.
    .* 모든 캐릭터와 일치합니다 (Newline 제외) 1은 첫 번째 캡처 그룹과 동일한 텍스트와 일치합니다
    1. 첫 경기 만 반환하는 대신 모든 경기를 반환하면 표현이 더 의미가 있습니다. 자세한 내용은 PHP 기능 preg_match_all을 참조하십시오.
    2. 최종 생각 정규 표현은 양날의 검입니다. 복잡성이 높을수록 문제를 해결하기가 더 어려워집니다. 그렇기 때문에 때로는 모든 사례와 일치하는 정규 표현을 찾기가 어렵고 대신 몇 가지 작은 정규식을 사용하는 것이 좋습니다. 문제의 좋은 시나리오를 갖는 것은 매우 도움이 될 수 있으며, 문자 범위, 제약, 주장, 반복, 선택적 값 등을 생각할 수 있습니다. 그룹 캡처에 더 많은 관심을 기울이면 일치가 추가 처리에 유용 해집니다. 예제의 표현을 자유롭게 개선하고 어떻게하는지 알려주십시오!
    3. 유용한 자원 아래에서는 Regex 기술의 성장에 도움이되는 추가 정보와 리소스를 찾을 수 있습니다. 나열되지 않은 유용한 것을 발견하면 기사에 의견을 추가하십시오. Lea Verou - /Reg (exp) {2}LAINED/: 정규 표현식을 탈취합니다

    https://www.youtube.com/watch?v=eklues9rvak PHP 라이브러리

    이름 설명 RegexpBuilder 인간이 읽을 수있는 방법의 사슬을 사용하여 Regex를 만듭니다 noonofluentregex 유창한 세터와 위와 같은 영어 용어를 사용하여 Regex Expressions를 구축합니다. Hoaregex Regex를 분석하고 문자열을 생성하는 도구를 제공합니다 Regex 리버스 정규 표현식이 주어지면 문자열이 생성됩니다 웹 사이트 url 설명 regex101.com PCRE Online Regex Tester regextester.com PCRE Online Regex Tester rexv.org PCRE Online Regex Tester debugx.com PCRE를 지원하고 매우 유용한 Visual Regex Debugger를 제공합니다. regexper.com JavaScript 스타일 Regex이지만 디버그에 유용합니다 phpliveregex.com PREG 기능에 대한 온라인 테스터 regxlib.com 사용 준비가 된 정규 표현식 데이터베이스 정기적 인 표현력 .info REGEX 튜토리얼, 서적 검토, 예

    제목 설명 저자 편집기 정규 표현 마스터 링 반드시 Regex 책이 있어야합니다 Jeffrey Friedl 오라일리 정규 표현식 포켓 참조 Perl, Ruby, Php, Python, C, Java 및 .NET에 대한 정기 표현식 Tony Stubblebine 오라일리 정규 표현식 (Regex) 에 대한 자주 묻는 질문 (FAQ) 정규 표현식 (Regex)의 실질적인 응용은 무엇입니까? 정규 표현식 (Regex)은 엄청나게 다재다능하며 다양한 실제 응용 분야에서 사용될 수 있습니다. 사용자 입력이 이메일 주소 또는 전화 번호와 같은 특정 형식과 일치하도록하기 위해 데이터 검증에 일반적으로 사용됩니다. 또한 웹 스크래핑에 사용하여 웹 페이지에서 특정 정보를 추출 할 수 있습니다. 또한 REGEX는 특정 텍스트 문자열 찾기 및 교체, 문자열을 일련의 하위 문자열로 나누기 등의 작업을위한 텍스트 처리에 사용될 수 있습니다. ?

    복잡한 정규 표현식을 만드는 데는 다양한 정규식 구성 요소를 이해하고 결합해야합니다. 여기에는 리터럴, 캐릭터 클래스, 정량 자 및 메타 카라스터가 포함됩니다. 이러한 구성 요소를 다양한 방식으로 결합하면 다양한 패턴과 일치하는 정규 표현식을 만들 수 있습니다. 예를 들어, 이메일 주소, 전화 번호 또는 URL과 일치하는 정규 표현식을 만들 수 있습니다. 정규 표현식 (Regex)을 사용할 때 피해야 할 몇 가지 일반적인 실수는 무엇입니까 (Regex)?

    정규 표현식을 사용할 때 피해야 할 몇 가지 일반적인 실수에는 DOT (.) 또는 별표와 같은 특정 구성 요소가 과도하게 사용하거나 오용하는 것이 포함됩니다 ( *), 예상치 못한 결과로 이어질 수 있습니다. 또 다른 일반적인 실수는 말 그대로 해석 될 때 특수 캐릭터를 제대로 탈출하지 않습니다. 또한 정규 표현이 기본적으로 사례에 민감하다는 것을 기억하는 것이 중요하므로 사례를 무시하려면 적절한 플래그를 사용해야합니다.

    정규 표현식 (Regex)을 어떻게 테스트 할 수 있습니까?

    일반 표현식을 테스트 할 수있는 몇 가지 온라인 도구가 있습니다. 이 도구를 사용하면 일반적으로 정규 표현식과 테스트 문자열을 입력 한 다음 정규 표현식과 일치하는 테스트 문자열의 일부를 강조 표시합니다. 이것은 정규 표현을 디버깅하고 예상대로 작동하는지 확인하는 좋은 방법이 될 수 있습니다.

    정규 표현식 (정규 표현)은 모든 프로그래밍 언어에서 사용할 수 있습니까?

    대부분의 현대 프로그래밍 언어는 정기적으로 지원합니다. 어떤 형태의 표현. 그러나 지원되는 특정 구문 및 기능은 언어마다 다를 수 있습니다. 예를 들어, JavaScript, Python 및 Ruby는 모두 정규 표현식을 지원하지만 각각 고유 한 구문 및 기능을 갖습니다.

    정규식 (Regex)을 사용하는 성능은 무엇입니까?

    정규 표현은 엄청나게 강력 할 수 있지만 제대로 사용하지 않으면 자원 집약적 일 수도 있습니다. 복잡한 정규 표현식은 특히 큰 텍스트 문자열에서 실행하는 데 오랜 시간이 걸릴 수 있습니다. 따라서 정규 표현식을 신중하게 사용하고 가능한 한 최적화하는 것이 중요합니다.

    정규 표현식 (Regex)을 최적화 할 수 있습니까?

    정기적 인 표현을 최적화하기위한 몇 가지 전략이 있습니다. 여기에는 불필요한 정량자를 피하고, 일치하는 텍스트가 필요하지 않을 때는 캡처되지 않은 그룹을 사용하고, 가능한 경우 교대 대신 문자 클래스를 사용하는 것이 포함됩니다. 또한 일부 정규식 엔진은 게으른 정량기와 같은 최적화 기능을 제공하여 성능을 향상시킬 수 있습니다.

    정규 표현식에 대해 더 많이 배우기위한 리소스는 무엇입니까 (Regex)? 정규 표현에 대해 더 많이 배울 수 있습니다. 여기에는 온라인 자습서, 서적 및 대화식 학습 플랫폼이 포함됩니다. 또한, 많은 프로그래밍 언어에는 정규 표현 구문 및 기능에 대한 광범위한 문서가 있습니다.

    정규식 (정규식)을 사용하여 HTML 또는 XML?

    일반 표현식을 사용하는 것이 기술적으로 가능합니다. HTML 또는 XML을 구문 분석하려면 일반적으로 권장되지 않습니다. HTML과 XML은 정규 표현식으로 정확하게 캡처하기 어려운 중첩 구조를 가지고 있기 때문입니다. 대신, 일반적으로 전용 HTML 또는 XML 파서를 사용하는 것이 좋습니다. 정규 표현식 (Regex)에 대한 몇 가지 대안은 무엇입니까?

    정규 표현은 엄청나게 강력하지만 항상 작업에 가장 적합한 도구는 아닙니다. 당면한 작업에 따라 다른 접근 방식을 사용하는 것이 좋습니다. 예를 들어 간단한 문자열 조작 작업의 경우 정규식 대신 내장 문자열 메소드를 사용할 수 있습니다. HTML 또는 XML을 구문 분석하려면 일반적으로 전용 파서를 사용합니다. 복잡한 텍스트 처리 작업의 경우 자연어 처리 라이브러리 사용을 고려할 수 있습니다.

    위 내용은 실제 사례와 함께 Regex를 탈취합니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

    본 웹사이트의 성명
    본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
    인기 튜토리얼
    더>
    최신 다운로드
    더>
    웹 효과
    웹사이트 소스 코드
    웹사이트 자료
    프론트엔드 템플릿