정규식 시작하기
cjx는 최근 크롤러 프로젝트를 진행하고 있는데 페이지에서 원하는 콘텐츠를 급히 캡쳐해야 하는데, 논리적인 판단을 통해 그것을 얻는 것이 너무 복잡합니다. 다행스럽게도 우리는 정규식이라는 강력한 도구를 가지고 있어 많은 일을 쉽게 수행할 수 있습니다. Cjx도 이전에 정규식에 대해 어느 정도 알고 있었습니다. 하지만 항상 이해가 불완전한 상태에 있었고 혼자서는 만족스러운 정규식을 효과적으로 작성하기가 어렵습니다. 최근에 저는 Jeffrey E.F. Fried가 쓴 Mastering Regular Expressions라는 책을 인터넷에서 발견했습니다. 첫 장을 읽고 문득 몇 가지 규칙을 쓸 수 있다는 걸 깨달았어요, 하하~~ cjx는 갑자기 패자에서 키 크고 돈 많고 잘생긴 사람으로 업그레이드 된 것 같은 느낌이 들었어요... 다음은 그 내용을 요약한 것입니다. 책의 첫 번째 장~
줄의 시작과 끝
아마도 가장 이해하기 쉬운 메타 문자는 캐럿 ^과 달러 기호 $일 것입니다. 텍스트 줄을 확인할 때 ^는 시작을 나타냅니다. 라인의 $는 끝을 나타냅니다.
독자는 문자에 따라 정규식을 이해하는 습관을 기르는 것이 가장 좋습니다. 예를 들어,
^cat는 cat
으로 시작하는 줄과 일치하지만, 대신
^cat는 첫 번째 문자로 c로 시작하고 그 뒤에 오는 줄과 일치합니다. a 다음에 t라는 텍스트가 옵니다.
두 해석의 결과에는 차이가 없지만, 새로 접한 정규식의 내부 논리를 문자별로 해석하면 이해하기가 더 쉽습니다.
여러 문자 중 하나와 일치합니다.
"grey"라는 단어를 검색해야 하는데 "grey"로 쓰여 있는지 확실하지 않은 경우 다음을 사용할 수 있습니다. 정규식 수식 구조 [...]. 이를 통해 사용자는 일반적으로 문자 그룹이라고 하는 어딘가에서 일치할 것으로 예상되는 문자를 나열할 수 있습니다.
그래서 gr[ea]y는 g를 먼저 찾은 다음 r을 찾은 다음 a 또는 e를 찾은 다음 마지막으로 y를 찾는 것을 의미합니다.
문자 그룹 내에서 문자 메타 문자 '-'는 범위를 나타냅니다.
[0-9A-Z_!.?]는 숫자, 대문자, 밑줄, 느낌표, 마침표 또는 물음표와 일치할 수 있습니다.
전용 문자 그룹
[...]을 [^...]으로 바꾸세요. 이 문자 그룹은 목록에 없는 모든 문자와 일치합니다. 예: [^1-6]은 1~6을 제외한 모든 문자와 일치합니다. 이 그룹 시작 부분의 ^는 제외를 의미하므로 여기에 나열되는 것은 일치시키려는 문자가 아니라 일치시키지 않으려는 문자입니다.
점을 사용하여 모든 문자를 일치시키세요
메타 문자는 모든 문자를 일치시키는 데 사용되는 문자 그룹을 작성하는 간단한 방법입니다. 표현식에서 "모든 문자 일치" 자리 표시자를 사용해야 하는 경우 점을 사용하는 것이 편리합니다.
은 모든 하위 표현식과 일치합니다.
메타 문자 |는 "또는"을 의미하는 매우 간결한 메타 문자입니다. 이를 활용하면 다양한 하위 표현식을 전체 표현식으로 결합할 수 있으며, 이 전체 표현식은 모든 하위 표현식과 일치할 수 있습니다.
선택 요소
이제 색상과 색상의 매칭을 살펴보겠습니다. 이들 사이의 차이점은 다음 단어가 이전 단어보다 u가 하나 더 많다는 것입니다. 이 문제를 해결하기 위해 coloru?r을 사용할 수 있습니다. 메타 문자 ?(즉, 물음표)는 선택적 옵션을 나타냅니다. 문자 뒤에 추가한다는 것은 해당 문자가 여기에 나타날 수 있다는 것을 의미하지만, 해당 문자의 발생이 성공적인 일치를 위한 필수 조건은 아닙니다.
기타 수량사:
+(더하기 기호) 및 *(별표)가 반복적으로 나타나는 경우 물음표와 유사하게 작동합니다. 메타 문자 +는 바로 앞의 요소가 한 번 이상 나타나는 것을 의미하고, *는 바로 앞의 요소가 여러 번 나타나거나 전혀 나타나지 않음을 의미합니다.
다음으로 높이 14의 수평선을 나타내는
와 같은 TAG를 살펴보세요. 또한 HR과 SIZE 사이에는 공백이 있어야 하며, 등호 양쪽에는 공백이 있어서는 안 됩니다. 그래서 웹페이지에서 그러한 HR을 찾고 싶다면
와 같이 표현을 작성합니다. 때로는 HR의 SIZE 값이 가변적인 경우가 많아 SIZE 속성이 존재하지 않을 수도 있습니다. 그런 다음 표현식은
괄호 및 역참조
지금까지 우리는 대괄호의 두 가지 용도를 살펴보았습니다. 1. 여러 옵션의 범위를 제한합니다. 2. 질문과 같은 수량어에 따라 여러 문자를 하나의 단위로 결합합니다. 표시 또는 별표 기능. 이제 역참조인 대괄호의 또 다른 용도를 소개하고 싶습니다. egrep에서는 일반적이지 않지만(인기 있는 GNU 버전에서는 이 기능을 지원하지만) 다른 도구에서는 매우 일반적입니다.
역참조를 지원하는 도구 소프트웨어에서 대괄호는 하위 표현식과 일치하는 텍스트를 "기억"할 수 있습니다. 이러한 텍스트가 무엇이든 메타문자 시퀀스 1은 이를 기억할 수 있습니다.
물론 표현식에 여러 개의 괄호를 사용할 수 있습니다. 그런 다음 1, 2, 3 등을 사용하여 첫 번째, 두 번째, 세 번째 대괄호 세트와 일치하는 텍스트를 나타냅니다. 대괄호는 여는 괄호 '('가 왼쪽에서 오른쪽으로 나타나는 순서대로 수행되므로 ([a-z])([0-9])12에서 1은 [a-z] 일치 내용을 나타내고 2는 [0을 나타냅니다. - 9] 콘텐츠 일치
마법의 탈출구
때로는 .+*?와 같은 일부 기호를 일치시켜야 할 수도 있지만 동시에 메타 기호라는 것을 알게 됩니다. 이러한 특수 메타 기호와 일치하도록
몇 가지 유용한 약어
t 탭 문자
n 줄 바꿈 문자
r 캐리지 리턴 문자
s 공백, 줄 바꿈, 탭 들여쓰기 등과 같은 모든 공백 문자. 모든 공백 문자
S s
w [a-zA-Z0-9]를 제외한 모든 문자는 w+에서 매우 유용하며 단어와 일치하는 데 사용할 수 있습니다.
W w를 제외한 모든 문자
d [0-9], 즉, 숫자
D d를 제외한 모든 문자, 즉 [^0-9]

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











확산은 더 잘 모방할 수 있을 뿐만 아니라 "창조"할 수도 있습니다. 확산 모델(DiffusionModel)은 이미지 생성 모델입니다. AI 분야에서 잘 알려진 GAN, VAE 알고리즘과 비교할 때 확산 모델은 먼저 이미지에 노이즈를 추가한 다음 점차적으로 노이즈를 제거하는 프로세스를 취합니다. 원본 이미지의 노이즈를 제거하고 복원하는 방법이 알고리즘의 핵심 부분입니다. 최종 알고리즘은 임의의 잡음이 있는 이미지에서 이미지를 생성할 수 있습니다. 최근 몇 년 동안 생성 AI의 경이적인 성장으로 인해 텍스트-이미지 생성, 비디오 생성 등에서 많은 흥미로운 애플리케이션이 가능해졌습니다. 이러한 생성 도구의 기본 원리는 이전 방법의 한계를 극복하는 특수 샘플링 메커니즘인 확산의 개념입니다.

키미: 단 한 문장이면 단 10초만에 PPT가 완성됩니다. PPT가 너무 짜증나네요! 회의를 하려면 PPT가 있어야 하고, 주간 보고서를 작성하려면 PPT가 있어야 하며, 누군가를 부정행위를 했다고 비난하려면 PPT를 보내야 합니다. 대학은 PPT 전공을 공부하는 것과 비슷합니다. 수업 시간에 PPT를 보고 수업 후에 PPT를 하는 거죠. 아마도 데니스 오스틴이 37년 전 PPT를 발명했을 때, 언젠가 PPT가 이렇게 널리 보급될 것이라고는 예상하지 못했을 것입니다. 우리가 PPT를 만들면서 힘들었던 경험을 이야기하면 눈물이 납니다. "20페이지가 넘는 PPT를 만드는 데 3개월이 걸렸고, 수십 번 수정했어요. PPT를 보면 토할 것 같았어요. 한창 때는 하루에 다섯 장씩 했는데, 숨소리까지 냈어요." PPT였어요." 즉석 회의가 있으면 해야죠.

베이징 시간으로 6월 20일 이른 아침, 시애틀에서 열린 최고의 국제 컴퓨터 비전 컨퍼런스인 CVPR2024가 최우수 논문 및 기타 수상작을 공식 발표했습니다. 올해는 우수논문 2편, 최우수 학생논문 2편 등 총 10편의 논문이 수상하였습니다. 컴퓨터 비전(CV) 분야 최고 학회는 매년 수많은 연구기관과 대학이 모여드는 CVPR이다. 통계에 따르면 올해 총 1만1532편의 논문이 제출돼 2719편이 채택돼 합격률 23.6%를 기록했다. Georgia Institute of Technology의 CVPR2024 데이터 통계 분석에 따르면 연구 주제 관점에서 가장 많은 논문이 이미지 및 비디오 합성 및 생성입니다(Imageandvideosyn

제목: 기술 초보자가 꼭 읽어야 할 책: C언어와 Python의 난이도 분석, 구체적인 코드 예제가 필요한 오늘날의 디지털 시대에 프로그래밍 기술은 점점 더 중요한 능력이 되었습니다. 소프트웨어 개발, 데이터 분석, 인공 지능과 같은 분야에서 일하고 싶거나 관심 있는 프로그래밍을 배우고 싶다면 적합한 프로그래밍 언어를 선택하는 것이 첫 번째 단계입니다. 많은 프로그래밍 언어 중에서 C 언어와 Python은 널리 사용되는 두 가지 프로그래밍 언어이며 각각 고유한 특성을 가지고 있습니다. 이번 글에서는 C언어와 Python의 난이도를 분석해보겠습니다.

우리는 LLM이 대규모 데이터를 사용하여 대규모 컴퓨터 클러스터에서 훈련된다는 것을 알고 있습니다. 이 사이트는 LLM 훈련 프로세스를 지원하고 개선하는 데 사용되는 다양한 방법과 기술을 소개합니다. 오늘 우리가 공유하고 싶은 것은 기본 기술에 대해 심층적으로 살펴보고 운영 체제 없이도 수많은 "베어 메탈"을 LLM 교육을 위한 컴퓨터 클러스터로 전환하는 방법을 소개하는 기사입니다. 이 기사는 기계가 생각하는 방식을 이해하여 일반 지능을 달성하기 위해 노력하는 AI 스타트업 Imbue에서 가져온 것입니다. 물론 운영 체제가 없는 "베어 메탈"을 LLM 교육을 위한 컴퓨터 클러스터로 전환하는 것은 탐색과 시행착오로 가득 찬 쉬운 과정이 아니지만 Imbue는 마침내 700억 개의 매개변수를 사용하여 LLM을 성공적으로 교육했습니다. 과정이 쌓이다

검색 증강 생성(RAG)은 검색을 사용하여 언어 모델을 향상시키는 기술입니다. 특히, 언어 모델은 답변을 생성하기 전에 광범위한 문서 데이터베이스에서 관련 정보를 검색한 다음 이 정보를 사용하여 생성 프로세스를 안내합니다. 이 기술은 콘텐츠의 정확성과 관련성을 크게 향상시키고 환각 문제를 효과적으로 완화하며 지식 업데이트 속도를 높이고 콘텐츠 생성 추적성을 향상시킬 수 있습니다. RAG는 의심할 여지 없이 인공 지능 연구에서 가장 흥미로운 분야 중 하나입니다. RAG에 대한 자세한 내용은 본 사이트의 칼럼 기사 "대형 모델의 단점을 보완하는 데 특화된 RAG의 새로운 발전은 무엇인가?"를 참조하시기 바랍니다. 이 리뷰는 이를 명확하게 설명합니다." 그러나 RAG는 완벽하지 않으며 사용자는 이를 사용할 때 몇 가지 "고통"에 직면하는 경우가 많습니다. 최근 NVIDIA의 고급 생성 AI 솔루션

Machine Power Report 편집자: Yang Wen 대형 모델과 AIGC로 대표되는 인공지능의 물결은 우리가 살고 일하는 방식을 조용히 변화시키고 있지만 대부분의 사람들은 여전히 그것을 어떻게 사용하는지 모릅니다. 이에 직관적이고 흥미롭고 간결한 인공지능 활용 사례를 통해 AI 활용 방법을 자세히 소개하고 모두의 사고를 자극하고자 'AI in Use' 칼럼을 론칭하게 됐다. 또한 독자들이 혁신적인 실제 사용 사례를 제출하는 것을 환영합니다. 영상 링크 : https://mp.weixin.qq.com/s/2hX_i7li3RqdE4u016yGhQ 최근 샤오홍슈에서는 혼자 사는 소녀의 인생 브이로그가 인기를 끌었습니다. 몇 가지 치유의 말과 함께 일러스트레이션 스타일의 애니메이션을 단 며칠 만에 쉽게 익힐 수 있습니다.

VSCode(Visual Studio Code)는 Microsoft에서 개발한 오픈 소스 코드 편집기로, 강력한 기능과 풍부한 플러그인 지원을 갖추고 있어 개발자가 선호하는 도구 중 하나입니다. 이 기사에서는 초보자가 VSCode 사용 기술을 빠르게 익히는 데 도움이 되는 소개 가이드를 제공합니다. 이번 글에서는 VSCode 설치 방법, 기본적인 편집 작업, 단축키, 플러그인 설치 등을 소개하고, 독자들에게 구체적인 코드 예시를 제공하겠습니다. 1. 먼저 VSCode를 설치하세요.
