Python 정규식의 중국어 일치 예

巴扎黑
풀어 주다: 2016-12-07 11:05:45
원래의
1448명이 탐색했습니다.

#coding=utf-8 
import re 
from urllib2 import urlopen 
webpage = urlopen('http://www.baidu.com')       #获取百度页面的信息
text = webpage.read()                           #读取为文本
tmp = text.decode('utf8')                       #对原文本进行utf8转码, 此处要跟代码的编码格式一致
pat = &#39;<title>(.*)?([\u4e00-\u9fa5]*)?</title>&#39; #对中文进行匹配
re.escape(pat)                                  #对匹配模式中需要转义的符号进行转义
pat = re.compile(pat)                           #compile一下
m = re.search(pat,tmp) 
title = m.group(1) 
print title 
webpage.close()
로그인 후 복사

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿