Ich verwende Python, um den CSDN-Webcrawler auszuführen. Beim Crawlen des Webseitentitels kann der reguläre Ausdruck, den ich verwendet habe, nicht mehr in CSDN verwendet werden. Der Titel wird in einer neuen Zeile angezeigt (?<=<title>).+?(?=<)
PS:
Nach der Methode von @caimaoy habe ich den regulären Ausdruck in
geändert und der Titel wurde perfekt extrahiert. (?<=<title>)(?:.|n)+?(?=<)
Nochmals vielen Dank an alle.
re.M 多行模式
自己写多行匹配 http://python3-cookbook.readt...
表达式那边加个
flag
吧