from_url_start ='s?q='
if line.find(from_url_start)!=-1:
from_url = +line.split(from_url_start)[1].split('&')[0]
Ich habe den Startindex auf „s?q=“ gesetzt und dann
from_url = +line.split(from_url_start)[1].split('&')[0]
Setzen Sie die Zeichenfolge, die mit split('&') endet, auf dieses '&' und extrahieren Sie dann den Mittelwert dieser beiden.
Der Wert inist
%E6%B0%B4%E6%9E%9C%E5%B9%B2%E8%8C%B6%E5%88%B6%E4%BD%9C
Der vollständige Code lautet
s?q=%E8%8D%92%E9%87%8E%E8%8C%B6%E5%92%8C%E8%8C%B6%E5%9B%AD%E8%8C%B6%E7%9A%84%E5%8C%BA%E5%88%AB&src=result_input&srcg=360aphone&rg=0&_ms=0&log_id=548920"
或者
s?q=%E5%B0%8F%E7%BD%90%E8%8C%B6%E5%8A%A0%E7%9B%9F%E8%B4%B9%E8%A6%81%E5%A4%9A%E5%B0%91%E9%92%B1"
Im vollständigen Code gibt es zwei Endsymbole & und „
Gibt es eine Möglichkeit, eine festzulegen und nur „dies“ auszuwählen, um den Abfangbereich zu beenden, wenn & nicht existiert?
Welche Art von Regelmäßigkeit ist erforderlich?
Wenn Sie split('&|"') so festlegen, wird dies der Fall sein Extrahieren Sie gleichzeitig die unnötigen Parameter
%E8%8D%92%E9%87%8E%E8%8C%B6%E5%92%8C%E8%8C%B6%E5%9B%AD%E8%8C%B6%E7%9A%84%E5%8C%BA%E5%88%AB&src=result_input&srcg=360aphone&rg=0&_ms=0&log_id=548920
可以先使用replace把 & 统一换成 "