from_url_start ='s?q='
if line.find(from_url_start)!=-1:
from_url = +line.split(from_url_start)[1].split('&')[0]
我透過設定開始索引是's?q='這個,然後再
from_url = +line.split(from_url_start)[1].split('&')[0]
設定結束split('&')的字串 是這個'&',然後提取這兩個中間的值
裡面的值為
%E6%B0%B4%E6%9E%9C%E5%B9%B2%E8%8C%B6%E5%88%B6%E4%BD%9C
完整的程式碼為
s?q=%E8%8D%92%E9%87%8E%E8%8C%B6%E5%92%8C%E8%8C%B6%E5%9B%AD%E8%8C%B6%E7%9A%84%E5%8C%BA%E5%88%AB&src=result_input&srcg=360aphone&rg=0&_ms=0&log_id=548920"
或者
s?q=%E5%B0%8F%E7%BD%90%E8%8C%B6%E5%8A%A0%E7%9B%9F%E8%B4%B9%E8%A6%81%E5%A4%9A%E5%B0%91%E9%92%B1"
在完整程式碼中有兩種結束的識別&和"
有沒有辦法設定一個,當不存在&時才選擇"這個為結束截取區域
需要什麼樣的正則
如果這樣設定split('&|"')他就會同時把後面不需要的參數提取出來
如
%E8%8D%92%E9%87%8E%E8%8C%B6%E5%92%8C%E8%8C%B6%E5%9B%AD%E8%8C%B6%E7%9A%84%E5%8C%BA%E5%88%AB&src=result_input&srcg=360aphone&rg=0&_ms=0&log_id=548920
他就把這段提取出來了
可以先用replace把 & 統一換成 "