php小編子墨在這裡為大家介紹一個有關Golang的小技巧。在使用html.Parse解析HTML時,有時我們需要重寫href的查詢字串,以包含&符號。這個技巧可以幫助我們在處理HTML連結時更有彈性方便,提升開發效率。接下來,我們將詳細講解如何使用該技巧,並且給出範例程式碼,希望對大家有所幫助。
我有以下程式碼:
package main import ( "os" "strings" "golang.org/x/net/html" ) func main() { myhtmldocument := `<!doctype html> <html> <head> </head> <body> <a href="http://www.example.com/input?foo=bar&baz=quux">wtf</a> </body> </html>` doc, _ := html.parse(strings.newreader(myhtmldocument)) html.render(os.stdout, doc) }
html.render 函數產生以下輸出:
<!DOCTYPE html><html><head> </head> <body> <a href="http://www.example.com/input?foo=bar&baz=quux">WTF</a> </body></html>
為什麼要重寫查詢字串並將 &
轉換為 &
(在 bar 和 baz 之間)?
有辦法避免這種行為嗎?
我正在嘗試進行模板轉換,但我不希望它破壞我的網址。
html.parse
想要產生有效的html,並且html 規範規定href
屬性中的與號碼必須進行編碼。
https://www.w3.org/tr/xhtml1/guidelines .html#c_12
在 sgml 和 xml 中,與字元(“&”)聲明實體引用的開始(例如,® 表示註冊商標符號“®”)。不幸的是,許多 html 使用者代理程式都默默地忽略了 html 文件中 & 符號的錯誤用法 - 將看起來不像實體引用的 & 符號視為文字 & 符號。基於 xml 的使用者代理程式不會容忍這種不正確的使用,並且任何錯誤使用 & 符號的文檔都將不是“有效的”,因此將不符合此規範。為了確保文件與歷史 html 使用者代理程式和基於 xml 的使用者代理程式相容,文件中使用的被視為文字字元的 & 符號必須將其自身表示為實體引用(例如「&」)。
例如,a元素的href屬性引用帶參數的cgi腳本時,必須表示為http://my.site.dom/cgi-bin/myscript.pl?class=guest& name=user
而不是http://my.site.dom/cgi-bin/myscript.pl?class=guest&name=user
。
在這種情況下,go 實際上使您的 html 更好、更有效
話雖這麼說- 瀏覽器將對其進行轉義,因此如果單擊它,生成的url 仍然是正確的(沒有&
,只有&
:
console.log(document.queryselector('a').href)
<a href="http://www.example.com/input?foo=bar&baz=quux">WTF</a>
以上是Golang html.Parse重寫href查詢字串以包含&的詳細內容。更多資訊請關注PHP中文網其他相關文章!