在Go 中,使用字符串範圍和符文切片進行迭代乍一看可能看起來相同,因為兩者都會產生Unicode對應資料結構的代碼點。但是,在處理多位元組字元時,有一個關鍵的區別變得明顯。
當您直接對字串進行範圍時,如以下程式碼所示:
<code class="go">for _, s := range str { fmt.Printf("type of v: %s, value: %v, string v: %s \n", reflect.TypeOf(s), s, string(s)) }</code>
您實際上是在迭代位元組序列。由於 Go 字串本質上是位元組數組,因此每次迭代都會從字串中產生一個位元組。對於主要包含 ASCII 字元的字串,這種粒度可能不會造成問題。但是,對於包含多位元組字元的 Unicode 字串,按位元組迭代可能會導致意外結果。
相反,對透過明確轉換字串建立的符文切片進行範圍到一段符文,例如:
<code class="go">for _, s := range []rune(str) { fmt.Printf("type : %s, value: %v ,string : %s\n", reflect.TypeOf(s), s, string(s)) }</code>
為您提供程式碼點的迭代。與字串不同,符文切片是 Unicode 字元的序列,這使得它們更適合在字元層級對文字資料進行操作。
範圍字串和符文切片之間的選擇變成使用索引時更為重要。索引字串將為您提供字元的位元組位置,而索引符文切片將提供字元在代碼點序列中的索引。
例如,如果您有一個包含多位元組字元的字串在索引 1 處,將其索引為符文切片將提供該字元的索引,則該索引可能與位元組索引不同。
在 Go 中,範圍涵蓋字串和符文切片不同的目的。對字串進行範圍調整可以提供字節,而對符文切片進行範圍調整則提供字元級迭代。兩者之間的決定取決於您是否需要使用位元組或字符,以及索引是否是一個因素。對於通用文字操作,符文切片是首選,無論字元編碼如何,都能確保基於字元的操作一致。
以上是Go 中字串和符文切片的範圍有什麼不同?的詳細內容。更多資訊請關注PHP中文網其他相關文章!