不同语言中的正则表达式行为:Go 与 Python
当尝试在 Go 中使用正则表达式时,开发人员可能会遇到意外行为。例如,考虑以下代码:
package main import ( "fmt" "regexp" ) func main() { a := "parameter=0xFF" regex := "^.+=\b0x[A-F][A-F]\b$" result, err := regexp.MatchString(regex, a) fmt.Println(result, err) // Prints: false <nil> }
尽管在 Python 中正常工作,但此代码无法匹配预期的输入字符串:
import re p = re.compile(r"^.+=\b0x[A-F][A-F]\b$") m = p.match("parameter=0xFF") if m is not None: print(m.group()) # Prints: parameter=0xFF
这种差异的根本原因在于Go 和 Python 中字符串文字之间的差异。在 Go 中,默认情况下字符串文字被视为“熟的”,这意味着它们被解释为特殊字符,例如转义序列。然而,对于正则表达式来说,这种行为是有问题的。
为了解决这个问题,Go 提供了原始字符串文字。原始字符串文字用反引号 (`) 而不是引号 (") 括起来。它们会忽略任何特殊字符或转义序列,确保文字完全按照书面形式进行解释。
因此,要解决此问题,请使用在 Go 代码中,正则表达式应指定为原始字符串文字:
var regex = `^.+=\b0x[A-F][A-F]\b$`
通过此修改,代码现在将正确匹配输入字符串并产生所需的结果。
以上是为什么 Go 和 Python 正则表达式产生不同的结果?的详细内容。更多信息请关注PHP中文网其他相关文章!