Go 言語では、str は不変のバイト シーケンスである「string」を指します。文字列には任意のデータを含めることができますが、通常は読み取り可能なテキストを含めるために使用されます。文字列は UTF-8 文字のシーケンスです (文字が ASCII コード テーブル内の文字の場合、1 バイトを占有し、その他の文字は UTF-8 文字に基づきます)。 2 ~ 4 バイトが必要です)。文字列は値型であり、その値は不変です。つまり、テキストが作成されると、このテキストの内容を再度変更することはできません。より深く言えば、文字列は固定長のバイト配列です。
このチュートリアルの動作環境: Windows 7 システム、GO バージョン 1.18、Dell G3 コンピューター。
Go 言語では、str は「文字列」を指します。
文字列は不変のバイトのシーケンスです。文字列には任意のデータを含めることができますが、通常は読み取り可能なテキストを含めるために使用されます。文字列は UTF-8 文字のシーケンスです。(文字がASCII コード テーブルでは、これらの文字は 1 バイトを占め、その他の文字は必要に応じて 2 ~ 4 バイトを占めます)。
Go 言語の文字列の内部実装では UTF-8 エンコーディングが使用されており、UTF-8 の各文字にはルーン タイプを通じて簡単にアクセスできます。もちろん、Go 言語は従来の ASCII コードでの文字ごとのアクセスもサポートしています。
UTF-8 は広く使用されているエンコード形式であり、XML や JSON などのテキスト ファイルの標準エンコードです。このエンコーディングによって占有されるバイト長が不確実であるため、Go 言語の文字列も必要に応じて 1 ~ 4 バイトを占有する可能性があります。これは、C、Java、Python などの他のプログラミング言語とは異なります (Java は常に2バイトを使用します)。 Go 言語はこれを行うことで、メモリとハードディスクの使用量を削減するだけでなく、他の言語のように UTF-8 文字セットを使用してテキストをエンコードおよびデコードする必要もありません。
文字列は値型であり、値は不変です。つまり、特定のテキストを作成した後、このテキストの内容を再度変更することはできません。より深く言えば、文字列は固定長のバイト配列です。 。
文字列の定義
二重引用符 "" を使用して文字列を定義でき、文字列内でエスケープ文字を使用して行を実現できます。改行、インデント、およびその他の効果で、一般的に使用されるエスケープ文字は次のとおりです。
\n
: 改行文字
\r
: キャリッジリターン
##\t: タブキー
\u または \U: Unicode 文字
\\: バックスラッシュ自体
package main import ( "fmt" ) func main() { var str = "PHP中文网\nGo语言教程" fmt.Println(str) }
##一般的な比較演算子 (==、!=、<、<=、>=、>) はメモリ内のバイト単位で比較されます。文字列比較を実装するには、次の結果が必要です。比較は文字列の自然なエンコード順序です。文字列が占めるバイト数の長さは、len(str) などの関数 len() を通じて取得できます。
文字列の内容 (純粋なバイト) は、標準のインデックス作成方法で取得できます。インデックスを角かっこ [] で囲んでください。インデックスは 0 からカウントされます:
&str[i]など、文字列内の特定のバイトのアドレスを取得することは違法です。
文字列結合文字「 」2 つの文字列 s1 と s2 は、 s := s1 s2 によって結合できます。 s2 を s1 の末尾に追加し、新しい文字列 s を生成します。
次の方法で、コード内の複数行の文字列を結合できます。
str := "Beginning of the string " + "second part of the string"
#「=」を使用して文字列を結合することもできます:
s := "hel" + "lo," s += "world!" fmt.Println(s) //输出 “hello, world!”ログイン後にコピー
#複数行の文字列を定義
# Go 言語では、二重引用符を使用して文字列を記述する方法は、文字列の一般的な表現の 1 つです。これを文字列リテラルと呼びます。この種の二重引用符リテラルは行をまたぐことはできません。ソース コード内で使用したい場合は、複数行の文字列を文字列に埋め込む場合は、` バックティックを使用する必要があります。コードは次のとおりです:
const str = `第一行 第二行 第三行 \r\n ` fmt.Println(str)
Backticks
`はキーボードのキー 1 の左側にあるキーで、2 つのバッククォートに挟まれた文字列がそのまま str 変数に代入されます。
このメソッドでは、バックティック間の改行は文字列内の改行として扱われますが、エスケープ文字はすべて無効となり、テキストがそのまま出力されます。複数行の文字列は、通常、埋め込みソース コードと埋め込みデータに使用されます。コードは次のとおりです:
const codeTemplate = `// Generated by github.com/davyxu/cellnet/ protoc-gen-msg // DO NOT EDIT!{{range .Protos}} // Source: {{.Name}}{{end}} package {{.PackageName}} {{if gt .TotalMessages 0}} import ( "github.com/davyxu/cellnet" "reflect" _ "github.com/davyxu/cellnet/codec/pb" ) {{end}} func init() { {{range .Protos}} // {{.Name}}{{range .Messages}} cellnet.RegisterMessageMeta("pb","{{.FullName}}", reflect.TypeOf((*{{.Name}})(nil)).Elem(), {{.MsgID}}) {{end}} {{end}} }
这段代码只定义了一个常量 codeTemplate,类型为字符串,使用`
定义,字符串的内容为一段代码生成中使用到的 Go 源码格式。
在`
间的所有代码均不会被编译器识别,而只是作为字符串的一部分。
字符串字面量
在Go语言中,字符串字面量是通过两种不同的方式创建的:
使用双引号(""
):在这里,字符串字面量使用双引号(""
)创建。此类字符串支持转义字符,如下表所示,但不跨越多行。这种类型的字符串文字在Golang程序中被广泛使用。
转义符 | 描述 |
---|---|
\\ | 反斜杠(\) |
\000 | 具有给定的3位8位八进制代码点的Unicode字符 |
\’ | 单引号(')。仅允许在字符文字中使用 |
\” | 双引号("")。仅允许在解释的字符串文字中使用 |
\a | ASCII铃声(BEL) |
\b | ASCII退格键(BS) |
\f | ASCII换页(FF) |
\n | ASCII换行符(LF) |
\r | ASCII回车(CR) |
\t | ASCII标签(TAB) |
\uhhhh | 具有给定的4位16位十六进制代码点的Unicode字符。 |
具有给定的8位32位十六进制代码点的Unicode字符。 | |
\v | ASCII垂直制表符(VT) |
\xhh | 具有给定的2位8位十六进制代码点的Unicode字符。 |
使用反引号(''
):此处,字符串文字是使用反引号(''
)创建的,也称为raw literals(原始文本)。原始文本不支持转义字符,可以跨越多行,并且可以包含除反引号之外的任何字符。通常,它用于在正则表达式和HTML中编写多行消息。
package main import "fmt" func main() { //创建并初始化 //带有字符串文字的变量 //使用双引号 My_value_1 := "Welcome to nhooo" //添加转义字符 My_value_2 := "Welcome!\nnhooo" //使用反引号 My_value_3 := `Hello!nhooo` //添加转义字符 //原始文本 My_value_4 := `Hello!\nnhooo` //显示 fmt.Println("String 1: ", My_value_1) fmt.Println("String 2: ", My_value_2) fmt.Println("String 3: ", My_value_3) fmt.Println("String 4: ", My_value_4) }
输出:
关于字符串的要点
字符串是不可变的:在Go语言中,一旦创建了字符串,则字符串是不可变的,无法更改字符串的值。换句话说,字符串是只读的。如果尝试更改,则编译器将引发错误。
//字符串是不可变的 package main import "fmt" func main() { //创建和初始化字符串 //使用简写声明 mystr := "Welcome to nhooo" fmt.Println("String:", mystr) /* 果你试图改变字符串的值,编译器将抛出一个错误,例如, cannot assign to mystr[1] mystr[1]= 'G' fmt.Println("String:", mystr) */ }
输出:
如何遍历字符串?:您可以使用for range循环遍历字符串。此循环可以在Unicode代码点上迭代一个字符串。
语法:
for index, chr:= range str{ // 语句.. }
在这里,索引是存储UTF-8编码代码点的第一个字节的变量,而chr是存储给定字符串的字符的变量,str是字符串。
//遍历字符串 //使用for范围循环 package main import "fmt" func main() { //字符串作为for循环中的范围 for index, s := range "nhooo" { fmt.Printf("%c 索引值是 %d\n", s, index) } }
输出:
如何访问字符串的单个字节?:字符串是一个字节,因此,我们可以访问给定字符串的每个字节。
//访问字符串的字节 package main import "fmt" func main() { //创建和初始化一个字符串 str := "Welcome to nhooo" //访问给定字符串的字节 for c := 0; c < len(str); c++ { fmt.Printf("\n字符 = %c 字节 = %v", str[c], str[c]) } }
如何从切片创建字符串?:在Go语言中,允许您从字节切片创建字符串。
//从切片创建一个字符串 package main import "fmt" func main() { //创建和初始化一个字节片 myslice1 := []byte{0x47, 0x65, 0x65, 0x6b, 0x73} //从切片创建字符串 mystring1 := string(myslice1) //显示字符串 fmt.Println("String 1: ", mystring1) //创建和初始化一个符文切片 myslice2 := []rune{0x0047, 0x0065, 0x0065, 0x006b, 0x0073} //从切片创建字符串 mystring2 := string(myslice2) //显示字符串 fmt.Println("String 2: ", mystring2) }
如何查找字符串的长度?:在Golang字符串中,可以使用两个函数(一个是len(),另一个是RuneCountInString())来找到字符串的长度。UTF-8包提供了RuneCountInString()函数,该函数返回字符串中存在的符文总数。len()函数返回字符串的字节数。
//查找字符串的长度 package main import ( "fmt" "unicode/utf8" ) func main() { //创建和初始化字符串 //使用简写声明 mystr := "Welcome to nhooo ??????" //查找字符串的长度 //使用len()函数 length1 := len(mystr) //使用RuneCountInString()函数 length2 := utf8.RuneCountInString(mystr) //显示字符串的长度 fmt.Println("string:", mystr) fmt.Println("Length 1:", length1) fmt.Println("Length 2:", length2) }
以上がgo 言語で str は何を意味しますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。