Terdapat lima jenis unsur leksikal dalam bahasa Go: 1. Pengecam, iaitu urutan aksara yang terdiri daripada beberapa huruf (dikodkan oleh Unicode), garis bawah dan nombor 2. Kata kunci, yang dikhaskan oleh bahasa pengaturcaraan Urutan aksara yang tidak dibenarkan digunakan oleh pengaturcara sebagai pengecam juga boleh dipanggil perkataan terpelihara; tatatanda.
Persekitaran pengendalian tutorial ini: sistem Windows 7, GO versi 1.18, komputer Dell G3.
Simbol bahasa bagi bahasa Go juga dipanggil unsur leksikal, yang merangkumi 5 kategori: pengecam, kata kunci, operator, pembatas dan Huruf , ia adalah unit paling asas yang membentuk Go kod dan program bahasa.
Secara umum, ruang, tab mendatar, pemulangan pengangkutan dan suapan baris diabaikan melainkan ia digunakan sebagai sebahagian daripada pemisah antara simbol berbilang bahasa. Tidak perlu memasukkan titik bertitik secara eksplisit dalam bahasa Go Apabila perlu, bahasa Go secara automatik akan memasukkan kod bertitik ke dalam kod untuk memisahkan pernyataan.
Kod bahasa Go terdiri daripada beberapa aksara Unicode Semua kod sumber bahasa Go mesti dikodkan dalam format pengekodan UTF-8 bagi spesifikasi pengekodan Unicode (iaitu, kod sumber bahasa Go bertulis. fail mestilah format pengekodan UTF- 8).
Simbol bahasa bagi bahasa Go juga dipanggil elemen leksikal, termasuk 5 kategori: Pengecam (pengecam), Kata kunci (kata kunci), Aksara operasi (pengendali), pembatas (pembatas) dan literal (tersurat). Secara umum, ruang, tab mendatar, pemulangan pengangkutan dan suapan baris diabaikan melainkan ia digunakan sebagai sebahagian daripada pemisah antara simbol berbilang bahasa. Tidak perlu memasukkan koma bertitik secara eksplisit dalam bahasa Go Apabila perlu, bahasa Go akan secara automatik memasukkan kod bertitik ke dalam kod untuk memisahkan pernyataan.
Kod bahasa Go terdiri daripada beberapa aksara Unicode Semua kod sumber bahasa Go mesti dikodkan dalam format pengekodan UTF-8 bagi spesifikasi pengekodan Unicode (iaitu, kod sumber bahasa Go bertulis. fail mestilah format pengekodan UTF- 8).
Pengecam bahasa Go ialah jujukan aksara yang terdiri daripada beberapa huruf (dikodkan oleh Unicode), garis bawah dan nombor aksara ini daripada mesti surat.
Nota:
Dalam kod bahasa Go, setiap pengecam mesti diisytiharkan sebelum digunakan.
Pengisytiharan mengikat pengecam bukan kosong kepada pemalar, jenis, pembolehubah, fungsi atau pakej kod.
Dalam blok kod yang sama, pengisytiharan berulang pengecam yang sama tidak dibenarkan (kecuali penyata tugasan).
Pengecam dalam fail kod sumber dan pakej kod perlu mengikut peraturan ini.
Skop pengecam yang diisytiharkan adalah sama dengan skop blok kod yang menjadi miliknya secara langsung.
Tegasnya, pernyataan pengisytiharan pakej kod bukanlah pengisytiharan. Kerana nama pakej kod tidak muncul dalam sebarang skop. Tujuan pernyataan pengisytiharan pakej kod adalah untuk mengenal pasti sama ada beberapa fail kod sumber tergolong dalam pakej kod yang sama, atau untuk menentukan nama rujukan pakej kod lalai apabila mengimport pakej kod.
Pengecam yang layak digunakan untuk mengakses pembolehubah atau jenis dalam pakej kod lain. Sebagai contoh, apabila saya perlu mengakses pemalar bernama O_RDONLY dalam os pakej kod, saya perlu menulis os.O_RDONLY seperti ini.
Pengecam yang layak boleh digunakan dan dua prasyarat perlu dipenuhi:
Pakej kod yang hendak diakses mesti diimport terlebih dahulu
Pengecam dalam pakej ini mestilah boleh dieksport.
Pengecam boleh eksport juga perlu memenuhi dua prasyarat:
Aksara pertama dalam nama pengecam mestilah huruf besar (Bahasa Go menentukan akses kebenaran pengecam ini berdasarkan kes aksara pertama dalam nama pengecam Apabila aksara pertama nama pengecam adalah huruf besar, kebenaran aksesnya adalah "awam", iaitu Pengecam boleh diakses oleh mana-mana kod dalam mana-mana pakej kod. melalui pengecam yang layak; apabila aksara pertama pengecam ialah huruf kecil, kebenaran aksesnya adalah "peribadi peringkat pakej", iaitu, hanya pengecam yang sama dengan pengecam itu hanya boleh diakses melalui kod dalam pakej kod );
Pengecam mestilah nama pembolehubah atau jenis yang diisytiharkan dalam pakej kod, atau tergolong dalam struktur Nama medan jenis atau nama kaedah.
Pengecam dipratentukan untuk bahasa Go:
Terdapat pengecam kosong dalam bahasa Go, yang diwakili oleh garis bawah dan biasanya digunakan dalam pengisytiharan yang tidak memerlukan pengenalan pengikatan baharu. Sebagai contoh, apabila kita hanya mahu melaksanakan fungsi permulaan dalam pakej kod tertentu tanpa menggunakan sebarang entiti program dalam pakej kod ini, kita boleh menulis pernyataan import berikut:
Antaranya, "runtime/cgo" mewakili pengecam pakej kod perpustakaan standard.
Kata kunci (juga dipanggil perkataan terpelihara) dikhaskan oleh bahasa pengaturcaraan dan tidak digunakan oleh pengaturcara sebagai pengecam. urutan aksara untuk digunakan.
类别 | 关键字 |
---|---|
程序声明 | import, package |
程序实体声明和定义 | chan, const, func, interface, map, struct, type, var |
程序控制流程 | go, select, break, case, continue, default, defer, else, fallthrough, for, goto, if, range, return, switch |
在Go语言中,程序实体的声明和定义是建立在其数据类型的体系之上的。例如关键字chan、func、interface、map和struct,分别于Go语言的复合数据类型Channel(通道)、Function(函数)、Interface(接口)、Map(字典)和Struct(结构体)相对应。
程序控制流程的关键字,一共15个。其中go和select,这两个主要用于Go语言并发编程。
简单来说,字面量就是值的一种标记法。但是,在Go中,字面量的含义要更加广泛一些。
Go语言代码中用到的字面量有以下3类:
1、表示基础数据类型值的各种字面量。例如,表示浮点数类型值的12E-3。
2、构造各种自定义的复合数据类型的类型字面量。例如,下面表示一个名称为Person的自定义结构体类型:
3、表示复合数据类型的值的复合字面量
被用来构造类型Struct(结构体)、Array(数组)、Slice(切片)和Map(字典)的值。例如,下面的字面量用于表示上面名称为Person的结构体类型的值:
注意:
对复合字面量的每次求值都会导致一个新的值被创建。因此,如上该复合字面量每被求值一次就会创建一个新的Person类型的值。
Go语言不允许在一个此类的复合字面变量中,出现重复的键。如下都是错误,无法通过编译,因为键都有重复。
一个类型确定了一类值的集合,以及可以在这些值上施加的操作。类型可以由类型名称或者类型字面量指定,分为基本类型和复合类型,基本类型的名称可以代表其自身。
如上声明了一个类型为string(基本类型中的一个)、名称为bookName的变量。
其他基本类型(预定义类型)有bool、byte、rune、int/uint、int8/uint8、int16/uint16、int32/uint32、int64/uint64、float32、float64、complex64和complex128。除了bool和string之外的其他基本类型也叫做数值类型。
复合类型一般由若干(也包括零)个其他已被定义的类型组合而成。复合类型有Channel(通道)、Function(函数)、Interface(接口)、Map(字典)、Struct(结构体)、Slice(切片)、Array(数组)和Pointer(指针)。
Go语言中的类型又可以分为静态类型和动态类型。一个变量的静态类型是指在变量声明中给出的那个类型。绝大多数类型的变量都只有静态类型。唯独接口类型的变量例外,它除了拥有静态类型之外,还拥有动态类型(接口类型在后面会讲到)。
每一个类型都会有一个潜在类型。如果这个类型是一个预定义类型(也就是基本类型),或者是一个由类型字面量构造的复合类型,那么它的潜在类型就是它自身。如string类型的潜在类型就是string类型,上面自定义的Person类型的潜在类型就是Person。如果一个类型并不属于上述情况,那么这个类型的潜在类型就是类型声明中的那个类型的潜在类型。
如下声明一个自定义类型
如上可以把类型MyString看作string类型的一个别名类型,那么MyString类型的潜在类型就是string类型。Go语言基本数据类型中的rune类型可以看作是uint32类型的一个别名类型,其潜在类型就是uint32。
注意:
一个类型的潜在类型具有可传递性,如下:
则类型isString的潜在类型就是string类型。
这里声明一个类型,如下:
**Nota:** Jenis asas MyStrings bukan [3]rentetan. [3] rentetan bukanlah jenis yang dipratentukan mahupun jenis komposit yang dibina daripada literal jenis, tetapi jenis tatasusunan yang jenis elemennya ialah rentetan.
Mengikut takrifan di atas, jenis potensi jenis MyStrings ialah rentetan jenis berpotensi bagi [3]rentetan.
Bahasa Go menetapkan bahawa jenis potensi jenis tatasusunan menentukan jenis elemen yang boleh disimpan dalam pembolehubah jenis itu.
Operator ialah simbol yang digunakan untuk melakukan operasi aritmetik atau logik tertentu. (Saya tidak akan menerangkannya secara terperinci di sini, ia serupa dengan operator dalam bahasa C), tetapi tiada operator ternary dalam bahasa Go, jadi kecuali untuk operator unary, semua operator mestilah operator binari. Bahasa Go mempunyai sejumlah 21 operator, termasuk operator aritmetik, operator perbandingan, operator logik, operator alamat dan operator penerimaan.
符号 | 说明 | 示例 |
---|---|---|
&& | 逻辑与操作。二元,逻辑操作符 | true && false //表达式结果是false |
== | 相等判断操作。二元,比较操作符 | “abc” == “abc”//结果是true |
!= | 不等判断操作。二元,比较操作符 | “abc” != “Abc”//结果是true |
< | 小于判断操作。二元,比较操作符 | 1 < 2 //表达式结果是true |
<= | 小于或等于。二元,比较操作符 | 1 <= 2 //表达式结果是true |
> | 大于判断操作。二元,比较操作符 | 3 > 2 //表达式结果是true |
>= | 大于或等于。二元,比较操作符 | 3 >= 2 //表达式结果是true |
+ | 表示求和,一元又是二元,算术操作符 | +1 //结果为1 (1+2) //结果是3 |
- | 表示求差,一元又是二元,算术操作符 | -1 //结果为-1 (1 – 2) //结果是-1 |
按位或操作,二元,算术操作符 | 5 11 //表达式的结果是15 | |
^ | 按位异或,一元又是二元,算术操作符 | 511//结果是14(5)//结果是-6 |
* | 求积或取值,一元,二元,算术,地址 | *p //取值操作 |
/ | 求商操作,二元,算术操作符 | 10 / 5 //表达式的结果为2 |
% | 求余数操作,二元,算术操作符 | 12 % 5 //表达式的结果为2 |
<< | 按位左移操作,二元,算术操作符 | 4 << 2 //表达式的结果为16 |
>> | 按位右移操作,二元,算术操作符 | 4 >> 2 //表达式的结果为1 |
& | 按位与操作,一元,二元,算术,地址 | &v //取地址操作 |
&^ | 按位清除操作,二元,算术操作符 | 5 &^ 11 //表达式的结果为4 |
! | 逻辑非操作,一元,逻辑操作符 | !b //若b为true,结果为false |
<- | 接收操作,一元,接收操作符 | <- ch |
注意:假设上面的ch 代表了元素类型为 byte的通道类型值,则<- ch表示从ch中接收byte类型值的操作。
重点讲解3个操作符:
1、&^
实现了按位清除操作,按位清除就是根据第二个操作数的二进制值对第一个操作数的二进制值进行相应的清零操作,如果第二个操作数的某个二进制位上的数组为1,就把第一个操作数的对应二进制位上的数值设置为0。否则,第一个操作数的对应二进制位上的数值不变。这样的操作并不会改变第一个操作数的原值,只会根据两个操作数的二进制值计算出结果值。这样就可以理解上面的5 &^ 11的结果为4了。
2、^
作为一元操作符,分两种情况:
(1). 操作数是无符号的整数类型,使用这一个操作就相当于对这个操作数和其整数类型的最大值进行二元的按位异或操作,如下:
如上,内置函数uint8会将一个整数字面量转换为一个uint8类型的值,这保证了一元操作符^的唯一操作数一定是一个无符号整数类型的值。
(2). 操作是有符号的整数类型,这一操作就相当于对这个操作数和-1进行二元按位异或操作。例如:
**注意:**以上的操作数的二进制值都是以补码形式表示;默认情况下整数字面量是有符号的,所以(2)中操作数1不需要显示使用内置函数int8 。
3、<-
接收操作符,只作用于通道类型的值。使用时,需要注意两点:
(1). 从一个通道类型的空值(即nil)接收值的表达式将会永远被阻塞。
(2). 从一个已被关闭的通道类型值接收值会永远成功并立即返回一个其元素类型的零值。
一个由接收操作符和通道类型的操作数所组成的表达式可以直接被用于变量赋值或初始化,如下所示(在赋值语句讲解时,再细说)
特殊标记 = 用于将一个值赋给一个已被声明的变量或常量。
特殊标记 := 则用于在声明一个变量的同时对这个变量进行赋值,且只能在函数体内使用。
又如下:
当同时对两个变量进行赋值或初始化时,第二个变量将会是一个布尔类型的值。这个值代表了接收操作的成功与否。如果这个值为false,就说明这个通道已经被关闭了。(之后讲解通道类型会详细介绍)。
优先级 | 操作符 |
---|---|
5 | * / % << >> & &^ |
4 | + - \ ^ |
3 | == != < <= > >= |
2 | && |
1 |
(1) 使用操作数来表示;
(2) 使用类型转换来表示;
(3) 使用内建函数调用来表示;
(4) 一个基本表达式和一个选择符号组成选择表达式;
例如,如果在一个结构体类型中存在字段f,我们就可以在这个结构体类型的变量x上应用一个选择符号来访问这个字段f,即x.f。其中,.f就是一个选择符号。注意:前提是这个变量x的值不能是nil。在Go语言中,nil用来表示空值。
(5) 一个基本表达式和一个索引符号组成索引表达式;
索引符号由狭义的表达式(仅由操作符和操作数组成)和外层的方括号组成,例如[]int{1,2,3,4,5}[2]就是索引表达式。
Go语言允许如下的赋值语句:
如上a为字典类型,x为字典的键。该索引表达式的结果是一对值,而不是单一值。第一个值的类型就是该字典类型的元素类型,而第二个值则是布尔类型。与变量ok绑定的布尔值代表了在字典类型a中是否包含了以x为键的键值对。如果在a中包含这样的键值对,那么赋给变量ok的值就是true,否则就为false。
**注意:**虽然当字典类型的变量a的值为nil时,求值表达式a[x]并不会发生任何错误,但是在这种情况下对a[x]进行赋值却会引起一个运行时恐慌( Go语言异常)。
(6) 一个基本表达式和一个切片符号组成切片表达式;
切片符号由2个或3个狭义的表达式和外层的方括号组成,这些表达式之间由冒号分隔。切片符号作用与索引符号类似,只不过索引符号针对的是一个点,切片符号针对的是一个范围。例如,要取出一个切片[]int{1,2,3,4,5}的第二个到第四个元素,那么可以使用切片符号的表达式[]int{1,2,3,4,5}[1:4],该结果还是一个切片。
切片表达式a[x:y:z],a是切片符号[x:y]的操作对象。其中,x代表了切片元素下界索引,y代表了切片的元素上界索引,而z则代表了切片的容量上界索引。约束如下:
0 <= 元素下界索引 <= 元素上界索引 <= 容量上界索引 <= 操作对象的容量
设a的值为[]int{1,2,3,4,5},则切片表达式a[:3]等同于a[0:3],这是因为切片符号的元素下界索引的默认值为0,相应的元素上界的索引的默认值为操作对象的长度值或容量值,即切片表达式a[3:]等同于a[3:5]。同样,切片表达式a[:]等同于复制a所代表的值并将这个复制品作为表达式的求值结果。
注意: UTF-8 编码格式会以3个字节来表示一个中文字符,而切片操作是针对字节进行的。
如果有“Go并发编程实战”的字符串类型的变量a,那么切片表达式a[1:3]的结果不是“o并”,而a[1:5]的结果才是“o并”。
(7) 一个基本表达式和一个类型断言符号组成;
类型断言符号以一个英文句号为前缀,并后跟一个被圆括号括起来的类型名称或类型字面量。类型断言符号用于判断一个变量或常量是否为一个预期的类型,并根据判断结果采取不同的响应。例如,如果要判断一个int8类型的变量num是否是int类型,可以这样编写表达式:interface{}(num).(int)。
对于一个求值结果为接口类型值的表达式x和一个类型T,对应的类型断言为:
该表达式的作用是判断“x不为nil且存储在其中的值是T类型的”是否成立。
如果T不是一个接口类型,那么x.(T)会判断类型T是否为x的动态类型(一个变量的动态类型就是在运行期间存储在其中的值的实际类型);而这个实际类型必须是该变量声明的那个类型的一个实现类型,否则就根本不可能在该变量中存储这一类型的值。所以类型T必须为x的类型的一个实现类型,而在Go语言中只有接口类型可以被其他类型实现,所以x的求值结果必须是一个接口类型的值。
所以上面表达式interface{}(num).(int)中表达式interface{}(num)的含义就是将变量num转换为interface{}类型的值(即它的结果值是接口类型的),而这刚好符合前面的定义。
知识点: interface{}是一个特殊的接口类型,代表空接口。所有类型都是它的实现类型。
在对变量的赋值或初始化的时候,也可以使用类型断言,如下:
当使用类型断言表达式同时对两个变量进行赋值时,如果类型断言成功,那么赋给第一个变量的将会是已经被转换为T类型的表达式x的求值结果,否则赋给第一个变量的就是类型T的零值。布尔类型会被赋给变量ok,它体现了类型断言的成功(true)与否(false)。
注意: 在这种场景下,即使类型断言失败也不会引发运行时恐慌。
(8) 一个基本表达式和一个调用符号组成。
调用符号只针对于函数或者方法。与调用符号组合的基本表达式不是一个代表代码包名称(或者其别名)的标识符就是一个代表结构体类型的方法的名称的标识符。调用符号由一个英文句号为前缀和一个被圆括号括起来的参数列表组成,多个参数列表之间用逗号分隔。例如,基本表达式os.Open(“/etc/profile”)表示对代码包os中的函数Open的调用。
如果函数f可以接受的参数的数量是不固定的,那么函数f就是一个能够接受可变长参数的函数,简称可变参函数。在Go语言中,在可变参函数的参数列表的最后总会出现一个可变长参数,这个可变长参数的类型声明形如…T。Go语言会在每次调用函数f的时候创建一个切片类型值,并用它来存放这些实际函数。这个切片类型值的长度就是当前调用表达式中与可变长参数绑定的实际参数的数量。
可变参函数appendIfAbsent声明如下(函数体省略):
针对此函数的调用表达式如下:
其中,与可变参数t绑定的切片类型值为[]string{”C”,”B”,”A”},包含了实际参数”C”,”B”和”A”。
也可以直接把一个元素类型为T的切片类型值赋给…T类型的可变长参数,如下调用:
或者如果有一个元素类型为stirng的切片类型的变量s的话,如下调用:
对于将切片类型的变量赋给可变长参数的情况,Go语言不会专门创建一个切片类型值来存储其中的实际参数。因为,这样的切片类型值已经存在了,可变长参数t的值就是变量s的值。
Atas ialah kandungan terperinci Terdapat beberapa jenis unsur leksikal dalam bahasa Go. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!