Go語言的奇特語法,你怎麼看?

剛開始接觸Go語言的同學覺得Go語言的語法很特別,尤其是使用C/C++或者Java等語言的同學。比如在C等語言中定義變量的時候類型是在名稱前面,而Go語言偏偏要將類型放在變量名稱後面,覺得很奇怪等等。下面是原文,對這些奇怪的語法給出了相對官方和靠譜的解釋。

不是為了與眾不同。而是為了更加清晰易懂。

Rob Pike 曾經在 Go 官方博客解釋過這個問題(原文地址:http://blog.golang.org/gos-declaration-syntax),簡略翻譯如下(水平有限翻譯的不對的地方見諒):

引言

Go語言新人常常會很疑惑為什麼這門語言的聲明語法(declaration syntax)會和傳統的C家族語言不同。在這篇博文裡,我們會進行一個比較,並做出解答。

Go語言的奇特語法,你怎麼看?

C 的語法

首先,先看看 C 的語法。C 採用了一種聰明而不同尋常的聲明語法。聲明變量時,只需寫出一個帶有目標變量名的表達式,然後在表達式裡指明該表達式本身的類型即可。比如:

int x;

上面的代碼聲明瞭 x 變量,並且其類型為 int——即,表達式 x 為 int 類型。一般而言,為了指明新變量的類型,我們得寫出一個表達式,其中含有我們要聲明的變量,這個表達式運算的結果值屬於某種基本類型,我們把這種基本類型寫到表達式的左邊。所以,下述聲明:

int *p;
int a[3];

指明瞭 p 是一個int類型的指針,因為 *p 的類型為 int。而 a 是一個 int 數組,因為 a[3] 的類型為 int(別管這裡出現的索引值,它只是用於指明數組的長度)。

我們接下來看看函數聲明的情況。C 的函數聲明中關於參數的類型是寫在括號外的,像下面這樣:

int main(argc, argv)
int argc;
char *argv[];
{ /* ... */ }

如前所述,我們可以看到 main 之所以是函數,是因為表達式 main(argc, argv) 返回 int。在現代記法中我們是這麼寫的:

int main(int argc, char *argv[]) { /* ... */ }

儘管看起來有些不同,但是基本的結構是一樣的。

總的來看,當類型比較簡單時,C的語法顯得很聰明。但是遺憾的是一旦類型開始複雜,C的這套語法很快就能讓人迷糊了。著名的例子如函數指針,我們得按下面這樣來寫:

int (*fp)(int a, int b);

在這兒,fp 之所以是一個指針是因為如果你寫出 (*fp)(a, b) 這樣的表達式將會調用一個函數,其返回 int 類型的值。如果當 fp 的某個參數本身又是一個函數,情況會怎樣呢?

int (*fp)(int (*ff)(int x, int y), int b)

這讀起來可就點難了。

當然了,我們聲明函數時是可以不寫明參數的名稱的,因此 main 函數可以聲明為:

int main(int, char *[])

回想一下,之前 argv 是下面這樣的

char *argv[]

你有沒有發現你是從聲明的「中間」去掉變量名而後構造出其變量類型的?儘管這不是很明顯,但你聲明某個 char *[] 類型的變量的時候,竟然需要把名字插入到變量類型的中間。

我們再來看看,如果我們不命名 fp 的參數會怎樣:

int (*fp)(int (*)(int, int), int)

這東西難懂的地方可不僅僅是要記得參數名原本是放這中間的

int (*)(int, int)

它更讓人混淆的地方還在於甚至可能都搞不清這竟然是個函數指針聲明。我們接著看看,如果返回值也是個函數指針類型又會怎麼樣

int (*(*fp)(int (*)(int, int), int))(int, int)

這已經很難看出是關於 fp 的聲明瞭。

你自己還可以構建出比這更復雜的例子,但這已經足以解釋 C 的聲明語法引入的某些複雜性了。

還有一點需要指出,由於類型語法和聲明語法是一樣的,要解析中間帶有類型的表達式可能會有些難度。這也就是為什麼,C 在做類型轉換的時候總是要把類型用括號括起來的原因,像這樣

(int)M_PI

Go 的語法

非C家族的語言通常在聲明時使用一種不同的類型語法。一般是名字先出現,然後常常跟著一個冒號。按照這樣來寫,我們上面所舉的例子就會變成下面這樣:

x: int
p: pointer to int
a: array[3] of int

這樣的聲明即便有些冗長,當至少是清晰的——你只需從左向右讀就行。Go 語言所採用的方案就是以此為基礎的,但為了追求簡潔性,Go 語言丟掉了冒號並去掉了部分關鍵詞,成了下面這樣:

x int
p *int
a [3]int

在 [3]int 和表達式中 a 的用法沒有直接的對應關係(我們在下一節會回過頭來探討指針的問題)。至此,你獲得了代碼清晰性方面的提升,但付出的代價是語法上需要區別對待。

下面我們來考慮函數的問題。雖然在 Go 語言裡,main 函數實際上沒有參數,但是我們先謄抄一下之前的 main 函數的聲明:

func main(argc int, argv *[]byte) int

粗略一看和 C 沒什麼不同,不過自左向右讀的話還不錯。

main 函數接受一個 int 和一個指針並返回一個 int。

如果此時把參數名去掉,它還是很清楚——因為參數名總在類型的前面,所以不會引起混淆。

func main(int, *[]byte) int

這種自左向右風格的聲明的一個價值在於,當類型變得更復雜時,它依然相對簡單。下面是一個函數變量的聲明(相當於 C 語言裡的函數指針)

f func(func(int,int) int, int) int

或者當它返回一個函數時:

f func(func(int,int) int, int) func(int, int) int

上面的聲明讀起來還是很清晰,自左向右,而且究竟哪一個變量名是當前被聲明的也容易看懂——因為變量名永遠在首位。

類型語法和表達式語法帶來的差別使得在 Go 語言裡調用閉包也變得更簡單:

sum := func(a, b int) int { return a+b } (3, 4)

指針

指針有些例外。注意在數組 (array )和切片 (slice) 中,Go 的類型語法把方括號放在了類型的左邊,但是在表達式語法中卻又把方括號放到了右邊:

var a []int
x = a[1]

類似的,Go 的指針沿用了 C 的 * 記法,但是我們寫的時候也是聲明時 * 在變量名右邊,但在表達式中卻又得把 * 放到左左邊:

var p *int
x = *p

不能寫成下面這樣

var p *int
x = p*

因為後綴的 * 可能會和乘法運算混淆,也許我們可以改用 Pascal 的 ^ 標記,像這樣

var p ^int
x = p^

我們也許還真的應該把 * 像上面這樣改成 ^ (當然這麼一改 xor 運算的符號也得改),因為在類型和表達式中的 * 前綴確實把好些事兒都搞得有點複雜,舉個例子來說,雖然我們可以像下面這樣寫

[]int("hi")

但在轉換時,如果類型是以 * 開頭的,就得加上括號:

(*int)(nil)

如果有一天我們願意放棄用 * 作為指針語法的話,那麼上面的括號就可以省略了。

可見,Go 的指針語法是和 C 相似的。但這種相似也意味著我們無法徹底避免在文法中有時為了避免類型和表達式的歧義需要補充括號的情況。

總而言之,儘管存在不足,但我們相信 Go 的類型語法要比 C 的容易懂。特別是當類型比較複雜時。

原文鏈接:https://www.zhihu.com/question/21656696/answer/19027040


分享到:


相關文章: