c++多級指針與「多維」數組

指針與數組是C/C++編程中非常重要的元素,同時也是較難以理解的。其中,多級指針與“多維”數組更是讓很多人云裡霧裡,其實,只要掌握一定的方法,理解多級指針和“多維”數組完全可以像理解一級指針和一維數組那樣簡單。

首先,先聲明一些常識,如果你對這些常識還不理解,請先去彌補一下基礎知識:

1、實際上並不存在多維數組,所謂的多維數組本質上是用一維數組模擬的。
2、數組名是一個常量(意味著不允許對其進行賦值操作),其代表數組首元素的首地址。
3、數組與指針的關係是因為數組下標操作符[],比如,int a[3][2]相當於*(*(a+3)+2) 。
4、指針是一種變量,也具有類型,其佔用內存空間大小和系統有關,一般32位系統下,sizeof(指針變量)=4。
5、指針可以進行加減算術運算,加減的基本單位是sizeof(指針所指向的數據類型)。
6、對數組的數組名進行取地址(&)操作,其類型為整個數組類型。
7、對數組的數組名進行sizeof運算符操作,其值為整個數組的大小(以字節為單位)。
8、數組作為函數形參時會退化為指針。

一、一維數組與數組指針

假如有一維數組如下:

char a[3];

該數組一共有3個元素,元素的類型為char,如果想定義一個指針指向該數組,也就是如果想把數組名a賦值給一個指針變量,那麼該指針變量的類型應該是什麼呢?前文說過,一個數組的數組名代表其首元素的首地址,也就是相當於&a[0],而a[0]的類型為char,因此&a[0]類型為char *,因此,可以定義如下的指針變量:

char * p = a;//相當於char * p = &a[0]

以上文字可用如下內存模型圖表示。

大家都應該知道,a和&a[0]代表的都是數組首元素的首地址,而如果你將&a的值打印出來,會發現該值也等於數組首元素的首地址。請注意我這裡的措辭,也就是說,&a雖然在數值上也等於數組首元素首地址的值,但是其類型並不是數組首元素首地址類型,也就是char *p = &a是錯誤的。

前文第6條常識已經說過,對數組名進行取地址操作,其類型為整個數組,因此,&a的類型是char (*)[3],所以正確的賦值方式如下:

char (*p)[3] = &a;

注:很多人對類似於a+1,&a+1,&a[0]+1,sizeof(a),sizeof(&a)等感到迷惑,其實只要搞清楚指針的類型就可以迎刃而解。比如在面對a+1和&a+1的區別時,由於a表示數組首元素首地址,其類型為char *,因此a+1相當於數組首地址值+sizeof(char);而&a的類型為char (*)[3],代表整個數組,因此&a+1相當於數組首地址值+sizeof(a)。(

sizeof(a)代表整個數組大小,前文第7條說明,但是無論數組大小如何,sizeof(&a)永遠等於一個指針變量佔用空間的大小,具體與系統平臺有關

二、二維數組與數組指針

假如有如下二維數組:

char a[3][2];

由於實際上並不存在多維數組,因此,可以將a[3][2]看成是一個具有3個元素的一維數組,只是這三個元素分別又是一個一維數組。實際上,在內存中,該數組的確是按照一維數組的形式存儲的,存儲順序為(低地址在前):a[0][0]、a[0][1]、a[1][0]、a[1][1]、a[2][0]、a[2][1]。(此種方式也不是絕對,也有按列優先存儲的模式)

為了方便理解,我畫了一張邏輯上的內存圖,之所以說是邏輯上的,是因為該圖只是便於理解,並不是數組在內存中實際的存儲模型(實際模型為前文所述)。

如上圖所示,我們可以將數組分成兩個維度來看,首先是第一維,將a[3][2]看成一個具有三個元素的一維數組,元素分別為:a[0]、a[1]、a[2],其中,a[0]、a[1]、a[2]又分別是一個具有兩個元素的一維數組(元素類型為char)。從第二個維度看,此處可以

將a[0]、a[1]、a[2]看成自己代表”第二維”數組的數組名,以a[0]為例,a[0](數組名)代表的一維數組是一個具有兩個char類型元素的數組,而a[0]是這個數組的數組名(代表數組首元素首地址),因此a[0]類型為char *,同理a[1]和a[2]類型都是char *。而a是第一維數組的數組名,代表首元素首地址,而首元素是一個具有兩個char類型元素的一維數組,因此a就是一個指向具有兩個char類型元素數組的數組指針,也就是char(*)[2]。

也就是說,如下的賦值是正確的:

char (*p)[2] = a;//a為第一維數組的數組名,類型為char (*)[2]
char * p = a[0];//a[0]維第二維數組的數組名,類型為char *

同樣,對a取地址操作代表整個數組的首地址,類型為數組類型(請允許我暫且這麼稱呼),也就是char (*)[3][2],所以如下賦值是正確的:

char (*p)[3][2] = &a;

三、三維數組與數組指針

假設有三維數組:

char a[3][2][2];

同樣,為了便於理解,特意畫了如下的邏輯內存圖。分析方法和二維數組類似,首先,從第一維角度看過去,a[3][2][2]是一個具有三個元素a[0]、a[1]、a[2]的一維數組,只是這三個元素分別又是一個"二維"數組,a作為第一維數組的數組名,代表數組首元素的首地址,也就是一個指向一個二維數組的數組指針,其類型為char (*)[2][2]。從第二維角度看過去,a[0]、a[1]、a[2]分別是第二維數組的數組名,代表第二維數組的首元素的首地址,也就是一個指向一維數組的數組指針,類型為char(*)[2];同理,從第三維角度看過去,a[0][0]、a[0][1]、a[1][0]、a[1][1]、a[2][0]、a[2][1]又分別是第三維數組的數組名,代表第三維數組的首元素的首地址,也就是一個指向char類型的指針,類型為char *。

由上可知,以下的賦值是正確的:

char (*p)[3][2][2] = &a;//對數組名取地址類型為整個數組
char (*p)[2][2] = a;
char (*p) [2] = a[0];//或者a[1]、a[2]
char *p = a[0][0];//或者a[0][1]、a[1][0]...

四:多級指針

所謂的多級指針,就是一個指向指針的指針,比如:

char *p = "my name is chenyang.";
char **pp = &p;//二級指針
char ***ppp = &pp;//三級指針

假設以上語句都位於函數體內,則可以使用下面的簡化圖來表達多級指針之間的指向關係。

多級指針通常用來作為函數的形參,比如常見的main函數聲明如下:

int main(int argc,char ** argv)

因為當數組用作函數的形參的時候,會退化為指針來處理,所以上面的形式和下面是一樣的。

int mian(int argc,char* argv[])

argv用於接收用戶輸入的命令參數,這些參數會以字符串數組的形式傳入,類似於:

char * parm[] = {"parm1","parm2","parm3","parm4"};//模擬用戶傳入的參數
main(sizeof(parm)/sizeof(char *),parm);//模擬調用main函數,實際中main函數是由入口函數調用的(glibc中的入口函數默認為_start)

多級指針的另一種常見用法是,假設用戶想調用一個函數分配一段內存,那麼分配的內存地址可以有兩種方式拿到:第一種是通過函數的返回值,該種方式的函數聲明如下:

void * get_memery(int size)
{
void *p = malloc(size);
return p;
}

第二種獲取地址的方法是使用二級指針,代碼如下:

int get_memery(int** buf,int size)
{
*buf = (int *)malloc(size);
if(*buf == NULL)
return -1;
else
return 0;
}
int *p = NULL;
get_memery(&p,10);

關於多級指針的用法很多,尤其以二級指針應用最為廣泛,後續的有時間再進行補充。