指針與數組是C/C++編程中非常重要的元素,同時也是較難以理解的。其中,多級指針與“多維”數組更是讓很多人云裡霧裡,其實,只要掌握一定的方法,理解多級指針和“多維”數組完全可以像理解一級指針和一維數組那樣簡單。
首先,先聲明一些常識,如果你對這些常識還不理解,請先去彌補一下基礎知識:
1、實際上並不存在多維數組,所謂的多維數組本質上是用一維數組模擬的。
2、數組名是一個常量(意味著不允許對其進行賦值操作),其代表數組首元素的首地址。
3、數組與指針的關係是因為數組下標操作符[],比如,int a[3][2]相當於*(*(a+3)+2) 。
4、指針是一種變量,也具有類型,其佔用內存空間大小和系統有關,一般32位系統下,sizeof(指針變量)=4。
5、指針可以進行加減算術運算,加減的基本單位是sizeof(指針所指向的數據類型)。
6、對數組的數組名進行取地址(&)操作,其類型為整個數組類型。
7、對數組的數組名進行sizeof運算符操作,其值為整個數組的大小(以字節為單位)。
8、數組作為函數形參時會退化為指針。
一、一維數組與數組指針
假如有一維數組如下:
char a[3];
該數組一共有3個元素,元素的類型為char,如果想定義一個指針指向該數組,也就是如果想把數組名a賦值給一個指針變量,那麼該指針變量的類型應該是什麼呢?前文說過,一個數組的數組名代表其首元素的首地址,也就是相當於&a[0],而a[0]的類型為char,因此&a[0]類型為char *,因此,可以定義如下的指針變量:
char * p = a;//相當於char * p = &a[0]
以上文字可用如下內存模型圖表示。
大家都應該知道,a和&a[0]代表的都是數組首元素的首地址,而如果你將&a的值打印出來,會發現該值也等於數組首元素的首地址。請注意我這裡的措辭,也就是說,&a雖然在數值上也等於數組首元素首地址的值,但是其類型並不是數組首元素首地址類型,也就是char *p = &a是錯誤的。
前文第6條常識已經說過,對數組名進行取地址操作,其類型為整個數組,因此,&a的類型是char (*)[3],所以正確的賦值方式如下:
char (*p)[3] = &a;
注:很多人對類似於a+1,&a+1,&a[0]+1,sizeof(a),sizeof(&a)等感到迷惑,其實只要搞清楚指針的類型就可以迎刃而解。比如在面對a+1和&a+1的區別時,由於a表示數組首元素首地址,其類型為char *,因此a+1相當於數組首地址值+sizeof(char);而&a的類型為char (*)[3],代表整個數組,因此&a+1相當於數組首地址值+sizeof(a)。(
二、二維數組與數組指針
假如有如下二維數組:
char a[3][2];
由於實際上並不存在多維數組,因此,可以將a[3][2]看成是一個具有3個元素的一維數組,只是這三個元素分別又是一個一維數組。實際上,在內存中,該數組的確是按照一維數組的形式存儲的,存儲順序為(低地址在前):a[0][0]、a[0][1]、a[1][0]、a[1][1]、a[2][0]、a[2][1]。(此種方式也不是絕對,也有按列優先存儲的模式)
為了方便理解,我畫了一張邏輯上的內存圖,之所以說是邏輯上的,是因為該圖只是便於理解,並不是數組在內存中實際的存儲模型(實際模型為前文所述)。
如上圖所示,我們可以將數組分成兩個維度來看,首先是第一維,將a[3][2]看成一個具有三個元素的一維數組,元素分別為:a[0]、a[1]、a[2],其中,a[0]、a[1]、a[2]又分別是一個具有兩個元素的一維數組(元素類型為char)。從第二個維度看,此處可以
也就是說,如下的賦值是正確的:
char (*p)[2] = a;//a為第一維數組的數組名,類型為char (*)[2]
char * p = a[0];//a[0]維第二維數組的數組名,類型為char *
同樣,對a取地址操作代表整個數組的首地址,類型為數組類型(請允許我暫且這麼稱呼),也就是char (*)[3][2],所以如下賦值是正確的:
char (*p)[3][2] = &a;
三、三維數組與數組指針
假設有三維數組:
char a[3][2][2];
同樣,為了便於理解,特意畫了如下的邏輯內存圖。分析方法和二維數組類似,首先,從第一維角度看過去,a[3][2][2]是一個具有三個元素a[0]、a[1]、a[2]的一維數組,只是這三個元素分別又是一個"二維"數組,a作為第一維數組的數組名,代表數組首元素的首地址,也就是一個指向一個二維數組的數組指針,其類型為char (*)[2][2]。從第二維角度看過去,a[0]、a[1]、a[2]分別是第二維數組的數組名,代表第二維數組的首元素的首地址,也就是一個指向一維數組的數組指針,類型為char(*)[2];同理,從第三維角度看過去,a[0][0]、a[0][1]、a[1][0]、a[1][1]、a[2][0]、a[2][1]又分別是第三維數組的數組名,代表第三維數組的首元素的首地址,也就是一個指向char類型的指針,類型為char *。
由上可知,以下的賦值是正確的:
char (*p)[3][2][2] = &a;//對數組名取地址類型為整個數組
char (*p)[2][2] = a;
char (*p) [2] = a[0];//或者a[1]、a[2]
char *p = a[0][0];//或者a[0][1]、a[1][0]...
四:多級指針
所謂的多級指針,就是一個指向指針的指針,比如:
char *p = "my name is chenyang.";
char **pp = &p;//二級指針
char ***ppp = &pp;//三級指針
假設以上語句都位於函數體內,則可以使用下面的簡化圖來表達多級指針之間的指向關係。
多級指針通常用來作為函數的形參,比如常見的main函數聲明如下:
int main(int argc,char ** argv)
因為當數組用作函數的形參的時候,會退化為指針來處理,所以上面的形式和下面是一樣的。
int mian(int argc,char* argv[])
argv用於接收用戶輸入的命令參數,這些參數會以字符串數組的形式傳入,類似於:
char * parm[] = {"parm1","parm2","parm3","parm4"};//模擬用戶傳入的參數
main(sizeof(parm)/sizeof(char *),parm);//模擬調用main函數,實際中main函數是由入口函數調用的(glibc中的入口函數默認為_start)
多級指針的另一種常見用法是,假設用戶想調用一個函數分配一段內存,那麼分配的內存地址可以有兩種方式拿到:第一種是通過函數的返回值,該種方式的函數聲明如下:
void * get_memery(int size)
{
void *p = malloc(size);
return p;
}
第二種獲取地址的方法是使用二級指針,代碼如下:
int get_memery(int** buf,int size)
{
*buf = (int *)malloc(size);
if(*buf == NULL)
return -1;
else
return 0;
}
int *p = NULL;
get_memery(&p,10);
關於多級指針的用法很多,尤其以二級指針應用最為廣泛,後續的有時間再進行補充。