一.C語(yǔ)言程序的存儲(chǔ)區(qū)域
1.由C語(yǔ)言代碼(文本文件)形成可執(zhí)行程序(二進(jìn)制文件),需要經(jīng)過(guò)編譯-匯編-連接三個(gè)階段。編譯過(guò)程把C語(yǔ)言文本文件生成匯編程序,匯編過(guò)程把匯編程序形成二進(jìn)制機(jī)器代碼,連接過(guò)程則將各個(gè)源文件生成的二進(jìn)制機(jī)器代碼文件組合成一個(gè)文件。
2.C語(yǔ)言編寫的程序經(jīng)過(guò)編譯-連接后,將形成一個(gè)統(tǒng)一文件,它由幾個(gè)部分組成。在程序運(yùn)行時(shí)又會(huì)產(chǎn)生其他幾個(gè)部分,各個(gè)部分代表了不同的存儲(chǔ)區(qū)域:
1>代碼段(Code或Text)
代碼段由程序中執(zhí)行的機(jī)器代碼組成。在C語(yǔ)言中,程序語(yǔ)句執(zhí)行編譯后,形成機(jī)器代碼。在執(zhí)行程序的過(guò)程中,CPU的程序計(jì)數(shù)器指向代碼段的每一條機(jī)器代碼,并由處理器依次運(yùn)行。
2>只讀數(shù)據(jù)段(RO data)
只讀數(shù)據(jù)段是程序使用的一些不會(huì)被更改的數(shù)據(jù),使用這些數(shù)據(jù)的方式類似查表式的操作,由于這些變量不需要更改,因此只需要放置在只讀存儲(chǔ)器中即可。
3>已初始化讀寫數(shù)據(jù)段(RW data)
已初始化數(shù)據(jù)是在程序中聲明,并且具有初值的變量,這些變量需要占用存儲(chǔ)器的空間,在程序執(zhí)行時(shí)它們需要位于可讀寫的內(nèi)存區(qū)域內(nèi),并且有初值,以供程序運(yùn)行時(shí)讀寫。
4>未初始化數(shù)據(jù)段(BBS)
未初始化數(shù)據(jù)是在程序中聲明,但是沒有初始化的變量,這些變量在程序運(yùn)行之前不需要占用存儲(chǔ)器的空間。
5>堆(heap)
堆內(nèi)存只在程序運(yùn)行時(shí)出現(xiàn),一般由程序員分配和釋放。在具有操作系統(tǒng)的情況下,如果程序沒有釋放,操作系統(tǒng)可能在程序(例如一個(gè)進(jìn)程)結(jié)束后會(huì)后內(nèi)存。
6>棧(statck)
堆內(nèi)存只在程序運(yùn)行時(shí)出現(xiàn),在函數(shù)內(nèi)部使用的變量,函數(shù)的參數(shù)以及返回值將使用??臻g,??臻g由編譯器自動(dòng)分配和釋放。
3.代碼段、只讀數(shù)據(jù)段、讀寫數(shù)據(jù)段、未初始化數(shù)據(jù)段屬于靜態(tài)區(qū)域,而堆和棧屬于動(dòng)區(qū)域。代碼段、只讀數(shù)據(jù)段和讀寫數(shù)據(jù)段將在連接之后產(chǎn)生,未初始化數(shù)據(jù)段將在程序初始化的時(shí)候開辟,而對(duì)堆和棧將在程序餓運(yùn)行中分配和釋放。
4.C語(yǔ)言程序分為映像和運(yùn)行時(shí)兩種狀態(tài)。在編譯-連接后形成的映像中,將只包含代碼段(Text)、只讀數(shù)據(jù)段(R0 Data)和讀寫數(shù)據(jù)段(RW Data)。在程序運(yùn)行之前,將動(dòng)態(tài)生成未初始化數(shù)據(jù)段(BSS),在程序的運(yùn)行時(shí)還將動(dòng)態(tài)生成堆(Heap)區(qū)域和棧(Stack)區(qū)域。
注:1.一般來(lái)說(shuō),在靜態(tài)的映像文件中,各個(gè)部分稱之為節(jié)(Section),而在運(yùn)行時(shí)的各個(gè)部分稱之為段(Segment)。如果不詳細(xì)區(qū)分,統(tǒng)稱為段。
2.C語(yǔ)言在編譯連接后,將生成代碼段(TEXT),只讀數(shù)據(jù)段(RO Data)和讀寫數(shù)據(jù)段(RW Data)。在運(yùn)行時(shí),除了上述三個(gè)區(qū)域外,還包括未初始化數(shù)據(jù)段(BBS)區(qū)域和堆(heap)區(qū)域和棧(Stack)區(qū)域。
二.C語(yǔ)言程序的段
1.段的分類
每一個(gè)源程序生成的目標(biāo)代碼將包含源程序所需要表達(dá)的所有信息和功能。目標(biāo)代碼中各段生成情況如下:
1>代碼段(Code)
代碼段由程序中的各個(gè)函數(shù)產(chǎn)生,函數(shù)的每一個(gè)語(yǔ)句將最終經(jīng)過(guò)編譯和匯編生成二進(jìn)制機(jī)器代碼
2>只讀數(shù)據(jù)段(RO Data)
只讀數(shù)據(jù)段由程序中所使用的數(shù)據(jù)產(chǎn)生,該部分?jǐn)?shù)據(jù)的特點(diǎn)在運(yùn)行中不需要改變,因此編譯器會(huì)將數(shù)據(jù)放入只讀的部分中。C語(yǔ)言的一些語(yǔ)法將生成只讀數(shù)據(jù)數(shù)據(jù)段。
2 只讀數(shù)據(jù)段(RO Data)
只讀數(shù)據(jù)段(RO Data)由程序中所使用的數(shù)據(jù)產(chǎn)生,該部分?jǐn)?shù)據(jù)的特點(diǎn)是在運(yùn)行中不需要改變,因此編譯器會(huì)將數(shù)據(jù)放入只讀的部分中。以下情況將生成只讀數(shù)據(jù)段。
n 只讀全局變量
定義全局變量const char a[100]=”abcdefg”將生成大小為100個(gè)字節(jié)的只讀數(shù)據(jù)區(qū),并使用字符串“abcdefg”初始化。如果定義為const char a[]=”abcdefg”,沒有指定大小,將根據(jù)“abcdefgh”字串的長(zhǎng)度,生成8個(gè)字節(jié)的只讀數(shù)據(jù)段。
n 只讀局部變量
例如:在函數(shù)內(nèi)部定義的變量const char b[100]=”9876543210”;其初始化的過(guò)程和全局變量。
n 程序中使用的常量
例如:在程序中使用printf("information\n”),其中包含了字串常量,編譯器會(huì)自動(dòng)把常量“information \n”放入只讀數(shù)據(jù)區(qū)。
注:在const char a[100]={“ABCDEFG”}中,定義了100個(gè)字節(jié)的數(shù)據(jù)區(qū),但是只初始化了前面的8個(gè)字節(jié)(7個(gè)字符和表示結(jié)束符的‘\0’)。在這種用法中,實(shí)際后面的字節(jié)米有初始化,但是在程序中也不能寫,實(shí)際上沒有任何用處。因此,在只讀數(shù)據(jù)段中,一般都需要做完全的的初始化。
3.讀寫數(shù)據(jù)段(RW Data)
讀寫數(shù)據(jù)段表示了在目標(biāo)文件中一部分可以讀也可以寫的數(shù)據(jù)區(qū),在某些場(chǎng)合它們又被稱為已初始化數(shù)據(jù)段。這部分?jǐn)?shù)據(jù)段和代碼,與只讀數(shù)據(jù)段一樣都屬于程序中的靜態(tài)區(qū)域,但是具有科協(xié)的特點(diǎn)。
n 已初始化全局變量
例如:在函數(shù)外部,定義全局的變量char a[100]=”abcdefg”
n 已初始化局部靜態(tài)變量
例如:在函數(shù)中定義static char b[100]=”9876543210”。函數(shù)中由static定義并且已經(jīng)初始化的數(shù)據(jù)和數(shù)組將被編譯為讀寫數(shù)據(jù)段。
說(shuō)明:
讀寫數(shù)據(jù)區(qū)的特點(diǎn)是必須在程序中經(jīng)過(guò)初始化,如果只有定義,沒有初始值,則不會(huì)生成讀寫數(shù)據(jù)區(qū),而會(huì)定義為未初始化數(shù)據(jù)區(qū)(BSS)。如果全局變量(函數(shù)外部定義的變量)加入static修飾符,寫成static char a[100]的形式,這表示只能在文件內(nèi)部使用,而不能被其他文件使用。
4.未初始化數(shù)據(jù)段(BSS)
未初始化數(shù)據(jù)段常被稱之為BSS(英文名為Block start by symbol的縮寫)。與讀寫數(shù)據(jù)段類似,它也屬于靜態(tài)數(shù)據(jù)區(qū)。但是該段中數(shù)據(jù)沒有經(jīng)過(guò)初始化。因此它只會(huì)在目標(biāo)文件中被標(biāo)識(shí),而不會(huì)真正稱為目標(biāo)文件中的一個(gè)段,該段將會(huì)在運(yùn)行時(shí)產(chǎn)生。未初始化數(shù)據(jù)段只有在運(yùn)行的初始化階段才會(huì)產(chǎn)生,因此它的大小不會(huì)影響目標(biāo)文件的大小。
三.在C語(yǔ)言的程序中,對(duì)變量的使用還有以下注意
1.在函數(shù)體中定義的變量通常是在棧上,不需要在程序中進(jìn)行管理,由編譯器處理。
2.用malloc,calloc,realoc等分配分配內(nèi)存的函數(shù)所分配的內(nèi)存空間在堆上,程序必須保證在使用后使用后freee釋放,否則會(huì)發(fā)生內(nèi)存泄漏。
3.所有函數(shù)體外定義的是全局變量,加了static修飾符后的變量不管在函數(shù)內(nèi)部或者外部存放在全局區(qū)(靜態(tài)區(qū))。
4.使用const定義的變量將放于程序的只讀數(shù)據(jù)區(qū)。
說(shuō)明:
在C語(yǔ)言中,可以定義static變量:在函數(shù)體內(nèi)定義 的static變量只能在該函數(shù)體內(nèi)有效;在所有函數(shù)體外定義的static變量,也只能在該文件中有效,不能在其他源文件中使用;對(duì)于沒有使用 static修飾的全局變量,可以在其他的源文件中使用。這些區(qū)別是編譯的概念,即如果不按要求使用變量,編譯器會(huì)報(bào)錯(cuò)。使用static 和沒使用static修飾的全局變量最終都將放置在程序的全局去(靜態(tài)去)。
四.程序中段的使用
C語(yǔ)言中的全局區(qū)(靜態(tài)區(qū)),實(shí)際上對(duì)應(yīng)著下述幾個(gè)段:
只讀數(shù)據(jù)段:R0 Data
讀寫數(shù)據(jù)段:RW Data
未初始化數(shù)據(jù)段:BSS Data
一般來(lái)說(shuō),直接定義的全局變量在未初始化數(shù)據(jù)區(qū),如果該變量有初始化則是在已初始化數(shù)據(jù)區(qū)(RW Data),加上const修飾符將放置在只讀區(qū)域(R0 Data).
eg:
const char ro[]=”this is a readonlydata”;//只讀數(shù)據(jù)段,不能改變r(jià)o數(shù)組中的內(nèi)容,ro存放在只讀數(shù)據(jù)段。
char rw1[]=”this is global readwrite data”;//已初始化讀寫數(shù)據(jù)段,可以改變數(shù)組rw1中的內(nèi)容。應(yīng)為數(shù)值是賦值不是把”this is global readwrite data” 地址給了rw1,不能改變”this is global readwrite data”的數(shù)值。因?yàn)槠鹗俏淖殖A糠旁谥蛔x數(shù)據(jù)段中
char bss_1[100];//未初始化數(shù)據(jù)段
const char *ptrconst = “constant data”;//”constant data”放在只讀數(shù)據(jù)段,不能改變ptrconst中的值,因?yàn)槠涫堑刂焚x值。ptrconst指向存放“constant data”的地址,其為只讀數(shù)據(jù)段。但可以改變ptrconst地址的數(shù)值,因其存放在讀寫數(shù)據(jù)段中。
int main()
{
short b;//b放置在棧上,占用2個(gè)字節(jié)
char a[100];//需要在棧上開辟100個(gè)字節(jié),a的值是其首地址
chars[]=”abcde”;//s在棧上,占用4個(gè)字節(jié),“abcde”本身放置在只讀數(shù)據(jù)存儲(chǔ)區(qū),占6字節(jié)。s是一個(gè)地址常量,不能改變其地址數(shù)值,即s++是錯(cuò)誤的。
char*p1;//p1在棧上,占用4個(gè)字節(jié)
char*p2 =”123456”;//”123456”放置在只讀數(shù)據(jù)存儲(chǔ)區(qū),占7個(gè)字節(jié)。p2在棧上,p2指向的內(nèi)容不能更改,但是p2的地址值可以改變,即p2++是對(duì)的。
static char bss_2[100];//局部未初始化數(shù)據(jù)段
static int c=0 ;//局部(靜態(tài))初始化區(qū)
p1 = (char *)malloc(10*sizeof(char));//分配的內(nèi)存區(qū)域在堆區(qū)
strcpy(p1,”xxx”);//”xxx”放置在只讀數(shù)據(jù)存儲(chǔ)區(qū),占5個(gè)字節(jié)
free(p1);//使用free釋放p1所指向的內(nèi)存
return 0;
}
說(shuō)明:
1.只讀數(shù)據(jù)段需要包括程序中定義的const型的數(shù)據(jù) (如:const char ro[]),還包括程序中需要使用的數(shù)據(jù)如“123456”。對(duì)于const char ro[]和const char * ptrconst的定義,它們指向的內(nèi)存都位于只讀數(shù)據(jù)據(jù)區(qū),其指向的內(nèi)容都不允許修改。區(qū)別在于前者不允許在程序中修改ro的值,后者允許在程序中修改ptrconst本身的值。對(duì)于后者,改寫成以下的形式,將不允許在程序中修改ptrconst本身的值:
const char * const ptrconst = “const data”;
2.讀寫數(shù)據(jù)段包含了已經(jīng)初始化的全局變量static char rw1[]以及局部靜態(tài)變量static char
rw2[]。rw1和rw2的差別在于編譯時(shí),是在函數(shù) 內(nèi)部使用的還是可以在整個(gè)文件中使用。對(duì)于前者,static修飾在于控制程序的其他文件時(shí)候可以訪問(wèn)rw1變量,如果有static修飾,將不能在其他 的C語(yǔ)言源文件中使用rw1,這種影響針對(duì)編譯-連接的特性,但無(wú)論有static,變量rw1都將被放置在讀寫數(shù)據(jù)段。對(duì)于后者rw2,它是局部的靜態(tài) 變量,放置在讀寫數(shù)據(jù)區(qū);如果不使用static修飾,其意義將完全改變,它將會(huì)是開辟在??臻g局部變量,而不是靜態(tài)變量。
3.未初始化數(shù)據(jù)段,事例1中的bss_1[100]和 bss_2[200]在程序中代表未初始化的數(shù)據(jù)段。其區(qū)別在于前者是全局的變量,在所有文件中都可以使用;后者是局部的變量,只在函數(shù)內(nèi)部使用。未初始 化數(shù)據(jù)段不設(shè)置后面的初始化數(shù)值,因此必須使用數(shù)值指定區(qū)域的大小,
編譯器將根據(jù)大小設(shè)置BBS中需要增加的長(zhǎng)度。
4.??臻g包括函數(shù)中內(nèi)部使用的變量如short b和char a[100],以及char *p1中p1這個(gè)變量的值。
1》變量p1指向的內(nèi)存建立在堆空間上,堆空間只能在程序內(nèi)部使用,但是堆空間(例如p1指向的內(nèi)存)可以作為返回值傳遞給其他函數(shù)處理。
2》??臻g主要用于以下3類數(shù)據(jù)的存儲(chǔ):
a.函數(shù)內(nèi)部的動(dòng)態(tài)變量
b.函數(shù)的參數(shù)
c.函數(shù)的返回值
3》??臻g主要的用處是供函數(shù)內(nèi)部的動(dòng)態(tài)變量使用,變量的空間在函數(shù)開始之前開辟,在函數(shù)退出后由編譯器自動(dòng)回收
4.看一個(gè)事例:
#include<stdio.h>
int main()
{
char*p =”tiger”;
p[1]=’I’;
p++;
printf(“%s\n”,p);
}
編譯后提示:段錯(cuò)誤
分析:
char *p =”tiger”;系統(tǒng)在棧上開辟了4個(gè)字節(jié)存儲(chǔ)p的數(shù)值?!眛iger”在只讀存儲(chǔ)區(qū)中存儲(chǔ),因此”tiger”的內(nèi)容不能改 變,*p=”tiger”,表示地址賦值,因此,p指向了只讀存儲(chǔ)區(qū),因此改變p指向的內(nèi)容會(huì)引起段錯(cuò)誤。但是因?yàn)閜是存放在棧上,因此p的數(shù)值是可以改 變的,因此p++是正確的。
五.const的使用
1.前言:
const是一個(gè)C語(yǔ)言的關(guān)鍵字,它限定一個(gè)變量不允許被改變。使用const在一定程序上可以提高程序的健壯性,另外,在觀看別人代碼的時(shí)候,清晰理解const所起的作用,對(duì)理解被人的程序有所幫助。
2.const變量和 常量
(1)const修飾的變量,其值存放在只讀數(shù)據(jù)段中,起值不能被改變。稱為只讀變量。
其形式為 const int a=5;此處可以用a代替5.
(2)常量:其也存在只讀數(shù)據(jù)段中,其數(shù)值也不能被改變。其形式為”abc”,5.
3.const 變量和const限定的內(nèi)容
先看一個(gè)事例:
#include<stdio.h>
typedef char *pStr;
intmain()
{
char string[6] = “tiger”;
const char*p1 = string;
const pStr p2 = string;
p1++;
p2++;
printf(“p1=%s\np2=%s\n”,p1,p2);
}
程序經(jīng)過(guò)編譯后,提示錯(cuò)誤為
error:increment of read-only variable ‘p2’
1>const 使用的基本形式為:const char m;
限定m 不可變
2>替換1式中的m,const char *pm;
限定*pm不可變,當(dāng)然pm是可變的,因此p1++是對(duì)的。
3>替換1式中的char,const newType m;
限定m不可變,問(wèn)題中的pStr是一種新類型,因此問(wèn)題中p2不可變,p2++是錯(cuò)誤的。
(3)const 和指針
類型聲明中const用來(lái)修飾一個(gè)常量,有如下兩種寫法:
1>const在前面
const int nValue;//nValue是const
const char *pContent;//*pContent是const,pConst可變
const (char *)pContent;//pContent是const,*pContent可變
char *const pContent;//pContent是const,*pContent可變
const char * const pContent;//pContent和*pContent都是const
2>const 在后面與上面的聲明對(duì)等
int const nValue; // nValue是const
char const * pContent;//*pContent是const, pContent可變
(char *) constpContent;//pContent是const, *pContent可變
char* const pContent;// pContent是const, *pContent可變
char const* const pContent;//pContent和*pContent都是const
說(shuō)明:const和指針一起使用是C語(yǔ)言中一個(gè)很常見的困惑之處,下面是兩天規(guī)則:
(1)沿著*號(hào)劃一條線,如果const位于*的左側(cè),則const就是用來(lái)修飾指針?biāo)赶虻淖兞?,即指針指向?yàn)槌A?;如果const位于*的右側(cè),const就是修飾指針本身,即指針本身是常量。你可以根據(jù)這個(gè)規(guī)則來(lái)看上面聲明的實(shí)際意義,相信定會(huì)一目了然。
(2)對(duì)于const (char *) ; 因?yàn)閏har *是一個(gè)整體,相當(dāng)于一個(gè)類型(如char),因此,這是限定指針是const。