C语言内存4区

个人笔记,多出借鉴他人

什么是代码区、常量区、静态区(全局区)、堆区、栈区?
如下图,是自己总结的内存分区的示意图。一般内存主要分为:代码区、常量区、静态区(全局区)、堆区、栈区这几个区域。

C语言内存4区 代码区:存放程序的代码,即CPU执行的机器指令,并且是只读的。
常量区:存放常量(程序在运行的期间不能够被改变的量,例如: 10,字符串常量”abcde”, 数组的名字等)
静态区(全局区):静态变量和全局变量的存储区域是一起的,一旦静态区的内存被分配, 静态区的内存直到程序全部结束之后才会被释放
堆区:由程序员调用malloc()函数来主动申请的,需使用free()函数来释放内存,若申请了堆区内存,之后忘记释放内存,很容易造成内存泄漏
栈区:存放函数内的局部变量,形参和函数返回值。栈区之中的数据的作用范围过了之后,系统就会回收自动管理栈区的内存(分配内存 , 回收内存),不需要开发人员来手动管理。栈区就像是一家客栈,里面有很多房间,客人来了之后自动分配房间,房间里的客人可以变动,是一种动态的数据变动。

代码区
代码区的内存是由系统控制的
代码区的存放 :程序中的函数编译后cpu指令
代码区的地址:函数的地址,程序的入口地址,程序的名字
函数的名称也是一个指针,可以通过查询函数名称所处的内存地址,查询函数存放的区域。
void test(void)
{
    printf("main:0x%p\n",main);//打印main函数的存放地址
}
可以看到main函数确实存放在0x08002e81这片地址区域,在代码区中。

常量区
下面来分析一句代码:
char *p = “abcdef”;
这句代码和char *p; p= “abcdef”;是等价的。
上面的两种定义方式的具体意思是:定义一个char * 型的指针p,p存放的是字符串常量”abcdef”的首地址,字符串常量”abcdef”是存放在常量区的,也就是p是指向常量区的。那么p指向的区域里面的内容是不可以得修改,只可以 *p来读取p指向的内容,当然也可以把指针p移走,指向其他区域。
测试如下:

void test(void)
{   
    char *p="abcdef";
    printf("0x%p: %s\n", p , p);//打印指针p的地址和p指向的字符串内容
    p="qwedma";
    printf("0x%p: %s\n", p , p);//打印指针p的地址和p指向的字符串内容
    p[0]='1';                     //尝试把p指向的第一个字符q修改为1
    printf("0x%p: %s\n", p , p);//打印指针p的地址和p指向的字符串内容
}
可以看到,abcdef字符串常量存放在0x08002ecc区域,p指针指向该区域,并把p指针移走指向qwedma字符串常量的首地址0x08002ee0。当尝试修改p指向的第一个字符,即把qwedma修改为1wedma,发现打印出来的内容并未改变,常量区的内容不可以改变。

继续看这句 char str[] = “abcd”;这句话是定义了一个字符数组,但是这个str数组是存放在栈区的,然后再把字符串常量”abcd”拷贝到栈区的str数组内,那么此时的str是可以修改的。

void test(void)
{
    char str[] = "abcd";
    printf("0x%p: %s\n", str , str);
    str[0]='e';
    printf("0x%p: %s\n", str , str);
}
 可以看到str是指向栈区的地址:0x200007c0,且指向的内容可以被修改,第一个字符a被修改为e。

静态区(全局区)
static int a;
int c;
void test(void)
{
    static int b=1;
    b++;
    printf("b:0x%p: %d\n", &b , b);
}
int main()
{
    printf("a: 0x%p: %d\n", &a , a);
    printf("c: 0x%p: %d\n", &c , c);
    for(uint8_t i=0;i<5;i++)
    {
        test();
    }
    return 0;
}

a是静态全局变量,b静态局部变量,c是全局变量,它们都存放在静态区;a和c并未初始化,打印出来都是0,说明编译器自动把他们初始化为0;b在for循环中初始化5次,但实际效果是b仅初始化一次,后面每次调用b都是上次的值,且b的地址一直是不变的,编译器只会为第一次初始化的b分配内存,后面4次初始化是无效的。

堆区
堆区是调用malloc函数来申请内存空间,这部分空间使用完后需要调用free()函数来释放。
void * mallc(size_t);函数的输入是分配的字节大小,返回是一个void*型的指针,该指针指向分配空间的首地址,void *型指针可以任意转换为其他类型的指针。

void test(void)
{   
    int *p1=malloc(4);//申请4字节的空间
    *p1=123;// 该空间赋值123
    printf("0x%p:%d\n",p1,*p1);
    printf("0x%p\n",&p1);
    free(p1);
    printf("0x%p:%d\n",p1,*p1);
    p1 = NULL;
    printf("0x%p\n",p1);
}
 

int *p1=malloc(4);语句是申请了4个字节的空间,空间的首地址赋给指针p1,可以看到这个首地址是0x200003e8,存在是堆区;
printf(“0x%p\n”,&p1);指针p1本身也是需要存放的,p1本身是存放在栈区的0x200009d0;
free(p1);内存释放函数 free(开辟的内存的首地址) ,将内存标记为可用且将里面的内容清空为0,但指针p1还是指向这片空间。比较安全的做法是p1 = NULL;把p1指针释放,避免造成野指针。

void test(void)
{   
    int *p1=malloc(4);
    int *p2=malloc(4);
    printf("p1:0x%p\n",p1);
    printf("p2:0x%p\n",p2);
}

p2的地址是大于p1的地址,验证堆区是向上生长的,后申请的空间地址会依次增加。

栈区
栈区由编译器自动分配释放,存放函数的参数值、返回值和局部变量,在程序运行过程中实时分配和释放,栈区由操作系统自动管理,无须手动管理。栈区是先进后出原则,即先进去的被堵在屋里的最里面,后进去的在门口,释放的时候门口的先出去。

void test(void)
{   
    int a;
    int b=0;    
    printf("a:0x%p:%d\n",&a,a);
    printf("b:0x%p:%d\n",&b,b);
}
 

可以看到后定义的局部变量b地址是比a小的,即栈区是向下生长的;
a变量没有进行初始化,打印出的a是垃圾值,编译器不会把局部变量初始化为0。但是,需要注意:如果你运行于debug调试模式,运行时机制会把你的栈空间全部初始化为0,这就是解释了为什么平时在debug时看到的未初始化的局部变量初始值是0.
使用局部变量时,尽量要先进行初始化,避免垃圾值造成错乱。

大小端测试
数据在内存中存放,有大段模式和小端模式。
小端模式(little-endian):低位字节存在低地址上,高位字节存在高地址上;
大端模式( big-endian):低位字节存在高地址上,高位字节存在低地址上,刚好与小端模式相反。
另:网络字节序:TCP/IP各层协议将字节序定义为Big-Endian,因此TCP/IP协议中使用的字节序通常称之为网络字节序

static uint32_t m=0x87654321;
char *p=(char*)&m;
void test(void)
{   
    printf("P  :0x%p: %x\n",p,*p);
    printf("P+1:0x%p: %x\n",p+1,*(p+1));
    printf("P+2:0x%p: %x\n",p+2,*(p+2));
    printf("P+3:0x%p: %x\n",p+3,*(p+3));
}

低字节21放在低地址,高字节87放在高地址,与小端模式相符。

keil中代码和数据量所占字节的查询
keil软件勾选上生成批处理文件,在keil编译完成后,可以查看到代码和定义的数据所占的字节大小。


如上图,Code是程序代码所占的字节,即代码区;
RO-data 代表只读数据,程序中所定义的常量数据和字符串等都位于此处,即常量区;
RW-data 代表已初始化的读写数据,程序中定义并且初始化的全局变量和静态变量位于此处,一部分静态区(全局区);
ZI-data 代表未初始化的读写数据,程序中定义了但没有初始化的全局变量和静态变量位于此处,另一部分的静态区(全局区)。ZI英语是zero initial,就是程序中用到的变量并且被系统初始化为0的变量的字节数,keil编译器默认是把你没有初始化的变量都赋值一个0,这些变量在程序运行时是保存在RAM中的。
Total ROM Size (Code + RO Data + RW Data)这样所写的程序占用的ROM的字节总数,也就是说程序所下载到ROM flash 中的大小。

为什么Rom中还要存RW,因为掉电后RAM中所有数据都丢失了,每次上电RAM中的数据是被重新赋值的,每次这些固定的值就是存储在Rom中的,为什么不包含ZI段呢,是因为ZI数据都是0,没必要包含,只要程序运行之前将ZI数据所在的区域一律清零即可,包含进去反而浪费存储空间。

实际上,ROM中的指令至少应该有这样的功能:
1. 将RW从ROM中搬到RAM中,因为RW是变量,变量不能存在ROM中。
2. 将ZI所在的RAM区域全部清零,因为ZI区域并不在Image中,所以需要程序根据编译器给出的ZI地址及大小来将相应得RAM区域清零。ZI中也是变量,同理:变量不能存在ROM中。
在程序运行的最初阶段,RO中的指令完成了这两项工作后C程序才能正常访问变量。否则只能运行不含变量的代码。
————————————————
版权声明:本文为CSDN博主「夜风~」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/u014470361/article/details/79297601

上一篇:十进制,八进制,十六进制


下一篇:C程序设计语言(第二版):练习2-3