一、什么是零长度数组

零长度数组就是长度为0的数组。

ANSI C 标准规定:定义一个数组时,数组的长度必须是一个常数,即数组的长度在编译的时候是确定的。在ANSI C 中定义一个数组的方法如下:

类型 数组名[数组元素个数];

int array[10];

C99 新标准规定:可以定义一个变长数组。

int len;

scanf("%d", &len);

int array[len];

也就是说,数组的长度在编译时是未确定的,在程序运行的时候才确定,甚至可以由用户指定大小。比如,我们可以定义一个数组,然后在程序运行时才指定这个数组的大小,还可以通过输入数据来初始化数组。

程序示例:

#include <stdio.h>

int main(void)

{

    int len;

    int i = 0;

    printf("please input a length: ");

    scanf("%d", &len);

    int a[len];

    for (i = 0; i < len; i++)

    {

        a[i] = i + 1;

    }

    for (i = 0; i < len; i++)

    {

        printf("a[%d] = %dn", i, a[i]);

    }

    return 0;

}

执行结果:

deng@itcast:~/tmp$ gcc 7.c

deng@itcast:~/tmp$ ./a.out 

please input a length: 10

a[0] = 1

a[1] = 2

a[2] = 3

a[3] = 4

a[4] = 5

a[5] = 6

a[6] = 7

a[7] = 8

a[8] = 9

a[9] = 10

————————————

在这个程序中,我们定义一个变量 len,作为数组的长度。程序运行后,我们可以通过输入指定数组的长度并初始化,最后再将数组的元素输出来。

我们在程序中定义一个零长度数组,你会发现除了 GCC 编译器,在其它编译环境下可能就编译通不过或者有警告信息。零长度数组的定义如下:

#include <stdio.h>

int main(void)

{

    //定义长度为零的数组

    int a[0];

    return 0;

}

————————————

零长度数组有一个奇特的地方,就是它不占用内存存储空间。我们使用 sizeof 关键字来查看一下零长度数组在内存中所占存储空间的大小。

程序示例:

#include <stdio.h>

int main(void)

{

    int a[0];

    printf("sizeof(a): %lun", sizeof(a));

    return 0;

}

执行结果:

deng@itcast:~/tmp$ gcc 7.c

deng@itcast:~/tmp$ ./a.out 

sizeof(a): 0

————————————

我们定义一个零长度数组,使用 sizeof 查看其大小可以看到:零长度数组在内存中不占用空间,大小为0。

零长度数组一般单独使用的机会很少,它常常作为结构体的一个成员,构成一个变长结构体 。

程序示例:

#include <stdio.h>

struct student

{

    int id;

    char sex;

    int a[0];

};

int main(void)

{

    int a[0];

    printf("sizeof(struct): %lun", sizeof(struct student));

    return 0;

}

执行结果:

deng@itcast:~/tmp$ gcc 7.c

deng@itcast:~/tmp$ ./a.out 

sizeof(struct): 8

————————————

零长度数组在结构体中同样不占用存储空间,所以 student结构体的大小为8。

 

二、零长度数组应用

零长度数组经常以变长结构体的形式,在某些特殊的应用场合,被程序员使用。在一个变长结构体中,零长度数组不占用结构体的存储空间,但是我们可以通过使用结构体的成员 a 去访问内存,非常方便。

程序示例:

#include <stdio.h>

#include <string.h>

#include <stdlib.h>

struct student

{

    int id;

    char sex;

    char a[0];

};

int main(void)

{

    struct student *s = NULL;

    s = malloc(sizeof(struct student) + 20);

    if (NULL == s)

    {

        printf("malloc failed..n");

        return 1;

    }

    memset(s, 0, sizeof(struct student) + 20);

    s->id = 1;

    s->sex = 'M';

    strcpy(s->a, "hello world");

    printf("id: %d sex: %c a: %sn", s->id, s->sex, s->a);

    free(s);

    return 0;

}

执行结果:

deng@itcast:~/tmp$ gcc 7.c

deng@itcast:~/tmp$ ./a.out 

id: 1 sex: M a: hello world

————————————

在这个程序中,我们使用 malloc 申请一片内存,大小为 sizeof(buffer) + 20,即28个字节大小。其中8个字节用来存储结构体指针 student 指向的结构体类型变量,另外20个字节空间,才是我们真正使用的内存空间。我们可以通过结构体成员 a,直接访问这片内存。

通过这种灵活的动态内存申请方式,这个 student结构体表示的一片内存缓冲区,就可以随时调整,可大可小。

这个特性,在一些场合非常有用。比如,现在很多在线视频网站,都支持多种格式的视频播放:普清、高清、超清、1080P、蓝光甚至4K。

如果我们本地程序需要在内存中申请一个 buffer 用来缓存解码后的视频数据,那么,不同的播放格式,需要的 buffer 大小是不一样的。

如果我们按照 4K 的标准去申请内存,那么当播放普清视频时,就用不了这么大的缓冲区,白白浪费内存。

而使用变长结构体,我们就可以根据用户的播放格式设置,灵活地申请不同大小的 buffer,大大节省了内存空间。

 

三、指针可以代替零长度数组?

大家在各种场合,可能常常会看到这样的字眼:数组名在作为函数参数进行参数传递时,就相当于是一个指针。

在这里,我们千万别被这句话迷惑了:数组名在作为函数参数传递时,确实传递的是一个地址,但数组名绝不是指针,两者不是同一个东西。

数组名用来表征一块连续内存存储空间的地址,而指针是一个变量,编译器要给它单独再分配一个内存空间,用来存放它指向的变量的地址。

我们看下面这个程序。

程序示例:

#include <stdio.h>

#include <string.h>

#include <stdlib.h>

struct s1

{

    int len;

    int a[0];

};

struct s2

{

    int len;

    int *a;

};

int main(void)

{

    printf("sizeof(s1): %lun", sizeof(struct s1));

    printf("sizeof(s2): %lun", sizeof(struct s2));

    return 0;

}

执行结果:

deng@itcast:~/tmp$ ./a.out

sizeof(s1): 4

sizeof(s2): 16

————————————

对于一个指针变量,编译器要为这个指针变量单独分配一个存储空间,然后在这个存储空间上存放另一个变量的地址,我们就说这个指针指向这个变量。而数组名,编译器不会再给其分配一个存储空间的,它仅仅是一个符号,跟函数名一样,用来表示一个地址。

程序示例:

#include <stdio.h>

#include <string.h>

#include <stdlib.h>

int a[10] = {1, 2, 3, 4, 5, 6, 7, 8, 9};

int b[0];

int *p = &a[5];

int main(void)

{

    return 0;

}

在这个程序中,我们分别定义一个普通数组、一个零长度数组和一个指针变量。其中这个指针变量 p 的值为 a[5] 这个数组元素的地址,也就是说指针 p 指向 a[5]。我们接着对这个程序使用 arm 交叉编译器进行编译,并进行反汇编。

deng@itcast:~/tmp$ arm-linux-gcc 7.c -o a.out

deng@itcast:~/tmp$ arm-linux-objdump -D a.out > a.dis

deng@itcast:~/tmp$

————————————

从反汇编生成的汇编代码中,我们找到 array1 和指针变量 p 的汇编代码。

00011024 <a>:

  11024:  00000001    andeq  r0, r0, r1

  11028:  00000002    andeq  r0, r0, r2

  1102c:  00000003    andeq  r0, r0, r3

  11030:  00000004    andeq  r0, r0, r4

  11034:  00000005    andeq  r0, r0, r5

  11038:  00000006    andeq  r0, r0, r6

  1103c:  00000007    andeq  r0, r0, r7

  11040:  00000008    andeq  r0, r0, r8

  11044:  00000009    andeq  r0, r0, r9

  11048:  00000000    andeq  r0, r0, r0

0001104c <p>:

  1104c:  00011038    andeq  r1, r1, r8, lsr r0

Disassembly of section .bss:

————————————

从汇编代码中,可以看到,对于长度为10的数组 a[10],编译器给它分配了从 0x11024–0x11048 一共40个字节的存储空间,但并没有给数组名 a单独分配存储空间,数组名 a仅仅表示这40个连续存储空间的首地址,即数组元素 a[0] 的地址。

而对于 a[0] 这个零长度数组,编译器并没有给它分配存储空间,此时的 a仅仅是一个符号,用来表示内存中的某个地址,我们可以通过查看可执行文件 a.out 的符号表来找到这个地址值。

78: 000082d4 0 FUNC GLOBAL DEFAULT 12 _start

    79: 000082bc    0 FUNC    GLOBAL DEFAULT  UND __libc_start_main@@GLIBC_

    80: 00000000    0 NOTYPE  WEAK  DEFAULT  UND __gmon_start__

    81: 00000000    0 NOTYPE  WEAK  DEFAULT  UND _Jv_RegisterClasses

    82: 00008408    0 FUNC    GLOBAL DEFAULT  13 _fini

    83: 0001104c    4 OBJECT  GLOBAL DEFAULT  22 p

    84: 00008410    4 OBJECT  GLOBAL DEFAULT  14 _IO_stdin_used

    85: 0001101c    0 NOTYPE  GLOBAL DEFAULT  22 __data_start

    86: 00011050    0 NOTYPE  GLOBAL DEFAULT  ABS __bss_start__

    87: 0000841c    0 NOTYPE  GLOBAL DEFAULT  ABS __exidx_end

    88: 00011024    40 OBJECT  GLOBAL DEFAULT  22 a

    89: 00011020    0 OBJECT  GLOBAL HIDDEN    22 __dso_handle

    90: 00011054    0 NOTYPE  GLOBAL DEFAULT  ABS __end__

    91: 0000839c  104 FUNC    GLOBAL DEFAULT  12 __libc_csu_init

    92: 00011054    0 NOTYPE  GLOBAL DEFAULT  ABS __bss_end__

    93: 00011050    0 NOTYPE  GLOBAL DEFAULT  ABS __bss_start

    94: 00011054    0 NOTYPE  GLOBAL DEFAULT  ABS _bss_end__

    95: 00011054    0 OBJECT  GLOBAL DEFAULT  23 b

    96: 00011054    0 NOTYPE  GLOBAL DEFAULT  ABS _end

    97: 00011050    0 NOTYPE  GLOBAL DEFAULT  ABS _edata

    98: 00008414    0 NOTYPE  GLOBAL DEFAULT  ABS __exidx_start

    99: 00008380    28 FUNC    GLOBAL DEFAULT  12 main

  100: 00008290    0 FUNC    GLOBAL DEFAULT  10 _init

————————————

从符号表里可以看到,b 的地址为 0x11054,在程序 bss 段的后面。b符号表示的默认地址是一片未使用的内存空间,仅此而已,编译器绝不会单独再给其分配一个内存空间来存储数组名。

看到这里,也许你就明白了:数组名和指针并不是一回事,数组名虽然在作为函数参数时,可以当一个地址使用,但是两者不能划等号。菜刀有时候可以当武器用,但是你不能说菜刀就是武器。

至于为什么不用指针,很简单。使用指针的话,指针本身也会占用存储空间不说,根据上面的 USB 驱动的案例分析,你会发现,它远远没有零长度数组用得巧妙——不会对结构体定义造成冗余,而且使用起来也很方便。

—— END ——


看到这里你是不是对C语言又有了一点新的认知呢~

如果你喜欢这篇文章的话,动动小指,点个赞再走~

如果你想学编程,小编推荐一个C语言/C++编程学习基地【点击进入】!


 

一个活跃、高逼格、高层次的编程学习殿堂;编程入门只是顺带,思维的提高才有价值!

涉及:编程入门、游戏编程、网络编程、Windows编程、Linux编程、Qt界面开发、黑客等等....

内容来源于网络如有侵权请私信删除

文章来源: 博客园

原文链接: https://www.cnblogs.com/huya-edu/p/13822241.html

你还没有登录,请先登录注册
  • 还没有人评论,欢迎说说您的想法!

相关课程