浅谈C语言中的强符号、弱符号、强引用和弱引用
首先我表示很悲剧,在看《程序员的自我修养--链接、装载与库》之前我竟不知道C有强符号、弱符号、强引用和弱引用。在看到3.5.5节弱符号和强符号时,我感觉有些困惑,所以写下此篇,希望能和同样感觉的朋友交流也希望高人指点。
首先我们看一下书中关于它们的定义。
引入场景:(1)文件A中定义并初始化变量i(int i = 1), 文件B中定义并初始化变量i(int i = 2)。编译链接A、B时会报错b.o:(.data+0x0): multiple definition of `i';a.o:(.data+0x0): multiple definition of `i'。(2)在文件C中定义并初始化两个变量i(int i = 1; int i = 2), 编译链接时会报错c.c:2:5: error: redefinition of ‘i'; c.c:1:5: note: previous definition of ‘i' was here。
强符号:像场景中这样的符号定义被称为强符号,对于C/C++来说,编译器默认函数和初始化的全局变量为强符号。
弱符号:接上文,为初始化的全局变量为弱符号。
编译器关于强弱符号的规则有:(1)强符号不允许多次定义,但强弱可以共存;(2)强弱共存时,强覆盖弱;(3)都是弱符号时,选择占用空间最大的,如选择 double类型的而不选择int类型的。
由以上定义所以有我之前没有想到的场景:
代码a.c:
1 int i = 2;
代码b.c:
#include<stdio.h>
int i;
int main(int argc, char** argv)
{
printf("i = %d\n", i);
return 0;
}
编译文件a和b并链接,结果输出i为2而不是0。
并且在同一个文件中定义但未初始化两个相同的变量不会报错,只有在使用变量时才会报错。
对于GCC编译器来说,还允许使用__attribute__((weak))来将强符号定义为弱符号,所已有
代码c.c
#include<stdio.h>
__attribute__((weak)) int i = 1;
int main(int argc, char** argv)
{
printf("i = %d\n", i);
return 0;
}
结果i的输出仍未2而不是1。
那么对于函数而言是不是也这样呢?先不看函数,而是先看由强弱符号而进一步引入的强弱引用。书中关于强弱引用的概述是对于强引用若未定义则链接时肯定会报错,而对于弱引用则不会报错,链接器默认其为0(这一点对于函数好理解,即函数符号所代表入口地址为0;对于变量就要注意了,既然是引用那自然就是地址了,所以同函数一样变量的地址为0而不是变量的值为0)。此时对于强弱引用是不是还没有什么明确的概念呢?到底什么是引用?引用和符号又是什么关系?这里我说一下我的理解(欢迎指正),在定义和声明处指定的函数名、变量名即为对应的符号,而在代码其他处调用函数或使用变量时,则把函说明和变量名看作引用,这样一来符号和引用在代码层面上其实就是一个东西,只是根据环境而叫法不同而已。那么强符号对应强引用,弱符号对应弱引用。
有上面的强弱引用的特点可看出,当一个函数为弱引用时,不管这个函数有没有定义,链接时都不会报错,而且我们可以根据判断函数名是否为0来决定是否执行这个函数。这样一来,包含这些函数的库就可以以模块、插件的形式和我们的引用组合一起,方便使用和卸载,并且由于强符号可以覆盖弱符号和强弱符号与强弱引用的关系可知,我们自己定义函数可以覆盖库中的函数,多么美妙。
先看根据条件判断是否执行函数:
代码d.c
#include<stdio.h>
void func()
{
printf("func()#1\n");
}
代码e.c
#include<stdio.h>
__attribute__((weak)) void func();
int main(int argc, char** argv)
{
if (func)
func();
return 0;
}
编译d.c,cc -c d.c 输出d.o;编译e.c并链接d.o,cc d.o e.c -o e输出可执行文件e,运行e正常执行函数func。编译e.c但不链接d.o,此时并不会报错,只不过func不会执行,因为没有它的定义所以if(func)为假。
再看函数覆盖:
代码f.c