编译器能够识别代码中的词汇、句子以及各种特定的格式,并将他们转换成计算机能够识别的二进制形式,这个过程称为编译(Compile). 代码经过编译以后,并没有生成最终的可执行文件(.exe 文件),而是生成了一种叫做目标文件(Object File)的中间文件(或者说临时文件)。 因为编译只是将我们自己写的代码变成了二进制形式,它还需要和系统组件(比如标准库、动态链接库等)结合起来,这些组件都是程序运行所必须的。 链接(Link)其实就是一个“打包”的过程,它将所有二进制形式的目标文件和系统组件组合成一个可执行文件。完成链接的过程也需要一个特殊的软件,叫做链接器(Linker)。 经过编译链接后,代码中的各种符号都被分配了地址,并将各种信息记录在符号表中。例如: int var = 100; 系统先在内存上分配一块内存,地址为1004,再将变量标识符var、int关键字标识符和地址1004等信息记录到符号表中, int* p = &var; 系统再在内存上分配一块内存,地址为1001,再将变量标识符p、int* 关键字标识符和地址1001等信息记录到符号表中, 当符号在被用到时,系统去符号表里查询地址,例如var,系统查询到地址是1004的位置,根据类型int 返回数值100; p,系统查询到地址1001的位置,根据类型int* 返回数值1004; *p,系统查询到地址1001的位置,根据类型int 返回数值100。 符号表用来体现作用域与可见性信息,符号表中语言符号可分为关键字符号,操作符符号及标识符符号, 符号表的作用: 1、收集符号属性;(词法分析) 2、上下文语义的合法性检查的依据;(语法分析) 3、作为目标代码生成阶段地址分配的依据;(语义分析) 符号表中的标识符一般设置的属性项目有: 1、符号名 2、符号的类型 3、符号的存储类别 4、符号的作用域及可视性 5、符号变量的存储分配信息 6、 符号的其它属性 实现符号表的常用数据结构: 1、一般的线性表:如:数组,链表等 2、有序表:查询较无序表快,如可以采用折半查找 3、二叉搜索树 4、Hash表 开/闭作用域: |