用C++对C++语法格式进行分析
前言
最近C++项目需要用到脚本,这就关系到如何绑定对象到脚本运行环境。因使用到多套脚本语言,所以现有的绑定技术,都不能满足需求。所以只能寻求解析C++的头文件,再根据描述进行绑定。起初发现boost有一套,但boost实在太臃肿了,对项目之后开发环境的搭建有一定要求。我力求最简明的项目管理,boost不太适合。自己写套吧。
正文
C++的语法格式总结
除编译器指令#开头与函数外,均必须要求分号结尾
代码块除单条语句的if、do/while、for都必须在大括号/花括号“{}”
代码块有8种,命名空间,全局,类,结构,全局函数,成员函数,lambda,函数内无名代码块
命名空间与全局相同,仅在声明前加“命名空间::”前缀
类声明块与全局块的区别有,友元声明,成员访问权限
模板支持类与函数
函数与模板有参数列表
分号结尾的声明可以是内置类型(int、double等)、类、模板类、typedef出来的类型、函数指针、lambda
函数可以重名
类的成员函数访问其他成员可以在此函数定义之后声明,并不像全局函数那样必须已经声明,所以用指针扫描一次C++文件是否合法是做不到的
若是类化的枚举(enum class),不需要对声明所在范围可见,否则同时要把成员也同时添加到所属范围
我不打算支持的,对于需求没有必要性的
命名空间
模板
函数体
逗号分割的多个变量我不想很好的支持
类型的校验
默认参数
union
枚举不判断名称冲突
lambda
变量名不能以数字开始
类的继承
函数指针
开发的原则
暂不跨平台,仅VS,不使用系统API这样适于修改为跨平台
使用C++
iter只进不退
遇到语法错误或文件结尾,抛异常
遇到{则进入块处理
处理;结尾的语言单元,函数必须自己处理完;及之前的内容再返回
成员函数定义代码不分析,因为第一条原则做不到,成员函数可能会引用还未声明的其他成员函数
不为最好的性能,但可以在这个结构上优化到极致
不求完整解析,但在这个框架上可以做到解析全部c++11与更高的版本特性
无注释,英文不好,中文注释又不适合全球化
结构描述
variant,method,type,comment,enumeration,enumeration_value从object继承,它们都可以属于全局或类或结构体。
document表示一个c++编译单元。
context表示一个上下文,是一个可以向上查找的队列。document完成解析后存储解析出来的变量、函数、类型。
reader,文件读取器,一个向前的char迭代器,可以用istreambuf_iterator
使用
main函数有_DEBUG宏保护,建议编译为库release使用。
#include
try
{
auto result = cpp_analysis::analysis("[cpp_header_file]");
// todo
}
catch (logic_error& e)
{
// todo:
}
项目位置
https://github.com/FettLuo/cpp_analysis[新标签打开]

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

C 语言中符号的使用方法涵盖算术、赋值、条件、逻辑、位运算符等。算术运算符用于基本数学运算,赋值运算符用于赋值和加减乘除赋值,条件运算符用于根据条件执行不同操作,逻辑运算符用于逻辑操作,位运算符用于位级操作,特殊常量用于表示空指针、文件结束标记和非数字值。

C语言中通过转义序列处理特殊字符,如:\n表示换行符。\t表示制表符。使用转义序列或字符常量表示特殊字符,如char c = '\n'。注意,反斜杠需要转义两次。不同平台和编译器可能有不同的转义序列,请查阅文档。

在 C 语言中,char 类型在字符串中用于:1. 存储单个字符;2. 使用数组表示字符串并以 null 终止符结束;3. 通过字符串操作函数进行操作;4. 从键盘读取或输出字符串。

多线程和异步的区别在于,多线程同时执行多个线程,而异步在不阻塞当前线程的情况下执行操作。多线程用于计算密集型任务,而异步用于用户交互操作。多线程的优势是提高计算性能,异步的优势是不阻塞 UI 线程。选择多线程还是异步取决于任务性质:计算密集型任务使用多线程,与外部资源交互且需要保持 UI 响应的任务使用异步。

char 数组在 C 语言中存储字符序列,声明为 char array_name[size]。访问元素通过下标运算符,元素以空终止符 '\0' 结尾,用于表示字符串终点。C 语言提供多种字符串操作函数,如 strlen()、strcpy()、strcat() 和 strcmp()。

在 C 语言中,char 和 wchar_t 的主要区别在于字符编码:char 使用 ASCII 或扩展 ASCII,wchar_t 使用 Unicode;char 占用 1-2 个字节,wchar_t 占用 2-4 个字节;char 适用于英语文本,wchar_t 适用于多语言文本;char 广泛支持,wchar_t 依赖于编译器和操作系统是否支持 Unicode;char 的字符范围受限,wchar_t 的字符范围更大,并使用专门的函数进行算术运算。

在 C 语言中,char 类型转换可以通过:强制类型转换:使用强制类型转换符将一种类型的数据直接转换为另一种类型。自动类型转换:当一种类型的数据可以容纳另一种类型的值时,编译器自动进行转换。

C语言中没有内置求和函数,需自行编写。可通过遍历数组并累加元素实现求和:循环版本:使用for循环和数组长度计算求和。指针版本:使用指针指向数组元素,通过自增指针遍历高效求和。动态分配数组版本:动态分配数组并自行管理内存,确保释放已分配内存以防止内存泄漏。
