博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
为「木兰」编程语言添加对中文命名标识符的支持
阅读量:1886 次
发布时间:2019-04-26

本文共 854 字,大约阅读时间需要 2 分钟。

基于 @肖剑 的(如很多人已经知道的, 当然是 Python 代码, 很不错, 嗯).

开始对「木兰」编程语言进行分析。首先打算摸索它的基本功能。前文已经进行了少量代码测试.

但, 可惜木兰, 打算先改进一下, 以便编写更易维护的测试代码. 测试代码打算先在逆向工程中运行(主力机器是 Mac),待基本确定范围后,再在 exe 中确认一遍。

运行 ulang-0.2.2.exe 后, 如果输入下面代码:

年 = year()

会报错LexingError.

在我 fork 出的逆向工程中运行python -m ulang可以启动同样的交互环境 ulang’s REPL. 但同样的代码报错不同, 似乎信息更多一些:

> 年 = year()SyntaxError: File "
", line 1:1, unknown token is found here年 = year()^

回头可以研究一下报错机制, 为何 exe 和逆向的不同.

早先回答时猜想是由于"实现的前端在词法分析这步拦住了"中文命名, 于是查看逆向代码中, 果然看到parser/lexer.py中关于标识符的正则表达规则中, 只允许英文/数字/下划线:

lg.add('IDENTIFIER', '\\$?[_a-zA-Z][_a-zA-Z0-9]*')

接下去就熟门熟路, 添加上中文字符的 unicode 范围:

lg.add('IDENTIFIER', '\\$?[_a-zA-Z\u4e00-\u9fa5][_a-zA-Z0-9\u4e00-\u9fa5]*')

再从逆向工程中运行:

$ python3 -m ulangWelcome to ulang's REPL..Type 'help' for more informations.> 年 = year()> 年2020

嗯, 告别过去, 不错的第一步.

逆向工程地址: https://github.com/MulanRevive/mulan

转载地址:http://uvgbf.baihongyu.com/

你可能感兴趣的文章
Shell编程:return 返回脚本调用的状态码
查看>>
Hbase Shell 调用java代码:通过比较器,强过滤查询
查看>>
Linux防删除,恢复删除
查看>>
linux: shell脚本日常功夫
查看>>
linux脚本: 批量管理主机
查看>>
scala集合类型,函数
查看>>
spark: rdd的应用(scala api)
查看>>
spark: rdd的应用(java api)
查看>>
yarn: 资源调度机制
查看>>
spark的shell脚本分析
查看>>
推荐算法: 基于用户的协同过滤算法
查看>>
推荐算法:基于物品的协同过滤算法
查看>>
docker系列3:docker搭建CDH集群[单机单节点]
查看>>
ubuntu 16:使用系统自带的中文输入法
查看>>
k8s单机版[ microk8s ]
查看>>
docker系列6 :k8s集群[ 解压安装 ]
查看>>
maven- idea: 打包可执行jar
查看>>
docker系列2: windows安装docker
查看>>
hbase数据转移: 导入导出
查看>>
docker系列7: docker搭建mysql
查看>>