oLua

June 29, 2026 · View on GitHub

一个聊胜于无的Lua优化工具。

优化点

Lua 中每次 a.b 都会触发一次 table 查找。如果在一个作用域内多次访问同一个表路径，可以缓存到 local 变量减少查找次数。

例如：

local x = a.b.c
local y = a.b.d
local z = a.b.e

优化为：

local a_b = a.b -- opt by oLua
local x = a_b.c
local y = a_b.d
local z = a_b.e

不同于简单的模式匹配，oLua 使用读写分析（Read/Write Analysis）来判断什么时候缓存仍然有效：

例如：

local x = a.b.c
local y = a.b.d
func1(a)         -- 函数可能修改 a，使 a.b 缓存失效
local z = a.b.e
local w = a.b.f

优化为：

local a_b = a.b -- opt by oLua
local x = a_b.c
local y = a_b.d
func1(a)
a_b = a.b -- opt by oLua（自动刷新）
local z = a_b.e
local w = a_b.f

某些函数确实不修改参数（如 print、tostring、pairs、math.floor），oLua 内置了常用纯函数白名单。匹配的调用不会使缓存失效。

用户也可以通过 -opt_table_access_pure_funcs 添加自定义纯函数（正则表达式，逗号分隔）：

./oLua -input file.lua -output out.lua -opt_table_access \
       -opt_table_access_pure_funcs "log_.*,debug_.*,trace_.*"

默认值 log_.* 匹配 log_info, log_error, log_debug 等日志函数。

oLua 的 table 访问优化基于严格的读写分析，对以下场景安全：

并通过以下机制避免破坏代码：

例如如下代码：

local a = { a = 1, 2 }
a.b = 1
a["c"] = 2
a[3] = 3
a.d = { e = 4 }
a.d.f = 5

每次往 a 中添加元素可能会触发 table 的扩容，所以可以优化为：

local a = {['a']=1, 2, ['b']=1, ['c']=2, [3]=3, ['d']={['e']=4,['f']=5}}

编译：

go mod tidy
go build

优化单个文件的 table 访问：

./oLua -input input.lua -output output.lua -opt_table_access

优化单个文件的 table 构造：

./oLua -input input.lua -output output.lua -opt_table_constructor

也可以同时启用多种优化、批量处理目录（原地替换）：

./oLua -inputpath input_dir -opt_table_access -opt_table_constructor

批量模式下，单个文件解析失败不会终止整个流程，会跳过该文件继续处理其他文件。

实测对比（PUC Lua 5.4.8，每个场景跑 3 次取最快）：

场景	描述	优化前	优化后	提速
浅层多读	500 万次游戏 update（`self.physics.velocity.x` 等典型字段访问）	0.78 s	0.40 s	~1.95×
深层链	100 万次 8 层链 `a.b.c.d.e.f.g.h`，每次 4 读	0.088 s	0.026 s	~3.4×
业务热点	5000 轮 × 1000 条数据，分支命中后才优化	0.32 s	0.30 s	~1.07×

业务代码典型场景（重复访问 self.xxx.yyy.zzz）大约 1.5×~2× 提速；极端深层访问可达 3×+；冷路径或访问次数少的代码不会被改动也不会有副作用。

table 构造优化：

	优化前	优化后
table 构造	3.3 s	1.9 s

运行单元测试：

go test ./...

查看代码覆盖率：

go test -coverprofile=coverage.out ./...
go tool cover -func=coverage.out

运行性能基准测试：

go test -bench=. -benchtime=1s -run="^$" ./...