PaddleRec config.yaml配置说明

May 9, 2022 · View on GitHub

目前支持runner和hyper_parameters的读取。

runner变量

名称	类型	取值	是否必须	作用描述
train_data_dir	string	任意	是	指定训练数据目录
train_reader_path	string	任意	是	指定训练时用的Reader()所在python文件地址
train_batch_size	int	>= 1	是	指定train阶段的批训练样本数量
model_save_path	string	任意	是	指定train阶段完成后Save参数的地址
test_data_dir	string	任意	是	指定测试数据目录
infer_reader_path	string	任意	是	指定测试时用的Reader()所在python文件地址
infer_batch_size	int	>= 1	是	指定infer阶段的批训练样本数量
infer_load_path	string	任意	是	指定infer阶段开始时初始化模型地址
infer_start_epoch	int	>= 0	是	初始化模型时从第几个epoch保留的参数开始加载（从0开始计数，包括本次）
infer_end_epoch	int	>= 0	是	初始化模型时到第几个epoch保留的参数停止加载（从0开始技术，不包括本次）
use_gpu	bool	True/False	是	指定是否使用gpu，若为False则默认使用cpu
use_xpu	bool	True/False	是	指定是否使用xpu，若为False则默认使用cpu
epochs	int	>= 1	是	指定train阶段需要训练几个epoch
print_interval	int	>= 1	是	训练指标打印batch间隔
use_auc	bool	True/False	否	在每个epoch开始时重置auc指标的值
use_visual	bool	True/False	否	开启模型训练的可视化功能，开启时需要安装visualDL
use_inference	bool	True/False	否	是否使用save_inference_model接口保存
save_inference_feed_varnames	list[string]	组网中指定Variable的name	否	预测模型的入口变量name
save_inference_fetch_varnames	list[string]	组网中指定Variable的name	否	预测模型的出口变量name
use_fleet	bool	True/False	否	指定是否使用分布式运行单机多卡或多机多卡
reader_type	string	QueueDataset/DataLoader/CustomizeDataLoader	否	指定使用的reader类型
model_init_path	string	任意	否	指定是否使用热启动，在训练初期加载初始化模型
num_workers	int	>= 0	否	用于加载数据的子进程个数

hyper_parameters变量

名称	类型	取值	是否必须	作用描述
optimizer.class	string	SGD/Adam/Adagrad	是	指定优化器类型
optimizer.learning_rate	float	> 0	否	指定学习率
reg	float	> 0	否	L2正则化参数，只在SGD下生效
others	/	/	/	由各个模型组网独立指定