PaddleRec config.yaml配置说明
May 9, 2022 · View on GitHub
目前支持runner和hyper_parameters的读取。
runner变量
| 名称 | 类型 | 取值 | 是否必须 | 作用描述 |
|---|---|---|---|---|
| train_data_dir | string | 任意 | 是 | 指定训练数据目录 |
| train_reader_path | string | 任意 | 是 | 指定训练时用的Reader()所在python文件地址 |
| train_batch_size | int | >= 1 | 是 | 指定train阶段的批训练样本数量 |
| model_save_path | string | 任意 | 是 | 指定train阶段完成后Save参数的地址 |
| test_data_dir | string | 任意 | 是 | 指定测试数据目录 |
| infer_reader_path | string | 任意 | 是 | 指定测试时用的Reader()所在python文件地址 |
| infer_batch_size | int | >= 1 | 是 | 指定infer阶段的批训练样本数量 |
| infer_load_path | string | 任意 | 是 | 指定infer阶段开始时初始化模型地址 |
| infer_start_epoch | int | >= 0 | 是 | 初始化模型时从第几个epoch保留的参数开始加载(从0开始计数,包括本次) |
| infer_end_epoch | int | >= 0 | 是 | 初始化模型时到第几个epoch保留的参数停止加载(从0开始技术,不包括本次) |
| use_gpu | bool | True/False | 是 | 指定是否使用gpu,若为False则默认使用cpu |
| use_xpu | bool | True/False | 是 | 指定是否使用xpu,若为False则默认使用cpu |
| epochs | int | >= 1 | 是 | 指定train阶段需要训练几个epoch |
| print_interval | int | >= 1 | 是 | 训练指标打印batch间隔 |
| use_auc | bool | True/False | 否 | 在每个epoch开始时重置auc指标的值 |
| use_visual | bool | True/False | 否 | 开启模型训练的可视化功能,开启时需要安装visualDL |
| use_inference | bool | True/False | 否 | 是否使用save_inference_model接口保存 |
| save_inference_feed_varnames | list[string] | 组网中指定Variable的name | 否 | 预测模型的入口变量name |
| save_inference_fetch_varnames | list[string] | 组网中指定Variable的name | 否 | 预测模型的出口变量name |
| use_fleet | bool | True/False | 否 | 指定是否使用分布式运行单机多卡或多机多卡 |
| reader_type | string | QueueDataset/DataLoader/CustomizeDataLoader | 否 | 指定使用的reader类型 |
| model_init_path | string | 任意 | 否 | 指定是否使用热启动,在训练初期加载初始化模型 |
| num_workers | int | >= 0 | 否 | 用于加载数据的子进程个数 |
hyper_parameters变量
| 名称 | 类型 | 取值 | 是否必须 | 作用描述 |
|---|---|---|---|---|
| optimizer.class | string | SGD/Adam/Adagrad | 是 | 指定优化器类型 |
| optimizer.learning_rate | float | > 0 | 否 | 指定学习率 |
| reg | float | > 0 | 否 | L2正则化参数,只在SGD下生效 |
| others | / | / | / | 由各个模型组网独立指定 |