ERNIE-4.5-300B-A47B 预训练
June 30, 2025 · View on GitHub
English | 简体中文
ERNIE-4.5-300B-A47B 预训练
本文档介绍如何进行 ERNIE-4.5-300B-A47B 预训练,运行训练至少需要96卡NVIDIA H800 80G。
数据准备
本repo为您准备了demo数据集以方便您进行测试,demo数据放在了 ./demo_data 路径下。如果您想使用其他数据集或使用自定义数据集,
请参考 Pretrain 数据集 中的内容。
镜像准备
您的机器需要安装CUDA驱动(>= 525.60.13),并安装 CUDA toolkit 12.9。您可以使用镜像 ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:3.1.0-gpu-cuda12.9-cudnn9.9 来进行预训练任务,同时
请确保您的集群中有 mpi 环境。
环境准备
mpirun python -m pip install -r requirements.txt --force-reinstall
开始训练
在准备好环境后。您可以通过执行以下命令来进行2016卡预训练:
mpirun bash scripts/train_2016_gpus.sh,
或执行以下命令来进行96卡预训练:
mpirun bash scripts/train_96_gpus.sh
- 注意,您需要将
train_2016_gpus.sh或train_96_gpus.sh中的master_ip与port根据您的环境进行替换。
该工具包提供了 ERNIE-4.5-300B-A47B 预训练的高性能实现,包括多维混合并行训练策略和 FP8 混合精度优化,更多的优化点和功能会基于此版本持续更新。