ACE-Step 1.5 安装指南

April 7, 2026 · View on GitHub

Language / 语言 / 言語: English | 中文 | 日本語


目录


环境要求

项目要求
Python3.11-3.12(正式版,非预发布版)
注意: Windows 上的 ROCm 需要 Python 3.12
GPU推荐 CUDA GPU;也支持 MPS / ROCm / Intel XPU / CPU
显存仅 DiT 模式 ≥4GB;LLM+DiT ≥6GB
磁盘核心模型约 10GB

快速开始(全平台)

1. 安装 uv(包管理器)

# macOS / Linux
curl -LsSf https://astral.sh/uv/install.sh | sh

# Windows (PowerShell)
powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"

2. 克隆 & 安装

git clone https://github.com/ACE-Step/ACE-Step-1.5.git
cd ACE-Step-1.5
uv sync

3. 启动

Gradio 网页界面(推荐):

uv run acestep

REST API 服务器:

uv run acestep-api

直接使用 Python(Conda / venv / 系统 Python):

# 先激活你的环境,然后:
python acestep/acestep_v15_pipeline.py          # Gradio UI
python acestep/api_server.py                     # REST API

首次运行时模型会自动下载。打开 http://localhost:7860(Gradio)或 http://localhost:8001(API)。


🚀 启动脚本

为所有平台提供开箱即用的启动脚本。这些脚本会自动处理环境检测、依赖安装和应用启动。所有脚本默认在启动时检查更新(可配置)。

可用脚本

平台脚本说明
Windowsstart_gradio_ui.bat启动 Gradio 网页界面(CUDA)
Windowsstart_api_server.bat启动 REST API 服务器(CUDA)
Windowsstart_gradio_ui_rocm.bat启动 Gradio 网页界面(AMD ROCm)
Windowsstart_api_server_rocm.bat启动 REST API 服务器(AMD ROCm)
Linuxstart_gradio_ui.sh启动 Gradio 网页界面(CUDA)
Linuxstart_api_server.sh启动 REST API 服务器(CUDA)
macOSstart_gradio_ui_macos.sh启动 Gradio 网页界面(MLX)
macOSstart_api_server_macos.sh启动 REST API 服务器(MLX)

Windows

# 启动 Gradio 网页界面(NVIDIA CUDA)
start_gradio_ui.bat

# 启动 REST API 服务器(NVIDIA CUDA)
start_api_server.bat

# 启动 Gradio 网页界面(AMD ROCm)
start_gradio_ui_rocm.bat

# 启动 REST API 服务器(AMD ROCm)
start_api_server_rocm.bat

ROCm 用户: ROCm 脚本(start_gradio_ui_rocm.batstart_api_server_rocm.bat)会自动设置 HSA_OVERRIDE_GFX_VERSIONACESTEP_LM_BACKEND=ptMIOPEN_FIND_MODE=FAST 及其他 ROCm 相关环境变量。这些脚本使用独立的 venv_rocm 虚拟环境,以避免 CUDA/ROCm wheel 冲突。

Linux

# 首次使用需添加执行权限
chmod +x start_gradio_ui.sh start_api_server.sh

# 启动 Gradio 网页界面
./start_gradio_ui.sh

# 启动 REST API 服务器
./start_api_server.sh

注意: 需要通过系统包管理器安装 Git(sudo apt install gitsudo yum install gitsudo pacman -S git)。

macOS(Apple Silicon / MLX)

macOS 脚本使用 MLX 后端,提供原生 Apple Silicon 加速(M1/M2/M3/M4)。

# 首次使用需添加执行权限
chmod +x start_gradio_ui_macos.sh start_api_server_macos.sh

# 启动 Gradio 网页界面(MLX 后端)
./start_gradio_ui_macos.sh

# 启动 REST API 服务器(MLX 后端)
./start_api_server_macos.sh

macOS 脚本会自动设置 ACESTEP_LM_BACKEND=mlx--backend mlx 以启用原生 Apple Silicon 加速,在非 arm64 机器上则回退到 PyTorch 后端。

注意: 通过 xcode-select --installbrew install git 安装 Git。

脚本功能

  • 启动时自动检查更新(默认启用,可配置)
  • 自动环境检测(便携 Python 或 uv)
  • 自动安装 uv(如需要)
  • 可配置下载源(HuggingFace/ModelScope)
  • 可自定义模型和参数

如何修改配置

所有可配置选项均定义为每个脚本顶部的变量。如需自定义,请用文本编辑器打开脚本并修改变量值。

示例:将界面语言改为中文并使用 1.7B LM 模型

Windows (.bat)Linux / macOS (.sh)

start_gradio_ui.bat 中找到以下行:

set LANGUAGE=en
set LM_MODEL_PATH=--lm_model_path acestep-5Hz-lm-0.6B

修改为:

set LANGUAGE=zh
set LM_MODEL_PATH=--lm_model_path acestep-5Hz-lm-1.7B

start_gradio_ui.sh 中找到以下行:

LANGUAGE="en"
LM_MODEL_PATH="--lm_model_path acestep-5Hz-lm-0.6B"

修改为:

LANGUAGE="zh"
LM_MODEL_PATH="--lm_model_path acestep-5Hz-lm-1.7B"

示例:禁用启动时更新检查

Windows (.bat)Linux / macOS (.sh)
REM set CHECK_UPDATE=true
set CHECK_UPDATE=false
# CHECK_UPDATE="true"
CHECK_UPDATE="false"

示例:启用已注释的选项 —— 删除注释前缀(.bat 用 REM,.sh 用 #):

Windows (.bat)Linux / macOS (.sh)

修改前:

REM set SHARE=--share

修改后:

set SHARE=--share

修改前:

# SHARE="--share"

修改后:

SHARE="--share"

常用可配置选项:

选项Gradio UIAPI 服务器说明
LANGUAGE界面语言:enzhheja
PORT服务端口(默认:7860 / 8001)
SERVER_NAME / HOST绑定地址(127.0.0.10.0.0.0
CHECK_UPDATE启动时更新检查(true / false
CONFIG_PATHDiT 模型(acestep-v15-turbo 等)
LM_MODEL_PATHLM 模型(acestep-5Hz-lm-0.6B / 1.7B / 4B
DOWNLOAD_SOURCE下载源(huggingface / modelscope
SHARE创建公开 Gradio 链接
INIT_LLM强制启用/禁用 LLM(true / false / auto
OFFLOAD_TO_CPU低显存 GPU 的 CPU 卸载

更新与维护工具

脚本(Windows)脚本(Linux/macOS)用途
check_update.batcheck_update.sh从 GitHub 检查并更新
merge_config.batmerge_config.sh更新后合并备份的配置
install_uv.batinstall_uv.sh安装 uv 包管理器
quick_test.batquick_test.sh测试环境配置

更新工作流:

# Windows                          # Linux / macOS
check_update.bat                    ./check_update.sh
merge_config.bat                    ./merge_config.sh

🪟 Windows 便携包

为 Windows 用户提供了预装依赖的便携包:

  1. 下载并解压:ACE-Step-1.5.7z
  2. 包含 python_embedded,所有依赖已预装
  3. 要求: CUDA 12.8

快速启动脚本

脚本说明
start_gradio_ui.bat启动 Gradio 网页界面
start_api_server.bat启动 REST API 服务器

两个脚本均支持自动环境检测、自动安装 uv、可配置下载源、可选 Git 更新检查、可自定义模型和参数。

配置

start_gradio_ui.bat

REM 界面语言 (en, zh, he, ja)
set LANGUAGE=zh

REM 下载源 (auto, huggingface, modelscope)
set DOWNLOAD_SOURCE=--download-source modelscope

REM Git 更新检查 (true/false)
set CHECK_UPDATE=true

REM 模型配置
set CONFIG_PATH=--config_path acestep-v15-turbo
set LM_MODEL_PATH=--lm_model_path acestep-5Hz-lm-1.7B

更新与维护

脚本用途
check_update.bat从 GitHub 检查并更新
merge_config.bat更新后合并备份的配置
install_uv.bat安装 uv 包管理器
quick_test.bat测试环境配置

AMD / ROCm 显卡

⚠️ uv run acestep 会安装 CUDA PyTorch wheels,可能覆盖已有的 ROCm 环境。

推荐工作流

# 1. 创建并激活虚拟环境
python -m venv .venv
source .venv/bin/activate

# 2. 安装 ROCm 兼容的 PyTorch
pip install torch --index-url https://download.pytorch.org/whl/rocm6.0

# 3. 安装 ACE-Step
pip install -e .

# 4. 启动服务
python -m acestep.acestep_v15_pipeline --port 7680

GPU 检测问题排查

如果显示 "No GPU detected, running on CPU":

  1. 运行诊断工具:python scripts/check_gpu.py
  2. RDNA3 GPU 设置 HSA_OVERRIDE_GFX_VERSION
GPU
RX 7900 XT/XTX, RX 9070 XTexport HSA_OVERRIDE_GFX_VERSION=11.0.0
RX 7800 XT, RX 7700 XTexport HSA_OVERRIDE_GFX_VERSION=11.0.1
RX 7600export HSA_OVERRIDE_GFX_VERSION=11.0.2
  1. Windows 上使用 start_gradio_ui_rocm.bat / start_api_server_rocm.bat
  2. 验证 ROCm 安装:rocm-smi

Linux(cachy-os / RDNA4)

详见 ACE-Step1.5-Rocm-Manual-Linux.md


Intel 显卡

项目详情
测试设备Windows 笔记本,Ultra 9 285H 集成显卡
卸载默认禁用
编译与量化默认启用
LLM 推理支持(已测试 acestep-5Hz-lm-0.6B
nanovllm 加速Intel GPU 暂不支持
测试环境PyTorch 2.8.0(Intel Extension for PyTorch

注意:生成超过 2 分钟的音频时,LLM 推理速度可能下降。Intel 独立显卡预计可用但尚未测试。


仅 CPU 模式

ACE-Step 可以在 CPU 上运行仅推理,但速度会显著变慢。

  • 不推荐在 CPU 上训练(包括 LoRA)。
  • 低显存系统可使用 DiT-only 模式(禁用 LLM)。

如果没有 GPU,建议:

  • 使用云 GPU 服务
  • 仅运行推理工作流
  • 使用 ACESTEP_INIT_LLM=false 启用 DiT-only 模式

Linux 注意事项

Python 3.11 预发布版问题

部分 Linux 发行版(包括 Ubuntu)自带 Python 3.11.0rc1 预发布版,可能导致 vLLM 后端出现段错误。

建议: 使用稳定版 Python(≥ 3.11.12)。Ubuntu 上可通过 deadsnakes PPA 安装。

如无法升级 Python,使用 PyTorch 后端:

uv run acestep --backend pt

环境变量 (.env)

cp .env.example .env   # 复制并编辑

关键变量

变量取值说明
ACESTEP_INIT_LLMauto / true / falseLLM 初始化模式
ACESTEP_CONFIG_PATH模型名称DiT 模型路径
ACESTEP_LM_MODEL_PATH模型名称LM 模型路径
ACESTEP_DOWNLOAD_SOURCEauto / huggingface / modelscope下载源
ACESTEP_API_KEY字符串API 认证密钥

LLM 初始化 (ACESTEP_INIT_LLM)

处理流程:GPU 检测 → ACESTEP_INIT_LLM 覆盖 → 模型加载

行为
auto(或空)使用 GPU 自动检测结果(推荐)
true / 1 / yes强制启用 LLM(可能导致 OOM)
false / 0 / no强制禁用,纯 DiT 模式

示例 .env

# 自动模式(推荐)
ACESTEP_INIT_LLM=auto

# 低显存 GPU 强制启用
ACESTEP_INIT_LLM=true
ACESTEP_LM_MODEL_PATH=acestep-5Hz-lm-0.6B

# 禁用 LLM 加速生成
ACESTEP_INIT_LLM=false

命令行参数

Gradio UI (acestep)

参数默认值说明
--port7860服务端口
--server-name127.0.0.1服务地址(使用 0.0.0.0 开放网络访问)
--sharefalse创建公开 Gradio 链接
--languageen界面语言:enzhheja
--init_servicefalse启动时自动初始化模型
--init_llmautoLLM 初始化:true / false / 省略为自动
--config_pathautoDiT 模型(如 acestep-v15-turbo
--lm_model_pathautoLM 模型(如 acestep-5Hz-lm-1.7B
--offload_to_cpuautoCPU 卸载(显存 < 20GB 时自动启用)
--download-sourceauto模型源:auto / huggingface / modelscope
--enable-apifalse同时启用 REST API 端点

示例:

# 公开访问 + 中文界面
uv run acestep --server-name 0.0.0.0 --share --language zh

# 启动时预初始化模型
uv run acestep --init_service true --config_path acestep-v15-turbo

# 使用 ModelScope 下载
uv run acestep --download-source modelscope

📥 模型下载

首次运行时模型会从 HuggingFaceModelScope 自动下载。

CLI 下载

uv run acestep-download                              # 下载主模型
uv run acestep-download --all                         # 下载所有模型
uv run acestep-download --download-source modelscope  # 从 ModelScope 下载
uv run acestep-download --model acestep-v15-sft       # 指定模型
uv run acestep-download --list                        # 列出所有可用模型

手动下载 (huggingface-cli)

# 主模型
huggingface-cli download ACE-Step/Ace-Step1.5 --local-dir ./checkpoints

# 可选模型
huggingface-cli download ACE-Step/acestep-5Hz-lm-0.6B --local-dir ./checkpoints/acestep-5Hz-lm-0.6B
huggingface-cli download ACE-Step/acestep-5Hz-lm-4B --local-dir ./checkpoints/acestep-5Hz-lm-4B

共享模型目录

如果你有多个 ACE-Step 安装(例如训练器、不同版本),可以共享同一个模型目录以避免重复下载、节省磁盘空间:

# 添加到 shell 配置文件(~/.bashrc、~/.zshrc 等)
export ACESTEP_CHECKPOINTS_DIR=~/ace-step-models

所有安装将使用相同的模型文件。也可以在 .env 文件中设置。

可用模型

模型说明HuggingFace
Ace-Step1.5(主模型)核心:vae, Qwen3-Embedding-0.6B, acestep-v15-turbo, acestep-5Hz-lm-1.7B链接
acestep-5Hz-lm-0.6B轻量 LM(0.6B 参数)链接
acestep-5Hz-lm-4B大型 LM(4B 参数)链接
acestep-v15-base基础 DiT 模型链接
acestep-v15-sftSFT DiT 模型链接
acestep-v15-turbo-shift1Turbo DiT(shift1)链接
acestep-v15-turbo-shift3Turbo DiT(shift3)链接
acestep-v15-turbo-continuousTurbo DiT(continuous shift 1-5)链接

💡 如何选择模型?

ACE-Step 会自动适配你的 GPU 显存。UI 会根据检测到的 GPU 等级预配置所有设置(LM 模型、后端、卸载、量化):

GPU 显存推荐 DiT推荐 LM 模型后端说明
≤6GB2B turbo无(仅 DiT)默认禁用 LM;INT8 量化 + 完全 CPU 卸载
6-8GB2B turboacestep-5Hz-lm-0.6Bpt轻量 LM,PyTorch 后端
8-16GB2B turbo/sft0.6B / 1.7Bvllm8-12GB 用 0.6B,12-16GB 用 1.7B
16-20GB2B sft 或 XL turboacestep-5Hz-lm-1.7BvllmXL 在 20GB 以下需要 CPU 卸载
20-24GBXL turbo/sftacestep-5Hz-lm-1.7BvllmXL 无需卸载;可用 4B LM
≥24GBXL sft(或 xl-base 用于 extract/lego/complete)acestep-5Hz-lm-4Bvllm最佳质量,所有模型无需卸载

📖 详细 GPU 兼容性信息(等级表、时长限制、批量大小、自适应 UI 默认设置、显存优化),请参阅 GPU 兼容性指南


开发

# 添加依赖
uv add package-name
uv add --dev package-name

# 更新所有依赖
uv sync --upgrade