FAQ

June 12, 2024 · View on GitHub

安装&环境

构建镜像的命令为

docker build -f docker/Dockerfile -t llm-api:pytorch .

如果想要提高推理效率和处理并发请求，推荐使用 vLLM

构建镜像的命令为

docker build -f docker/Dockerfile.vllm -t llm-api:vllm .

pip install vllm>=0.4.3
pip install -r requirements.txt 
pip uninstall transformer-engine -y

模型启动命令及参数含义见 script

模型启动命令及参数含义见 vllm_script

vllm 环境下 embedding 模型启动貌似会出问题

解决方案：

pip uninstall transformer-engine

如果使用 docker 方式启动模型，且模型权重不在该项目下，需要将模型权重挂载到容器中，添加如下命令

-v {local_model_path}:/workspace/{container_model_path}

具体使用方式兼容 openai

接入到其他基于 chatgpt 的前后端项目，只需要修改环境变量