FAQ
June 12, 2024 · View on GitHub
安装&环境
docker 环境
构建镜像的命令为
docker build -f docker/Dockerfile -t llm-api:pytorch .
如果想要提高推理效率和处理并发请求,推荐使用 vLLM
构建镜像的命令为
docker build -f docker/Dockerfile.vllm -t llm-api:vllm .
本地环境
pip install vllm>=0.4.3
pip install -r requirements.txt
pip uninstall transformer-engine -y
模型启动命令
不使用 vllm
模型启动命令及参数含义见 script
使用 vllm
模型启动命令及参数含义见 vllm_script
vllm 环境下 embedding 模型启动貌似会出问题
解决方案:
pip uninstall transformer-engine
模型挂载
如果使用 docker 方式启动模型,且模型权重不在该项目下,需要将模型权重挂载到容器中,添加如下命令
-v {local_model_path}:/workspace/{container_model_path}
接口调用方式
可用的接口
-
/v1/models: 查询模型信息 -
/v1/chat/completions: 聊天 -
/v1/completions: 文字接龙 -
/v1/embeddings: 句子嵌入 -
/v1/rerank: 句子相似性重排序
具体使用方式兼容 openai
接入其他 web 项目
接入到其他基于 chatgpt 的前后端项目,只需要修改环境变量
-
OPENAI_API_KEY: 此处随意填一个字符串即可 -
OPENAI_API_BASE: 后端启动的接口地址,如:http://192.168.0.xx:80/v1