Retningslinje for OnnxRuntime GenAI Windows GPU

February 1, 2026 · View on GitHub

Denne retningslinje beskriver trin til opsætning og brug af ONNX Runtime (ORT) med GPU'er på Windows. Den er designet til at hjælpe dig med at udnytte GPU-acceleration til dine modeller, hvilket forbedrer ydeevne og effektivitet.

Dokumentet giver vejledning om:

Miljøopsætning: Instruktioner til installation af nødvendige afhængigheder som CUDA, cuDNN og ONNX Runtime.
Konfiguration: Hvordan du konfigurerer miljøet og ONNX Runtime til effektivt at bruge GPU-ressourcer.
Optimeringstips: Råd om, hvordan du finjusterer dine GPU-indstillinger for optimal ydeevne.

1. Python 3.10.x /3.11.8

Note Vi anbefaler at bruge miniforge som dit Python-miljø


conda create -n pydev python==3.11.8

conda activate pydev

Reminder Hvis du har installeret nogen Python ONNX-biblioteker, skal du afinstallere dem

2. Installer CMake med winget


winget install -e --id Kitware.CMake

3. Installer Visual Studio 2022 - Desktop Development med C++

Note Hvis du ikke ønsker at kompilere, kan du springe dette trin over

CPP

4. Installer NVIDIA Driver

NVIDIA GPU Driver https://www.nvidia.com/en-us/drivers/
NVIDIA CUDA 12.4 https://developer.nvidia.com/cuda-12-4-0-download-archive
NVIDIA CUDNN 9.4 https://developer.nvidia.com/cudnn-downloads

Reminder Brug venligst standardindstillingerne under installationen

5. Sæt NVIDIA-miljø

Kopier NVIDIA CUDNN 9.4 lib, bin, include til NVIDIA CUDA 12.4 lib, bin, include

kopier 'C:\Program Files\NVIDIA\CUDNN\v9.4\bin\12.6' filer til 'C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\bin'
kopier 'C:\Program Files\NVIDIA\CUDNN\v9.4\include\12.6' filer til 'C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\include'
kopier 'C:\Program Files\NVIDIA\CUDNN\v9.4\lib\12.6' filer til 'C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\lib\x64'

6. Download Phi-3.5-mini-instruct-onnx


winget install -e --id Git.Git

winget install -e --id GitHub.GitLFS

git lfs install

git clone https://huggingface.co/microsoft/Phi-3.5-mini-instruct-onnx

7. Kør InferencePhi35Instruct.ipynb

Åbn Notebook og kør den

RESULT

8. Kompiler ORT GenAI GPU

Note

Afinstaller venligst først alle onnx, onnxruntime og onnxruntime-genai pakker


pip list

Derefter afinstaller alle onnxruntime biblioteker, f.eks.


pip uninstall onnxruntime

pip uninstall onnxruntime-genai

pip uninstall onnxruntume-genai-cuda

Tjek Visual Studio Extension support

Kontroller i C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras, at mappen C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras\visual_studio_integration findes.

Hvis den ikke findes, tjek andre CUDA toolkit driver-mapper og kopier mappen visual_studio_integration og dens indhold til C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras\visual_studio_integration

Hvis du ikke ønsker at kompilere, kan du springe dette trin over


git clone https://github.com/microsoft/onnxruntime-genai

Download https://github.com/microsoft/onnxruntime/releases/download/v1.19.2/onnxruntime-win-x64-gpu-1.19.2.zip
Pak onnxruntime-win-x64-gpu-1.19.2.zip ud, og omdøb mappen til ort, kopier derefter ort-mappen til onnxruntime-genai
Brug Windows Terminal, åbn Developer Command Prompt for VS 2022 og gå til onnxruntime-genai

RESULT

Kompiler det med dit Python-miljø


cd onnxruntime-genai

python build.py --use_cuda  --cuda_home "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4" --config Release


cd build/Windows/Release/Wheel

pip install .whl

Ansvarsfraskrivelse:
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten Co-op Translator. Selvom vi bestræber os på nøjagtighed, bedes du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det oprindelige dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi påtager os intet ansvar for misforståelser eller fejltolkninger, der opstår som følge af brugen af denne oversættelse.