Retningslinje for OnnxRuntime GenAI Windows GPU
February 1, 2026 · View on GitHub
Denne retningslinje beskriver trin til opsætning og brug af ONNX Runtime (ORT) med GPU'er på Windows. Den er designet til at hjælpe dig med at udnytte GPU-acceleration til dine modeller, hvilket forbedrer ydeevne og effektivitet.
Dokumentet giver vejledning om:
- Miljøopsætning: Instruktioner til installation af nødvendige afhængigheder som CUDA, cuDNN og ONNX Runtime.
- Konfiguration: Hvordan du konfigurerer miljøet og ONNX Runtime til effektivt at bruge GPU-ressourcer.
- Optimeringstips: Råd om, hvordan du finjusterer dine GPU-indstillinger for optimal ydeevne.
1. Python 3.10.x /3.11.8
Note Vi anbefaler at bruge miniforge som dit Python-miljø
conda create -n pydev python==3.11.8
conda activate pydev
Reminder Hvis du har installeret nogen Python ONNX-biblioteker, skal du afinstallere dem
2. Installer CMake med winget
winget install -e --id Kitware.CMake
3. Installer Visual Studio 2022 - Desktop Development med C++
Note Hvis du ikke ønsker at kompilere, kan du springe dette trin over

4. Installer NVIDIA Driver
-
NVIDIA GPU Driver https://www.nvidia.com/en-us/drivers/
-
NVIDIA CUDA 12.4 https://developer.nvidia.com/cuda-12-4-0-download-archive
-
NVIDIA CUDNN 9.4 https://developer.nvidia.com/cudnn-downloads
Reminder Brug venligst standardindstillingerne under installationen
5. Sæt NVIDIA-miljø
Kopier NVIDIA CUDNN 9.4 lib, bin, include til NVIDIA CUDA 12.4 lib, bin, include
-
kopier 'C:\Program Files\NVIDIA\CUDNN\v9.4\bin\12.6' filer til 'C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\bin'
-
kopier 'C:\Program Files\NVIDIA\CUDNN\v9.4\include\12.6' filer til 'C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\include'
-
kopier 'C:\Program Files\NVIDIA\CUDNN\v9.4\lib\12.6' filer til 'C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\lib\x64'
6. Download Phi-3.5-mini-instruct-onnx
winget install -e --id Git.Git
winget install -e --id GitHub.GitLFS
git lfs install
git clone https://huggingface.co/microsoft/Phi-3.5-mini-instruct-onnx
7. Kør InferencePhi35Instruct.ipynb
Åbn Notebook og kør den

8. Kompiler ORT GenAI GPU
Note
- Afinstaller venligst først alle onnx, onnxruntime og onnxruntime-genai pakker
pip list
Derefter afinstaller alle onnxruntime biblioteker, f.eks.
pip uninstall onnxruntime
pip uninstall onnxruntime-genai
pip uninstall onnxruntume-genai-cuda
- Tjek Visual Studio Extension support
Kontroller i C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras, at mappen C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras\visual_studio_integration findes.
Hvis den ikke findes, tjek andre CUDA toolkit driver-mapper og kopier mappen visual_studio_integration og dens indhold til C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras\visual_studio_integration
- Hvis du ikke ønsker at kompilere, kan du springe dette trin over
git clone https://github.com/microsoft/onnxruntime-genai
-
Pak onnxruntime-win-x64-gpu-1.19.2.zip ud, og omdøb mappen til ort, kopier derefter ort-mappen til onnxruntime-genai
-
Brug Windows Terminal, åbn Developer Command Prompt for VS 2022 og gå til onnxruntime-genai

- Kompiler det med dit Python-miljø
cd onnxruntime-genai
python build.py --use_cuda --cuda_home "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4" --config Release
cd build/Windows/Release/Wheel
pip install .whl
Ansvarsfraskrivelse:
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten Co-op Translator. Selvom vi bestræber os på nøjagtighed, bedes du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det oprindelige dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi påtager os intet ansvar for misforståelser eller fejltolkninger, der opstår som følge af brugen af denne oversættelse.