Использование Windows GPU для создания решения Prompt flow с Phi-3.5-Instruct ONNX

February 1, 2026 · View on GitHub

В этом документе приведён пример использования PromptFlow с ONNX (Open Neural Network Exchange) для разработки AI-приложений на базе моделей Phi-3.

PromptFlow — это набор инструментов для разработки, который упрощает полный цикл создания AI-приложений на основе LLM (Large Language Model) — от идеи и прототипирования до тестирования и оценки.

Интегрируя PromptFlow с ONNX, разработчики могут:

  • Оптимизировать производительность модели: использовать ONNX для эффективного вывода и развертывания моделей.
  • Упростить разработку: применять PromptFlow для управления рабочим процессом и автоматизации рутинных задач.
  • Улучшить сотрудничество: обеспечить удобную совместную работу команды через единое рабочее окружение.

Prompt flow — это набор инструментов, который упрощает полный цикл разработки AI-приложений на базе LLM: от идеи, прототипирования, тестирования и оценки до развертывания в продакшн и мониторинга. Он значительно облегчает prompt engineering и позволяет создавать LLM-приложения с качеством, готовым к промышленному использованию.

Prompt flow может подключаться к OpenAI, Azure OpenAI Service и настраиваемым моделям (Huggingface, локальные LLM/SLM). Мы планируем развернуть квантизированную ONNX-модель Phi-3.5 в локальных приложениях. Prompt flow поможет нам лучше спланировать бизнес и реализовать локальные решения на базе Phi-3.5. В этом примере мы объединим ONNX Runtime GenAI Library для создания решения Prompt flow на базе Windows GPU.

Установка

ONNX Runtime GenAI для Windows GPU

Прочитайте это руководство по настройке ONNX Runtime GenAI для Windows GPU нажмите здесь

Настройка Prompt flow в VSCode

  1. Установите расширение Prompt flow для VS Code

pfvscode

  1. После установки расширения Prompt flow для VS Code, кликните по нему и выберите Installation dependencies, следуйте этому руководству для установки Prompt flow SDK в вашем окружении

pfsetup

  1. Скачайте пример кода и откройте его в VS Code

pfsample

  1. Откройте flow.dag.yaml и выберите ваше Python-окружение

pfdag

Откройте chat_phi3_ort.py и укажите путь к вашей модели Phi-3.5-instruct ONNX

pfphi

  1. Запустите prompt flow для тестирования

Откройте flow.dag.yaml, нажмите на визуальный редактор

pfv

после этого запустите выполнение для теста

pfflow

  1. Вы также можете запускать пакетные задания в терминале для получения дополнительных результатов

pf run create --file batch_run.yaml --stream --name 'Your eval qa name'    

Результаты можно просмотреть в вашем браузере по умолчанию

pfresult

Отказ от ответственности:
Этот документ был переведен с помощью сервиса автоматического перевода Co-op Translator. Несмотря на наши усилия по обеспечению точности, просим учитывать, что автоматический перевод может содержать ошибки или неточности. Оригинальный документ на его исходном языке следует считать авторитетным источником. Для получения критически важной информации рекомендуется обращаться к профессиональному переводу, выполненному человеком. Мы не несем ответственности за любые недоразумения или неправильные толкования, возникшие в результате использования данного перевода.