Использование Windows GPU для создания решения Prompt flow с Phi-3.5-Instruct ONNX
February 1, 2026 · View on GitHub
В этом документе приведён пример использования PromptFlow с ONNX (Open Neural Network Exchange) для разработки AI-приложений на базе моделей Phi-3.
PromptFlow — это набор инструментов для разработки, который упрощает полный цикл создания AI-приложений на основе LLM (Large Language Model) — от идеи и прототипирования до тестирования и оценки.
Интегрируя PromptFlow с ONNX, разработчики могут:
- Оптимизировать производительность модели: использовать ONNX для эффективного вывода и развертывания моделей.
- Упростить разработку: применять PromptFlow для управления рабочим процессом и автоматизации рутинных задач.
- Улучшить сотрудничество: обеспечить удобную совместную работу команды через единое рабочее окружение.
Prompt flow — это набор инструментов, который упрощает полный цикл разработки AI-приложений на базе LLM: от идеи, прототипирования, тестирования и оценки до развертывания в продакшн и мониторинга. Он значительно облегчает prompt engineering и позволяет создавать LLM-приложения с качеством, готовым к промышленному использованию.
Prompt flow может подключаться к OpenAI, Azure OpenAI Service и настраиваемым моделям (Huggingface, локальные LLM/SLM). Мы планируем развернуть квантизированную ONNX-модель Phi-3.5 в локальных приложениях. Prompt flow поможет нам лучше спланировать бизнес и реализовать локальные решения на базе Phi-3.5. В этом примере мы объединим ONNX Runtime GenAI Library для создания решения Prompt flow на базе Windows GPU.
Установка
ONNX Runtime GenAI для Windows GPU
Прочитайте это руководство по настройке ONNX Runtime GenAI для Windows GPU нажмите здесь
Настройка Prompt flow в VSCode
- Установите расширение Prompt flow для VS Code

- После установки расширения Prompt flow для VS Code, кликните по нему и выберите Installation dependencies, следуйте этому руководству для установки Prompt flow SDK в вашем окружении

- Скачайте пример кода и откройте его в VS Code

- Откройте flow.dag.yaml и выберите ваше Python-окружение

Откройте chat_phi3_ort.py и укажите путь к вашей модели Phi-3.5-instruct ONNX

- Запустите prompt flow для тестирования
Откройте flow.dag.yaml, нажмите на визуальный редактор

после этого запустите выполнение для теста

- Вы также можете запускать пакетные задания в терминале для получения дополнительных результатов
pf run create --file batch_run.yaml --stream --name 'Your eval qa name'
Результаты можно просмотреть в вашем браузере по умолчанию

Отказ от ответственности:
Этот документ был переведен с помощью сервиса автоматического перевода Co-op Translator. Несмотря на наши усилия по обеспечению точности, просим учитывать, что автоматический перевод может содержать ошибки или неточности. Оригинальный документ на его исходном языке следует считать авторитетным источником. Для получения критически важной информации рекомендуется обращаться к профессиональному переводу, выполненному человеком. Мы не несем ответственности за любые недоразумения или неправильные толкования, возникшие в результате использования данного перевода.