Lab 2 - Kør Prompt flow med Phi-3-mini i AIPC

February 1, 2026 · View on GitHub

Hvad er Prompt flow

Prompt flow er en samling udviklingsværktøjer designet til at strømline hele udviklingscyklussen for LLM-baserede AI-applikationer, fra idéudvikling, prototyping, test, evaluering til produktion og overvågning. Det gør prompt engineering meget nemmere og giver dig mulighed for at bygge LLM-apps med produktionskvalitet.

Med prompt flow kan du:

Oprette flows, der forbinder LLM’er, prompts, Python-kode og andre værktøjer i en eksekverbar arbejdsgang.
Fejlsøge og iterere dine flows, især interaktionen med LLM’er, på en nem måde.
Evaluere dine flows, beregne kvalitets- og ydelsesmetrikker med større datasæt.
Integrere test og evaluering i dit CI/CD-system for at sikre kvaliteten af dit flow.
Udrulle dine flows til den serveringsplatform, du vælger, eller nemt integrere dem i din apps kodebase.
(Valgfrit, men stærkt anbefalet) Samarbejde med dit team ved at bruge cloud-versionen af Prompt flow i Azure AI.

Hvad er AIPC

En AI PC har en CPU, en GPU og en NPU, hver med specifikke AI-accelerationsmuligheder. En NPU, eller neural processing unit, er en specialiseret accelerator, der håndterer kunstig intelligens (AI) og maskinlæringsopgaver (ML) direkte på din PC i stedet for at sende data til behandling i skyen. GPU’en og CPU’en kan også håndtere disse opgaver, men NPU’en er især god til AI-beregninger med lavt strømforbrug. AI PC’en repræsenterer et grundlæggende skift i, hvordan vores computere fungerer. Det er ikke en løsning på et problem, der ikke eksisterede før. I stedet lover det en stor forbedring for dagligdags PC-brug.

Hvordan fungerer det så? Sammenlignet med generativ AI og de massive store sprogmodeller (LLMs), der er trænet på enorme mængder offentlige data, er den AI, der kører på din PC, mere tilgængelig på næsten alle niveauer. Konceptet er lettere at forstå, og fordi det er trænet på dine data uden at skulle tilgå skyen, er fordelene mere umiddelbart tiltalende for en bredere gruppe.

På kort sigt handler AI PC-verdenen om personlige assistenter og mindre AI-modeller, der kører direkte på din PC, bruger dine data til at tilbyde personlige, private og mere sikre AI-forbedringer til ting, du allerede gør hver dag – tage mødereferater, organisere en fantasy football-liga, automatisere forbedringer til foto- og videoredigering eller lægge den perfekte rejseplan til en familiegensamling baseret på alles ankomst- og afgangstider.

Byg genereringskode-flows på AIPC

Note ：Hvis du ikke har fuldført installationen af miljøet, besøg venligst Lab 0 -Installations

Åbn Prompt flow-udvidelsen i Visual Studio Code og opret et tomt flow-projekt

create

Tilføj Inputs og Outputs parametre og tilføj Python-kode som nyt flow

flow

Du kan bruge denne struktur (flow.dag.yaml) som reference til at opbygge dit flow


inputs:
  question:
    type: string
    default: how to write Bubble Algorithm
outputs:
  answer:
    type: string
    reference: ${Chat_With_Phi3.output}
nodes:
- name: Chat_With_Phi3
  type: python
  source:
    type: code
    path: Chat_With_Phi3.py
  inputs:
    question: ${inputs.question}

Tilføj kode i Chat_With_Phi3.py



from promptflow.core import tool

# import torch
from transformers import AutoTokenizer, pipeline,TextStreamer
import intel_npu_acceleration_library as npu_lib

import warnings

import asyncio
import platform

class Phi3CodeAgent:
    
    model = None
    tokenizer = None
    text_streamer = None
    
    model_id = "microsoft/Phi-3-mini-4k-instruct"

    @staticmethod
    def init_phi3():
        
        if Phi3CodeAgent.model is None or Phi3CodeAgent.tokenizer is None or Phi3CodeAgent.text_streamer is None:
            Phi3CodeAgent.model = npu_lib.NPUModelForCausalLM.from_pretrained(
                                    Phi3CodeAgent.model_id,
                                    torch_dtype="auto",
                                    dtype=npu_lib.int4,
                                    trust_remote_code=True
                                )
            Phi3CodeAgent.tokenizer = AutoTokenizer.from_pretrained(Phi3CodeAgent.model_id)
            Phi3CodeAgent.text_streamer = TextStreamer(Phi3CodeAgent.tokenizer, skip_prompt=True)

    

    @staticmethod
    def chat_with_phi3(prompt):
        
        Phi3CodeAgent.init_phi3()

        messages = "<|system|>You are a AI Python coding assistant. Please help me to generate code in Python.The answer only genertated Python code, but any comments and instructions do not need to be generated<|end|><|user|>" + prompt +"<|end|><|assistant|>"



        generation_args = {
            "max_new_tokens": 1024,
            "return_full_text": False,
            "temperature": 0.3,
            "do_sample": False,
            "streamer": Phi3CodeAgent.text_streamer,
        }

        pipe = pipeline(
            "text-generation",
            model=Phi3CodeAgent.model,
            tokenizer=Phi3CodeAgent.tokenizer,
            # **generation_args
        )

        result = ''

        with warnings.catch_warnings():
            warnings.simplefilter("ignore")
            response = pipe(messages, **generation_args)
            result =response[0]['generated_text']
            return result


@tool
def my_python_tool(question: str) -> str:
    if platform.system() == 'Windows':
        asyncio.set_event_loop_policy(asyncio.WindowsSelectorEventLoopPolicy())
    return Phi3CodeAgent.chat_with_phi3(question)

Du kan teste flowet via Debug eller Run for at tjekke, om genereringskoden fungerer korrekt

RUN

Kør flowet som udviklings-API i terminalen


pf flow serve --source ./ --port 8080 --host localhost

Du kan teste det i Postman / Thunder Client

Note

Den første kørsel tager lang tid. Det anbefales at downloade phi-3 modellen via Hugging face CLI.
På grund af den begrænsede regnekraft i Intel NPU anbefales det at bruge Phi-3-mini-4k-instruct.
Vi bruger Intel NPU Acceleration til at kvantisere INT4-konvertering, men hvis du genstarter servicen, skal du slette cache- og nc_workshop-mapperne.

Ressourcer

Lær Promptflow https://microsoft.github.io/promptflow/
Lær Intel NPU Acceleration https://github.com/intel/intel-npu-acceleration-library
Eksempelkode, download Local NPU Agent Sample Code

Ansvarsfraskrivelse:
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten Co-op Translator. Selvom vi bestræber os på nøjagtighed, bedes du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det oprindelige dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi påtager os intet ansvar for misforståelser eller fejltolkninger, der opstår som følge af brugen af denne oversættelse.