Lab 2 - Kør Prompt flow med Phi-3-mini i AIPC
February 1, 2026 · View on GitHub
Hvad er Prompt flow
Prompt flow er en samling udviklingsværktøjer designet til at strømline hele udviklingscyklussen for LLM-baserede AI-applikationer, fra idéudvikling, prototyping, test, evaluering til produktion, implementering og overvågning. Det gør prompt engineering meget nemmere og giver dig mulighed for at bygge LLM-apps med produktionskvalitet.
Med prompt flow kan du:
-
Oprette flows, der forbinder LLM’er, prompts, Python-kode og andre værktøjer i en eksekverbar arbejdsgang.
-
Fejlsøge og iterere dine flows, især interaktionen med LLM’er, på en nem måde.
-
Evaluere dine flows, beregne kvalitets- og ydelsesmetrikker med større datasæt.
-
Integrere test og evaluering i dit CI/CD-system for at sikre kvaliteten af dit flow.
-
Udrulle dine flows til den serveringsplatform, du vælger, eller nemt integrere dem i din apps kodebase.
-
(Valgfrit, men stærkt anbefalet) Samarbejde med dit team ved at bruge cloud-versionen af Prompt flow i Azure AI.
Bygning af genereringskode-flows på Apple Silicon
Note :Hvis du ikke har fuldført installationen af miljøet, besøg venligst Lab 0 -Installations
- Åbn Prompt flow-udvidelsen i Visual Studio Code og opret et tomt flow-projekt

- Tilføj Input- og Output-parametre og tilføj Python-kode som nyt flow

Du kan bruge denne struktur (flow.dag.yaml) som reference til at opbygge dit flow
inputs:
prompt:
type: string
default: Write python code for Fibonacci serie. Please use markdown as output
outputs:
result:
type: string
reference: ${gen_code_by_phi3.output}
nodes:
- name: gen_code_by_phi3
type: python
source:
type: code
path: gen_code_by_phi3.py
inputs:
prompt: ${inputs.prompt}
- Kvantificer phi-3-mini
Vi ønsker at køre SLM bedre på lokale enheder. Generelt kvantificerer vi modellen (INT4, FP16, FP32)
python -m mlx_lm.convert --hf-path microsoft/Phi-3-mini-4k-instruct
Note: standardmappen er mlx_model
- Tilføj kode i Chat_With_Phi3.py
from promptflow import tool
from mlx_lm import load, generate
# The inputs section will change based on the arguments of the tool function, after you save the code
# Adding type to arguments and return value will help the system show the types properly
# Please update the function name/signature per need
@tool
def my_python_tool(prompt: str) -> str:
model_id = './mlx_model_phi3_mini'
model, tokenizer = load(model_id)
# <|user|>\nWrite python code for Fibonacci serie. Please use markdown as output<|end|>\n<|assistant|>
response = generate(model, tokenizer, prompt="<|user|>\n" + prompt + "<|end|>\n<|assistant|>", max_tokens=2048, verbose=True)
return response
- Du kan teste flowet via Debug eller Run for at tjekke, om genereringskoden fungerer korrekt

- Kør flowet som udviklings-API i terminalen
pf flow serve --source ./ --port 8080 --host localhost
Du kan teste det i Postman / Thunder Client
Note
-
Første kørsel tager lang tid. Det anbefales at downloade phi-3 modellen via Hugging face CLI.
-
På grund af den begrænsede regnekraft i Intel NPU anbefales det at bruge Phi-3-mini-4k-instruct.
-
Vi bruger Intel NPU Acceleration til at kvantificere INT4-konvertering, men hvis du genstarter servicen, skal du slette cache- og nc_workshop-mapperne.
Ressourcer
-
Lær Promptflow https://microsoft.github.io/promptflow/
-
Lær Intel NPU Acceleration https://github.com/intel/intel-npu-acceleration-library
-
Eksempelkode, download Local NPU Agent Sample Code
Ansvarsfraskrivelse:
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten Co-op Translator. Selvom vi bestræber os på nøjagtighed, bedes du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det oprindelige dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi påtager os intet ansvar for misforståelser eller fejltolkninger, der opstår som følge af brugen af denne oversættelse.