Kvantisering af Phi-3.5 med Intel OpenVINO

February 1, 2026 · View on GitHub

Intel er den mest traditionelle CPU-producent med mange brugere. Med fremkomsten af maskinlæring og dyb læring har Intel også deltaget i konkurrencen om AI-acceleration. Til modelinference bruger Intel ikke kun GPU'er og CPU'er, men også NPUs.

Vi håber at implementere Phi-3.x-familien på endenheden og dermed blive den vigtigste del af AI PC og Copilot PC. Indlæsningen af modellen på endenheden afhænger af samarbejdet mellem forskellige hardwareproducenter. Dette kapitel fokuserer primært på anvendelsesscenariet for Intel OpenVINO som en kvantitativ model.

Hvad er OpenVINO

OpenVINO er et open source-værktøjssæt til optimering og implementering af dyb læringsmodeller fra cloud til edge. Det accelererer dyb læringsinference på tværs af forskellige anvendelsestilfælde, såsom generativ AI, video, lyd og sprog med modeller fra populære frameworks som PyTorch, TensorFlow, ONNX og flere. Konverter og optimer modeller, og implementer dem på en blanding af Intel® hardware og miljøer, både on-premises og på enheden, i browseren eller i skyen.

Med OpenVINO kan du nu hurtigt kvantisere GenAI-modellen på Intel-hardware og accelerere modelreferencen.

OpenVINO understøtter nu kvantiseringskonvertering af Phi-3.5-Vision og Phi-3.5 Instruct

Opsætning af miljø

Sørg for, at følgende miljøafhængigheder er installeret, dette er requirement.txt


--extra-index-url https://download.pytorch.org/whl/cpu
optimum-intel>=1.18.2
nncf>=2.11.0
openvino>=2024.3.0
transformers>=4.40
openvino-genai>=2024.3.0.0

Kvantisering af Phi-3.5-Instruct med OpenVINO

Kør venligst dette script i Terminal



export llm_model_id = "microsoft/Phi-3.5-mini-instruct"

export llm_model_path = "your save quantizing Phi-3.5-instruct location"

optimum-cli export openvino --model {llm_model_id} --task text-generation-with-past --weight-format int4 --group-size 128 --ratio 0.6  --sym  --trust-remote-code {llm_model_path}

Kvantisering af Phi-3.5-Vision med OpenVINO

Kør venligst dette script i Python eller Jupyter lab


import requests
from pathlib import Path
from ov_phi3_vision import convert_phi3_model
import nncf

if not Path("ov_phi3_vision.py").exists():
    r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/notebooks/phi-3-vision/ov_phi3_vision.py")
    open("ov_phi3_vision.py", "w").write(r.text)


if not Path("gradio_helper.py").exists():
    r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/notebooks/phi-3-vision/gradio_helper.py")
    open("gradio_helper.py", "w").write(r.text)

if not Path("notebook_utils.py").exists():
    r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/utils/notebook_utils.py")
    open("notebook_utils.py", "w").write(r.text)



model_id = "microsoft/Phi-3.5-vision-instruct"
out_dir = Path("../model/phi-3.5-vision-128k-instruct-ov")
compression_configuration = {
    "mode": nncf.CompressWeightsMode.INT4_SYM,
    "group_size": 64,
    "ratio": 0.6,
}
if not out_dir.exists():
    convert_phi3_model(model_id, out_dir, compression_configuration)

🤖 Eksempler på Phi-3.5 med Intel OpenVINO

Labs	Introduktion	Gå til
🚀 Lab-Introduktion Phi-3.5 Instruct	Lær, hvordan du bruger Phi-3.5 Instruct på din AI PC	Gå til
🚀 Lab-Introduktion Phi-3.5 Vision (billede)	Lær, hvordan du bruger Phi-3.5 Vision til at analysere billeder på din AI PC	Gå til
🚀 Lab-Introduktion Phi-3.5 Vision (video)	Lær, hvordan du bruger Phi-3.5 Vision til at analysere video på din AI PC	Gå til

Ressourcer

Lær mere om Intel OpenVINO https://www.intel.com/content/www/us/en/developer/tools/openvino-toolkit/overview.html
Intel OpenVINO GitHub Repo https://github.com/openvinotoolkit/openvino.genai

Ansvarsfraskrivelse:
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten Co-op Translator. Selvom vi bestræber os på nøjagtighed, bedes du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det oprindelige dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi påtager os intet ansvar for misforståelser eller fejltolkninger, der opstår som følge af brugen af denne oversættelse.