Kvantisering af Phi-3.5 med Intel OpenVINO
February 1, 2026 · View on GitHub
Intel er den mest traditionelle CPU-producent med mange brugere. Med fremkomsten af maskinlæring og dyb læring har Intel også deltaget i konkurrencen om AI-acceleration. Til modelinference bruger Intel ikke kun GPU'er og CPU'er, men også NPUs.
Vi håber at implementere Phi-3.x-familien på endenheden og dermed blive den vigtigste del af AI PC og Copilot PC. Indlæsningen af modellen på endenheden afhænger af samarbejdet mellem forskellige hardwareproducenter. Dette kapitel fokuserer primært på anvendelsesscenariet for Intel OpenVINO som en kvantitativ model.
Hvad er OpenVINO
OpenVINO er et open source-værktøjssæt til optimering og implementering af dyb læringsmodeller fra cloud til edge. Det accelererer dyb læringsinference på tværs af forskellige anvendelsestilfælde, såsom generativ AI, video, lyd og sprog med modeller fra populære frameworks som PyTorch, TensorFlow, ONNX og flere. Konverter og optimer modeller, og implementer dem på en blanding af Intel® hardware og miljøer, både on-premises og på enheden, i browseren eller i skyen.
Med OpenVINO kan du nu hurtigt kvantisere GenAI-modellen på Intel-hardware og accelerere modelreferencen.
OpenVINO understøtter nu kvantiseringskonvertering af Phi-3.5-Vision og Phi-3.5 Instruct
Opsætning af miljø
Sørg for, at følgende miljøafhængigheder er installeret, dette er requirement.txt
--extra-index-url https://download.pytorch.org/whl/cpu
optimum-intel>=1.18.2
nncf>=2.11.0
openvino>=2024.3.0
transformers>=4.40
openvino-genai>=2024.3.0.0
Kvantisering af Phi-3.5-Instruct med OpenVINO
Kør venligst dette script i Terminal
export llm_model_id = "microsoft/Phi-3.5-mini-instruct"
export llm_model_path = "your save quantizing Phi-3.5-instruct location"
optimum-cli export openvino --model {llm_model_id} --task text-generation-with-past --weight-format int4 --group-size 128 --ratio 0.6 --sym --trust-remote-code {llm_model_path}
Kvantisering af Phi-3.5-Vision med OpenVINO
Kør venligst dette script i Python eller Jupyter lab
import requests
from pathlib import Path
from ov_phi3_vision import convert_phi3_model
import nncf
if not Path("ov_phi3_vision.py").exists():
r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/notebooks/phi-3-vision/ov_phi3_vision.py")
open("ov_phi3_vision.py", "w").write(r.text)
if not Path("gradio_helper.py").exists():
r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/notebooks/phi-3-vision/gradio_helper.py")
open("gradio_helper.py", "w").write(r.text)
if not Path("notebook_utils.py").exists():
r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/utils/notebook_utils.py")
open("notebook_utils.py", "w").write(r.text)
model_id = "microsoft/Phi-3.5-vision-instruct"
out_dir = Path("../model/phi-3.5-vision-128k-instruct-ov")
compression_configuration = {
"mode": nncf.CompressWeightsMode.INT4_SYM,
"group_size": 64,
"ratio": 0.6,
}
if not out_dir.exists():
convert_phi3_model(model_id, out_dir, compression_configuration)
🤖 Eksempler på Phi-3.5 med Intel OpenVINO
| Labs | Introduktion | Gå til |
|---|---|---|
| 🚀 Lab-Introduktion Phi-3.5 Instruct | Lær, hvordan du bruger Phi-3.5 Instruct på din AI PC | Gå til |
| 🚀 Lab-Introduktion Phi-3.5 Vision (billede) | Lær, hvordan du bruger Phi-3.5 Vision til at analysere billeder på din AI PC | Gå til |
| 🚀 Lab-Introduktion Phi-3.5 Vision (video) | Lær, hvordan du bruger Phi-3.5 Vision til at analysere video på din AI PC | Gå til |
Ressourcer
-
Lær mere om Intel OpenVINO https://www.intel.com/content/www/us/en/developer/tools/openvino-toolkit/overview.html
-
Intel OpenVINO GitHub Repo https://github.com/openvinotoolkit/openvino.genai
Ansvarsfraskrivelse:
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten Co-op Translator. Selvom vi bestræber os på nøjagtighed, bedes du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det oprindelige dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi påtager os intet ansvar for misforståelser eller fejltolkninger, der opstår som følge af brugen af denne oversættelse.