Phi-3.5:n kvantisointi Intel OpenVINO:lla
February 1, 2026 · View on GitHub
Intel on perinteisin suorittimien valmistaja, jolla on paljon käyttäjiä. Koneoppimisen ja syväoppimisen nousun myötä Intel on myös liittynyt tekoälyn kiihdytyskilpailuun. Mallin päättelyssä Intel käyttää paitsi GPU:ita ja CPU:ita, myös NPU:ita.
Toivomme voivamme ottaa Phi-3.x -perheen käyttöön loppukäyttäjän laitteissa, pyrkien siitä tekoäly-PC:n ja Copilot-PC:n tärkein osa. Mallin lataaminen loppukäyttäjän laitteella riippuu eri laitevalmistajien yhteistyöstä. Tässä luvussa keskitytään pääasiassa Intel OpenVINO:n käyttötilanteeseen kvantitatiivisena mallina.
Mikä on OpenVINO
OpenVINO on avoimen lähdekoodin työkalu syväoppimismallien optimointiin ja käyttöönottoon pilvestä reunalaitteisiin. Se nopeuttaa syväoppimisen päättelyä monissa käyttötapauksissa, kuten generatiivisessa tekoälyssä, videoissa, äänissä ja kielissä, hyödyntäen suosittuja kehyksiä kuten PyTorch, TensorFlow, ONNX ja muita. Muunna ja optimoi malleja, ja ota ne käyttöön erilaisissa Intel®-laitteissa ja ympäristöissä, paikallisesti tai laitteella, selaimessa tai pilvessä.
Nyt OpenVINO:n avulla voit nopeasti kvantisoida GenAI-mallin Intel-laitteistolla ja nopeuttaa mallin referenssiä.
OpenVINO tukee nyt Phi-3.5-Vision ja Phi-3.5 Instruct -mallien kvantisointimuunnosta.
Ympäristön asennus
Varmista, että seuraavat ympäristöriippuvuudet on asennettu, tämä on requirement.txt
--extra-index-url https://download.pytorch.org/whl/cpu
optimum-intel>=1.18.2
nncf>=2.11.0
openvino>=2024.3.0
transformers>=4.40
openvino-genai>=2024.3.0.0
Phi-3.5-Instructin kvantisointi OpenVINO:lla
Aja tämä skripti terminaalissa
export llm_model_id = "microsoft/Phi-3.5-mini-instruct"
export llm_model_path = "your save quantizing Phi-3.5-instruct location"
optimum-cli export openvino --model {llm_model_id} --task text-generation-with-past --weight-format int4 --group-size 128 --ratio 0.6 --sym --trust-remote-code {llm_model_path}
Phi-3.5-Vision kvantisointi OpenVINO:lla
Aja tämä skripti Pythonissa tai Jupyter labissa
import requests
from pathlib import Path
from ov_phi3_vision import convert_phi3_model
import nncf
if not Path("ov_phi3_vision.py").exists():
r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/notebooks/phi-3-vision/ov_phi3_vision.py")
open("ov_phi3_vision.py", "w").write(r.text)
if not Path("gradio_helper.py").exists():
r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/notebooks/phi-3-vision/gradio_helper.py")
open("gradio_helper.py", "w").write(r.text)
if not Path("notebook_utils.py").exists():
r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/utils/notebook_utils.py")
open("notebook_utils.py", "w").write(r.text)
model_id = "microsoft/Phi-3.5-vision-instruct"
out_dir = Path("../model/phi-3.5-vision-128k-instruct-ov")
compression_configuration = {
"mode": nncf.CompressWeightsMode.INT4_SYM,
"group_size": 64,
"ratio": 0.6,
}
if not out_dir.exists():
convert_phi3_model(model_id, out_dir, compression_configuration)
🤖 Phi-3.5:n esimerkit Intel OpenVINO:lla
| Labit | Esittely | Siirry |
|---|---|---|
| 🚀 Lab-esittely Phi-3.5 Instruct | Opi käyttämään Phi-3.5 Instructia tekoäly-PC:ssäsi | Siirry |
| 🚀 Lab-esittely Phi-3.5 Vision (kuva) | Opi käyttämään Phi-3.5 Visionia kuvien analysointiin tekoäly-PC:ssäsi | Siirry |
| 🚀 Lab-esittely Phi-3.5 Vision (video) | Opi käyttämään Phi-3.5 Visionia videoiden analysointiin tekoäly-PC:ssäsi | Siirry |
Resurssit
-
Lisätietoja Intel OpenVINO:sta https://www.intel.com/content/www/us/en/developer/tools/openvino-toolkit/overview.html
-
Intel OpenVINO GitHub Repo https://github.com/openvinotoolkit/openvino.genai
Vastuuvapauslauseke:
Tämä asiakirja on käännetty käyttämällä tekoälypohjaista käännöspalvelua Co-op Translator. Vaikka pyrimme tarkkuuteen, huomioithan, että automaattikäännöksissä saattaa esiintyä virheitä tai epätarkkuuksia. Alkuperäistä asiakirjaa sen alkuperäiskielellä tulee pitää virallisena lähteenä. Tärkeissä tiedoissa suositellaan ammattimaista ihmiskäännöstä. Emme ole vastuussa tämän käännöksen käytöstä aiheutuvista väärinymmärryksistä tai tulkinnoista.