Quantification de Phi-3.5 avec Intel OpenVINO

February 1, 2026 · View on GitHub

Intel est le fabricant de CPU le plus traditionnel avec de nombreux utilisateurs. Avec l’essor de l’apprentissage automatique et du deep learning, Intel a également rejoint la course à l’accélération de l’IA. Pour l’inférence des modèles, Intel utilise non seulement des GPU et des CPU, mais aussi des NPU.

Nous espérons déployer la famille Phi-3.x côté terminal, dans l’espoir de devenir la partie la plus importante des PC IA et des PC Copilot. Le chargement du modèle côté terminal dépend de la coopération entre différents fabricants de matériel. Ce chapitre se concentre principalement sur le scénario d’application d’Intel OpenVINO en tant que modèle quantifié.

Qu’est-ce qu’OpenVINO

OpenVINO est une boîte à outils open source pour optimiser et déployer des modèles de deep learning du cloud jusqu’à la périphérie. Il accélère l’inférence deep learning dans divers cas d’usage, tels que l’IA générative, la vidéo, l’audio et le langage, avec des modèles issus de frameworks populaires comme PyTorch, TensorFlow, ONNX, et plus encore. Convertissez et optimisez les modèles, puis déployez-les sur un mélange de matériels et environnements Intel®, sur site ou sur appareil, dans le navigateur ou dans le cloud.

Avec OpenVINO, vous pouvez désormais quantifier rapidement le modèle GenAI sur le matériel Intel et accélérer la référence du modèle.

OpenVINO prend désormais en charge la conversion de quantification de Phi-3.5-Vision et Phi-3.5 Instruct.

Configuration de l’environnement

Veuillez vous assurer que les dépendances d’environnement suivantes sont installées, ceci correspond au fichier requirement.txt


--extra-index-url https://download.pytorch.org/whl/cpu
optimum-intel>=1.18.2
nncf>=2.11.0
openvino>=2024.3.0
transformers>=4.40
openvino-genai>=2024.3.0.0

Quantification de Phi-3.5-Instruct avec OpenVINO

Dans le terminal, veuillez exécuter ce script



export llm_model_id = "microsoft/Phi-3.5-mini-instruct"

export llm_model_path = "your save quantizing Phi-3.5-instruct location"

optimum-cli export openvino --model {llm_model_id} --task text-generation-with-past --weight-format int4 --group-size 128 --ratio 0.6  --sym  --trust-remote-code {llm_model_path}


Quantification de Phi-3.5-Vision avec OpenVINO

Veuillez exécuter ce script en Python ou dans Jupyter lab


import requests
from pathlib import Path
from ov_phi3_vision import convert_phi3_model
import nncf

if not Path("ov_phi3_vision.py").exists():
    r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/notebooks/phi-3-vision/ov_phi3_vision.py")
    open("ov_phi3_vision.py", "w").write(r.text)


if not Path("gradio_helper.py").exists():
    r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/notebooks/phi-3-vision/gradio_helper.py")
    open("gradio_helper.py", "w").write(r.text)

if not Path("notebook_utils.py").exists():
    r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/utils/notebook_utils.py")
    open("notebook_utils.py", "w").write(r.text)



model_id = "microsoft/Phi-3.5-vision-instruct"
out_dir = Path("../model/phi-3.5-vision-128k-instruct-ov")
compression_configuration = {
    "mode": nncf.CompressWeightsMode.INT4_SYM,
    "group_size": 64,
    "ratio": 0.6,
}
if not out_dir.exists():
    convert_phi3_model(model_id, out_dir, compression_configuration)

🤖 Exemples pour Phi-3.5 avec Intel OpenVINO

LabsPrésentationAccéder
🚀 Lab-Présentation Phi-3.5 InstructApprenez à utiliser Phi-3.5 Instruct sur votre PC IAAccéder
🚀 Lab-Présentation Phi-3.5 Vision (image)Apprenez à utiliser Phi-3.5 Vision pour analyser des images sur votre PC IAAccéder
🚀 Lab-Présentation Phi-3.5 Vision (vidéo)Apprenez à utiliser Phi-3.5 Vision pour analyser des vidéos sur votre PC IAAccéder

Ressources

  1. En savoir plus sur Intel OpenVINO https://www.intel.com/content/www/us/en/developer/tools/openvino-toolkit/overview.html

  2. Dépôt GitHub Intel OpenVINO https://github.com/openvinotoolkit/openvino.genai

Avertissement :
Ce document a été traduit à l’aide du service de traduction automatique Co-op Translator. Bien que nous nous efforcions d’assurer l’exactitude, veuillez noter que les traductions automatiques peuvent contenir des erreurs ou des inexactitudes. Le document original dans sa langue d’origine doit être considéré comme la source faisant foi. Pour les informations critiques, une traduction professionnelle réalisée par un humain est recommandée. Nous déclinons toute responsabilité en cas de malentendus ou de mauvaises interprétations résultant de l’utilisation de cette traduction.