کوانتایز کردن Phi-3.5 با استفاده از Intel OpenVINO
February 1, 2026 · View on GitHub
اینتل یکی از قدیمیترین تولیدکنندگان CPU با تعداد زیادی کاربر است. با رشد یادگیری ماشین و یادگیری عمیق، اینتل نیز وارد رقابت برای تسریع هوش مصنوعی شده است. برای استنتاج مدل، اینتل نه تنها از GPU و CPU استفاده میکند، بلکه از NPUها نیز بهره میبرد.
امیدواریم خانواده Phi-3.x را در سمت انتهایی پیادهسازی کنیم و به بخش مهمی از کامپیوترهای هوش مصنوعی و کامپیوترهای همراه تبدیل شویم. بارگذاری مدل در سمت انتهایی به همکاری تولیدکنندگان سختافزار مختلف بستگی دارد. این فصل عمدتاً بر سناریوی کاربردی Intel OpenVINO به عنوان یک مدل کوانتیزه شده تمرکز دارد.
OpenVINO چیست
OpenVINO یک مجموعه ابزار متنباز برای بهینهسازی و استقرار مدلهای یادگیری عمیق از فضای ابری تا لبه است. این ابزار استنتاج یادگیری عمیق را در کاربردهای مختلف مانند هوش مصنوعی مولد، ویدئو، صدا و زبان با مدلهایی از فریمورکهای محبوبی مانند PyTorch، TensorFlow، ONNX و غیره تسریع میکند. مدلها را تبدیل و بهینهسازی کرده و در ترکیبی از سختافزار و محیطهای اینتل، چه در محل و چه روی دستگاه، در مرورگر یا در فضای ابری مستقر میکند.
اکنون با OpenVINO میتوانید مدل GenAI را به سرعت روی سختافزار اینتل کوانتیزه کرده و استنتاج مدل را تسریع کنید.
در حال حاضر OpenVINO از تبدیل کوانتیزه Phi-3.5-Vision و Phi-3.5 Instruct پشتیبانی میکند.
راهاندازی محیط
لطفاً اطمینان حاصل کنید که وابستگیهای محیط زیر نصب شدهاند، این فایل requirement.txt است
--extra-index-url https://download.pytorch.org/whl/cpu
optimum-intel>=1.18.2
nncf>=2.11.0
openvino>=2024.3.0
transformers>=4.40
openvino-genai>=2024.3.0.0
کوانتایز کردن Phi-3.5-Instruct با استفاده از OpenVINO
در ترمینال، لطفاً این اسکریپت را اجرا کنید
export llm_model_id = "microsoft/Phi-3.5-mini-instruct"
export llm_model_path = "your save quantizing Phi-3.5-instruct location"
optimum-cli export openvino --model {llm_model_id} --task text-generation-with-past --weight-format int4 --group-size 128 --ratio 0.6 --sym --trust-remote-code {llm_model_path}
کوانتایز کردن Phi-3.5-Vision با استفاده از OpenVINO
لطفاً این اسکریپت را در پایتون یا Jupyter lab اجرا کنید
import requests
from pathlib import Path
from ov_phi3_vision import convert_phi3_model
import nncf
if not Path("ov_phi3_vision.py").exists():
r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/notebooks/phi-3-vision/ov_phi3_vision.py")
open("ov_phi3_vision.py", "w").write(r.text)
if not Path("gradio_helper.py").exists():
r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/notebooks/phi-3-vision/gradio_helper.py")
open("gradio_helper.py", "w").write(r.text)
if not Path("notebook_utils.py").exists():
r = requests.get(url="https://raw.githubusercontent.com/openvinotoolkit/openvino_notebooks/latest/utils/notebook_utils.py")
open("notebook_utils.py", "w").write(r.text)
model_id = "microsoft/Phi-3.5-vision-instruct"
out_dir = Path("../model/phi-3.5-vision-128k-instruct-ov")
compression_configuration = {
"mode": nncf.CompressWeightsMode.INT4_SYM,
"group_size": 64,
"ratio": 0.6,
}
if not out_dir.exists():
convert_phi3_model(model_id, out_dir, compression_configuration)
🤖 نمونههایی برای Phi-3.5 با Intel OpenVINO
| آزمایشگاهها | معرفی | رفتن |
|---|---|---|
| 🚀 معرفی آزمایشگاه Phi-3.5 Instruct | یاد بگیرید چگونه از Phi-3.5 Instruct در کامپیوتر هوش مصنوعی خود استفاده کنید | رفتن |
| 🚀 معرفی آزمایشگاه Phi-3.5 Vision (تصویر) | یاد بگیرید چگونه از Phi-3.5 Vision برای تحلیل تصویر در کامپیوتر هوش مصنوعی خود استفاده کنید | رفتن |
| 🚀 معرفی آزمایشگاه Phi-3.5 Vision (ویدئو) | یاد بگیرید چگونه از Phi-3.5 Vision برای تحلیل ویدئو در کامپیوتر هوش مصنوعی خود استفاده کنید | رفتن |
منابع
-
اطلاعات بیشتر درباره Intel OpenVINO https://www.intel.com/content/www/us/en/developer/tools/openvino-toolkit/overview.html
-
مخزن GitHub Intel OpenVINO https://github.com/openvinotoolkit/openvino.genai
سلب مسئولیت:
این سند با استفاده از سرویس ترجمه هوش مصنوعی Co-op Translator ترجمه شده است. در حالی که ما در تلاش برای دقت هستیم، لطفاً توجه داشته باشید که ترجمههای خودکار ممکن است حاوی خطاها یا نادرستیهایی باشند. سند اصلی به زبان بومی خود باید به عنوان منبع معتبر در نظر گرفته شود. برای اطلاعات حیاتی، ترجمه حرفهای انسانی توصیه میشود. ما مسئول هیچ گونه سوءتفاهم یا تفسیر نادرستی که از استفاده این ترجمه ناشی شود، نیستیم.