E2E_OpenVino_Phi3Vision.md
February 1, 2026 · View on GitHub
הדגמה זו מציגה כיצד להשתמש במודל מאומן מראש כדי ליצור קוד Python המבוסס על תמונה והנחיית טקסט.
הנה הסבר שלב אחר שלב:
-
ייבוא והגדרות:
- מייבאים את הספריות והמודולים הנחוצים, כולל
requests,PILלעיבוד תמונות, ו-transformersלטיפול במודל ובעיבוד.
- מייבאים את הספריות והמודולים הנחוצים, כולל
-
טעינה והצגת התמונה:
- פותחים קובץ תמונה (
demo.png) באמצעות ספרייתPILומציגים אותה.
- פותחים קובץ תמונה (
-
הגדרת ההנחיה:
- יוצרים הודעה הכוללת את התמונה ובקשה ליצירת קוד Python לעיבוד התמונה ושמירתה באמצעות
plt(matplotlib).
- יוצרים הודעה הכוללת את התמונה ובקשה ליצירת קוד Python לעיבוד התמונה ושמירתה באמצעות
-
טעינת המעבד:
- טוענים את ה-
AutoProcessorמהמודל המאומן מראש שממוקם בתיקייתout_dir. המעבד הזה מטפל בקלטי הטקסט והתמונה.
- טוענים את ה-
-
יצירת ההנחיה:
- משתמשים בשיטה
apply_chat_templateכדי לעצב את ההודעה להנחיה מתאימה למודל.
- משתמשים בשיטה
-
עיבוד הקלטים:
- מעבדים את ההנחיה והתמונה לטנסורים שהמודל יכול להבין.
-
הגדרת פרמטרים ליצירה:
- מגדירים את הפרמטרים לתהליך יצירת הטקסט של המודל, כולל מספר מקסימלי של טוקנים חדשים ליצירה והאם לבצע דגימה של הפלט.
-
יצירת הקוד:
- המודל מייצר את קוד ה-Python בהתבסס על הקלטים ופרמטרי היצירה. משתמשים ב-
TextStreamerכדי לטפל בפלט, תוך דילוג על ההנחיה והטוקנים המיוחדים.
- המודל מייצר את קוד ה-Python בהתבסס על הקלטים ופרמטרי היצירה. משתמשים ב-
-
פלט:
- מדפיסים את הקוד שנוצר, שצריך לכלול קוד Python לעיבוד התמונה ושמירתה כפי שהוגדר בהנחיה.
הדגמה זו ממחישה כיצד לנצל מודל מאומן מראש באמצעות OpenVino ליצירת קוד דינמי בהתבסס על קלט משתמש ותמונות.
כתב ויתור:
מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית Co-op Translator. למרות שאנו שואפים לדיוק, יש לקחת בחשבון כי תרגומים אוטומטיים עלולים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפת המקור שלו נחשב למקור הסמכותי. למידע קריטי מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. אנו לא נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.