MLflow

February 1, 2026 · View on GitHub

MLflow یک پلتفرم متن‌باز است که برای مدیریت چرخه کامل یادگیری ماشین طراحی شده است.

MLFlow

MLFlow برای مدیریت چرخه یادگیری ماشین استفاده می‌شود، شامل آزمایش‌ها، قابلیت بازتولید، استقرار و یک رجیستری مرکزی مدل. MLflow در حال حاضر چهار مؤلفه ارائه می‌دهد.

MLflow Tracking: ثبت و جستجوی آزمایش‌ها، کد، پیکربندی داده و نتایج.
MLflow Projects: بسته‌بندی کد علوم داده به شکلی که بتوان اجرای آن را روی هر پلتفرمی بازتولید کرد.
Mlflow Models: استقرار مدل‌های یادگیری ماشین در محیط‌های مختلف سرویس‌دهی.
Model Registry: ذخیره، حاشیه‌نویسی و مدیریت مدل‌ها در یک مخزن مرکزی.

این پلتفرم قابلیت‌هایی برای پیگیری آزمایش‌ها، بسته‌بندی کد به اجرای قابل بازتولید و به اشتراک‌گذاری و استقرار مدل‌ها دارد. MLFlow در Databricks ادغام شده و از کتابخانه‌های مختلف یادگیری ماشین پشتیبانی می‌کند، به طوری که وابسته به کتابخانه خاصی نیست. می‌توان آن را با هر کتابخانه یادگیری ماشین و در هر زبان برنامه‌نویسی استفاده کرد، زیرا API REST و CLI برای سهولت فراهم می‌کند.

MLFlow

ویژگی‌های کلیدی MLFlow شامل موارد زیر است:

پیگیری آزمایش‌ها: ثبت و مقایسه پارامترها و نتایج.
مدیریت مدل: استقرار مدل‌ها در پلتفرم‌های مختلف سرویس‌دهی و استنتاج.
رجیستری مدل: مدیریت مشترک چرخه عمر مدل‌های MLflow، شامل نسخه‌بندی و حاشیه‌نویسی.
پروژه‌ها: بسته‌بندی کد یادگیری ماشین برای به اشتراک‌گذاری یا استفاده در تولید. MLFlow همچنین از حلقه MLOps پشتیبانی می‌کند که شامل آماده‌سازی داده، ثبت و مدیریت مدل‌ها، بسته‌بندی مدل‌ها برای اجرا، استقرار سرویس‌ها و نظارت بر مدل‌ها است. هدف آن ساده‌سازی فرآیند انتقال از نمونه اولیه به جریان کاری تولید، به ویژه در محیط‌های ابری و لبه است.

سناریوی انتها به انتها - ساخت یک wrapper و استفاده از Phi-3 به عنوان مدل MLFlow

در این نمونه انتها به انتها، دو رویکرد مختلف برای ساخت یک wrapper دور مدل زبان کوچک Phi-3 (SLM) و سپس اجرای آن به عنوان مدل MLFlow، چه به صورت محلی و چه در فضای ابری مانند Azure Machine Learning workspace، نشان داده خواهد شد.

MLFlow

پروژه	توضیحات	محل قرارگیری
Transformer Pipeline	Transformer Pipeline ساده‌ترین گزینه برای ساخت wrapper است اگر بخواهید از مدل HuggingFace با طعم آزمایشی transformers در MLFlow استفاده کنید.	TransformerPipeline.ipynb
Custom Python Wrapper	در زمان نگارش، pipeline ترنسفورمر از تولید wrapper MLFlow برای مدل‌های HuggingFace در فرمت ONNX، حتی با بسته آزمایشی optimum پایتون، پشتیبانی نمی‌کرد. در چنین مواردی می‌توانید wrapper پایتون سفارشی خود را برای حالت MLFlow بسازید.	CustomPythonWrapper.ipynb

پروژه: Transformer Pipeline

شما به بسته‌های پایتون مرتبط از MLFlow و HuggingFace نیاز خواهید داشت:
```
import mlflow
import transformers
```
سپس باید یک pipeline ترنسفورمر را با ارجاع به مدل هدف Phi-3 در رجیستری HuggingFace راه‌اندازی کنید. همانطور که در کارت مدل Phi-3-mini-4k-instruct دیده می‌شود، وظیفه آن از نوع «تولید متن» است:
```
pipeline = transformers.pipeline(
    task = "text-generation",
    model = "microsoft/Phi-3-mini-4k-instruct"
)
```
اکنون می‌توانید pipeline ترنسفورمر مدل Phi-3 خود را در قالب MLFlow ذخیره کنید و جزئیات اضافی مانند مسیر هدف آثار، تنظیمات خاص مدل و نوع API استنتاج را ارائه دهید:
```
model_info = mlflow.transformers.log_model(
    transformers_model = pipeline,
    artifact_path = "phi3-mlflow-model",
    model_config = model_config,
    task = "llm/v1/chat"
)
```

پروژه: Custom Python Wrapper

در اینجا می‌توانیم از API generate() ONNX Runtime مایکروسافت برای استنتاج مدل ONNX و رمزگذاری/رمزگشایی توکن‌ها استفاده کنیم. باید بسته onnxruntime_genai را برای محاسبات هدف خود انتخاب کنید، در مثال زیر هدف CPU است:
```
import mlflow
from mlflow.models import infer_signature
import onnxruntime_genai as og
```

کلاس سفارشی ما دو متد پیاده‌سازی می‌کند: load_context() برای مقداردهی اولیه مدل ONNX Phi-3 Mini 4K Instruct، پارامترهای تولیدکننده و توکنایزر؛ و predict() برای تولید توکن‌های خروجی بر اساس prompt داده شده:

class Phi3Model(mlflow.pyfunc.PythonModel):
    def load_context(self, context):
        # Retrieving model from the artifacts
        model_path = context.artifacts["phi3-mini-onnx"]
        model_options = {
             "max_length": 300,
             "temperature": 0.2,         
        }
    
        # Defining the model
        self.phi3_model = og.Model(model_path)
        self.params = og.GeneratorParams(self.phi3_model)
        self.params.set_search_options(**model_options)
        
        # Defining the tokenizer
        self.tokenizer = og.Tokenizer(self.phi3_model)

    def predict(self, context, model_input):
        # Retrieving prompt from the input
        prompt = model_input["prompt"][0]
        self.params.input_ids = self.tokenizer.encode(prompt)

        # Generating the model's response
        response = self.phi3_model.generate(self.params)

        return self.tokenizer.decode(response[0][len(self.params.input_ids):])

اکنون می‌توانید از تابع mlflow.pyfunc.log_model() برای تولید wrapper پایتون سفارشی (در قالب pickle) برای مدل Phi-3، همراه با مدل اصلی ONNX و وابستگی‌های لازم استفاده کنید:

model_info = mlflow.pyfunc.log_model(
    artifact_path = artifact_path,
    python_model = Phi3Model(),
    artifacts = {
        "phi3-mini-onnx": "cpu_and_mobile/cpu-int4-rtn-block-32-acc-level-4",
    },
    input_example = input_example,
    signature = infer_signature(input_example, ["Run"]),
    extra_pip_requirements = ["torch", "onnxruntime_genai", "numpy"],
)

امضاهای مدل‌های تولید شده MLFlow

در مرحله ۳ پروژه Transformer Pipeline بالا، وظیفه مدل MLFlow را به «llm/v1/chat» تنظیم کردیم. چنین دستوری یک wrapper API مدل تولید می‌کند که با Chat API شرکت OpenAI سازگار است، همانطور که در زیر نشان داده شده:

{inputs: 
  ['messages': Array({content: string (required), name: string (optional), role: string (required)}) (required), 'temperature': double (optional), 'max_tokens': long (optional), 'stop': Array(string) (optional), 'n': long (optional), 'stream': boolean (optional)],
outputs: 
  ['id': string (required), 'object': string (required), 'created': long (required), 'model': string (required), 'choices': Array({finish_reason: string (required), index: long (required), message: {content: string (required), name: string (optional), role: string (required)} (required)}) (required), 'usage': {completion_tokens: long (required), prompt_tokens: long (required), total_tokens: long (required)} (required)],
params: 
  None}

در نتیجه، می‌توانید prompt خود را به فرمت زیر ارسال کنید:
```
messages = [{"role": "user", "content": "What is the capital of Spain?"}]
```

سپس، از پردازش پس از پاسخ سازگار با OpenAI، مانند response[0][‘choices’][0][‘message’][‘content’] استفاده کنید تا خروجی خود را به شکلی زیباتر تبدیل کنید، مثلاً به این صورت:

Question: What is the capital of Spain?

Answer: The capital of Spain is Madrid. It is the largest city in Spain and serves as the political, economic, and cultural center of the country. Madrid is located in the center of the Iberian Peninsula and is known for its rich history, art, and architecture, including the Royal Palace, the Prado Museum, and the Plaza Mayor.

Usage: {'prompt_tokens': 11, 'completion_tokens': 73, 'total_tokens': 84}

در مرحله ۳ پروژه Custom Python Wrapper بالا، اجازه می‌دهیم بسته MLFlow امضای مدل را از یک نمونه ورودی داده شده تولید کند. امضای wrapper MLFlow ما به این شکل خواهد بود:
```
{inputs: 
  ['prompt': string (required)],
outputs: 
  [string (required)],
params: 
  None}
```

بنابراین، prompt ما باید شامل کلید دیکشنری "prompt" باشد، مشابه این:

{"prompt": "<|system|>You are a stand-up comedian.<|end|><|user|>Tell me a joke about atom<|end|><|assistant|>",}

خروجی مدل سپس به صورت رشته ارائه خواهد شد:

Alright, here's a little atom-related joke for you!

Why don't electrons ever play hide and seek with protons?

Because good luck finding them when they're always "sharing" their electrons!

Remember, this is all in good fun, and we're just having a little atomic-level humor!

سلب مسئولیت:
این سند با استفاده از سرویس ترجمه هوش مصنوعی Co-op Translator ترجمه شده است. در حالی که ما در تلاش برای دقت هستیم، لطفاً توجه داشته باشید که ترجمه‌های خودکار ممکن است حاوی خطاها یا نواقصی باشند. سند اصلی به زبان بومی خود باید به عنوان منبع معتبر در نظر گرفته شود. برای اطلاعات حیاتی، ترجمه حرفه‌ای انسانی توصیه می‌شود. ما مسئول هیچ گونه سوءتفاهم یا تفسیر نادرستی که از استفاده این ترجمه ناشی شود، نیستیم.