تنظیم دقیق Phi-3 با چارچوب Apple MLX

February 1, 2026 · View on GitHub

ما می‌توانیم تنظیم دقیق همراه با Lora را از طریق خط فرمان چارچوب Apple MLX انجام دهیم. (اگر می‌خواهید بیشتر درباره عملکرد چارچوب MLX بدانید، لطفاً Inference Phi-3 with Apple MLX Framework را مطالعه کنید)

1. آماده‌سازی داده‌ها

به طور پیش‌فرض، چارچوب MLX به فرمت jsonl برای train، test و eval نیاز دارد و با Lora ترکیب می‌شود تا کارهای تنظیم دقیق را کامل کند.

توجه:

فرمت داده jsonl ：


{"text": "<|user|>\nWhen were iron maidens commonly used? <|end|>\n<|assistant|> \nIron maidens were never commonly used <|end|>"}
{"text": "<|user|>\nWhat did humans evolve from? <|end|>\n<|assistant|> \nHumans and apes evolved from a common ancestor <|end|>"}
{"text": "<|user|>\nIs 91 a prime number? <|end|>\n<|assistant|> \nNo, 91 is not a prime number <|end|>"}
....

مثال ما از داده‌های TruthfulQA استفاده می‌کند، اما حجم داده‌ها نسبتاً کم است، بنابراین نتایج تنظیم دقیق لزوماً بهترین نیستند. توصیه می‌شود یادگیرندگان بر اساس سناریوهای خود از داده‌های بهتر استفاده کنند.
فرمت داده با قالب Phi-3 ترکیب شده است

لطفاً داده‌ها را از این لینک دانلود کنید، لطفاً تمام فایل‌های .jsonl در پوشه data را شامل کنید

2. تنظیم دقیق در ترمینال شما

لطفاً این دستور را در ترمینال اجرا کنید


python -m mlx_lm.lora --model microsoft/Phi-3-mini-4k-instruct --train --data ./data --iters 1000

توجه:

این تنظیم دقیق LoRA است، چارچوب MLX نسخه QLoRA را منتشر نکرده است
می‌توانید config.yaml را برای تغییر برخی پارامترها تنظیم کنید، مانند



# The path to the local model directory or Hugging Face repo.
model: "microsoft/Phi-3-mini-4k-instruct"
# Whether or not to train (boolean)
train: true

# Directory with {train, valid, test}.jsonl files
data: "data"

# The PRNG seed
seed: 0

# Number of layers to fine-tune
lora_layers: 32

# Minibatch size.
batch_size: 1

# Iterations to train for.
iters: 1000

# Number of validation batches, -1 uses the entire validation set.
val_batches: 25

# Adam learning rate.
learning_rate: 1e-6

# Number of training steps between loss reporting.
steps_per_report: 10

# Number of training steps between validations.
steps_per_eval: 200

# Load path to resume training with the given adapter weights.
resume_adapter_file: null

# Save/load path for the trained adapter weights.
adapter_path: "adapters"

# Save the model every N iterations.
save_every: 1000

# Evaluate on the test set after training
test: false

# Number of test set batches, -1 uses the entire test set.
test_batches: 100

# Maximum sequence length.
max_seq_length: 2048

# Use gradient checkpointing to reduce memory use.
grad_checkpoint: true

# LoRA parameters can only be specified in a config file
lora_parameters:
  # The layer keys to apply LoRA to.
  # These will be applied for the last lora_layers
  keys: ["o_proj","qkv_proj"]
  rank: 64
  scale: 1
  dropout: 0.1

لطفاً این دستور را در ترمینال اجرا کنید


python -m  mlx_lm.lora --config lora_config.yaml

3. اجرای آداپتور تنظیم دقیق برای تست

می‌توانید آداپتور تنظیم دقیق را در ترمینال اجرا کنید، مانند این


python -m mlx_lm.generate --model microsoft/Phi-3-mini-4k-instruct --adapter-path ./adapters --max-token 2048 --prompt "Why do chameleons change colors? " --eos-token "<|end|>"

و مدل اصلی را برای مقایسه نتایج اجرا کنید


python -m mlx_lm.generate --model microsoft/Phi-3-mini-4k-instruct --max-token 2048 --prompt "Why do chameleons change colors? " --eos-token "<|end|>"

می‌توانید نتایج تنظیم دقیق را با مدل اصلی مقایسه کنید

4. ادغام آداپتورها برای تولید مدل‌های جدید


python -m mlx_lm.fuse --model microsoft/Phi-3-mini-4k-instruct

5. اجرای مدل‌های تنظیم دقیق کم‌حجم با استفاده از ollama

قبل از استفاده، لطفاً محیط llama.cpp خود را پیکربندی کنید


git clone https://github.com/ggerganov/llama.cpp.git

cd llama.cpp

pip install -r requirements.txt

python convert.py 'Your meger model path'  --outfile phi-3-mini-ft.gguf --outtype f16

توجه:

اکنون تبدیل کم‌حجمی برای fp32، fp16 و INT 8 پشتیبانی می‌شود
مدل ادغام شده فاقد tokenizer.model است، لطفاً آن را از https://huggingface.co/microsoft/Phi-3-mini-4k-instruct دانلود کنید

یک مدل Ollma تنظیم کنید


FROM ./phi-3-mini-ft.gguf
PARAMETER stop "<|end|>"

دستور را در ترمینال اجرا کنید


 ollama create phi3ft -f Modelfile 

 ollama run phi3ft "Why do chameleons change colors?"

تبریک می‌گوییم! تنظیم دقیق را با چارچوب MLX به خوبی یاد گرفتید

سلب مسئولیت:
این سند با استفاده از سرویس ترجمه هوش مصنوعی Co-op Translator ترجمه شده است. در حالی که ما در تلاش برای دقت هستیم، لطفاً توجه داشته باشید که ترجمه‌های خودکار ممکن است حاوی خطاها یا نواقصی باشند. سند اصلی به زبان بومی خود باید به عنوان منبع معتبر در نظر گرفته شود. برای اطلاعات حیاتی، ترجمه حرفه‌ای انسانی توصیه می‌شود. ما مسئول هیچ گونه سوءتفاهم یا تفسیر نادرستی که از استفاده از این ترجمه ناشی شود، نیستیم.