การปรับแต่ง Phi-3 ด้วย Apple MLX Framework

February 1, 2026 · View on GitHub

เราสามารถทำการปรับแต่ง (Fine-tuning) ร่วมกับ Lora ผ่านคำสั่งใน Apple MLX Framework ได้ (หากต้องการทราบรายละเอียดเพิ่มเติมเกี่ยวกับการทำงานของ MLX Framework กรุณาอ่าน Inference Phi-3 with Apple MLX Framework)

1. การเตรียมข้อมูล

โดยค่าเริ่มต้น MLX Framework ต้องการข้อมูลในรูปแบบ jsonl สำหรับ train, test และ eval และจะใช้ร่วมกับ Lora เพื่อทำงานปรับแต่งโมเดลให้เสร็จสมบูรณ์

Note:

รูปแบบข้อมูล jsonl ：


{"text": "<|user|>\nWhen were iron maidens commonly used? <|end|>\n<|assistant|> \nIron maidens were never commonly used <|end|>"}
{"text": "<|user|>\nWhat did humans evolve from? <|end|>\n<|assistant|> \nHumans and apes evolved from a common ancestor <|end|>"}
{"text": "<|user|>\nIs 91 a prime number? <|end|>\n<|assistant|> \nNo, 91 is not a prime number <|end|>"}
....

ตัวอย่างของเราใช้ข้อมูลจาก TruthfulQA's data แต่ปริมาณข้อมูลค่อนข้างน้อย จึงทำให้ผลลัพธ์การปรับแต่งอาจไม่ดีที่สุด แนะนำให้ผู้เรียนใช้ข้อมูลที่เหมาะสมกับสถานการณ์ของตนเองเพื่อให้ได้ผลลัพธ์ที่ดีกว่า
รูปแบบข้อมูลจะต้องสอดคล้องกับเทมเพลตของ Phi-3

กรุณาดาวน์โหลดข้อมูลจาก ลิงก์นี้ โดยให้รวมไฟล์ .jsonl ทั้งหมดในโฟลเดอร์ data

2. การปรับแต่งในเทอร์มินัลของคุณ

กรุณารันคำสั่งนี้ในเทอร์มินัล


python -m mlx_lm.lora --model microsoft/Phi-3-mini-4k-instruct --train --data ./data --iters 1000

Note:

นี่คือการปรับแต่งแบบ LoRA โดย MLX framework ยังไม่ได้ปล่อย QLoRA
คุณสามารถตั้งค่า config.yaml เพื่อเปลี่ยนแปลงอาร์กิวเมนต์บางอย่าง เช่น



# The path to the local model directory or Hugging Face repo.
model: "microsoft/Phi-3-mini-4k-instruct"
# Whether or not to train (boolean)
train: true

# Directory with {train, valid, test}.jsonl files
data: "data"

# The PRNG seed
seed: 0

# Number of layers to fine-tune
lora_layers: 32

# Minibatch size.
batch_size: 1

# Iterations to train for.
iters: 1000

# Number of validation batches, -1 uses the entire validation set.
val_batches: 25

# Adam learning rate.
learning_rate: 1e-6

# Number of training steps between loss reporting.
steps_per_report: 10

# Number of training steps between validations.
steps_per_eval: 200

# Load path to resume training with the given adapter weights.
resume_adapter_file: null

# Save/load path for the trained adapter weights.
adapter_path: "adapters"

# Save the model every N iterations.
save_every: 1000

# Evaluate on the test set after training
test: false

# Number of test set batches, -1 uses the entire test set.
test_batches: 100

# Maximum sequence length.
max_seq_length: 2048

# Use gradient checkpointing to reduce memory use.
grad_checkpoint: true

# LoRA parameters can only be specified in a config file
lora_parameters:
  # The layer keys to apply LoRA to.
  # These will be applied for the last lora_layers
  keys: ["o_proj","qkv_proj"]
  rank: 64
  scale: 1
  dropout: 0.1

กรุณารันคำสั่งนี้ในเทอร์มินัล


python -m  mlx_lm.lora --config lora_config.yaml

3. ทดสอบการรัน Fine-tuning adapter

คุณสามารถรัน fine-tuning adapter ในเทอร์มินัลได้ดังนี้


python -m mlx_lm.generate --model microsoft/Phi-3-mini-4k-instruct --adapter-path ./adapters --max-token 2048 --prompt "Why do chameleons change colors? " --eos-token "<|end|>"

และรันโมเดลต้นฉบับเพื่อเปรียบเทียบผลลัพธ์


python -m mlx_lm.generate --model microsoft/Phi-3-mini-4k-instruct --max-token 2048 --prompt "Why do chameleons change colors? " --eos-token "<|end|>"

คุณสามารถลองเปรียบเทียบผลลัพธ์ของ Fine-tuning กับโมเดลต้นฉบับได้

4. รวม adapters เพื่อสร้างโมเดลใหม่


python -m mlx_lm.fuse --model microsoft/Phi-3-mini-4k-instruct

5. การรันโมเดล fine-tuning ที่ถูก quantized ด้วย ollama

ก่อนใช้งาน กรุณาตั้งค่าสภาพแวดล้อม llama.cpp ของคุณให้เรียบร้อย


git clone https://github.com/ggerganov/llama.cpp.git

cd llama.cpp

pip install -r requirements.txt

python convert.py 'Your meger model path'  --outfile phi-3-mini-ft.gguf --outtype f16

Note:

ตอนนี้รองรับการแปลง quantization ของ fp32, fp16 และ INT 8
โมเดลที่รวมแล้วจะไม่มี tokenizer.model กรุณาดาวน์โหลดได้จาก https://huggingface.co/microsoft/Phi-3-mini-4k-instruct

ตั้งค่า Ollma Model


FROM ./phi-3-mini-ft.gguf
PARAMETER stop "<|end|>"

รันคำสั่งในเทอร์มินัล


 ollama create phi3ft -f Modelfile 

 ollama run phi3ft "Why do chameleons change colors?"

ยินดีด้วย! คุณเชี่ยวชาญการปรับแต่งด้วย MLX Framework แล้ว

ข้อจำกัดความรับผิดชอบ:
เอกสารนี้ได้รับการแปลโดยใช้บริการแปลภาษาอัตโนมัติ Co-op Translator แม้เราจะพยายามให้ความถูกต้องสูงสุด แต่โปรดทราบว่าการแปลอัตโนมัติอาจมีข้อผิดพลาดหรือความไม่ถูกต้อง เอกสารต้นฉบับในภาษาต้นทางถือเป็นแหล่งข้อมูลที่เชื่อถือได้ สำหรับข้อมูลที่สำคัญ ขอแนะนำให้ใช้บริการแปลโดยผู้เชี่ยวชาญมนุษย์ เราไม่รับผิดชอบต่อความเข้าใจผิดหรือการตีความผิดใด ๆ ที่เกิดจากการใช้การแปลนี้