การทำ Inference Phi-3 ด้วย Apple MLX Framework
February 1, 2026 · View on GitHub
MLX Framework คืออะไร
MLX เป็นเฟรมเวิร์กอาร์เรย์สำหรับงานวิจัยด้าน machine learning บนชิป Apple silicon พัฒนาโดยทีมวิจัย machine learning ของ Apple
MLX ถูกออกแบบโดยนักวิจัย machine learning เพื่อใช้งานโดยนักวิจัย machine learning เฟรมเวิร์กนี้เน้นความใช้งานง่าย แต่ยังคงประสิทธิภาพสูงในการฝึกสอนและนำโมเดลไปใช้งาน การออกแบบของเฟรมเวิร์กเองก็เรียบง่ายในเชิงแนวคิด เราตั้งใจให้ผู้วิจัยสามารถขยายและพัฒนา MLX ได้อย่างง่ายดาย เพื่อให้สามารถทดลองไอเดียใหม่ๆ ได้อย่างรวดเร็ว
โมเดล LLMs สามารถเร่งความเร็วบนอุปกรณ์ Apple Silicon ผ่าน MLX และสามารถรันโมเดลได้อย่างสะดวกสบายบนเครื่องท้องถิ่น
การใช้ MLX ในการทำ inference กับ Phi-3-mini
1. ตั้งค่าสภาพแวดล้อม MLX ของคุณ
- Python 3.11.x
- ติดตั้งไลบรารี MLX
pip install mlx-lm
2. รัน Phi-3-mini ใน Terminal ด้วย MLX
python -m mlx_lm.generate --model microsoft/Phi-3-mini-4k-instruct --max-token 2048 --prompt "<|user|>\nCan you introduce yourself<|end|>\n<|assistant|>"
ผลลัพธ์ (สภาพแวดล้อมของผมคือ Apple M1 Max, 64GB) เป็นดังนี้

3. การทำ Quantize Phi-3-mini ด้วย MLX ใน Terminal
python -m mlx_lm.convert --hf-path microsoft/Phi-3-mini-4k-instruct
Note: โมเดลสามารถทำ quantize ได้ผ่าน mlx_lm.convert โดยค่าดีฟอลต์จะเป็น INT4 ตัวอย่างนี้ทำการ quantize Phi-3-mini เป็น INT4
โมเดลสามารถทำ quantize ได้ผ่าน mlx_lm.convert โดยค่าดีฟอลต์คือ INT4 ตัวอย่างนี้เป็นการทำ quantize Phi-3-mini เป็น INT4 หลังจาก quantize แล้วโมเดลจะถูกเก็บไว้ในไดเรกทอรีเริ่มต้น ./mlx_model
เราสามารถทดสอบโมเดลที่ถูก quantize ด้วย MLX จาก terminal ได้
python -m mlx_lm.generate --model ./mlx_model/ --max-token 2048 --prompt "<|user|>\nCan you introduce yourself<|end|>\n<|assistant|>"
ผลลัพธ์คือ

4. รัน Phi-3-mini ด้วย MLX ใน Jupyter Notebook

Note: กรุณาอ่านตัวอย่างนี้ คลิกที่ลิงก์นี้
แหล่งข้อมูล
-
เรียนรู้เกี่ยวกับ Apple MLX Framework https://ml-explore.github.io
-
Apple MLX GitHub Repo https://github.com/ml-explore
ข้อจำกัดความรับผิดชอบ:
เอกสารนี้ได้รับการแปลโดยใช้บริการแปลภาษาอัตโนมัติ Co-op Translator แม้เราจะพยายามให้ความถูกต้องสูงสุด แต่โปรดทราบว่าการแปลอัตโนมัติอาจมีข้อผิดพลาดหรือความไม่ถูกต้อง เอกสารต้นฉบับในภาษาต้นทางถือเป็นแหล่งข้อมูลที่เชื่อถือได้ สำหรับข้อมูลที่สำคัญ ขอแนะนำให้ใช้บริการแปลโดยผู้เชี่ยวชาญมนุษย์ เราไม่รับผิดชอบต่อความเข้าใจผิดหรือการตีความผิดที่เกิดขึ้นจากการใช้การแปลนี้