Inferensi Phi-3 dengan Apple MLX Framework

February 1, 2026 · View on GitHub

Apa itu MLX Framework

MLX adalah framework array untuk riset machine learning di Apple silicon, dikembangkan oleh tim riset machine learning Apple.

MLX dirancang oleh peneliti machine learning untuk peneliti machine learning. Framework ini dibuat agar mudah digunakan, namun tetap efisien untuk melatih dan menjalankan model. Desain framework ini juga secara konsep sederhana. Kami bertujuan agar peneliti dapat dengan mudah mengembangkan dan meningkatkan MLX untuk mempercepat eksplorasi ide-ide baru.

LLM dapat dipercepat di perangkat Apple Silicon melalui MLX, dan model dapat dijalankan secara lokal dengan sangat mudah.

Menggunakan MLX untuk inferensi Phi-3-mini

1. Siapkan lingkungan MLX Anda

  1. Python 3.11.x
  2. Instal Library MLX

pip install mlx-lm

2. Menjalankan Phi-3-mini di Terminal dengan MLX


python -m mlx_lm.generate --model microsoft/Phi-3-mini-4k-instruct --max-token 2048 --prompt  "<|user|>\nCan you introduce yourself<|end|>\n<|assistant|>"

Hasilnya (lingkungan saya adalah Apple M1 Max, 64GB) adalah

Terminal

3. Mengkuantisasi Phi-3-mini dengan MLX di Terminal


python -m mlx_lm.convert --hf-path microsoft/Phi-3-mini-4k-instruct

Note: Model dapat dikuantisasi melalui mlx_lm.convert, dan kuantisasi default adalah INT4. Contoh ini mengkuantisasi Phi-3-mini ke INT4.

Model dapat dikuantisasi melalui mlx_lm.convert, dan kuantisasi default adalah INT4. Contoh ini mengkuantisasi Phi-3-mini menjadi INT4. Setelah dikuantisasi, model akan disimpan di direktori default ./mlx_model

Kita dapat menguji model yang sudah dikuantisasi dengan MLX dari terminal


python -m mlx_lm.generate --model ./mlx_model/ --max-token 2048 --prompt  "<|user|>\nCan you introduce yourself<|end|>\n<|assistant|>"

Hasilnya adalah

INT4

4. Menjalankan Phi-3-mini dengan MLX di Jupyter Notebook

Notebook

Note: Silakan baca contoh ini klik tautan ini

Sumber Daya

  1. Pelajari tentang Apple MLX Framework https://ml-explore.github.io

  2. Repositori Apple MLX di GitHub https://github.com/ml-explore

Penafian:
Dokumen ini telah diterjemahkan menggunakan layanan terjemahan AI Co-op Translator. Meskipun kami berupaya untuk mencapai akurasi, harap diingat bahwa terjemahan otomatis mungkin mengandung kesalahan atau ketidakakuratan. Dokumen asli dalam bahasa aslinya harus dianggap sebagai sumber yang sahih. Untuk informasi penting, disarankan menggunakan terjemahan profesional oleh manusia. Kami tidak bertanggung jawab atas kesalahpahaman atau penafsiran yang keliru yang timbul dari penggunaan terjemahan ini.