Inferens Phi-3 dengan Rangka Kerja Apple MLX

February 1, 2026 · View on GitHub

Apa itu Rangka Kerja MLX

MLX adalah rangka kerja array untuk penyelidikan pembelajaran mesin pada cip Apple silicon, dibangunkan oleh penyelidik pembelajaran mesin Apple.

MLX direka oleh penyelidik pembelajaran mesin untuk penyelidik pembelajaran mesin. Rangka kerja ini bertujuan untuk mesra pengguna, tetapi masih cekap untuk melatih dan melaksanakan model. Reka bentuk rangka kerja ini juga mudah dari segi konsep. Kami berhasrat untuk memudahkan penyelidik mengembangkan dan memperbaiki MLX dengan tujuan untuk meneroka idea baru dengan pantas.

LLM boleh dipercepatkan pada peranti Apple Silicon melalui MLX, dan model boleh dijalankan secara tempatan dengan sangat mudah.

Menggunakan MLX untuk inferens Phi-3-mini

1. Sediakan persekitaran MLX anda

  1. Python 3.11.x
  2. Pasang Perpustakaan MLX

pip install mlx-lm

2. Menjalankan Phi-3-mini di Terminal dengan MLX


python -m mlx_lm.generate --model microsoft/Phi-3-mini-4k-instruct --max-token 2048 --prompt  "<|user|>\nCan you introduce yourself<|end|>\n<|assistant|>"

Keputusannya (persekitaran saya adalah Apple M1 Max, 64GB) adalah

Terminal

3. Kuantisasi Phi-3-mini dengan MLX di Terminal


python -m mlx_lm.convert --hf-path microsoft/Phi-3-mini-4k-instruct

Nota: Model boleh dikuantisasi melalui mlx_lm.convert, dan kuantisasi lalai adalah INT4. Contoh ini mengkuantisasi Phi-3-mini ke INT4

Model boleh dikuantisasi melalui mlx_lm.convert, dan kuantisasi lalai adalah INT4. Contoh ini adalah untuk mengkuantisasi Phi-3-mini ke INT4. Selepas kuantisasi, ia akan disimpan dalam direktori lalai ./mlx_model

Kita boleh menguji model yang telah dikuantisasi dengan MLX dari terminal


python -m mlx_lm.generate --model ./mlx_model/ --max-token 2048 --prompt  "<|user|>\nCan you introduce yourself<|end|>\n<|assistant|>"

Keputusannya adalah

INT4

4. Menjalankan Phi-3-mini dengan MLX dalam Jupyter Notebook

Notebook

Nota: Sila baca contoh ini klik pautan ini

Sumber

  1. Ketahui tentang Rangka Kerja Apple MLX https://ml-explore.github.io

  2. Repositori Apple MLX GitHub https://github.com/ml-explore

Penafian:
Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI Co-op Translator. Walaupun kami berusaha untuk ketepatan, sila ambil maklum bahawa terjemahan automatik mungkin mengandungi kesilapan atau ketidaktepatan. Dokumen asal dalam bahasa asalnya harus dianggap sebagai sumber yang sahih. Untuk maklumat penting, terjemahan profesional oleh manusia adalah disyorkan. Kami tidak bertanggungjawab atas sebarang salah faham atau salah tafsir yang timbul daripada penggunaan terjemahan ini.