Phi-3 inferálása az Apple MLX keretrendszerrel

February 1, 2026 · View on GitHub

Mi az MLX keretrendszer

Az MLX egy tömb-alapú keretrendszer gépi tanulási kutatásokhoz Apple szilíciumon, amelyet az Apple gépi tanulási kutatócsoportja fejlesztett.

Az MLX-et gépi tanulási kutatók tervezték gépi tanulási kutatók számára. A keretrendszer célja, hogy felhasználóbarát legyen, ugyanakkor hatékonyan lehessen vele modelleket tanítani és futtatni. Maga a keretrendszer koncepciója is egyszerű. Az a célunk, hogy a kutatók könnyen bővíthessék és fejleszthessék az MLX-et, hogy gyorsan tudjanak új ötleteket kipróbálni.

Az LLM-ek Apple Silicon eszközökön az MLX segítségével gyorsíthatók, és a modellek kényelmesen futtathatók helyben.

Phi-3-mini inferálása MLX-szel

1. MLX környezet beállítása

Python 3.11.x
Telepítsd az MLX könyvtárat


pip install mlx-lm

2. Phi-3-mini futtatása terminálban MLX-szel


python -m mlx_lm.generate --model microsoft/Phi-3-mini-4k-instruct --max-token 2048 --prompt  "<|user|>\nCan you introduce yourself<|end|>\n<|assistant|>"

Az eredmény (az én környezetem Apple M1 Max, 64GB) a következő:

Terminal

3. Phi-3-mini kvantálása MLX-szel terminálban


python -m mlx_lm.convert --hf-path microsoft/Phi-3-mini-4k-instruct

Megjegyzés: A modellt az mlx_lm.convert segítségével lehet kvantálni, az alapértelmezett kvantálás INT4. Ez a példa Phi-3-mini modellt kvantálja INT4-re.

A modellt az mlx_lm.convert segítségével lehet kvantálni, az alapértelmezett kvantálás INT4. Ebben a példában Phi-3-mini modellt kvantálunk INT4-re. A kvantálás után a modell az alapértelmezett ./mlx_model könyvtárba kerül mentésre.

A kvantált modellt terminálból is tesztelhetjük MLX segítségével


python -m mlx_lm.generate --model ./mlx_model/ --max-token 2048 --prompt  "<|user|>\nCan you introduce yourself<|end|>\n<|assistant|>"

Az eredmény:

INT4

4. Phi-3-mini futtatása MLX-szel Jupyter Notebookban

Notebook

Megjegyzés: Kérjük, olvasd el ezt a mintát kattints ide

Források

Ismerd meg az Apple MLX keretrendszert https://ml-explore.github.io
Apple MLX GitHub tárhely https://github.com/ml-explore

Jogi nyilatkozat:
Ez a dokumentum az AI fordító szolgáltatás, a Co-op Translator segítségével készült. Bár a pontosságra törekszünk, kérjük, vegye figyelembe, hogy az automatikus fordítások hibákat vagy pontatlanságokat tartalmazhatnak. Az eredeti dokumentum az anyanyelvén tekintendő hiteles forrásnak. Fontos információk esetén szakmai, emberi fordítást javaslunk. Nem vállalunk felelősséget a fordítás használatából eredő félreértésekért vagy téves értelmezésekért.