Inference Phi-3 på Android
February 1, 2026 · View on GitHub
Låt oss utforska hur du kan göra inferens med Phi-3-mini på Android-enheter. Phi-3-mini är en ny modellserie från Microsoft som möjliggör distribution av stora språkmodeller (LLMs) på edge-enheter och IoT-enheter.
Semantic Kernel och inferens
Semantic Kernel är ett applikationsramverk som låter dig skapa applikationer kompatibla med Azure OpenAI Service, OpenAI-modeller och även lokala modeller. Om du är ny på Semantic Kernel rekommenderar vi att du tittar på Semantic Kernel Cookbook.
För att komma åt Phi-3-mini med Semantic Kernel
Du kan kombinera det med Hugging Face Connector i Semantic Kernel. Se detta exempelkod.
Som standard motsvarar det modell-ID:t på Hugging Face. Men du kan också ansluta till en lokalt uppbyggd Phi-3-mini-modellserver.
Anropa kvantiserade modeller med Ollama eller LlamaEdge
Många användare föredrar att använda kvantiserade modeller för att köra modeller lokalt. Ollama och LlamaEdge låter individuella användare anropa olika kvantiserade modeller:
Ollama
Du kan köra ollama run Phi-3 direkt eller konfigurera det offline genom att skapa en Modelfile med sökvägen till din .gguf-fil.
FROM {Add your gguf file path}
TEMPLATE \"\"\"<|user|> .Prompt<|end|> <|assistant|>\"\"\"
PARAMETER stop <|end|>
PARAMETER num_ctx 4096
LlamaEdge
Om du vill använda .gguf-filer både i molnet och på edge-enheter samtidigt är LlamaEdge ett utmärkt val. Du kan titta på denna exempelkod för att komma igång.
Installera och kör på Android-telefoner
- Ladda ner MLC Chat-appen (gratis) för Android-telefoner.
- Ladda ner APK-filen (148MB) och installera den på din enhet.
- Starta MLC Chat-appen. Du kommer att se en lista med AI-modeller, inklusive Phi-3-mini.
Sammanfattningsvis öppnar Phi-3-mini upp spännande möjligheter för generativ AI på edge-enheter, och du kan börja utforska dess kapabiliteter på Android.
Ansvarsfriskrivning:
Detta dokument har översatts med hjälp av AI-översättningstjänsten Co-op Translator. Även om vi strävar efter noggrannhet, vänligen observera att automatiska översättningar kan innehålla fel eller brister. Det ursprungliga dokumentet på dess modersmål bör betraktas som den auktoritativa källan. För kritisk information rekommenderas professionell mänsklig översättning. Vi ansvarar inte för några missförstånd eller feltolkningar som uppstår till följd av användningen av denna översättning.