iOS-ൽ Phi-3 ഇൻഫറൻസ്
February 1, 2026 · View on GitHub
Phi-3-mini Microsoft നിർമാണമുള്ള ഒരു പുതിയ മോഡൽ പരമ്പരയാണ്, ഇത് Edge ഡിവൈസുകളിലും IoT ഉപകരണങ്ങളിലുമുള്ള Large Language Models (LLMs) ഡിപ്ലോയ് ചെയ്യാൻ സാധ്യമാക്കുന്നു. Phi-3-mini iOS, Android, Edge Device ഡിപ്ലോയ്മെന്റുകൾക്കായി ലഭ്യമാണ്, BYOD പരിസ്ഥിതികളിൽ Generative AI ഡിപ്ലോയ് ചെയ്യാൻ ഇത് അനുവദിക്കുന്നു. താഴെയുള്ള ഉദാഹരണം iOS-ൽ Phi-3-mini എങ്ങനെ ഡിപ്ലോയ് ചെയ്യാമെന്ന് കാണിക്കുന്നു.
1. തയ്യാറെടുപ്പ്
- a. macOS 14+
- b. Xcode 15+
- c. iOS SDK 17.x (iPhone 14 A16 or greater)
- d. Python 3.10+ ഇൻസ്റ്റാൾ ചെയ്യുക (Conda ശുപാർശ ചെയ്യപ്പെടുന്നു)
- e. Python ലൈബ്രറി ഇൻസ്റ്റാൾ ചെയ്യുക:
python-flatbuffers - f. CMake ഇൻസ്റ്റാൾ ചെയ്യുക
സെമാന്റിക് കർണൽ (Semantic Kernel) மற்றும் ഇൻഫറൻസ്
Semantic Kernel ഒരു അപ്ലിക്കേഷൻ ഫ്രെയിമ്വർക്കാണ്, ഇത് Azure OpenAI Service, OpenAI മോഡലുകൾ, പോലും ലോക്കൽ മോഡലുകൾ എന്നിവയ്ക്ക് അനുയോജ്യമായ ആപ്പുകൾ സൃഷ്ടിക്കാൻ നിങ്ങളെ പ്രേരിപ്പിക്കുന്നു. Semantic Kernel വഴി ലോക്കൽ സർവീസുകളിലേക്ക് ആക്സസ് ചെയ്യുന്നതിലൂടെ നിങ്ങളുടെ സ്വയം ഹോസ്റ്റ് ചെയ്ത Phi-3-mini മോഡൽ സർവറുമായി ലളിതമായ ഇന്റഗ്രേഷൻ സാധ്യമാണ്.
Ollama അല്ലെങ്കിൽ LlamaEdge ഉപയോഗിച്ച് ക്വാന്റ്റൈസ്ഡ് മോഡലുകൾ കോളുചെയ്യൽ
ലോകത്തിൽ പല ഉപയോക്താക്കൾക്കും മോഡലുകൾ ലോക്കലായി ഓടിക്കാൻ ക്വാന്റൈസ്ഡ് മോഡലുകൾ ഉപയോഗിക്കാൻ പ്രാധാന്യമുണ്ട്. Ollamaയും LlamaEdgeഉം വ്യത്യസ്ത ക്വാന്റൈസ്ഡ് മോഡലുകൾ കോളുചെയ്യാൻ ഉപയോക്താക്കളെ അനുവദിക്കുന്നു:
Ollama
നിങ്ങൾക്ക് നേരിട്ട് ollama run phi3 റൺ ചെയ്യാവുന്നതാണ് അല്ലെങ്കിൽ അത് ഓഫ്ലൈനായി കോൺഫിഗർ ചെയ്യാം. നിങ്ങളുടെ gguf ഫയലിന്റെ പാത്ത് ഉപയോഗിച്ച് ഒരു Modelfile സൃഷ്ടിക്കുക. Phi-3-mini ക്വാന്റൈസ്ഡ് മോഡൽ റൺ ചെയ്യുന്നതിനുള്ള സാമ്പിൾ കോഡ്:
FROM {Add your gguf file path}
TEMPLATE \"\"\"<|user|> .Prompt<|end|> <|assistant|>\"\"\"
PARAMETER stop <|end|>
PARAMETER num_ctx 4096
LlamaEdge
താനൊരു സമയത്ത് ക്ലൗഡ് மற்றும் എഡ്ജ് ഡിവൈസുകളിൽ gguf ഉപയോഗിക്കാൻ ആഗ്രഹമുണ്ടെങ്കിൽ, LlamaEdge നല്ലൊരു ഓപ്ഷനാണ്.
2. iOS-ക്കുള്ള ONNX Runtime കമ്പൈൽ ചെയ്യൽ
git clone https://github.com/microsoft/onnxruntime.git
cd onnxruntime
./build.sh --build_shared_lib --ios --skip_tests --parallel --build_dir ./build_ios --ios --apple_sysroot iphoneos --osx_arch arm64 --apple_deploy_target 17.5 --cmake_generator Xcode --config Release
cd ../
കുറിപ്പ്
-
a. കമ്പൈൽ ചെയ്യുന്നതിന് മുൻപ്, Xcode ശരിയായി കോൺഫിഗർ ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക மற்றும் ടർമിനലിൽ അത് ആക്ടീവ് ഡെവലപ്പർ ഡയറക്ടറിയായി സജ്ജമാക്കി:
sudo xcode-select -switch /Applications/Xcode.app/Contents/Developer -
b. ONNX Runtime വ്യത്യസ്ത പ്ലാറ്റ്ഫോമുകൾക്കായി കമ്പൈൽ ചെയ്യേണ്ടതുണ്ട്. iOS-ിന്, നിങ്ങൾക്ക്
arm64അല്ലെങ്കിൽx86_64සඳහා കമ്പൈൽ ചെയ്യാം. -
c. കമ്പൈലേഷനുമായി ചേർന്നുള്ള ഏറ്റവും പുതിയ iOS SDK ഉപയോഗിക്കണമെന്ന് ശുപാർശ ചെയ്യപ്പെടുന്നു. എന്നിരുന്നാലും, മുൻപ് ഉപയോഗിച്ചിരുന്ന SDK-കളുമായി പൊരുൾക്കപ്പെടേണ്ടതുണ്ടെങ്കിൽ നിങ്ങൾ പഴയ ভার്ഷൻ ഉപയോഗിക്കാവുന്നതാണ്.
3. iOS-ക്കുള്ള ONNX Runtime ഉപയോഗിച്ച് Generative AI കമ്പൈൽ ചെയ്യൽ
കുറിപ്പ്: Generative AI with ONNX Runtime ഇപ്പോൾ പ്രിവ്യൂ ഘട്ടത്തിലാണ്, അതുകൊണ്ട് സാധ്യതയുള്ള മാറ്റങ്ങളെ കുറിച്ച് ദയവായി ശ്രദ്ധിക്കുക.
git clone https://github.com/microsoft/onnxruntime-genai
cd onnxruntime-genai
mkdir ort
cd ort
mkdir include
mkdir lib
cd ../
cp ../onnxruntime/include/onnxruntime/core/session/onnxruntime_c_api.h ort/include
cp ../onnxruntime/build_ios/Release/Release-iphoneos/libonnxruntime*.dylib* ort/lib
export OPENCV_SKIP_XCODEBUILD_FORCE_TRYCOMPILE_DEBUG=1
python3 build.py --parallel --build_dir ./build_ios --ios --ios_sysroot iphoneos --ios_arch arm64 --ios_deployment_target 17.5 --cmake_generator Xcode --cmake_extra_defines CMAKE_XCODE_ATTRIBUTE_CODE_SIGNING_ALLOWED=NO
4. Xcode-ൽ ഒരു ആപ്പ് ആപ്ലിക്കേഷൻ സൃഷ്ടിക്കുക
ഞാൻ ആപ്പ് ഡെവലപ്മെന്റിനായി Objective-C തിരഞ്ഞെടുക്കുകയാണ്, കാരണം ONNX Runtime C++ API ഉപയോഗിച്ചുള്ള Generative AI-യിൽ Objective-C കൂടുതൽ അനുയോജ്യമാണ്. φυσικά, നിങ്ങൾ Swift bridging വഴി ബന്ധപ്പെട്ട কলുകൾ പൂര്ത്തിയാക്കുകയും ചെയ്യാം.

5. ONNX ക്വാന്റൈസ്ഡ് INT4 മോഡൽ App ആപ്ലിക്കേഷൻ പ്രോജക്റ്റിലേക്ക് കോപ്പി ചെയ്യുക
ഞങ്ങൾയ്ക്ക് ആദ്യം ഡൗൺലോഡ് ചെയ്യേണ്ട ONNX ഫോർമാറ്റിലുള്ള INT4 ക്വാന്റൈസേഷൻ മോഡൽ ഇറക്കുമതി ചെയ്യേണ്ടതുണ്ട്

ഡൗൺലോഡ് കഴിഞ്ഞ്, അത് Xcode പ്രോജക്റ്റിലെ Resources ഡയറക്ടറിയിലേക്ക് ചേർക്കേണ്ടതുണ്ട്.

6. ViewControllers-ലിൽ C++ API ചേർക്കൽ
കുറിപ്പ്:
-
a. അനുയോജ്യമായ C++ ഹെഡർ ഫയലുകൾ പ്രോജക്റ്റിലേക്ക് ചേർക്കുക.

-
b. Xcode-ൽ
onnxruntime-genaiഡൈനാമിക് ലൈബ്രറി ഉൾപ്പെടുത്തുക.
-
c. ടെസ്റ്റിംഗിന് C Samples കോഡ് ഉപയോഗിക്കുക. കൂടുതൽ പ്രവർത്തനക്ഷമതക്കായി ChatUI പോലുള്ള അധിക ഫീച്ചറുകൾ നിങ്ങൾക്ക് ചേർക്കാവുന്നതാണ്.
-
d. നിങ്ങളുടെ പ്രോജക്റ്റിൽ C++ ഉപയോഗിക്കേണ്ടതിനാൽ, Objective-C++ പിന്തുണ സജ്ജമാക്കാൻ
ViewController.mനാമംViewController.mmഎന്നാക്കി മാറ്റുക.
NSString *llmPath = [[NSBundle mainBundle] resourcePath];
char const *modelPath = llmPath.cString;
auto model = OgaModel::Create(modelPath);
auto tokenizer = OgaTokenizer::Create(*model);
const char* prompt = "<|system|>You are a helpful AI assistant.<|end|><|user|>Can you introduce yourself?<|end|><|assistant|>";
auto sequences = OgaSequences::Create();
tokenizer->Encode(prompt, *sequences);
auto params = OgaGeneratorParams::Create(*model);
params->SetSearchOption("max_length", 100);
params->SetInputSequences(*sequences);
auto output_sequences = model->Generate(*params);
const auto output_sequence_length = output_sequences->SequenceCount(0);
const auto* output_sequence_data = output_sequences->SequenceData(0);
auto out_string = tokenizer->Decode(output_sequence_data, output_sequence_length);
auto tmp = out_string;
7. ആപ് റൺ ചെയ്യൽ
സെറ്റപ്പ് പൂര്ത്തിയായ ശേഷം, Phi-3-mini മോഡൽ ഇൻഫറൻസിന്റെ ഫലങ്ങൾ കാണാൻ നിങ്ങൾ ആപ്പ് റൺ ചെയ്യാം.

കൂടുതൽ സാമ്പിൾ കോഡ് மற்றும் വിശദമായ നിർദേശങ്ങൾക്ക്, സന്ദർശിക്കുക Phi-3 Mini Samples repository.
അവകാശവിമുക്തി: ഈ രേഖ Co-op Translator എന്ന എഐ (കൃത്രിമ ബുദ്ധി) പരിഭാഷാ സേവനം ഉപയോഗിച്ച് പരിഭാഷപ്പെടുത്തിയതാണ്. ഞങ്ങൾ കൃത്യതയ്ക്ക് ശ്രമിച്ചിരുന്നാലും, ഓട്ടോമേറ്റഡ് പരിഭാഷകളിൽ പിശകുകൾ അല്ലെങ്കിൽ തെറ്റുകൾ ഉണ്ടാകാമെന്നതിൽ ദയവായി ശ്രദ്ധിക്കുക. അതിന്റെ മാതൃഭാഷയിലുള്ള യഥാർത്ഥ രേഖ മാത്രമേ അധികാരപരമായ ഉറവിടമായി കണക്കാക്കപ്പെടൂ. നിർണായകമായ വിവരങ്ങൾക്കായി പ്രൊഫഷണൽ മനുഷ്യപരിഭാഷ ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ പരിഭാഷ ഉപയോഗിച്ചതിനാൽ ഉണ്ടാകുന്ന ഏതൊരു തെറ്റിദ്ധാരണകൾക്കും അല്ലെങ്കിൽ തെറ്റായി വ്യാഖ്യാനിക്കലുകൾക്കും ഞങ്ങൾ ഉത്തരവാദികളുമായി നിൽക്കുന്നില്ല.