പ്രമേയമായി പരാമർശിച്ച പ്രധാന സാങ്കേതികവിദ്യകൾ
February 1, 2026 · View on GitHub
- DirectML - DirectX 12 ന്റെ മുകളിൽ നിർമ്മിച്ചിരിക്കുന്ന, ഹാർഡ്വെയർ-അസിസ്റ്റഡ് മെഷീൻ ലേണിംഗിനുള്ള ഒരു ലോ-ലെവൽ API.
- CUDA - Nvidia വികസിപ്പിച്ച രണ്ട് സാദൃശ്യമുള്ള കംപ്യൂട്ടിങ് പ്ലാറ്റ്ഫോം மற்றும் ആപ്ളിക്കേഷൻ പ്രോഗ്രാമിംഗ് ഇന്റർഫേസ് (API) മോഡൽ, GPUകളിൽ ജനറൽ-പർപ്പസ് പ്രോസസ്സിംഗ് സാധ്യമാക്കുന്നു.
- ONNX (ഓപ്പൺ ന്യുറൽ നെറ്റ്വർക്ക് എക്സ്ചേഞ്ച്) - മെഷീൻ ലേണിംഗ് മോഡലുകൾ പ്രതിനിധീകരിക്കാൻ രൂപകൽപ്പന ചെയ്ത ഒരു തുറന്ന ഫോർമാറ്റ്, വിവിധ ML ഫ്രെയിംവർക്കുകൾക്കിടയിൽ ഇന്റർഓപ്പറബിലിറ്റി നൽകുന്നു.
- GGUF (ജനറിക് ഗ്രാഫ് അപ്ഡേറ്റ് ഫോർമാറ്റ്) - മെഷീൻ ലേണിംഗ് മോഡലുകൾ പ്രതിനിധീകരിക്കുകയും അപ്ഡേറ്റ് ചെയ്യുകയും ചെയ്യുന്നതിനുള്ള ഒരു ഫോർമാറ്റ്; പ്രത്യേകിച്ച് 4-8 ബിറ്റ് ക്വാൻറൈസേഷൻ ഉപയോഗിച്ച് CPUs-ൽ ഫലപ്രദമായി പ്രവർത്തിക്കാവുന്ന ചെറിയ ഭാഷാ മോഡലുകൾക്കു ഏറെ പ്രയോജനകരമാണ്.
DirectML
DirectML ഹാർഡ്വെയർ-അസിസ്റ്റഡ് മെഷീൻ ലേണിംഗ് സാധ്യമാക്കുന്ന ഒരു ലോ-ലെവൽ API ആണ്. GPU ആക്സിലറേഷൻ ഉപയോഗിക്കാൻ ഇത് DirectX 12 ന്റെ മുകളിൽ നിർമ്മിച്ചിരിക്കുകയാണ്, കൂടാതെ വ്യത്യസ്ത GPU വിതരണക്കാരുമായെല്ലാം പ്രവർത്തിക്കാൻ കോഡ് മാറ്റങ്ങൾ ആവശ്യമില്ല എന്ന നിലയിൽ vendor-agnostic ആണ്. ഇത് പ്രധാനമായും GPUകളിൽ മോഡൽ പരിശീലനത്തിനും ഇൻഫറൻസിംഗിനും ഉപയോഗിക്കുന്നു.
ഹാർഡ്വെയർ പിന്തുണയെ സംബന്ധിച്ച്, DirectML വിവിധതരം GPUകളുമായി പ്രവർത്തിക്കാൻ രൂപകൽപ്പന ചെയ്തതാണ്, ഇതിൽ AMD ഇന്റഗ്രേറ്റഡ് અને ഡിസ്ക്രീറ്റ് GPUകൾ, Intel ഇന്റഗ്രേറ്റഡ് GPUകൾ, NVIDIA ഡിസ്ക്രീറ്റ് GPUകൾ എന്നിവ ഉൾപ്പെടുന്നു. ഇത് Windows AI പ്ലാറ്റ്ഫോമിന്റെ ഭാഗമായി ആണ് ಮತ್ತು Windows 10 & 11 ൽ പിന്തുണയ്ക്കപ്പെടുന്നു, അതിലൂടെ ഏതെങ്കിലും Windows ഡിവൈസിൽ മോഡൽ പരിശീലനവും ഇൻഫറൻസും നടത്താൻ സാധ്യമാണ്.
DirectML-നെ സംബന്ധിച്ച ചില അപ്ഡേറ്റുകളും അവസരങ്ങളും ഉണ്ടായിട്ടുണ്ട്, ഉദാഹരണത്തിന് 150 ഓൺഎഎൻഎക്സ് ഓപ്പറേറ്ററുകൾ വരെ പിന്തുണയ്ക്കൽ എന്നിവയും ONNX runtime-നും WinML-നും ഉപയോഗിച്ചുവരുന്നത് പോലുള്ളവയും. ഇത് പ്രമുഖ ഇന്റഗ്രേറ്റഡ് ഹാർഡ്വെയർ വെണ്ടറുകൾ (IHVs) പിന്തുണയ്ക്കുന്നു, ഓരോന്നും വിവിധ മെറ്റാകമാൻഡുകൾ നടപ്പിലാക്കി വരുന്നു.
CUDA
CUDA (Compute Unified Device Architecture) Nvidia എത്തിച്ചെടുത്ത ഒരു പരലൽ കംപ്യൂട്ടിങ് പ്ലാറ്റ്ഫോംയും API മോഡലും ആണ്. CUDA-സാധ്യമായ GPU ഉപയോഗിച്ച് സോഫ്റ്റ്വേർ ഡവലപ്പർമാർ ജനറൽ-പർപ്പസ് പ്രോസസ്സിംഗ് നടത്താൻ സാധിക്കുകയും ചെയ്യുന്നു — ഇതിനെ GPGPU (General-Purpose computing on Graphics Processing Units) എന്നാണ് വിളിക്കുന്നത്. CUDA Nvidia-യുടെ GPU ആക്സിലറേഷന്റെ പ്രധാന സഹായിയാണ്, മെഷീൻ ലേണിംഗ്, ശാസ്ത്രീയ കണക്കുകൂട്ടൽ, വീഡിയോ പ്രോസസിംഗ് തുടങ്ങിയ വിവിധ മേഖലയിലായാണ് വ്യാപകമായി ഉപയോഗിക്കുന്നത്.
CUDA-യ്ക്ക് ഹാർഡ്വെയർ പിന്തുണ Nvidia 的 GPUകളെ അടിസ്ഥാനമാക്കി പ്രത്യേകിച്ച് ഉണ്ടാവുന്നു, കാരണം ഇത് Nvidia വികസിപ്പിച്ച ഒരു പ്രോപ്രൈറ്ററി സാങ്കേതികവിദ്യയാണ്. ഓരോ ആർക്കിടെക്ചറും CUDA ടൂൾകിറ്റിന്റെ പ്രത്യേക പതിപ്പുകൾക്കാണ് പിന്തുണ നൽകുന്നത്, അവ ഡവലപ്പർമാർക്ക് CUDA ആപ്ലിക്കേഷനുകൾ നിർമ്മിക്കാൻ ആവശ്യമായ ലൈബ്രറികളും ടൂൾസും നൽകുന്നു.
ONNX
ONNX (Open Neural Network Exchange) മെഷീൻ ലേണിംഗ് മോഡലുകൾ പ്രതിനിധീകരിക്കാൻ രൂപകൽപ്പന ചെയ്ത ഒരു തുറന്ന ഫോർമാറ്റാണ്. ഇത് വിപുലീകരിക്കാവുന്ന കംപ്യൂട്ടേഷൻ ഗ്രാഫ് മോഡലിന്റെ നിർവചനവും, തയ്യാറാക്കിയ ഇൻ-বിൽട്ട് ഓപ്പറേറ്ററുകളുടെ നിർവചനങ്ങളുമും സ്റ്റാൻഡേർഡ് ഡാറ്റാ ടൈപ്പുകളുടെ നിർവചനങ്ങളുമാണ് നൽകുന്നത്. ONNX ഡെവലപ്പർമാർക്ക് മോഡലുകൾ വിവിധ ML ഫ്രെയിംവർക്കുകളിലായി മാറ്റാൻ അനുവദിച്ച് ഇന്റർഓപ്പറബിലിറ്റിയും AI ആപ്ലിക്കേഷനുകൾ സൃഷ്ടിക്കുകയും ഡിപ്ലോയ് ചെയ്യുകയും ചെയ്യാൻ എളുപ്പമാക്കുന്നു.
Phi3 mini ONNX Runtime ഉപയോഗിച്ച് CPU യിലും GPU യിലും വ്യത്യസ്ഥ ഡിവൈസുകളിൽ പ്രവർത്തിക്കാം, സർക്കുലർ പ്ലാറ്റ്ഫോമുകൾ ഉൾപ്പെടെ Windows, Linux, Mac ഡെസ്ക്ടോപ്പുകൾ, മൊബൈൽ CPUകൾ എന്നിവയ്ക്കു മൈത്രീയമാണ്. ഞങ്ങൾ ചേർത്ത tốiേപ്പെടുത്തിയ കോൺഫിഗറേഷനുകൾ ആണ്
- ONNX models for int4 DML: AWQ മുഖാന്തിരം int4 ആയി ക്വാൻറൈസ് ചെയ്തത്
- ONNX model for fp16 CUDA
- ONNX model for int4 CUDA: RTN മുഖാന്തിരം int4 ആയി ക്വാൻറൈസ് ചെയ്തത്
- ONNX model for int4 CPU and Mobile: RTN മുഖാന്തിരം int4 ആയി ക്വാൻറൈസ് ചെയ്തത്
Llama.cpp
Llama.cpp C++യില് എഴുതപ്പെട്ട ഒരു ഓപ്പൺ-സോഴ്സ് സോഫ്റ്റ്വെയർ ലൈബ്രറിയാണ്. ഇത് Llama ഉൾപ്പെടെയുള്ള വിവിധ വലുതായായ ഭാഷാ മോഡലുകളിൽ ഇൻഫറൻസ് നടത്തുന്നു. ജനറൽ-പർപ്പസ് ടെൻസർ ലൈബ്രറിയായ ggml നൊപ്പം വികസിപ്പിച്ചെടുത്ത Llama.cpp মূল Python നടപ്പിലാക്കലിനേക്കാൾ വേഗത്തിൽ ഇൻഫറൻസ് നടത്താനും കുറഞ്ഞ മെമ്മറി ഉപയോഗിക്കാനുമാണ് ലക്ഷ്യം. ഇത് ഹാർഡ്വെയർ ഓപ്റ്റിമൈസേഷൻ, ക്വാന്തൈസേഷൻ എന്നിവയ്ക്കും പിന്തുണ നൽകുന്നു, കൂടാതെ ഒരു ലളിതമായ APIയും examples3 പോലുള്ള ഉദാഹരണങ്ങളും നൽകുന്നു. ഫലപ്രദമായ LLM ഇൻഫറൻസിൽ ആകർഷണമുണ്ടെങ്കിൽ, Phi3-ൽ Llama.cpp പ്രവർത്തിക്കാനാകുന്നുണ്ടെന്നതിനാൽ Llama.cpp പരിശോധിക്കാൻ വാക്കുതീരും.
GGUF
GGUF (ജനറിക് ഗ്രാഫ് അപ്ഡേറ്റ് ഫോർമാറ്റ്) മെഷീൻ ലേണിംഗ് മോഡലുകൾ പ്രതിനിധീകരിക്കുകയും അപ്ഡേറ്റ് ചെയ്യുകയും ചെയ്യുന്നതിനുള്ള ഒരു ഫോർമാറ്റ് ആണ്. ഇത് சிறുചുരുക്കമുള്ള ഭാഷാ മോഡലുകൾക്കായി പ്രത്യേകിച്ച് പ്രയോജനകരമാണ്, അവ 4-8 ബിറ്റ് ക്വാൻറൈസേഷൻ ഉപയോഗിച്ച് CPUs-ൽ ഫലപ്രദമായി പ്രവർത്തിക്കാറുണ്ട്. GGUF മാർഗ്ഗം റാപ്പിഡ് പ്രോട്ടോട്ടൈപ്പിംഗിനും എഡ്ജ് ഡിവൈസുകളിലോ CI/CD പോലുള്ള ബാച്ച് ജോബുകളിലോ മോഡലുകൾ ഓടിക്കുന്നതിനും ഉപകരിച്ചു പോകുന്നു.
പ്രത്യാഖ്യാനം: ഈ രേഖ AI പരിഭാഷാ സേവനമായ Co‑op Translator (https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. ഞങ്ങൾ കൃത്യതയ്ക്ക് പരിശ്രമിച്ചാൽ പോലും, സ്വയംചാലിതമായ പരിഭാഷകളിൽ പിശകുകളോ അസത്യതകളോ ഉണ്ടായിരിക്കാമെന്നതിൽ ദയവായി ശ്രദ്ധിക്കുക. മൗലികരൂപം അതിന്റെ മാതൃഭാഷയിലുള്ളതെന്തെന്നത് അധികൃത സ്രോതസ്സായി കണക്കാക്കണം. പ്രധാനപ്പെട്ട വിവരങ്ങളെ ബന്ധപ്പെട്ടാണ് പ്രൊഫഷണൽ മാനവപരിഭാഷ നിർദ്ദേശിക്കുന്നത്. ഈ പരിഭാഷ ഉപയോഗിച്ചതിൽ നിന്നുണ്ടാകുന്ന ഏതൊരു തെറ്റിദ്ധാരണത്തിനോ തെറ്റായ വ്യാഖ്യാനത്തിനോ ഞങ്ങൾ ഉത്തരവാദികളല്ല.