முக்கிய தொழில்நுட்பங்கள்

February 1, 2026 · View on GitHub

DirectML - DirectX 12-ஐ அடிப்படையாகக் கொண்டு உருவாக்கப்பட்ட, ஹார்ட்வேரை வேகமாக செயல்படுத்தும் மெஷின் லெர்னிங் API.
CUDA - Nvidia உருவாக்கிய ஒரு பார்‌லல் கம்ப்யூட்டிங் தளம் மற்றும் API மாடல், GPU-களில் பொதுவான செயல்பாடுகளை செயல்படுத்த உதவுகிறது.
ONNX (Open Neural Network Exchange) - மெஷின் லெர்னிங் மாடல்களை பிரதிநிதித்துவப்படுத்த உருவாக்கப்பட்ட ஒரு திறந்த வடிவமைப்பு, பல்வேறு ML கட்டமைப்புகளுக்கு இடையே இணக்கத்தன்மையை வழங்குகிறது.
GGUF (Generic Graph Update Format) - மெஷின் லெர்னிங் மாடல்களை பிரதிநிதித்துவப்படுத்தவும் புதுப்பிக்கவும் பயன்படுத்தப்படும் வடிவமைப்பு, குறிப்பாக CPUs-ல் 4-8bit குவாண்டைசேஷனுடன் சிறப்பாக இயங்கும் சிறிய மொழி மாடல்களுக்கு பயனுள்ளதாக உள்ளது.

DirectML

DirectML என்பது ஹார்ட்வேரை வேகமாக செயல்படுத்தும் மெஷின் லெர்னிங் API ஆகும். இது DirectX 12-ஐ அடிப்படையாகக் கொண்டு GPU வேகத்தை பயன்படுத்துகிறது மற்றும் விற்பனையாளர் சார்ந்ததாக இல்லை, அதாவது பல GPU விற்பனையாளர்களுக்கு இடையே எந்த குறியீடு மாற்றங்களும் தேவையில்லை. இது முக்கியமாக GPU-களில் மாடல் பயிற்சி மற்றும் தீர்மான செயல்பாடுகளுக்கு பயன்படுத்தப்படுகிறது.

ஹார்ட்வேரின் ஆதரவு குறித்து, DirectML பல GPU-களுடன் வேலை செய்ய வடிவமைக்கப்பட்டுள்ளது, அதில் AMD ஒருங்கிணைந்த மற்றும் தனித்துவ GPU-கள், Intel ஒருங்கிணைந்த GPU-கள் மற்றும் NVIDIA தனித்துவ GPU-கள் அடங்கும். இது Windows AI தளத்தின் ஒரு பகுதியாகும் மற்றும் Windows 10 & 11-ல் ஆதரிக்கப்படுகிறது, இதனால் எந்த Windows சாதனத்திலும் மாடல் பயிற்சி மற்றும் தீர்மானங்களை இயக்க முடியும்.

DirectML-இல் 150 ONNX ஆபரேட்டர்களுக்கு ஆதரவு மற்றும் ONNX runtime மற்றும் WinML ஆகியவற்றால் பயன்படுத்தப்படுவது போன்ற புதுப்பிப்புகள் மற்றும் வாய்ப்புகள் உள்ளன. இது முக்கிய ஒருங்கிணைந்த ஹார்ட்வேர விற்பனையாளர்களால் ஆதரிக்கப்படுகிறது, ஒவ்வொன்றும் பல்வேறு மெட்டாகமாண்டுகளை செயல்படுத்துகிறது.

CUDA

CUDA என்பது Compute Unified Device Architecture-ஐ குறிக்கிறது, இது Nvidia உருவாக்கிய ஒரு பார்‌லல் கம்ப்யூட்டிங் தளம் மற்றும் API மாடல் ஆகும். இது மென்பொருள் டெவலப்பர்களுக்கு CUDA-ஆதரவு கொண்ட GPU-ஐ பொதுவான செயல்பாடுகளுக்கு பயன்படுத்த அனுமதிக்கிறது – இது GPGPU (Graphics Processing Units-ல் பொதுவான கம்ப்யூட்டிங்) என அழைக்கப்படுகிறது. CUDA Nvidia-வின் GPU வேகத்தை இயக்குவதற்கான முக்கிய காரணியாகும் மற்றும் மெஷின் லெர்னிங், அறிவியல் கணக்கீடு மற்றும் வீடியோ செயலாக்கம் போன்ற பல துறைகளில் பரவலாக பயன்படுத்தப்படுகிறது.

CUDA-க்கு ஹார்ட்வேர ஆதரவு Nvidia-வின் GPU-களுக்கு மட்டுமே குறிப்பிட்டது, ஏனெனில் இது Nvidia உருவாக்கிய சொந்த தொழில்நுட்பமாகும். ஒவ்வொரு கட்டமைப்பும் CUDA டூல்கிட் பதிப்புகளை ஆதரிக்கிறது, இது டெவலப்பர்களுக்கு CUDA பயன்பாடுகளை உருவாக்கவும் இயக்கவும் தேவையான நூலகங்கள் மற்றும் கருவிகளை வழங்குகிறது.

ONNX

ONNX (Open Neural Network Exchange) என்பது மெஷின் லெர்னிங் மாடல்களை பிரதிநிதித்துவப்படுத்த உருவாக்கப்பட்ட ஒரு திறந்த வடிவமைப்பு ஆகும். இது விரிவாக்கக்கூடிய கணக்கீட்டு கிராஃப் மாடலின் வரையறையை வழங்குகிறது, மேலும் உள்ளமைக்கப்பட்ட ஆபரேட்டர்கள் மற்றும் நிலையான தரவுத் வகைகளின் வரையறைகளை வழங்குகிறது. ONNX டெவலப்பர்களுக்கு மாடல்களை பல்வேறு ML கட்டமைப்புகளுக்கு இடையே நகர்த்த அனுமதிக்கிறது, இதனால் இணக்கத்தன்மை கிடைக்கிறது மற்றும் AI பயன்பாடுகளை உருவாக்கவும் வெளியிடவும் எளிதாகிறது.

Phi3 mini ONNX Runtime-ஐ CPU மற்றும் GPU-களில் பல சாதனங்களில் இயக்க முடியும், அதில் சர்வர் தளங்கள், Windows, Linux மற்றும் Mac டெஸ்க்டாப்கள் மற்றும் மொபைல் CPU-கள் அடங்கும். நாங்கள் சேர்த்துள்ள மேம்படுத்தப்பட்ட கட்டமைப்புகள்:

int4 DML-க்கு ONNX மாடல்கள்: AWQ மூலம் int4-க்கு குவாண்டைசேஷன் செய்யப்பட்டது
fp16 CUDA-க்கு ONNX மாடல்
int4 CUDA-க்கு ONNX மாடல்: RTN மூலம் int4-க்கு குவாண்டைசேஷன் செய்யப்பட்டது
int4 CPU மற்றும் மொபைலுக்கு ONNX மாடல்: RTN மூலம் int4-க்கு குவாண்டைசேஷன் செய்யப்பட்டது

Llama.cpp

Llama.cpp என்பது C++-ல் எழுதப்பட்ட ஒரு திறந்த மூல மென்பொருள் நூலகமாகும். இது Llama உட்பட பல பெரிய மொழி மாடல்களில் தீர்மானங்களை செயல்படுத்துகிறது. ggml நூலகத்துடன் (ஒரு பொதுவான டென்சர் நூலகம்) இணைந்து உருவாக்கப்பட்டது, llama.cpp முதன்மை Python செயல்பாட்டுடன் ஒப்பிடும்போது வேகமான தீர்மானம் மற்றும் குறைந்த நினைவக பயன்பாட்டை வழங்குகிறது. இது ஹார்ட்வேர மேம்பாடு, குவாண்டைசேஷன் ஆகியவற்றை ஆதரிக்கிறது மற்றும் ஒரு எளிய API மற்றும் எடுத்துக்காட்டுகளை வழங்குகிறது. திறமையான LLM தீர்மானத்தில் ஆர்வமுள்ளவர்களுக்கு llama.cpp ஆராய்வதற்கு மதிப்புள்ளது, ஏனெனில் Phi3 Llama.cpp-ஐ இயக்க முடியும்.

GGUF

GGUF (Generic Graph Update Format) என்பது மெஷின் லெர்னிங் மாடல்களை பிரதிநிதித்துவப்படுத்தவும் புதுப்பிக்கவும் பயன்படுத்தப்படும் ஒரு வடிவமைப்பு ஆகும். இது குறிப்பாக CPUs-ல் 4-8bit குவாண்டைசேஷனுடன் சிறப்பாக இயங்கும் சிறிய மொழி மாடல்களுக்கு பயனுள்ளதாக உள்ளது. GGUF விரைவான முன்னோட்டம் மற்றும் எட்ஜ் சாதனங்களில் அல்லது CI/CD பைப்‌லைன்கள் போன்ற தொகுதி வேலைகளில் மாடல்களை இயக்குவதற்கு பயனுள்ளதாக உள்ளது.

குறிப்பு:
இந்த ஆவணம் Co-op Translator என்ற AI மொழிபெயர்ப்பு சேவையைப் பயன்படுத்தி மொழிபெயர்க்கப்பட்டுள்ளது. நாங்கள் துல்லியத்திற்காக முயற்சிக்கின்றோம், ஆனால் தானியக்க மொழிபெயர்ப்புகளில் பிழைகள் அல்லது தவறான தகவல்கள் இருக்கக்கூடும் என்பதை தயவுசெய்து கவனத்தில் கொள்ளுங்கள். அதன் தாய்மொழியில் உள்ள மூல ஆவணம் அதிகாரப்பூர்வ ஆதாரமாக கருதப்பட வேண்டும். முக்கியமான தகவல்களுக்கு, தொழில்முறை மனித மொழிபெயர்ப்பு பரிந்துரைக்கப்படுகிறது. இந்த மொழிபெயர்ப்பைப் பயன்படுத்துவதால் ஏற்படும் எந்த தவறான புரிதல்கள் அல்லது தவறான விளக்கங்களுக்கு நாங்கள் பொறுப்பல்ல.