ഫൈൻ-ട്യൂൺ ചെയ്ത മോഡലുമായി റിമോട്ട് ഇൻഫറൻസ്

February 1, 2026 · View on GitHub

റിമോട്ട് പരിസരത്തിൽ അഡാപ്റ്ററുകൾ ട്രെയിൻ ചെയ്‌തശേഷം, മോഡലുമായി ഇടപെടാൻ ഒരു ലളിതമായ Gradio അപ്ലിക്കേഷൻ ഉപയോഗിക്കുക.

ഫൈൻ-ട്യൂൺ പൂർത്തിയായി

Azure റിസോഴ്‌സുകൾ പ്രൊവിഷൻ ചെയ്യുക

റിമോട്ട് ഇൻഫറൻസിനായി Azure റിസോഴ്‌സുകൾ സജ്ജീകരിക്കാൻ, കമാൻഡ് പെലറ്റിൽ നിന്ന് AI Toolkit: Provision Azure Container Apps for inference 실행 ചെയ്യേണ്ടതാണ്. ഈ സജ്ജീകരണത്തിനിടെ നിങ്ങളുടെ Azure Subscription અને resource group തിരഞ്ഞെടുക്കാൻ നിങ്ങളോട് ആവശ്യപ്പെടും.
ഇൻഫറൻസ് റിസോഴ്‌സ് പ്രൊവിഷൻ ചെയ്യുക

by default, inference-ന്റെ subscription և resource group ഫൈൻ-ട്യൂണിംഗ് സമയത്ത് ഉപയോഗിച്ചവയുമായി സാമ്യം കാണും. ഇൻഫറൻസ് അതേ Azure Container App Environment ഉപയോഗിക്കുകയും ഫൈൻ-ട്യൂണിംഗ് ഘട്ടത്തിൽ സൃഷ്ടിച്ച Azure Files-ൽ സൂക്ഷിച്ചിരിക്കുന്ന മോഡൽ և മോഡൽ അഡാപ്റ്റര്‍ ആക്സസ് ചെയ്യുകയും ചെയ്യും.

AI Toolkit ഉപയോഗിക്കുക

ഇൻഫറൻസിനുള്ള ഡിപ്ലോയ്മെന്റ്

നിങ്ങൾ ഇൻഫറൻസ് കോഡ് തിരുത്തണമെങ്കിൽ അല്ലെങ്കിൽ ഇൻഫറൻസ് മോഡൽ റീലോഡ് ചെയ്യണമെങ്കിൽ, ദയവായി AI Toolkit: Deploy for inference കമാൻഡ് നിർവഹിക്കണം. ഇത് നിങ്ങളുടെ പുതിയ കോഡ് ACA യുമായി സിംക്രനൈസ് ചെയ്ത് റിപ്ലിക്കയെ പുനരാരംഭിക്കും.

ഇൻഫറൻസിനായി ഡിപ്ലോയ് ചെയ്യുക

ഡിപ്ലോയ്മെന്റ് വിജയകരമായി പൂർത്തിയായപ്പോൾ, മോഡൽ ഇപ്പോൾ ഈ എൻഡ്‌പോയിൻറ് ഉപയോഗിച്ച് വിലയിരുത്താൻ റെഡിയാണ്.

ഇൻഫറൻസ് API ആക്‌സസ് ചെയ്യുക

VSCode നോട്ടിഫിക്കേഷനിൽ പ്രദർശിപ്പിക്കുന്ന "Go to Inference Endpoint" ബട്ടണിൽ ക്ലിക്ക് ചെയ്ത് നിങ്ങൾ ഇൻഫറൻസ് API ആക്‌സസ് ചെയ്യலாம். বিকল্পമായി, വെബ് API എൻഡ്‌പോയിൻറ് ACA_APP_ENDPOINT./infra/inference.config.json ഫയലിലും ഔട്ട്‌പുട്ട് പാനലിലും കണ്ടെത്താവുന്നതാണ്.

ആപ്പ് എൻഡ്‌പോയിന്റ്

ശ്രദ്ധിക്കുക: ഇൻഫറൻസ് എൻഡ്‌പോയിന്റ് പൂര്‍ണമായും പ്രവർത്തിക്കാൻ ചില നിമിഷങ്ങൾ എടുത്തേക്കാം.

ടെമ്പ്ലേറ്റിൽ ഉൾക്കൊള്ളിച്ച ഇൻഫറൻസ് ഘടകങ്ങൾ

FolderContents
infraറിലവന്റ് റിമോട്ട് പ്രവർത്തനങ്ങൾക്ക് ആവശ്യമായ എല്ലാ കോൺഫിഗറೇಶനുകളും ഉൾക്കൊള്ളിക്കുന്നു.
infra/provision/inference.parameters.jsonബൈസ്‌പ് ടെംപ്ലേറ്റുകൾക്കുള്ള പാരാമീറ്ററുകൾ ഇവിടെ ഉൾക്കൊള്ളിക്കുന്നു, ഇൻഫറൻസ് വേണ്ട Azure റിസോഴ്‌സുകൾ പ്രൊവിഷൻ ചെയ്യാൻ ഇത് ഉപയോഗിക്കുന്നു.
infra/provision/inference.bicepഇൻഫറൻസ് ആവശ്യമായ Azure റിസോഴ്‌സുകൾ പ്രൊവിഷൻ ചെയ്യുന്നതിനുള്ള ടെംപ്ലേറ്റുകൾ ഇവിടെ ഉൾക്കൊള്ളിക്കുന്നു.
infra/inference.config.jsonകോൺഫിഗറേഷൻ ഫയൽ, AI Toolkit: Provision Azure Container Apps for inference കമാൻഡ് દ્વારા സൃഷ്ടിക്കപ്പെടുന്നത്. ഇത് മറ്റ് റിമോട്ട് കമാൻഡ് പെലറ്റുകൾക്ക് ഇൻപുട്ടായി ഉപയോഗിക്കുന്നു.

Azure റിസോഴ്‌സ് പ്രൊവിഷനിനായി AI Toolkit ക്രമീകരിക്കൽ

Configure the AI Toolkit

Provision Azure Container Apps for inference` കമാൻഡ്.

കോൺഫിഗറേഷൻ പാരാമീറ്ററുകൾ ./infra/provision/inference.parameters.json ഫയലിൽ കണ്ടെത്താവുന്നതാണ്. വിശദാംശങ്ങൾ ഇവയാണ്:

ParameterDescription
defaultCommandsവെബ് API ആരംഭിപ്പിക്കുന്നതിനുള്ള കമാൻഡുകളാണ് ഇത്.
maximumInstanceCountGPU ഇൻസ്റ്റൻസുകളുടെ പരമാവധി ശേഷി നിശ്ചയിക്കുന്ന പാരാമീറ്റർ.
locationAzure റിസോഴ്‌സുകൾ പ്രൊവിഷൻ ചെയ്യപ്പെടുന്ന സ്ഥലം. ഡിഫോൾട്ട് മൂല്യം തിരഞ്ഞെടുക്കപ്പെട്ട resource group's ലൊക്കേഷനുമായി സാമ്യം കാണും.
storageAccountName, fileShareName acaEnvironmentName, acaEnvironmentStorageName, acaAppName, acaLogAnalyticsNameഈ പാരാമീറ്ററുകൾ പ്രൊവിഷനിനുള്ള Azure റിസോഴ്‌സുകൾ നാമകരണം ചെയ്യാൻ ഉപയോഗിക്കുന്നു. ഡിഫോൾട്ടായി, അവ ഫൈൻ-ട്യൂണിംഗ് resource നാമത്തോടുകൂടിയിരിക്കും. നിങ്ങളുടെ സ്വന്തം കസ്റ്റം നാമമുള്ള റിസോഴ്‌സുകൾ സൃഷ്ടിക്കാൻ പുതിയ and ഉപയോഗിച്ചിട്ടില്ലാത്ത റിസോഴ്‌സ് പേര് നൽകാം, അല്ലെങ്കിൽ നിലവിലുള്ള Azure റിസോഴ്‌സ് ഉപയോഗിക്കാൻ ആഗ്രഹിക്കുന്നുവെങ്കിൽ അതിന്റെ പേര് നൽകാം. വിശദാംശങ്ങൾക്ക് Using existing Azure Resources സെക്ഷൻ കാണുക.

നിലവിലുള്ള Azure റിസോഴ്‌സുകൾ ഉപയോഗിക്കൽ

ഡിഫോൾട്ടായി, ഇൻഫറൻസ് പ്രൊവിഷൻ ഫൈൻ-ട്യൂണിംഗിന് ഉപയോഗിച്ചിരുന്ന അതേ Azure Container App Environment, Storage Account, Azure File Share, Azure Log Analytics എന്നിവ ഉപയോഗിക്കും. ഇൻഫറൻസ് APIക്കായി വേർതിരിച്ച Azure Container App ഒന്ന് മാത്രമാണ് രചിക്കുക.

ഫൈൻ-ട്യൂണിംഗ് ഘട്ടത്തിൽ നിങ്ങൾ Azure റിസോഴ്‌സുകൾ അനുകൂലിപ്പിച്ചുവെങ്കിൽ അല്ലെങ്കിൽ ഇൻഫറൻസിനായി നിങ്ങളുടേത് നിലനിൽക്കുന്ന Azure റിസോഴ്‌സുകൾ ഉപയോഗിക്കാൻ ആഗ്രഹിച്ചാൽ, അവയുടെ നാമങ്ങൾ ./infra/inference.parameters.json ഫയലിൽ निर्दിഷ്ടമാക്കുക. തുടർന്ന്, കമാൻഡ് പദ്ധതി നിന്നു AI Toolkit: Provision Azure Container Apps for inference കമാൻഡ് 실행 ചെയ്യുക. ഇത് നൽകിയിട്ടുള്ള റിസോഴ്‌സുകൾ അപ്‌ഡേറ്റ് ചെയ്യുകയും മിസ്റ്റിങ്ങ് ആയവ ഉണ്ടെങ്കിൽ സൃഷ്ടിക്കുകയും ചെയ്യും.

ഉദാഹരണത്തിന്, നിങ്ങൾക്ക് നിലവിലുള്ള Azure കൺറെയ്നർ എൻവയോൺമെന്റ് ഉണ്ടെങ്കിൽ, നിങ്ങളുടെ ./infra/finetuning.parameters.json ഇങ്ങനെ കാണിക്കേണ്ടതാണ്:

{
    "$schema": "https://schema.management.azure.com/schemas/2019-04-01/deploymentParameters.json#",
    "contentVersion": "1.0.0.0",
    "parameters": {
      ...
      "acaEnvironmentName": {
        "value": "<your-aca-env-name>"
      },
      "acaEnvironmentStorageName": {
        "value": null
      },
      ...
    }
  }

മാനുവൽ പ്രൊവിഷൻ

നിങ്ങൾക്ക് Azure റിസോഴ്‌സുകൾ കൈയ്യൊരുക്കി സജ്ജീകരിക്കാൻ ഇഷ്ടമാണെങ്കിൽ, ./infra/provision ഫോൾഡറിലുള്ള നൽകിയ bicep ഫയലുകൾ ഉപയോഗിക്കാവുന്നതാണ്. AI Toolkit കമാൻഡ് പെലറ്റ് ഉപയോഗിക്കാതെ നിങ്ങൾ ഇതിനകം എല്ലാ Azure റിസോഴ്‌സുകളും സജ്ജീകരിച്ചിട്ടുണ്ടെങ്കിൽ, നിങ്ങൾക്ക് തെളിവുകൾ മാത്രം inference.config.json ഫയലിലേക്ക് നൽകിയ റിസോഴ്‌സ് നാമങ്ങൾ എൻട്രി ചെയ്യാവുന്നതാണ്.

ഉദാഹരണത്തിന്:

{
  "SUBSCRIPTION_ID": "<your-subscription-id>",
  "RESOURCE_GROUP_NAME": "<your-resource-group-name>",
  "STORAGE_ACCOUNT_NAME": "<your-storage-account-name>",
  "FILE_SHARE_NAME": "<your-file-share-name>",
  "ACA_APP_NAME": "<your-aca-name>",
  "ACA_APP_ENDPOINT": "<your-aca-endpoint>"
}

ഡിസ്ക്ലെയിമർ: ഈ രേഖ AI വിവർത്തന സേവനമായ Co‑op Translator (https://github.com/Azure/co-op-translator) ഉപയോഗിച്ച് വിവർത്തനം ചെയ്തതാണ്. ഞങ്ങൾ കൃത്യതയ്ക്കായി ശ്രമിച്ചിട്ടുണ്ടെങ്കിലും, ഓട്ടോമാറ്റിക് വിവർത്തനങ്ങളിൽ പിശകുകളും അശുദ്ധികളുമുണ്ടാകാമെന്ന് ദയവായി അറിഞ്ഞിരിക്കുക. മൗലിക ഭാഷയിലെ രേഖയെ അധികാരപരമായ ഉറവിടമായി പരിഗണിക്കുക. നിർണക്കായക വിവരങ്ങൾക്ക് പ്രൊഫഷണൽ മനുഷ്യ വിവർത്തനം ശുപാർശ ചെയ്യപ്പെടുന്നു. ഈ വിവർത്തനം ഉപയോഗിച്ചതിൽ നിന്നുണ്ടാകുന്ന ഏതെങ്കിലും തെറ്റിധാരണകൾക്കോ തെറ്റായ വ്യാഖ്യാനങ്ങൾക്കോ ഞങ്ങൾക്ക് ഉത്തരവാദിത്വമില്ല.