Replace Model_Name
February 1, 2026 · View on GitHub
GitHub Models में Phi परिवार
GitHub Models में आपका स्वागत है! हमने Azure AI पर होस्ट किए गए AI मॉडल्स को एक्सप्लोर करने के लिए सब कुछ तैयार कर रखा है।

GitHub Models पर उपलब्ध मॉडल्स के बारे में अधिक जानकारी के लिए, GitHub Model Marketplace देखें।
उपलब्ध मॉडल्स
प्रत्येक मॉडल के लिए एक समर्पित प्लेग्राउंड और सैंपल कोड उपलब्ध है।

GitHub Model कैटलॉग में Phi परिवार
शुरुआत कैसे करें
कुछ बेसिक उदाहरण आपके लिए तैयार हैं जिन्हें आप चला सकते हैं। आप इन्हें samples डायरेक्टरी में पा सकते हैं। यदि आप सीधे अपनी पसंदीदा भाषा में जाना चाहते हैं, तो उदाहरण निम्न भाषाओं में उपलब्ध हैं:
- Python
- JavaScript
- C#
- Java
- cURL
सैंपल्स और मॉडल्स चलाने के लिए एक समर्पित Codespaces Environment भी उपलब्ध है।

सैंपल कोड
नीचे कुछ उपयोग मामलों के लिए उदाहरण कोड स्निपेट्स दिए गए हैं। Azure AI Inference SDK के बारे में अधिक जानकारी के लिए, पूर्ण दस्तावेज़ और सैंपल देखें।
सेटअप
- एक personal access token बनाएं
आपको टोकन के लिए कोई विशेष अनुमति देने की जरूरत नहीं है। ध्यान दें कि यह टोकन Microsoft सेवा को भेजा जाएगा।
नीचे दिए गए कोड स्निपेट्स का उपयोग करने के लिए, अपने टोकन को क्लाइंट कोड के लिए कुंजी के रूप में सेट करने के लिए एक environment variable बनाएं।
यदि आप bash का उपयोग कर रहे हैं:
export GITHUB_TOKEN="<your-github-token-goes-here>"
यदि आप powershell में हैं:
$Env:GITHUB_TOKEN="<your-github-token-goes-here>"
यदि आप Windows command prompt का उपयोग कर रहे हैं:
set GITHUB_TOKEN=<your-github-token-goes-here>
Python सैंपल
निर्भरताएँ इंस्टॉल करें
pip के माध्यम से Azure AI Inference SDK इंस्टॉल करें (आवश्यक: Python >=3.8):
pip install azure-ai-inference
एक बेसिक कोड सैंपल चलाएं
यह सैंपल chat completion API को बेसिक कॉल दिखाता है। यह GitHub AI मॉडल inference endpoint और आपके GitHub टोकन का उपयोग करता है। कॉल synchronous है।
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential
endpoint = "https://models.inference.ai.azure.com"
model_name = "Phi-4"
token = os.environ["GITHUB_TOKEN"]
client = ChatCompletionsClient(
endpoint=endpoint,
credential=AzureKeyCredential(token),
)
response = client.complete(
messages=[
UserMessage(content="I have \$20,000 in my savings account, where I receive a 4% profit per year and payments twice a year. Can you please tell me how long it will take for me to become a millionaire? Also, can you please explain the math step by step as if you were explaining it to an uneducated person?"),
],
temperature=0.4,
top_p=1.0,
max_tokens=2048,
model=model_name
)
print(response.choices[0].message.content)
मल्टी-टर्न बातचीत चलाएं
यह सैंपल chat completion API के साथ मल्टी-टर्न बातचीत दिखाता है। जब आप मॉडल को चैट एप्लिकेशन के लिए उपयोग करते हैं, तो आपको उस बातचीत का इतिहास संभालना होगा और नवीनतम संदेश मॉडल को भेजने होंगे।
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential
token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
# Replace Model_Name
model_name = "Phi-4"
client = ChatCompletionsClient(
endpoint=endpoint,
credential=AzureKeyCredential(token),
)
messages = [
SystemMessage(content="You are a helpful assistant."),
UserMessage(content="What is the capital of France?"),
AssistantMessage(content="The capital of France is Paris."),
UserMessage(content="What about Spain?"),
]
response = client.complete(messages=messages, model=model_name)
print(response.choices[0].message.content)
आउटपुट स्ट्रीम करें
बेहतर उपयोगकर्ता अनुभव के लिए, आप मॉडल के जवाब को स्ट्रीम करना चाहेंगे ताकि पहला टोकन जल्दी दिखे और आपको लंबे जवाब का इंतजार न करना पड़े।
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential
token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
# Replace Model_Name
model_name = "Phi-4"
client = ChatCompletionsClient(
endpoint=endpoint,
credential=AzureKeyCredential(token),
)
response = client.complete(
stream=True,
messages=[
SystemMessage(content="You are a helpful assistant."),
UserMessage(content="Give me 5 good reasons why I should exercise every day."),
],
model=model_name,
)
for update in response:
if update.choices:
print(update.choices[0].delta.content or "", end="")
client.close()
GitHub Models के लिए मुफ्त उपयोग और दर सीमाएँ

प्लेग्राउंड और मुफ्त API उपयोग के लिए दर सीमाएँ आपको मॉडल्स के साथ प्रयोग करने और अपने AI एप्लिकेशन का प्रोटोटाइप बनाने में मदद करने के लिए हैं। इन सीमाओं से आगे उपयोग के लिए, और अपने एप्लिकेशन को स्केल पर लाने के लिए, आपको Azure खाते से संसाधन प्रावधान करना होगा, और वहां से प्रमाणीकरण करना होगा न कि अपने GitHub personal access token से। आपको अपने कोड में कुछ भी बदलने की जरूरत नहीं है। Azure AI में मुफ्त स्तर की सीमाओं से आगे कैसे बढ़ें, यह जानने के लिए इस लिंक का उपयोग करें।
खुलासे
जब आप किसी मॉडल के साथ इंटरैक्ट कर रहे होते हैं, तो याद रखें कि आप AI के साथ प्रयोग कर रहे हैं, इसलिए सामग्री में गलतियाँ हो सकती हैं।
यह फीचर विभिन्न सीमाओं (जैसे प्रति मिनट अनुरोध, प्रति दिन अनुरोध, प्रति अनुरोध टोकन, और समवर्ती अनुरोध) के अधीन है और इसे प्रोडक्शन उपयोग के लिए डिज़ाइन नहीं किया गया है।
GitHub Models Azure AI Content Safety का उपयोग करता है। ये फ़िल्टर GitHub Models अनुभव के हिस्से के रूप में बंद नहीं किए जा सकते। यदि आप भुगतान किए गए सेवा के माध्यम से मॉडल का उपयोग करने का निर्णय लेते हैं, तो कृपया अपनी सामग्री फ़िल्टर को अपनी आवश्यकताओं के अनुसार कॉन्फ़िगर करें।
यह सेवा GitHub के Pre-release Terms के अधीन है।
अस्वीकरण:
यह दस्तावेज़ AI अनुवाद सेवा Co-op Translator का उपयोग करके अनुवादित किया गया है। जबकि हम सटीकता के लिए प्रयासरत हैं, कृपया ध्यान दें कि स्वचालित अनुवादों में त्रुटियाँ या अशुद्धियाँ हो सकती हैं। मूल दस्तावेज़ अपनी मूल भाषा में ही अधिकारिक स्रोत माना जाना चाहिए। महत्वपूर्ण जानकारी के लिए, पेशेवर मानव अनुवाद की सलाह दी जाती है। इस अनुवाद के उपयोग से उत्पन्न किसी भी गलतफहमी या गलत व्याख्या के लिए हम जिम्मेदार नहीं हैं।