Replace Model_Name
February 1, 2026 · View on GitHub
Phi-familien i GitHub Models
Velkommen til GitHub Models! Vi har alt klar til, at du kan udforske AI-modeller hostet på Azure AI.

For mere information om de modeller, der er tilgængelige på GitHub Models, kan du besøge GitHub Model Marketplace
Tilgængelige modeller
Hver model har en dedikeret playground og eksempelkode

Phi-familien i GitHub Model Catalog
Kom godt i gang
Der er nogle grundlæggende eksempler klar til dig, som du kan køre. Du kan finde dem i samples-mappen. Hvis du vil hoppe direkte til dit foretrukne sprog, kan du finde eksemplerne i følgende sprog:
- Python
- JavaScript
- C#
- Java
- cURL
Der findes også et dedikeret Codespaces-miljø til at køre samples og modeller.

Eksempelkode
Nedenfor er eksempler på kode til nogle få brugsscenarier. For yderligere information om Azure AI Inference SDK, se den fulde dokumentation og samples.
Opsætning
- Opret en personal access token
Du behøver ikke give nogen tilladelser til tokenet. Bemærk, at tokenet vil blive sendt til en Microsoft-tjeneste.
For at bruge kodeeksemplerne nedenfor, opret en miljøvariabel, hvor du sætter dit token som nøgle for klientkoden.
Hvis du bruger bash:
export GITHUB_TOKEN="<your-github-token-goes-here>"
Hvis du bruger powershell:
$Env:GITHUB_TOKEN="<your-github-token-goes-here>"
Hvis du bruger Windows kommandoprompt:
set GITHUB_TOKEN=<your-github-token-goes-here>
Python-eksempel
Installer afhængigheder
Installer Azure AI Inference SDK med pip (kræver: Python >=3.8):
pip install azure-ai-inference
Kør et grundlæggende kodeeksempel
Dette eksempel viser et simpelt kald til chat completion API’en. Det bruger GitHub AI model inference endpoint og dit GitHub-token. Kaldet er synkront.
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential
endpoint = "https://models.inference.ai.azure.com"
model_name = "Phi-4"
token = os.environ["GITHUB_TOKEN"]
client = ChatCompletionsClient(
endpoint=endpoint,
credential=AzureKeyCredential(token),
)
response = client.complete(
messages=[
UserMessage(content="I have \$20,000 in my savings account, where I receive a 4% profit per year and payments twice a year. Can you please tell me how long it will take for me to become a millionaire? Also, can you please explain the math step by step as if you were explaining it to an uneducated person?"),
],
temperature=0.4,
top_p=1.0,
max_tokens=2048,
model=model_name
)
print(response.choices[0].message.content)
Kør en samtale med flere runder
Dette eksempel viser en samtale med flere runder med chat completion API’en. Når du bruger modellen til en chatapplikation, skal du håndtere samtalens historik og sende de seneste beskeder til modellen.
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential
token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
# Replace Model_Name
model_name = "Phi-4"
client = ChatCompletionsClient(
endpoint=endpoint,
credential=AzureKeyCredential(token),
)
messages = [
SystemMessage(content="You are a helpful assistant."),
UserMessage(content="What is the capital of France?"),
AssistantMessage(content="The capital of France is Paris."),
UserMessage(content="What about Spain?"),
]
response = client.complete(messages=messages, model=model_name)
print(response.choices[0].message.content)
Stream outputtet
For en bedre brugeroplevelse vil du gerne streame modellens svar, så det første token vises tidligt, og du undgår at vente på lange svar.
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential
token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"
# Replace Model_Name
model_name = "Phi-4"
client = ChatCompletionsClient(
endpoint=endpoint,
credential=AzureKeyCredential(token),
)
response = client.complete(
stream=True,
messages=[
SystemMessage(content="You are a helpful assistant."),
UserMessage(content="Give me 5 good reasons why I should exercise every day."),
],
model=model_name,
)
for update in response:
if update.choices:
print(update.choices[0].delta.content or "", end="")
client.close()
GRATIS brug og grænser for GitHub Models

Rate limits for playground og gratis API-brug er designet til at hjælpe dig med at eksperimentere med modeller og prototype din AI-applikation. For brug ud over disse grænser, og for at skalere din applikation, skal du tildele ressourcer fra en Azure-konto og autentificere derfra i stedet for med dit GitHub personal access token. Du behøver ikke ændre noget andet i din kode. Brug dette link for at finde ud af, hvordan du kan gå ud over gratisgrænserne i Azure AI.
Oplysninger
Husk, at når du interagerer med en model, eksperimenterer du med AI, så fejl i indhold kan forekomme.
Funktionen er underlagt forskellige begrænsninger (herunder anmodninger pr. minut, anmodninger pr. dag, tokens pr. anmodning og samtidige anmodninger) og er ikke designet til produktionsbrug.
GitHub Models bruger Azure AI Content Safety. Disse filtre kan ikke slås fra som en del af GitHub Models-oplevelsen. Hvis du vælger at bruge modeller gennem en betalt tjeneste, skal du konfigurere dine indholdsfiltre, så de opfylder dine krav.
Denne tjeneste er underlagt GitHubs Pre-release Terms.
Ansvarsfraskrivelse:
Dette dokument er blevet oversat ved hjælp af AI-oversættelsestjenesten Co-op Translator. Selvom vi bestræber os på nøjagtighed, bedes du være opmærksom på, at automatiserede oversættelser kan indeholde fejl eller unøjagtigheder. Det oprindelige dokument på dets oprindelige sprog bør betragtes som den autoritative kilde. For kritisk information anbefales professionel menneskelig oversættelse. Vi påtager os intet ansvar for misforståelser eller fejltolkninger, der opstår som følge af brugen af denne oversættelse.