Famille Phi dans AITK
March 30, 2026 · View on GitHub
AI Toolkit pour VS Code simplifie le développement d'applications d'IA générative en regroupant des outils et modèles de développement IA de pointe issus de Microsoft Foundry Catalog et d'autres catalogues comme Hugging Face. Vous pourrez parcourir le catalogue de modèles IA alimenté par GitHub Models et Microsoft Foundry Model Catalogs, les télécharger localement ou à distance, les affiner, les tester et les utiliser dans votre application.
La préversion d'AI Toolkit s'exécutera localement. L'inférence locale ou l'affinage dépend du modèle que vous avez sélectionné, vous pouvez avoir besoin d'un GPU comme un GPU NVIDIA CUDA. Vous pouvez également exécuter directement les modèles GitHub avec AITK.
Commencer
En savoir plus sur comment installer le sous-système Windows pour Linux
et changer la distribution par défaut.
Répertoire GitHub de AI Toolkit
-
Windows, Linux, macOS
-
Pour l'affinage sur Windows et Linux, un GPU Nvidia est nécessaire. De plus, Windows nécessite le sous-système pour Linux avec une distribution Ubuntu 18.4 ou supérieure. En savoir plus sur comment installer le sous-système Windows pour Linux et changer la distribution par défaut.
Installer AI Toolkit
AI Toolkit est distribué en tant que Extension Visual Studio Code, vous devez donc d'abord installer VS Code, puis télécharger AI Toolkit depuis le VS Marketplace. Le AI Toolkit est disponible dans le Marketplace Visual Studio et peut être installé comme n'importe quelle autre extension VS Code.
Si vous ne connaissez pas l'installation des extensions VS Code, suivez ces étapes :
Connexion
- Dans la barre d’activités de VS Code, sélectionnez Extensions
- Dans la barre de recherche des extensions, tapez "AI Toolkit"
- Sélectionnez "AI Toolkit for Visual Studio code"
- Sélectionnez Installer
Vous êtes maintenant prêt à utiliser l'extension !
Vous serez invité à vous connecter à GitHub, veuillez cliquer sur "Autoriser" pour continuer. Vous serez redirigé vers la page de connexion GitHub.
Veuillez vous connecter et suivre les étapes du processus. Après réussite, vous serez redirigé vers VS Code.
Une fois l'extension installée, vous verrez apparaître l'icône AI Toolkit dans votre barre d'activités.
Explorons les actions disponibles !
Actions disponibles
La barre latérale principale de AI Toolkit est organisée en
- Modèles
- Ressources
- Playground
- Affinage
- Évaluation
sont disponibles dans la section Ressources. Pour commencer, sélectionnez Catalogue de modèles.
Télécharger un modèle depuis le catalogue
Au lancement de AI Toolkit depuis la barre latérale de VS Code, vous pouvez choisir parmi les options suivantes :

- Trouver un modèle pris en charge dans Catalogue de modèles et le télécharger localement
- Tester l'inférence du modèle dans le Playground Modèle
- Affiner le modèle localement ou à distance dans Affinage Modèle
- Déployer les modèles affinés vers le cloud via la palette de commandes pour AI Toolkit
- Évaluer les modèles
Note
GPU vs CPU
Vous remarquerez que les fiches modèles affichent la taille du modèle, la plateforme et le type d’accélérateur (CPU, GPU). Pour des performances optimisées sur les appareils Windows disposant d’au moins un GPU, sélectionnez les versions de modèles ciblant uniquement Windows.
Cela garantit un modèle optimisé pour l'accélérateur DirectML.
Les noms de modèles ont le format suivant :
{model_name}-{accelerator}-{quantization}-{format}.
Pour vérifier si vous disposez d'un GPU sur votre appareil Windows, ouvrez Gestionnaire des tâches, puis sélectionnez l'onglet Performance. Si vous avez des GPU, ils seront listés sous des noms comme "GPU 0" ou "GPU 1".
Exécuter le modèle dans le playground
Une fois tous les paramètres configurés, cliquez sur Générer le projet.
Une fois le modèle téléchargé, sélectionnez Charger dans le Playground sur la fiche du modèle dans le catalogue :
- Lancer le téléchargement du modèle
- Installer tous les prérequis et dépendances
- Créer l’espace de travail VS Code

Utiliser l'API REST dans votre application
AI Toolkit comprend un serveur web API REST local sur le port 5272 qui utilise le format OpenAI chat completions.
Cela vous permet de tester votre application localement sans avoir à dépendre d’un service cloud de modèle IA. Par exemple, le fichier JSON suivant montre comment configurer le corps de la requête :
{
"model": "Phi-4",
"messages": [
{
"role": "user",
"content": "what is the golden ratio?"
}
],
"temperature": 0.7,
"top_p": 1,
"top_k": 10,
"max_tokens": 100,
"stream": true
}
Vous pouvez tester l’API REST avec (par exemple) Postman ou l’outil CURL (Client URL) :
curl -vX POST http://127.0.0.1:5272/v1/chat/completions -H 'Content-Type: application/json' -d @body.json
Utilisation de la bibliothèque cliente OpenAI pour Python
from openai import OpenAI
client = OpenAI(
base_url="http://127.0.0.1:5272/v1/",
api_key="x" # requis pour l'API mais non utilisé
)
chat_completion = client.chat.completions.create(
messages=[
{
"role": "user",
"content": "what is the golden ratio?",
}
],
model="Phi-4",
)
print(chat_completion.choices[0].message.content)
Utilisation de la bibliothèque cliente Azure OpenAI pour .NET
Ajoutez la bibliothèque cliente Azure OpenAI pour .NET à votre projet via NuGet :
dotnet add {project_name} package Azure.AI.OpenAI --version 1.0.0-beta.17
Ajoutez un fichier C# nommé OverridePolicy.cs à votre projet et collez le code suivant :
// OverridePolicy.cs
using Azure.Core.Pipeline;
using Azure.Core;
internal partial class OverrideRequestUriPolicy(Uri overrideUri)
: HttpPipelineSynchronousPolicy
{
private readonly Uri _overrideUri = overrideUri;
public override void OnSendingRequest(HttpMessage message)
{
message.Request.Uri.Reset(_overrideUri);
}
}
Ensuite, collez le code suivant dans votre fichier Program.cs :
// Program.cs
using Azure.AI.OpenAI;
Uri localhostUri = new("http://localhost:5272/v1/chat/completions");
OpenAIClientOptions clientOptions = new();
clientOptions.AddPolicy(
new OverrideRequestUriPolicy(localhostUri),
Azure.Core.HttpPipelinePosition.BeforeTransport);
OpenAIClient client = new(openAIApiKey: "unused", clientOptions);
ChatCompletionsOptions options = new()
{
DeploymentName = "Phi-4",
Messages =
{
new ChatRequestSystemMessage("You are a helpful assistant. Be brief and succinct."),
new ChatRequestUserMessage("What is the golden ratio?"),
}
};
StreamingResponse<StreamingChatCompletionsUpdate> streamingChatResponse
= await client.GetChatCompletionsStreamingAsync(options);
await foreach (StreamingChatCompletionsUpdate chatChunk in streamingChatResponse)
{
Console.Write(chatChunk.ContentUpdate);
}
Affinage avec AI Toolkit
- Commencez par la découverte des modèles et le playground.
- Affinage et inférence de modèles en utilisant les ressources de calcul locales.
- Affinage et inférence à distance en utilisant les ressources Azure
Ressources Q&R AI Toolkit
Veuillez consulter notre page Q&R pour les problèmes et solutions les plus courants.
Avertissement :
Ce document a été traduit à l’aide du service de traduction automatique Co-op Translator. Bien que nous nous efforcions d’assurer l’exactitude, veuillez noter que les traductions automatiques peuvent comporter des erreurs ou des inexactitudes. Le document original dans sa langue d’origine doit être considéré comme la source faisant autorité. Pour les informations critiques, il est recommandé de recourir à une traduction professionnelle réalisée par un humain. Nous déclinons toute responsabilité en cas de malentendus ou de mauvaises interprétations résultant de l’utilisation de cette traduction.