Famille Phi dans AITK

March 30, 2026 · View on GitHub

AI Toolkit pour VS Code simplifie le développement d'applications d'IA générative en regroupant des outils et modèles de développement IA de pointe issus de Microsoft Foundry Catalog et d'autres catalogues comme Hugging Face. Vous pourrez parcourir le catalogue de modèles IA alimenté par GitHub Models et Microsoft Foundry Model Catalogs, les télécharger localement ou à distance, les affiner, les tester et les utiliser dans votre application.

La préversion d'AI Toolkit s'exécutera localement. L'inférence locale ou l'affinage dépend du modèle que vous avez sélectionné, vous pouvez avoir besoin d'un GPU comme un GPU NVIDIA CUDA. Vous pouvez également exécuter directement les modèles GitHub avec AITK.

Commencer

En savoir plus sur comment installer le sous-système Windows pour Linux

et changer la distribution par défaut.

Répertoire GitHub de AI Toolkit

Windows, Linux, macOS
Pour l'affinage sur Windows et Linux, un GPU Nvidia est nécessaire. De plus, Windows nécessite le sous-système pour Linux avec une distribution Ubuntu 18.4 ou supérieure. En savoir plus sur comment installer le sous-système Windows pour Linux et changer la distribution par défaut.

Installer AI Toolkit

AI Toolkit est distribué en tant que Extension Visual Studio Code, vous devez donc d'abord installer VS Code, puis télécharger AI Toolkit depuis le VS Marketplace. Le AI Toolkit est disponible dans le Marketplace Visual Studio et peut être installé comme n'importe quelle autre extension VS Code.

Si vous ne connaissez pas l'installation des extensions VS Code, suivez ces étapes :

Connexion

Dans la barre d’activités de VS Code, sélectionnez Extensions
Dans la barre de recherche des extensions, tapez "AI Toolkit"
Sélectionnez "AI Toolkit for Visual Studio code"
Sélectionnez Installer

Vous êtes maintenant prêt à utiliser l'extension !

Vous serez invité à vous connecter à GitHub, veuillez cliquer sur "Autoriser" pour continuer. Vous serez redirigé vers la page de connexion GitHub.

Veuillez vous connecter et suivre les étapes du processus. Après réussite, vous serez redirigé vers VS Code.

Une fois l'extension installée, vous verrez apparaître l'icône AI Toolkit dans votre barre d'activités.

Explorons les actions disponibles !

Actions disponibles

La barre latérale principale de AI Toolkit est organisée en

Modèles
Ressources
Playground
Affinage
Évaluation

sont disponibles dans la section Ressources. Pour commencer, sélectionnez Catalogue de modèles.

Télécharger un modèle depuis le catalogue

Au lancement de AI Toolkit depuis la barre latérale de VS Code, vous pouvez choisir parmi les options suivantes :

Catalogue de modèles AI toolkit

Trouver un modèle pris en charge dans Catalogue de modèles et le télécharger localement
Tester l'inférence du modèle dans le Playground Modèle
Affiner le modèle localement ou à distance dans Affinage Modèle
Déployer les modèles affinés vers le cloud via la palette de commandes pour AI Toolkit
Évaluer les modèles

Note

GPU vs CPU

Vous remarquerez que les fiches modèles affichent la taille du modèle, la plateforme et le type d’accélérateur (CPU, GPU). Pour des performances optimisées sur les appareils Windows disposant d’au moins un GPU, sélectionnez les versions de modèles ciblant uniquement Windows.

Cela garantit un modèle optimisé pour l'accélérateur DirectML.

Les noms de modèles ont le format suivant :

{model_name}-{accelerator}-{quantization}-{format}.

Pour vérifier si vous disposez d'un GPU sur votre appareil Windows, ouvrez Gestionnaire des tâches, puis sélectionnez l'onglet Performance. Si vous avez des GPU, ils seront listés sous des noms comme "GPU 0" ou "GPU 1".

Exécuter le modèle dans le playground

Une fois tous les paramètres configurés, cliquez sur Générer le projet.

Une fois le modèle téléchargé, sélectionnez Charger dans le Playground sur la fiche du modèle dans le catalogue :

Lancer le téléchargement du modèle
Installer tous les prérequis et dépendances
Créer l’espace de travail VS Code

Charger le modèle dans le playground

Utiliser l'API REST dans votre application

AI Toolkit comprend un serveur web API REST local sur le port 5272 qui utilise le format OpenAI chat completions.

Cela vous permet de tester votre application localement sans avoir à dépendre d’un service cloud de modèle IA. Par exemple, le fichier JSON suivant montre comment configurer le corps de la requête :

{
    "model": "Phi-4",
    "messages": [
        {
            "role": "user",
            "content": "what is the golden ratio?"
        }
    ],
    "temperature": 0.7,
    "top_p": 1,
    "top_k": 10,
    "max_tokens": 100,
    "stream": true
}

Vous pouvez tester l’API REST avec (par exemple) Postman ou l’outil CURL (Client URL) :

curl -vX POST http://127.0.0.1:5272/v1/chat/completions -H 'Content-Type: application/json' -d @body.json

Utilisation de la bibliothèque cliente OpenAI pour Python

from openai import OpenAI

client = OpenAI(
    base_url="http://127.0.0.1:5272/v1/", 
    api_key="x" # requis pour l'API mais non utilisé
)

chat_completion = client.chat.completions.create(
    messages=[
        {
            "role": "user",
            "content": "what is the golden ratio?",
        }
    ],
    model="Phi-4",
)

print(chat_completion.choices[0].message.content)

Utilisation de la bibliothèque cliente Azure OpenAI pour .NET

Ajoutez la bibliothèque cliente Azure OpenAI pour .NET à votre projet via NuGet :

dotnet add {project_name} package Azure.AI.OpenAI --version 1.0.0-beta.17

Ajoutez un fichier C# nommé OverridePolicy.cs à votre projet et collez le code suivant :

// OverridePolicy.cs
using Azure.Core.Pipeline;
using Azure.Core;

internal partial class OverrideRequestUriPolicy(Uri overrideUri)
    : HttpPipelineSynchronousPolicy
{
    private readonly Uri _overrideUri = overrideUri;

    public override void OnSendingRequest(HttpMessage message)
    {
        message.Request.Uri.Reset(_overrideUri);
    }
}

Ensuite, collez le code suivant dans votre fichier Program.cs :

// Program.cs
using Azure.AI.OpenAI;

Uri localhostUri = new("http://localhost:5272/v1/chat/completions");

OpenAIClientOptions clientOptions = new();
clientOptions.AddPolicy(
    new OverrideRequestUriPolicy(localhostUri),
    Azure.Core.HttpPipelinePosition.BeforeTransport);
OpenAIClient client = new(openAIApiKey: "unused", clientOptions);

ChatCompletionsOptions options = new()
{
    DeploymentName = "Phi-4",
    Messages =
    {
        new ChatRequestSystemMessage("You are a helpful assistant. Be brief and succinct."),
        new ChatRequestUserMessage("What is the golden ratio?"),
    }
};

StreamingResponse<StreamingChatCompletionsUpdate> streamingChatResponse
    = await client.GetChatCompletionsStreamingAsync(options);

await foreach (StreamingChatCompletionsUpdate chatChunk in streamingChatResponse)
{
    Console.Write(chatChunk.ContentUpdate);
}

Affinage avec AI Toolkit

Commencez par la découverte des modèles et le playground.
Affinage et inférence de modèles en utilisant les ressources de calcul locales.
Affinage et inférence à distance en utilisant les ressources Azure

Affinage avec AI Toolkit

Ressources Q&R AI Toolkit

Veuillez consulter notre page Q&R pour les problèmes et solutions les plus courants.

Avertissement :
Ce document a été traduit à l’aide du service de traduction automatique Co-op Translator. Bien que nous nous efforcions d’assurer l’exactitude, veuillez noter que les traductions automatiques peuvent comporter des erreurs ou des inexactitudes. Le document original dans sa langue d’origine doit être considéré comme la source faisant autorité. Pour les informations critiques, il est recommandé de recourir à une traduction professionnelle réalisée par un humain. Nous déclinons toute responsabilité en cas de malentendus ou de mauvaises interprétations résultant de l’utilisation de cette traduction.