Phi-3.5-Instruct WebGPU RAG Chatbot
February 1, 2026 · View on GitHub
Démo pour présenter WebGPU et le modèle RAG
Le modèle RAG avec Phi-3.5 Onnx hébergé utilise l’approche Retrieval-Augmented Generation, combinant la puissance des modèles Phi-3.5 avec l’hébergement ONNX pour des déploiements IA efficaces. Ce modèle est essentiel pour affiner les modèles sur des tâches spécifiques à un domaine, offrant un équilibre entre qualité, coût et compréhension de contextes longs. Il fait partie de la suite Azure AI, proposant une large sélection de modèles faciles à trouver, tester et utiliser, répondant aux besoins de personnalisation de divers secteurs.
Qu’est-ce que WebGPU
WebGPU est une API graphique web moderne conçue pour offrir un accès efficace au processeur graphique (GPU) d’un appareil directement depuis les navigateurs web. Elle est destinée à succéder à WebGL, avec plusieurs améliorations clés :
- Compatibilité avec les GPU modernes : WebGPU est conçu pour fonctionner parfaitement avec les architectures GPU contemporaines, en s’appuyant sur des API système comme Vulkan, Metal et Direct3D 12.
- Performance améliorée : Elle prend en charge les calculs GPU à usage général et des opérations plus rapides, adaptée aussi bien au rendu graphique qu’aux tâches d’apprentissage automatique.
- Fonctionnalités avancées : WebGPU donne accès à des capacités GPU plus avancées, permettant des charges de travail graphiques et computationnelles plus complexes et dynamiques.
- Réduction de la charge JavaScript : En déléguant davantage de tâches au GPU, WebGPU réduit significativement la charge sur JavaScript, ce qui améliore les performances et la fluidité.
WebGPU est actuellement supporté par des navigateurs comme Google Chrome, avec des travaux en cours pour étendre la prise en charge à d’autres plateformes.
03.WebGPU
Environnement requis :
Navigateurs supportés :
- Google Chrome 113+
- Microsoft Edge 113+
- Safari 18 (macOS 15)
- Firefox Nightly.
Activer WebGPU :
- Sur Chrome/Microsoft Edge
Activez le flag chrome://flags/#enable-unsafe-webgpu.
Ouvrez votre navigateur :
Lancez Google Chrome ou Microsoft Edge.
Accédez à la page des flags :
Dans la barre d’adresse, tapez chrome://flags et appuyez sur Entrée.
Recherchez le flag :
Dans la barre de recherche en haut de la page, tapez 'enable-unsafe-webgpu'
Activez le flag :
Trouvez le flag #enable-unsafe-webgpu dans la liste des résultats.
Cliquez sur le menu déroulant à côté et sélectionnez Activé.
Redémarrez votre navigateur :
Après avoir activé le flag, vous devez redémarrer votre navigateur pour que les modifications prennent effet. Cliquez sur le bouton Relancer qui apparaît en bas de la page.
- Sous Linux, lancez le navigateur avec
--enable-features=Vulkan. - Safari 18 (macOS 15) a WebGPU activé par défaut.
- Dans Firefox Nightly, entrez about:config dans la barre d’adresse et réglez
dom.webgpu.enabledsur true.
Configuration du GPU pour Microsoft Edge
Voici les étapes pour configurer un GPU haute performance pour Microsoft Edge sous Windows :
- Ouvrir les Paramètres : Cliquez sur le menu Démarrer et sélectionnez Paramètres.
- Paramètres système : Allez dans Système puis Affichage.
- Paramètres graphiques : Faites défiler vers le bas et cliquez sur Paramètres graphiques.
- Choisir une application : Sous « Choisir une application pour définir la préférence », sélectionnez Application de bureau puis Parcourir.
- Sélectionner Edge : Naviguez jusqu’au dossier d’installation de Edge (généralement
C:\Program Files (x86)\Microsoft\Edge\Application) et sélectionnezmsedge.exe. - Définir la préférence : Cliquez sur Options, choisissez Haute performance, puis cliquez sur Enregistrer.
Cela garantira que Microsoft Edge utilise votre GPU haute performance pour de meilleures performances. - Redémarrez votre machine pour que ces paramètres soient pris en compte.
Exemples : Veuillez cliquer sur ce lien
Avertissement :
Ce document a été traduit à l’aide du service de traduction automatique Co-op Translator. Bien que nous nous efforcions d’assurer l’exactitude, veuillez noter que les traductions automatiques peuvent contenir des erreurs ou des inexactitudes. Le document original dans sa langue d’origine doit être considéré comme la source faisant foi. Pour les informations critiques, une traduction professionnelle réalisée par un humain est recommandée. Nous déclinons toute responsabilité en cas de malentendus ou de mauvaises interprétations résultant de l’utilisation de cette traduction.