Après l’introduction de Copilot, son dernier assistant connecté pour Windows 11, Microsoft fait à nouveau progresser l’intégration de l’IA générative dans Windows. Lors de la conférence des développeurs Ignite 2023 qui se tient actuellement à Seattle, Microsoft a annoncé un partenariat avec NVIDIA sur TensorRT-LLM qui promet d’améliorer les expériences des utilisateurs sur les ordinateurs de bureau et les ordinateurs portables Windows équipés de GPU RTX.

La nouvelle version devrait prendre en charge de nouveaux modèles de langage volumineux, rendant ainsi plus accessibles les charges de travail exigeantes en matière d’IA. Il convient de souligner sa compatibilité avec l’API Chat d’OpenAI, qui permet une exécution locale (plutôt que dans le cloud) sur les PC et les stations de travail dotés de GPU RTX à partir de 8 Go de VRAM.

La bibliothèque TensorRT-LLM de NVIDIA a été publiée le mois dernier et est censée améliorer les performances des modèles de Large Language Models (LLM) utilisant les Tensor Cores sur les cartes graphiques RTX. Elle fournit aux développeurs une API Python pour définir des LLM et construire des moteurs TensorRT plus rapidement sans connaissances approfondies en C++ ou CUDA.

Avec la sortie de TensorRT-LLM v0.6.0, la navigation dans les complexités des projets d’IA générative personnalisés sera simplifiée grâce à l’introduction d’AI Workbench. Il s’agit d’une boîte à outils unifiée facilitant la création, le test et la personnalisation rapides de modèles d’IA générative et de LLM pré-entraînés. La plateforme devrait également permettre aux développeurs de rationaliser la collaboration et le déploiement, garantissant ainsi un développement de modèles efficace et évolutif.

Conscients de l’importance de soutenir les développeurs d’IA, NVIDIA et Microsoft publient également des améliorations DirectML. Ces optimisations accélèrent les modèles d’IA fondamentaux tels que Llama 2 et Stable Diffusion, offrant aux développeurs davantage d’options pour le déploiement inter-fournisseurs et établissant de nouvelles normes de performance.

Un fonctionnement local

La nouvelle mise à jour de la bibliothèque TensorRT-LLM promet également une amélioration substantielle des performances d’inférence, avec des vitesses jusqu’à 5x plus rapides. Cette mise à jour étend également la prise en charge d’autres LLM populaires, notamment Mistral 7B et Nemotron-3 8B, et étend les capacités des LLM locaux rapides et précis à une gamme plus large d’appareils Windows portables.

L’intégration de TensorRT-LLM pour Windows avec l’API Chat d’OpenAI par le biais d’un nouveau wrapper permettra à des centaines de projets et d’applications basés sur l’IA de fonctionner localement sur des PC équipés de RTX. Il ne sera donc plus nécessaire de s’appuyer sur des services sur le cloud et de garantir la sécurité des données privées et exclusives sur les PC sous Windows 11.

L’avenir de l’IA sur les PC dotés de Windows 11 a encore un long chemin à parcourir. Les modèles d’IA étant de plus en plus disponibles et les développeurs continuant à innover, l’exploitation de la puissance des GPU RTX de NVIDIA pourrait changer la donne. Cependant, il est encore trop tôt pour dire s’il s’agira de la dernière pièce du puzzle dont Microsoft a désespérément besoin pour libérer pleinement les capacités de l’IA sur les PC Windows.

Reddit en panne : Impossible d’accéder aux subreddits !

YouTube Music Recap 2024 : Découvrez vos artistes et chansons préférés de l’année

Windows 11 sur Meta Quest 3 : Travaillez en VR avec votre PC !

Bose acquiert McIntosh Group : L’audio de luxe et l’automobile révolutionnés ?

Test du Lenovo Yoga 9i (2024) : Le 2-en-1 premium se perfectionne avec la puce Intel Core Ultra

Test du Honor Magic V3 : Le smartphone pliable le plus fin du monde est arrivé !

Test du FlexiSpot E7 Pro : Le bureau debout qui allie robustesse, stabilité et design élégant

Test du Google Pixel 9 Pro XL, l’IA et l’autonomie révolutionnent le smartphone

OPPO Reno 13 et 13 Pro : Performances boostées avec le Dimensity 8350 et design élégant

Oura s’associe à Dexcom pour intégrer le suivi du glucose à sa bague connectée

Android 16 : Vos dossiers médicaux disponibles dans Health Connect au format FHIR !

OnePlus Pad Pro de 13 pouces : Plus grand pour encore plus de possibilités ?

Snapdragon X Elite Gen 2 : Le PC Windows du futur avec Oryon v3 ?

ChatGPT-5 : OpenAI face à des défis majeurs dans sa quête de l’IA avancée

ChatGPT: Le mode vocal avancé de OpenAI s’étend au Web !

Google Pixel Laptop : Un retour en force sur le marché des ordinateurs portables ?

Octoverse 2024 : Python détrône JavaScript sur GitHub !

GitHub Copilot : Multi-modèles, Xcode et nouvelles fonctionnalités pour les développeurs

Copilot Chat : GitHub intègre les modèles d’IA d’Anthropic et Google !

Samsung Health SDK : la boîte à outils ultime pour les développeurs d’applications santé

Bluesky : Le guide complet pour débuter et maîtriser l’alternative à X

Notion : Formulaires, e-mails et IA pour une productivité maximale !

Sky Follower Bridge : Retrouvez vos contacts X sur Bluesky !

ChatGPT Search : Découvrez les fonctionnalités qui révolutionnent la recherche en ligne

Windows 11 exploitera bientôt votre GPU pour l’IA générative

Un fonctionnement local

Les utilisateurs de l’iPhone 14 bénéficieront d’un SOS par satellite pendant une année supplémentaire gratuite

La vidéo 1080p Premium de YouTube est désormais disponible sur un plus grand nombre d’appareils

The author Yohann Poiron

Windows 11 exploitera bientôt votre GPU pour l’IA générative

Un fonctionnement local

The author Yohann Poiron

vous pourriez aussi aimer