fermer

Intelligence Artificielle

L’intelligence artificielle (IA) transforme de nombreux secteurs, de la santé à la finance, en passant par l’éducation et la sécurité. Explorez comment l’IA est utilisée pour automatiser des tâches, augmenter l’efficacité et créer de nouvelles opportunités de marché.

Nos discussions incluent également les défis éthiques et les implications sociétales de l’adoption de l’IA, fournissant une perspective équilibrée sur ce développement technologique clé.

Intelligence Artificielle

L’IA de Bing Chat peut désormais comprendre vos photos

bing ia chatgpt

Bing Chat, ChatGPT et d’autres outils d’IA générative analogues se sont principalement concentrés sur la compréhension du contenu textuel et la fourniture de réponses. Cependant, il est également très utile de comprendre les images, et c’est ce que Microsoft est en train de déployer dans son IA Bing Chat.

Dans un récent article de blog annonçant Bing Chat Entreprise, Microsoft a annoncé une nouvelle fonctionnalité pour Bing Chat, appelée Visual Search. Avec Visual Search, vous pouvez télécharger une image ou sélectionner une image existante sur le Web, et Bing essaiera de la comprendre et d’utiliser ce contexte dans ses réponses. La vidéo de démonstration de Microsoft (intégrée ci-dessous) montre quelqu’un qui télécharge une maquette dessinée à la main d’un formulaire Web et demande à Bing de générer du code HTML et CSS pour le rendre fonctionnel.

Microsoft explique dans son article de blog : « Que vous soyez en vacances dans une nouvelle ville et que vous posiez des questions sur l’architecture d’un bâtiment particulier où que vous soyez à la maison et que vous essayiez de trouver des idées de repas en fonction du contenu de votre réfrigérateur, téléchargez l’image dans Bing Chat et utilisez-la pour exploiter les connaissances du Web afin d’obtenir des réponses ».

Les logiciels capables de détecter le contenu des images ne sont pas nouveaux. Google Lens est capable d’identifier des personnes, des animaux, des plantes, des points de repère et d’autres objets dans des photos depuis 2017, et son prédécesseur plus limité Google Goggles remonte à 2010. Microsoft utilise les fonctionnalités de détection d’images de GPT-4, qui est le même modèle de langage utilisé par la version premium de ChatGPT. Cependant, les entrées d’images ne sont pas encore disponibles dans ChatGPT, c’est donc la première fois que nous voyons cette fonctionnalité largement disponible.

J’ai essayé la recherche visuelle avec quelques photos, et les résultats sont impressionnants. En demandant à Bing de décrire des images, vous obtenez des réponses beaucoup plus détaillées que celles fournies par Google Lens.

Vous pouvez tester la fonctionnalité en ouvrant Bing Chat dans Microsoft Edge (Microsoft la bloque toujours dans les autres navigateurs) et en cliquant sur l’icône du contour de l’appareil photo dans le champ de texte.

Lire plus
Intelligence Artificielle

Google teste un modèle d’IA capable de générer du contenu d’actualité

the climate reality project Hb6uWq0i4MI unsplash

Vous êtes probablement déjà fatigué d’entendre parler d’intelligence artificielle, mais deviner quoi : l’intelligence artificielle est là pour rester, et elle pourrait non seulement faire les gros titres des journaux, mais aussi écrire les journaux eux-mêmes.

L’IA progressant à un rythme exponentiel, il semble que tout le monde craigne une prise de contrôle potentielle par l’IA. Or, il semblerait que Google soit en train de tester un nouveau modèle d’IA qui pourrait faire frémir les journalistes.

Google a révélé dans un tweet officiel qu’il testait un nouveau modèle d’IA baptisé Genesis, qui aidera les journalistes à mieux rédiger leurs articles. Il semble que le New York Times, le Washington Post et News Corp. aient déjà vu ce que ce nouvel outil d’IA peut faire.

Vous devez vous demander comment cette IA fonctionnera exactement. Eh bien, il semble que l’IA rassemblera le contenu et les ressources nécessaires concernant les événements actuels afin d’élaborer un article d’actualité en rapport avec ce scénario. Toutefois, des sources fiables ont révélé au New York Times que Google est en train de concevoir un « outil responsable » qui a pour seul but de faciliter le travail des journalistes afin qu’ils puissent se concentrer sur des choses plus importantes. Cela signifie que sans une contribution humaine constante, ce modèle ne pourra pas fonctionner et qu’il n’est en aucun cas destiné à être automatisé à 100 %.

Google cherche-t-il à remplacer les journalistes ?

Un porte-parole de Google a déclaré : « Tout simplement, ces outils ne sont pas destinés à, et ne peuvent pas, remplacer le rôle essentiel des journalistes dans le reportage, la création et la vérification des faits de leurs articles. Ils pourraient offrir des options pour les titres et d’autres styles d’écriture ».

Imaginez, par exemple, comment cet article aurait été rédigé avec l’outil Genesis. J’aurais entré quelques informations dans l’outil, comme le nom de la source et quelques informations sur Google et son nouveau projet, comme son nom et le fait qu’il utilise l’IA, et c’est tout. Mon travail serait fait, et je n’aurais plus qu’à copier et coller l’article généré par l’IA et à le partager avec vous. Je ne peux m’empêcher de me poser des questions : serai-je même nécessaire dans ce processus ?

Pour rappel, le site populaire CNET a utilisé des outils d’IA pour générer des articles. Tôt ou tard, nous recevrons donc notre tout premier article généré par l’IA. Ce n’est qu’une question de temps. Étant donné les antécédents de l’IA en matière d’exactitude et de légitimité de l’information, le scepticisme est plus que justifié. Nous sommes à un stade où la frontière entre le contenu organique et le contenu généré par l’IA s’est estompée au point d’être méconnaissable. Seul l’avenir nous dira comment Google s’y prendra pour remédier à cette incohérence et garantir l’exactitude et l’authenticité à 100 %.

Que pensez-vous de cette nouvelle révélation ? Êtes-vous convaincu de l’approche adoptée par Google ? L’avenir du journalisme étant entre les mains de l’IA, serez-vous à l’aise avec les informations que vous recevez ?

Lire plus
Intelligence Artificielle

ChatGPT peut maintenant se souvenir de qui vous êtes et de ce que vous voulez

Capture decran 2023 07 21 08.16.52

OpenAI permet aux utilisateurs d’obtenir plus facilement des réponses de ChatGPT en rapport avec leur domaine de travail et leurs centres d’intérêt.

Appelées instructions personnalisées, il s’agit essentiellement d’informations personnelles et de scénarios spécifiques qui influencent les types de réponses que vous obtenez du chatbot. « ChatGPT prendra en compte vos instructions personnalisées pour chaque conversation à venir », explique OpenAI dans un article de blog. Par exemple, si vos instructions personnalisées indiquent à ChatGPT que vous êtes un élève de troisième, il répondra aux questions d’une manière adaptée à ce niveau scolaire.

Il y a deux avantages à cela. Tout d’abord, vous n’avez pas besoin de préciser que vous êtes un élève de troisième à chaque fois que vous entrez dans une invite — l’IA le sait déjà et répondra en conséquence. C’est un peu comme la fonction de conversation de Google Assistant, qui ne vous demande plus de dire « Hey Google » avant chaque requête. Deuxièmement, les instructions personnalisées réduisent considérablement le champ d’action du chatbot, en l’aidant à trouver la bonne réponse. Cette capacité sera très utile aux personnes de tous niveaux d’éducation et à celles qui recherchent des réponses adaptées à un rôle ou à une tâche spécifique plutôt que des réponses génériques.

ChatGPT se souvient essentiellement de vous et de vos besoins, et vous fournira les réponses que vous cherchez.

Capture decran 2023 07 21 08.17.15 jpg

Encore à peaufiner

Les instructions personnalisées sont désormais disponibles en phase bêta, mais la fonction est limitée à l’abonnement ChatGPT Plus, qui coûte 20 dollars par mois. Elle est accessible à partir de l’application mobile, de l’interface de bureau et même avec des plug-ins tiers. Cependant, elle n’est pas disponible pour les utilisateurs de l’Union européenne.

La fonction ChatGPT étant encore en version bêta, il peut y avoir quelques problèmes de performance. Par exemple, dans un exemple donné à The Verge, si vos instructions personnalisées indiquent au chatbot que vous êtes un codeur qui travaille dans un langage particulier, il se peut que vous receviez des recettes de cuisine écrites dans ce code au lieu du format plus traditionnel attendu. « ChatGPT n’interprète pas toujours parfaitement les instructions personnalisées — il peut parfois les ignorer ou les appliquer alors que ce n’est pas prévu », prévient l’entreprise sur son site Web.

Aussi pratiques qu’elles puissent paraître, les instructions personnalisées peuvent également présenter des risques pour la vie privée, puisque vous indiquez essentiellement à un chatbot IA votre profession, vos domaines d’expertise et/ou votre niveau d’études. L’entreprise conseille de ne déployer des instructions personnalisées que pour les plug-ins auxquels vous faites confiance. Cependant, OpenAI promet qu’elle supprimera les « identifiants personnels » qu’elle trouvera dans les instructions personnalisées. Et tout comme les conversations standard de ChatGPT, les interactions personnalisées ne répondront pas si elles violent les politiques de sécurité. Vous pouvez également choisir de les modifier ou de les supprimer à votre convenance, mais elles apparaîtront en tant que telles dans votre historique de chat, à moins que vous ne les effaciez également.

Lire plus
Intelligence Artificielle

Le nouveau concurrent ChatGPT de Meta est Llama 2

Next generation of Llama 2 AI he

ChatGPT est l’un des chatbots d’IA générative les plus populaires (si ce n’est le plus populaire), et son modèle de langage GPT sous-jacent alimente de nombreux autres services. L’entreprise anciennement connue sous le nom de Facebook, Meta, s’est maintenant associée à Microsoft pour créer une alternative : Llama 2.

Oui, vous avez bien lu ! Meta a collaboré avec Microsoft pour faire une incursion dans le secteur commercial de l’IA. Avec cette entrée dans le secteur commercial de l’IA, Meta vise à affronter Bard de Google, Bing AI de Microsoft et ChatGPT d’OpenAI, les grands noms de cet espace.

Llama a été initialement publié en février 2023 en tant que Large Language Model, mais contrairement au modèle GPT qui alimente ChatGPT et Bing Chat, il n’a pas été conçu comme un chatbot à usage général. Au contraire, il était fourni sous une licence non commerciale et destiné à des fins de recherche, telles que l’analyse d’ensembles de données, pour des groupes tels que les universités et les ONG. Au moins une version du modèle pouvait également fonctionner sans puissant serveur — après avoir été entraîné, le modèle LLaMA-13B pouvait fonctionner avec un seul GPU NVIDIA Tesla V100 que l’on retrouve dans un datacenter. Cependant, le modèle Llama a fait l’objet d’une fuite en ligne une semaine après sa présentation. Plus récemment, il a fait l’objet d’un procès intenté par Sarah Silverman et deux autres auteurs, qui affirment que Llama et ChatGPT d’OpenAI utilisent leurs livres protégés par des droits d’auteur comme données d’entraînement sans leur autorisation.

Meta vient d’introduire Llama 2, qui est disponible gratuitement pour la recherche et l’utilisation commerciale, et qui est également open source. Les modèles GPT-3.5 et GPT-4 d’OpenAI ne sont ni gratuits ni libres. Comme la version originale, ils sont conçus pour être entraînés sur des ensembles de données personnalisés, tels que des bases de données de recherche ou de la documentation logicielle.

Le mot d’ordre le plus important concernant la sortie de Llama 2 est « open source ». Cela signifie que le code source et les paramètres de Llama 2 sont rendus publics (uniquement pour les chercheurs et les entreprises partenaires pour le moment). Meta pense qu’en rendant son modèle de langage large (LLM) open source, les entreprises, les startups, les entrepreneurs et les chercheurs peuvent créer des avancées et des percées évolutives pilotées par des machines. Cela permettra également aux développeurs et aux chercheurs d’améliorer encore le modèle d’IA et de corriger les vulnérabilités au fur et à mesure qu’elles apparaissent, en temps réel.

Un partenariat avec Microsoft

Meta s’est également associé à Microsoft pour faciliter le déploiement de Llama 2 sur les serveurs.

LlaMa 2 technical specifications jpg

Meta a déclaré dans son annonce : « Nous sommes maintenant prêts à ouvrir la source de la prochaine version de Llama 2 et à la rendre disponible gratuitement pour la recherche et l’utilisation commerciale. Nous incluons les poids du modèle et le code de départ pour le modèle pré-entraîné et les versions conversationnelles affinées également. » La documentation explique : « Les modèles pré-entraînés de Llama 2 sont entraînés sur 2 billions de tokens et ont une longueur de contexte deux fois supérieure à celle de Llama 1. Ses modèles affinés ont été entraînés sur plus d’un million d’annotations humaines. Llama 2 a été entraîné sur des sources de données en ligne accessibles au public. Le modèle affiné, Llama-2-chat, exploite des ensembles de données d’instruction accessibles au public et plus d’un million d’annotations humaines ».

Il n’existe pas encore de chatbot Llama 2, mais il se peut que vous utilisiez dans un proche avenir une application ou un outil d’IA utilisant Llama.

Lire plus
Intelligence Artificielle

Apple testerait un chatbot IA « Apple GPT », mais ne sait pas du tout ce qu’il va en faire

siri glow

Bien sûr, Apple est en train de créer son propre chatbot alimenté par l’IA, que certains ingénieurs appellent « Apple GPT », selon un rapport de Bloomberg. L’entreprise n’aurait pas encore de projet concret pour rendre cette technologie accessible au public.

Comme l’indique Bloomberg, le chatbot utilise son propre modèle de grand langage (LLM) appelé « Ajax », fonctionnant sur Google Cloud et construit avec Google JAX, un framework créé pour accélérer la recherche sur l’apprentissage automatique. Des sources proches de la situation ont déclaré au média qu’Apple avait plusieurs équipes travaillant sur le projet, qui comprend la prise en compte des implications potentielles en matière de protection de la vie privée.

Alors que d’autres géants de la technologie, dont Meta, Microsoft et Google, se sont empressés de proposer leurs propres produits d’IA générative aux entreprises et au grand public, Apple a brillé par son absence. Alors qu’Apple a interdit à ses employés d’utiliser ChatGPT, Bloomberg rapporte que des ingénieurs ont utilisé en interne le chatbot alimenté par Ajax. Ajax a été créé pour « unifier le développement de l’apprentissage automatique », précise Bloomberg.

Bien qu’elle ait intégré des fonctions d’IA dans ses produits depuis des années, Apple a été prise de court par le succès de concurrents tels que ChatGPT d’OpenAI et Google Bard. Le marché de l’IA générative, qui peut produire des essais, des images et des vidéos à partir de textes, a suscité l’intérêt des consommateurs et des entreprises, entraînant une vague de produits connexes.

Les progrès d’Apple en matière d’IA et la stagnation de Siri

Si Apple a fait des progrès en matière d’IA, notamment dans des domaines tels que l’amélioration des photos et la recherche sur l’iPhone, son assistant vocal Siri stagne. Bien qu’elle ait intégré l’IA dans ses logiciels depuis longtemps, Apple est restée relativement discrète dans le domaine de l’IA générative.

Pour renforcer ses efforts en matière d’IA, Apple a embauché John Giannandrea, anciennement de Google, pour superviser Siri et ses équipes d’apprentissage automatique. Craig Federighi, vice-président senior de l’ingénierie logicielle d’Apple, est également impliqué dans la direction de l’initiative en matière d’IA.

Prochaine annonce sur l’IA

Lors d’une récente conversation avec Good Morning America, le PDG d’Apple, Tim Cook, a indiqué que l’entreprise suivait attentivement l’évolution de la technologie de l’IA et a fait part de ses inquiétudes concernant les produits d’IA. Le rapport indique également que si les projets de l’entreprise dans le domaine de l’IA restent assez flous, certains indices laissent penser qu’Apple pourrait faire une annonce importante liée à l’IA l’année prochaine.

L’intégration idéale des modèles linguistiques d’Apple se ferait au sein de Siri, ce qui permettrait à l’assistant vocal d’effectuer davantage de tâches pour le compte des utilisateurs.

Lire plus
Intelligence Artificielle

Google Bard prend désormais en charge les extensions

E125 444254 GOOGLE Q223 BARD A006 23s fr FR 2096x1182 V4 1 3

Google Bard a finalement trouvé ses marques après des débuts incroyablement difficiles et un long jeu de rattrapage avec d’autres chatbots comme ChatGPT et Bing Chat de Microsoft. Heureusement pour Google, Bard a pris le relais et a introduit un grand nombre de nouvelles fonctionnalités depuis son lancement.

Aujourd’hui, le modèle linguistique IA de Google, Bard, devrait s’intégrer directement à une série de services Google et d’options tierces, offrant aux utilisateurs une expérience améliorée grâce à la prise en charge des extensions. Cela pour constituer l’impulsion finale dont il a besoin pour atteindre, voire dépasser, ChatGPT.

Actuellement, Bard extrait des informations de sites Web mis en cache, mais Google reconnaît le besoin d’informations actualisées qui ne peuvent pas être mises en cache, comme les prix en temps réel et la disponibilité des billets d’avion. Lors de la conférence Google I/O, l’entreprise a dévoilé son intention d’intégrer Bard à ses propres outils, tels que Google Maps, Google Flights et YouTube, ainsi qu’à des services tiers.

Bien que les extensions soient encore au stade early preview, les premiers partenaires incluent Adobe. Neuf extensions devraient être lancées, dont Google Flights, Google Hotels, Google Maps, Instacart, Kayak, OpenTable, Redfin, YouTube et Zillow.

bard extensions preview jpg

Bien que les extensions ne soient pas encore totalement fonctionnelles, un nouveau menu Extensions permettra aux utilisateurs d’activer ou de désactiver des services spécifiques. Chaque extension Bard sera accompagnée d’instructions sur la manière de l’utiliser au mieux. En outre, il semblerait que Google prépare une extension Workspace, permettant à Bard d’accéder à Google Docs, Drive et Gmail.

Une très bonne idée

Ces nouvelles extensions rapprochent Bard de son concurrent, ChatGPT, qui présente également son propre ensemble de plugins, y compris des offres de Kayak et Instacart, qui permettent aux utilisateurs de poser des questions sur les coûts de voyage ou les possibilités de livraison de nourriture et de recevoir des réponses actualisées. Cela pourrait suggérer que Google a l’intention de faire de Bard un assistant de planification, ce qui, en toute honnêteté, est une très bonne idée pour commencer à intégrer Bard dans nos activités quotidiennes.

Cette intégration de divers services améliorera les capacités des modèles linguistiques d’IA, offrant aux utilisateurs une expérience plus complète et plus interactive. Quoi qu’il en soit, ces extensions permettront à Bard de s’aligner sur ChatGPT et lui donneront une longueur d’avance dans la course à la suprématie de l’IA.

Lire plus
Intelligence Artificielle

Bing Chat Enterprise de Microsoft offre une meilleure protection de la vie privée aux entreprises

Microsoft annonce un nouvel outil de chat alimenté par l’IA, conçu pour offrir un niveau plus élevé de protection des données aux entreprises qui s’inquiètent de la confidentialité et de la sécurité des outils d’IA générative. Voici donc Bing Chat Enterprise, une version sécurisée de son chatbot Bing Chat, spécialement conçue pour être utilisée par les employés d’une entreprise.

Cette annonce fait suite à la mise en place par un grand nombre d’entreprises d’interdictions étendues de la technologie, notamment par des sociétés comme Apple, Goldman Sachs, Verizon et Samsung. ChatGPT était la cible principale, mais des alternatives comme Bing Chat et Google Bard ont été incluses dans les interdictions.

La raison la plus souvent citée pour ces interdictions est la sécurité et la confidentialité, ce qui est exactement l’objectif de Bing Chat Enterprise.

BCE inEdgeSidebar Still 16x9 jpgBing Chat Enterprise de Microsoft offre une meilleure protection de la vie privée aux entreprises

Selon un article de blog publié dans le cadre de Microsoft Inspire, l’objectif de Bing Chat Enterprise est de garantir aux organisations que les données des utilisateurs et des entreprises ne fuient jamais à l’extérieur de l’entreprise. « Ce qui entre et sort reste protégé », peut-on lire dans l’article de blog. Cela inclut également les données de discussions, que Microsoft affirme ne pas pouvoir voir ou utiliser pour entraîner les modèles.

Malheureusement, Microsoft n’a pas vraiment expliqué en quoi cela diffère de la version standard de Bing Chat, se contentant d’indiquer que « l’utilisation d’outils d’IA qui ne sont pas conçus pour l’entreprise met involontairement en péril des données commerciales sensibles ».

Toujours les fonctionnalités de base

Microsoft précise que Bing Chat Enterprise utilise toujours des données Web et fournit des réponses sourcées, ainsi que des citations de liens Web. Il est possible d’y accéder directement à partir des emplacements standard de Bing Chat, y compris sur Bing.com, depuis la barre latérale de Microsoft Edge et, à terme, par Windows Copilot.

Bing Chat Enterprise est disponible en preview dès aujourd’hui et est inclus gratuitement dans Microsoft 365. Microsoft précise même que l’application sera bientôt disponible en tant qu’outil autonome pour 5 dollars par mois et par utilisateur.

Lire plus
Intelligence Artificielle

Google va vous permettre de créer votre propre modèle d’IA grâce à NotebookLM

Capture decran 2023 07 17 08.45.40 1

Avez-vous déjà essayé ChatGPT ? Avez-vous utilisé l’un de ces générateurs gratuits d’images d’IA ? Êtes-vous impatient que l’assistant de votre téléphone devienne réellement utile ? Cela vous démange d’avoir des fonctions de ce type sur certains des meilleurs téléphones qui sortiront à l’avenir ?

Sachez que cet avenir est presque proche. Après tout, Google a consacré environ 70 % de sa présentation I/O 2023 à l’IA. Après quoi ils ont accordé 20 minutes de temps de projecteur aux Pixel 7a et Pixel Fold (qui, bien sûr, seront dotés de fonctionnalités basées sur l’IA).

Mais nous sommes impatients de tester les choses alimentées par l’IA dès maintenant ! Et si Bard est arrivée dans de nombreux pays, il y a encore plus à venir. Pourquoi pas le Project Tailwind (qui s’appelle désormais NotebookLM) ? À propos duquel, soit dit en passant, Google a fait preuve de souplesse en le développant en deux semaines environ. Voilà. C’est une bonne chose.

Mais de quoi s’agit-il avec NotebookLM ? Il s’agit de réinventer le traditionnel cahier sur lequel on écrit avec un stylo. Mais voici la particularité : NotebookLM prend toutes vos notes et construit un modèle d’intelligence artificielle basé sur ces informations. Ce qui vous permet de faire des choses intéressantes telles que :

  • Lui demander d’afficher toutes les mentions d’un sujet
  • Vous demander de compiler une liste de situations
  • Créer des glossaires relatifs à un sujet
  • Lui demander de comparer les différentes façons dont l’information est utilisée.

Et, sans doute, bien d’autres choses encore. Si cela vous semble être le meilleur moyen de trier et d’utiliser votre travail scolaire, je ne peux que le confirmer.

DocumentGuide Keyword V2.width 1000.format webp

Bientôt à la disposition de tous

Mais voilà : cet outil va bien au-delà du simple travail scolaire. Cet outil peut vous aider à créer et à naviguer dans des bases de données, des règles et des directives pour différents types de matériel et de logiciels, ou même des choses simples comme la tenue d’un livre de cuisine.

Voici un exemple de ce dernier point :

  • Obtenez toutes vos recettes de famille tapées dans Google Docs
  • Téléchargez-les toutes dans un seul dossier Drive
  • Demandez au modèle d’IA de les analyser
  • Demandez-lui de vous présenter les recettes qui contiennent les ingrédients que vous avez à la maison

J’aime à dire que les percées technologiques les plus importantes sont celles qui peuvent avoir un impact significatif sur chacun, quel que soit son poste ou son secteur d’activité. Et c’est exactement ce qui se passe avec NotebookLM.

Sachez que NotebookLM sera progressivement mis à la disposition du public à partir de maintenant. Si vous êtes impatient de l’essayer, inscrivez-vous pour être averti par ce lien.

Lire plus
Intelligence Artificielle

Google Bard peut désormais s’exprimer, et se dote d’autres nouveautés

ai evergreen hero.width 1600.for

Dans le monde des chatbots d’intelligence artificielle (IA), ChatGPT d’OpenAI est sans doute le plus connu. Mais, Google Bard est sur ses talons, et le chatbot vient de se voir attribuer une nouvelle capacité : le pouvoir de la parole.

Le changement a été détaillé dans un article de blog de Google, qui décrit la mise à jour comme « la plus grande expansion de Bard à ce jour ». Elle permet à Bard non seulement de parler, mais aussi de converser dans plus de 40 langues, dont le français, d’utiliser des images comme prompts, et bien d’autres choses encore.

L’article de blog de Google explique que l’ajout de la parole à Bard peut être utile « si vous voulez entendre la prononciation correcte d’un mot ou écouter un poème ou un script ». Pour écouter ce que le chatbot a à dire, il vous suffit de saisir votre message, d’attendre la réponse, puis de sélectionner l’icône du son.

Bard peut désormais s’exprimer dans plus de 40 langues et comprendre les messages écrits dans ces mêmes langues. La liste des langues comprend le français, l’arabe, le grec, l’espagnol, le swahili, l’urdu et bien d’autres encore.

Les nouvelles fonctionnalités ne se limitent pas à doter Bard d’une boîte vocale. Google indique qu’il est désormais possible d’utiliser une image comme prompt, ce que les rivaux de Bard peuvent faire depuis quelques mois. Cette fonctionnalité utilise Google Lens et n’est disponible qu’en anglais pour l’instant, mais Google précise qu’elle devrait s’étendre à d’autres langues « prochainement ».

Adapter le ton de Bard

En outre, il est désormais possible d’adapter le ton des réponses de Bard, avec des styles de sortie tels que simple, long, court, professionnel ou décontracté. Cela pourrait offrir un peu plus de flexibilité pour l’utilisation de Bard dans différents contextes.

Le chatbot vous permet également d’épingler et de renommer des conversations dans la barre latérale de Google Bard. Si vous l’utilisez pour générer du code, vous pouvez exporter du code Python vers l’environnement de développement intégré Replit, ainsi que vers Google Colab. De plus, vous pouvez désormais partager les réponses du chatbot avec vos amis. Ces trois fonctionnalités fonctionnent dans plus de 40 langues.

Il reste à voir si ces nouvelles astuces aideront Google Bard à réduire l’écart avec ChatGPT. Mais, il est intéressant d’observer ce que font les développeurs d’IA pour tenter de s’imposer dans une compétition qui s’intensifie de plus en plus.

Lire plus
Intelligence Artificielle

Elon Musk lance xAI pour « comprendre la véritable nature de l’univers »

pKRwNMDR

Elon Musk a créé une nouvelle entreprise appelée « xAI », dont l’objectif est de « comprendre la véritable nature de l’univers ». Le site Web Web de l’entreprise mentionne quant à lui qu’elle cherche à comprendre l’univers, plus précisément.

Le site Web de la nouvelle société de Musk se compose actuellement d’une page unique présentant le profil de son équipe dirigeante et appelant des ingénieurs et des chercheurs expérimentés à rejoindre l’entreprise dans la région de la baie de San Francisco. On y trouve également la phrase suivante : « L’objectif de xAI est de comprendre la vraie nature de l’univers ».

Dans un tweet annonçant la nouvelle initiative, Musk a déclaré que xAI viserait à « comprendre la réalité ».

Musk a récemment lancé l’idée de créer « une IA maximisant la recherche de la vérité et essayant de comprendre la nature de l’univers ». Il a proposé le nom de TruthGPT pour cette IA, un clin d’œil subtil à ChatGPT et à ses problèmes de précision. Il semble que xAI soit l’aboutissement de ces ambitions. La société xAI ne fait pas partie de X Corp, qui est aujourd’hui la société mère de Twitter. Toutefois, la dernière entreprise de Musk dans le domaine de l’IA travaillera en étroite collaboration avec Twitter, Tesla et d’autres entreprises.

Pour l’instant, on ne sait pas exactement ce que l’entreprise prévoit de construire, mais l’équipe de xAI sera disponible pour répondre à toutes les questions brûlantes lors d’une session Twitter Spaces le 14 juillet. Musk n’en est pas à son premier coup d’essai en matière d’IA. Il a notamment été l’un des membres fondateurs d’OpenAI, le fabricant de ChatGPT, et a également siégé à son conseil d’administration.

Cependant, il aurait voulu acquérir la société, mais son offre a été rejetée et il s’est retiré avec amertume.

Musk fera-t-il différemment en matière d’IA ?

xAI a embauché (et continue d’embaucher) des experts de l’industrie qui ont travaillé auparavant chez Microsoft, OpenAI, DeepMind et Google Research. La petite équipe de xAI a contribué à des produits d’IA bien connus comme le modèle GPT-4 d’OpenAI, le modèle d’apprentissage profond AlphaCode de Deepmind qui écrit des logiciels à un niveau compétitif, et le modèle de langage Minerva de Google qui peut résoudre des requêtes scientifiques et mathématiques avec une approche étape par étape.

Il est assez intéressant de constater que Musk recrute certains des experts en IA les plus accomplis et met en place un laboratoire d’IA de sa propre poche, alors qu’il est également celui qui met en garde contre le potentiel de l’IA à nuire à la civilisation. Musk a signé une lettre ouverte très médiatisée demandant une pause de six mois dans le développement de modèles d’IA avancés tels que GPT-4, en invoquant des risques tangibles pour l’humanité. Musk a également critiqué publiquement OpenAI à plusieurs reprises pour son développement imprudent de l’IA.

Les experts en neurosciences décrivent également les efforts de Musk pour implanter une puce d’interface cérébrale sur un être humain, bien que sa société Neuralink soit passée au crible pour cruauté envers les animaux, risques de contamination par des agents pathogènes et ambitions démesurées. Il serait intéressant de voir comment xAI fait les choses différemment alors que les appels à la réglementation résonnent partout.

Alors qu’une multitude d’entreprises spécialisées dans l’IA développent déjà des outils de plus en plus sophistiqués pour toute une série de tâches, tant pour les entreprises que pour les consommateurs, Musk semble en retard sur le sujet. Cela pourrait être dû en partie à sa préoccupation pour Twitter, qui a connu une période chaotique depuis qu’il a racheté l’entreprise en octobre. Mais, Musk espère maintenant qu’en attirant la bonne équipe, il pourra avoir un impact significatif et défier les grands acteurs actuels de l’IA.

Lire plus
Intelligence Artificielle

Le chatbot Google Bard est désormais disponible en France, et s’améliore !

Capture decran 2023 07 13 09.31.09

Le chatbot de Google, Bard, a connu un lancement délicat, mais l’entreprise technologique n’a cessé de peaufiner son produit depuis. Les fonctionnalités de Bard ont été considérablement étendues depuis ses débuts, dans le but de suivre ChatGPT d’OpenAI.

Aujourd’hui, la société basée dans la Silicon Valley a annoncé l’une de ses plus importantes mises à jour, qui élargit l’accès, offre davantage de moyens d’interagir avec Bard et introduit des fonctionnalités qui devraient rendre le modèle plus facile à utiliser et à manipuler.

La première grande nouvelle concerne le déploiement progressif de Bard dans le monde entier. Google affirme que le chatbot d’IA est désormais disponible dans « la majeure partie du monde » et qu’il est possible d’interagir avec lui dans « les langues les plus parlées ». Bien que nous ne disposions pas d’un nombre exact de langues, nous savons que Bard en parle désormais plus de 40, dont « le français, l’arabe, le chinois, l’allemand, l’hindi et l’espagnol », selon l’entreprise.

L’expansion n’est pas la seule mise à jour majeure que Google a annoncée aujourd’hui. Plusieurs autres changements majeurs visent à améliorer la productivité des utilisateurs et à multiplier les possibilités d’interaction avec le modèle linguistique.

Les réponses de Bard changent

Le ton est très important lorsqu’il s’agit d’interaction. C’est probablement la raison pour laquelle Google a ajouté une option permettant d’ajuster le ton des réponses que Bard vous donne. Cinq options ont été ajoutées : simple, long, court, professionnel et décontracté. Vous pouvez désormais demander une réponse rapide, une réponse légère ou une réponse approfondie. Le ton peut également être modifié une fois la réponse émise. Ainsi, si vous souhaitez rendre une réponse plus professionnelle ou supprimer des termes techniques détaillés, vous pouvez désormais le faire très facilement.

Cette fonctionnalité est aujourd’hui lancée en anglais, et il est prévu de l’étendre à d’autres langues dans un proche avenir. Google ajoute également une option audio à ses réponses, afin que vous puissiez écouter ce que dit Bard au lieu de le lire. L’entreprise technologique suggère que le bouton audio vous donnera une perspective différente sur Bard, et peut être pratique si vous écoutez des poèmes ou des scripts. L’option audio est disponible dans plus de 40 langues à partir d’aujourd’hui.

Google veut vous rendre plus productif

Bard reçoit également un certain nombre de mises à jour de productivité afin de rendre son utilisation un peu plus efficace. La première nouveauté facilitera le suivi des anciennes conversations. Les utilisateurs peuvent désormais « épingler et renommer » les anciennes conversations dans la barre latérale, ce qui devrait accélérer le temps nécessaire pour retrouver une conversation particulière avec le bot. Les conversations avec Bard peuvent désormais être partagées avec des amis, ce qui facilite la collaboration. Vous pouvez choisir de partager l’intégralité de la conversation par un lien, ou de ne sélectionner que certaines parties de la conversation à transmettre.

Google a également simplifié les choses pour les développeurs en ajoutant Replit à la liste des endroits où le code Python peut être directement exporté. Auparavant, Bard ne pouvait exporter que vers Google Colab.

Capture decran 2023 07 13 09.43.23 scaled

Dernièrement, Google a ajouté Bard à un grand nombre de ses produits. Cette nouvelle mise à jour change un peu les choses et ajoute les capacités de Google Lens à Bard. Vous pouvez donc désormais inclure des images dans vos prompts. Bard peut être en mesure de fournir plus d’informations sur une image, de trouver une légende pour vous ou d’effectuer toute autre tâche pour laquelle l’analyse d’une image particulière serait utile. Contrairement aux autres fonctions de productivité, celle-ci n’est lancée qu’en anglais pour l’instant. Il s’agit de la deuxième grande mise à jour de Bard concernant les images. La première a eu lieu en mai et a donné à Bard la possibilité de trouver et de récupérer des images très spécifiques pour son utilisateur.

Lire plus
Intelligence Artificielle

DALL-E d’OpenAI s’entraînera sur la bibliothèque de Shutterstock pendant encore 6 ans

Shutterstock and OpenAI

Shutterstock, le principal fournisseur de contenu photographique, a annoncé son intention d’étendre son accord existant avec OpenAI, une importante société de recherche et de déploiement de l’IA.

Ce partenariat stratégique vise à stimuler l’innovation technologique en matière d’IA en fournissant à OpenAI de nombreuses données d’entraînement pour ses modèles d’IA. En retour, Shutterstock bénéficiera d’un accès prioritaire aux dernières technologies d’OpenAI et à de nouvelles capacités d’édition, ce qui permettra d’améliorer les options de transformation du contenu pour ses clients.

Shutterstock et OpenAI collaborent depuis 2021, et cette récente extension de leur partenariat renforce l’engagement de Shutterstock à stimuler l’innovation technologique en matière d’IA. OpenAI obtiendra sous licence un large éventail de données de Shutterstock au cours des 6 prochaines années, notamment des images, des vidéos, de la musique et les métadonnées associées. Cet ensemble complet de données permettra à OpenAI d’améliorer ses modèles d’IA et de développer des capacités d’IA générative de pointe.

L’IA générative a révolutionné l’industrie créative en offrant un contenu hautement personnalisable et à la demande. Cette technologie permet aux modèles d’IA de créer des images, des vidéos et de la musique uniques en temps réel, ce qui représente à la fois des opportunités et des défis pour les galeries de contenu comme Shutterstock. Si l’IA générative offre aux utilisateurs des possibilités créatives infinies, elle a également suscité des inquiétudes chez les artistes et les photographes qui craignent que leur travail ne soit utilisé sans crédit ou compensation appropriés.

L’utilisation d’images protégées par des droits d’auteur pour l’entraînement des modèles d’IA est devenue une question controversée, qui donne lieu à des litiges juridiques entre les entreprises d’IA générative et les galeries d’images. Getty Images, un acteur majeur de l’industrie des images de stock, a récemment intenté une action en justice contre Stability AI et Midjourney, les accusant d’avoir récupéré des contenus protégés par le droit d’auteur et d’avoir entraîné leurs modèles d’IA sans autorisation.

Des questions sur les droits d’auteur

Le paysage juridique entourant l’IA et les droits d’auteur est complexe et évolutif. Si certains experts estiment que l’entraînement de modèles à partir d’images publiques relève de la doctrine de l’usage loyal, d’autres pensent qu’une autorisation explicite est nécessaire. Comme il est peu probable que ces questions juridiques soient réglées dans un avenir proche, il est essentiel pour les entreprises comme Shutterstock de naviguer dans cet espace de manière responsable et éthique.

Contrairement à certaines galeries d’images, Shutterstock a choisi d’exploiter le potentiel de l’IA générative. En partenariat avec OpenAI, Shutterstock a lancé un créateur d’images basé sur DALL-E 2 d’OpenAI. Cet outil innovant permet aux utilisateurs de générer des images uniques et personnalisables, élargissant ainsi les possibilités créatives des clients de Shutterstock.

Pour répondre aux préoccupations des artistes et des photographes, Shutterstock a mis en place un « fonds de contribution » qui rémunère les artistes pour leur contribution à la formation des modèles d’IA générative de Shutterstock. En outre, Shutterstock maintient des redevances permanentes liées à l’octroi de licences pour les actifs nouvellement générés, ce qui garantit que les artistes reçoivent une reconnaissance et une rémunération appropriées pour leur travail.

Shutterstock veut rester à la pointe de la technologie

L’engagement de Shutterstock dans le développement de modèles d’IA générative va au-delà de son partenariat avec OpenAI. L’entreprise a conclu des accords de licence avec des acteurs clés de l’industrie tels que Nvidia, Meta et LG. Ces collaborations visent à faire progresser l’IA générative dans divers domaines, notamment les modèles 3D, les images et le texte.

En travaillant avec des leaders de l’industrie, Shutterstock peut tirer parti de leur expertise et de leurs ressources pour stimuler l’innovation dans le domaine de l’IA générative. Cette approche collaborative permet à Shutterstock de rester à la pointe des avancées technologiques tout en favorisant des relations mutuellement bénéfiques au sein de la communauté de l’IA.

La collaboration entre Shutterstock et OpenAI représente une étape importante vers l’avenir du contenu de stock alimenté par l’IA. À mesure que l’IA générative continue d’évoluer, elle jouera un rôle crucial pour répondre à la demande croissante de contenu hautement personnalisé et à la demande. En exploitant la puissance de l’IA, Shutterstock vise à donner aux créatifs et aux spécialistes du marketing des outils innovants qui rationalisent le processus de création de contenu.

Lire plus
Intelligence Artificielle

Qu’est-ce que l’IA générative et pourquoi est-elle importante ?

generativeAI security Vyacheslav

L’ère de l’intelligence artificielle est arrivée, et l’IA générative joue un rôle essentiel en apportant des avancées sans précédent à la technologie quotidienne. Il existe déjà plusieurs outils d’IA gratuits qui peuvent vous aider à générer des images, des textes, de la musique, des vidéos et bien d’autres choses encore en quelques secondes. Le remplissage génératif AI d’Adobe dans Photoshop et les capacités étonnantes de Midjourney nous ont en effet surpris.

Mais qu’est-ce que l’IA générative et comment alimente-t-elle une innovation aussi rapide ?

Comme son nom l’indique, l’IA générative désigne un type de technologie d’IA capable de générer un nouveau contenu à partir des données sur lesquelles elle a été formée. Elle peut générer des textes, des images, des sons, des vidéos et des données synthétiques. L’IA générative peut produire un large éventail de résultats sur la base des entrées de l’utilisateur ou de ce que nous appelons des « invites ». L’IA générative est essentiellement un sous-domaine de l’apprentissage automatique qui peut créer de nouvelles données à partir d’un ensemble de données donné.

Si le modèle a été entraîné sur de grands volumes de texte, il peut produire de nouvelles combinaisons de textes à consonance naturelle. Plus les données sont importantes, meilleur sera le résultat. Si l’ensemble de données a été nettoyé avant l’entraînement, vous obtiendrez probablement une réponse nuancée.

Qu’est-ce que l’IA générative et pourquoi est-elle importante ?

De même, si vous avez entraîné un modèle à l’aide d’un vaste corpus d’images comportant un label, des légendes et de nombreux exemples visuels, le modèle d’IA peut apprendre à partir de ces exemples et procéder à la classification et à la génération d’images. Ce système sophistiqué d’IA programmé pour apprendre à partir d’exemples s’appelle un réseau neuronal.

artificial intelligence ChatGPT jpg

Cela dit, il existe différents types de modèles d’IA générative. Il s’agit des GAN, Generative Adversarial Network (réseau antagoniste génératif), des autoencodeurs variationnels (VAE), des transformateurs génératifs pré-entrainés (GPT), des modèles autorégressifs, et bien d’autres encore. Je vais brièvement évoquer ces modèles génératifs ci-dessous.

Actuellement, les modèles GPT sont devenus populaires après la publication de GPT-4/3.5 (ChatGPT), PaLM 2 (Google Bard), GPT-3 (DALL – E), LLaMA (Meta), Stable Diffusion, et d’autres. Toutes ces interfaces d’IA conviviales sont construites sur l’architecture Transformer. Dans cet article, nous allons donc nous concentrer sur l’IA générative et GPT (Generative Pretrained Transformer).

Quels sont les différents types de modèles d’IA générative ?

Parmi tous les modèles d’IA générative, GPT est privilégié par beaucoup, mais commençons par le GAN.

Dans une architecture GAN, deux réseaux parallèles sont formés, dont l’un est utilisé pour générer du contenu (appelé générateur) et l’autre évalue le contenu généré (appelé discriminateur). Fondamentalement, l’objectif est d’opposer deux réseaux neuronaux afin d’obtenir des résultats qui reflètent les données réelles. Les modèles basés sur les GAN ont été principalement utilisés pour les tâches de génération d’images.

Ensuite, nous avons l’autoencodeur variationnel (VAE), qui implique le processus d’encodage, d’apprentissage, de décodage et de génération de contenu. Par exemple, si vous avez l’image d’un chien, l’autoencodeur décrit la scène (couleur, taille, oreilles, etc.), puis apprend les caractéristiques d’un chien. Ensuite, il recrée une image approximative à l’aide de points clés, ce qui donne une image simplifiée. Enfin, il génère l’image finale après avoir ajouté davantage de variété et de nuances.

En ce qui concerne les modèles autorégressifs, ils sont proches du modèle T et Transformer mais manquent d’auto-attention. Il est principalement utilisé pour générer des textes en produisant une séquence, puis en prédisant la partie suivante sur la base des séquences qu’il a générées jusqu’à présent. Ensuite, nous avons les modèles de normalisation des flux et les modèles basés sur l’énergie.

Qu’est-ce qu’un modèle GPT (Generative Pretrained Transformer) ?

Avant l’arrivée de l’architecture Transformer, les réseaux neuronaux récurrents (RNN) et les réseaux neuronaux convolutifs (CNN) comme les GAN et les VAE étaient largement utilisés pour l’IA générative. En 2017, des chercheurs travaillant chez Google ont publié un article fondateur intitulé « Attention is all you need » (Vaswani, Uszkoreit, et al., 2017) pour faire progresser le domaine de l’IA générative et créer quelque chose comme un grand modèle de langage (LLM).

Google a ensuite publié le modèle BERT (Bidirectional Encoder Representations from Transformers) en 2018, qui met en œuvre l’architecture Transformer. Au même moment, OpenAI a publié son premier modèle GPT-1 basé sur l’architecture Transformer.

Quel est donc l’ingrédient clé de l’architecture Transformer qui en a fait un favori pour l’IA générative ? Comme l’article l’a justement intitulé, elle a introduit l’auto-attention, qui faisait défaut dans les architectures de réseaux neuronaux antérieures. Cela signifie qu’elle prédit le mot suivant dans une phrase à l’aide d’une méthode appelée Transformer. Il accorde une attention particulière aux mots voisins afin de comprendre le contexte et d’établir une relation entre les mots.

Grâce à ce processus, le Transformer développe une compréhension raisonnable de la langue et utilise ces connaissances pour prédire le mot suivant de manière fiable. L’ensemble de ce processus est appelé mécanisme d’attention.

transformers jpg

« Pré-entraîné »

Ceci dit, il faut garder à l’esprit que les LLM sont appelés avec mépris perroquets stochastiques (Bender, Gebru, et al., 2021) parce que le modèle imite simplement des mots aléatoires sur la base de décisions probabilistes et de modèles qu’il a appris. Il ne détermine pas le mot suivant sur la base de la logique et n’a pas de véritable compréhension du texte.

Pour ce qui est du terme « pré-entraîné » dans GPT, il signifie que le modèle a déjà été entraîné sur une quantité massive de données textuelles avant même d’appliquer le mécanisme d’attention. En pré-entraînant les données, il apprend ce qu’est une structure de phrase, des modèles, des faits, des phrases, etc. Cela permet au modèle de bien comprendre le fonctionnement de la syntaxe du langage.

Comment Google et OpenAI abordent-ils l’IA générative ?

Google et OpenAI utilisent tous deux des modèles basés sur des Transformers respectivement dans Google Bard et ChatGPT. Cependant, il existe des différences majeures dans l’approche. Le dernier modèle PaLM 2 de Google utilise un encodeur bidirectionnel (mécanisme d’auto-attention et réseau neuronal de type feed-forward), ce qui signifie qu’il prend en compte tous les mots environnants. Il essaie essentiellement de comprendre le contexte de la phrase et génère ensuite tous les mots à la fois. L’approche de Google consiste essentiellement à prédire les mots manquants dans un contexte donné.

En revanche, ChatGPT d’OpenAI s’appuie sur l’architecture Transformer pour prédire le mot suivant dans une séquence — de gauche à droite. Il s’agit d’un modèle unidirectionnel conçu pour générer des phrases cohérentes. Il continue la prédiction jusqu’à ce qu’il ait généré une phrase complète ou un paragraphe. C’est peut-être la raison pour laquelle Google Bard est capable de générer des textes beaucoup plus rapidement que ChatGPT. Néanmoins, les deux modèles s’appuient sur l’architecture Transformer pour offrir des frontaux d’IA générative.

Applications de l’IA générative

Nous savons tous que l’IA générative a d’énormes applications non seulement pour le texte, mais aussi pour les images, les vidéos, la génération audio et bien d’autres choses encore. Les chatbots comme ChatGPT, Google Bard, Bing Chat, etc., tirent parti de l’IA générative. L’IA générative peut également être utilisée pour l’autocomplétion, le résumé de texte, l’assistant virtuel, la traduction, etc. Pour générer de la musique, nous avons vu des exemples comme Google MusicLM et récemment Meta a lancé MusicGen pour la génération de musique.

Par ailleurs, de DALL-E 2 à Stable Diffusion, tous utilisent l’IA générative pour créer des images réalistes à partir de descriptions textuelles. Dans la génération de vidéos également, les modèles Runway’s Gen-1, StyleGAN 2 et BigGAN s’appuient sur des réseaux adversoriels génératifs pour générer des vidéos réalistes. En outre, l’IA générative trouve des applications dans la génération de modèles 3D et certains des modèles les plus populaires sont DeepFashion et ShapeNet.

L’IA générative peut également être d’une aide précieuse dans la découverte de médicaments. Elle peut concevoir de nouveaux médicaments pour une maladie spécifique. Nous avons déjà vu des modèles de découverte de médicaments comme AlphaFold, développé par Google DeepMind. Enfin, l’IA générative peut être utilisée pour la modélisation prédictive afin de prévoir des événements futurs dans les domaines de la finance et de la météorologie.

Limites de l’IA générative

Si l’IA générative possède d’immenses capacités, elle n’est pas exempte de défauts. Tout d’abord, elle nécessite un large corpus de données pour entraîner un modèle. Pour de nombreuses petites startups, des données de haute qualité peuvent ne pas être facilement disponibles. Nous avons déjà vu des entreprises telles que Reddit, Stack Overflow et Twitter fermer l’accès à leurs données ou facturer des frais d’accès élevés. Récemment, The Internet Archive a signalé que son site Web était devenu inaccessible pendant une heure parce qu’une startup d’IA avait commencé à le harceler pour obtenir des données d’entraînement.

Par ailleurs, les modèles d’IA générative ont également été fortement critiqués pour leur manque de contrôle et leur partialité. Les modèles d’IA formés à partir de données biaisées provenant de l’Internet peuvent surreprésenter une partie de la communauté. Nous avons vu que les générateurs de photos de l’IA rendent principalement des images avec des tons de peau plus clairs. Ensuite, il y a un énorme problème de génération de vidéos et d’images « deepfake » à l’aide de modèles d’IA générative. Comme indiqué précédemment, les modèles d’IA générative ne comprennent pas le sens ou l’impact de leurs mots et imitent généralement des résultats basés sur les données sur lesquelles ils ont été formés.

Il est fort probable qu’en dépit des meilleurs efforts et de l’alignement, de la désinformation, de la génération de deepfakes, du jailbreaking et des tentatives sophistiquées de phishing utilisant sa capacité persuasive de langage naturel, les entreprises auront du mal à dompter les limites de l’IA générative.

Lire plus
Intelligence Artificielle

Anthropic dévoile Claude 2, le dernier concurrent de ChatGPT

Claude2 Blog V1 1

Anthropic, le laboratoire d’IA créé par des expatriés de OpenAI, a lancé son propre concurrent de ChatGPT, Claude, en mars dernier. Aujourd’hui, Anthropic présente Claude 2, son chatbot d’IA de nouvelle génération, qui serait plus rapide, plus intelligent pour traiter des requêtes plus longues, et il est plus apte à articuler ses réponses.

Le laboratoire d’IA basé à San Francisco affirme que Claude peut désormais éviter les contenus nuisibles de manière plus efficace. Le processus de développement d’Anthropic a notamment consisté à former le modèle Claude à des règles inspirées de la Déclaration universelle des droits de l’homme des Nations unies. Pour une IA, cette « constitution morale » n’est rien de plus qu’un ensemble de paramètres, mais elle fait toute la différence en rendant le chatbot plus empathique et plus humain, et moins machinal.

Anthropic décrit cet effort dans un document de recherche intitulé « Constitutional AI: Harmlessness from AI Feedback ». Un autre aspect notable de cette approche est que Claude est censé améliorer lui-même son comportement et s’adapter aux cas de mauvaise conduite sans nécessiter d’intervention humaine.

D’après les tests internes d’Anthropic, Claude 2 serait deux fois plus efficace pour éviter les réponses nuisibles. Pour l’instant, le seul inconvénient est que Claude 2 est limité aux États-Unis et au Royaume-Uni, mais Anthropic prévoit de l’étendre à l’échelle mondiale dans les mois à venir.

Une alternative à ChatGPT qui mise sur la sécurité

Autre évolution notable, Claude 2 est désormais accessible via son propre site Web. Afin d’élargir sa portée, notamment auprès des entreprises, les API de la deuxième génération du modèle Claude ont également été publiées.

Avec Claude 2, Anthropic cherche à offrir une mise à jour de la même ampleur que celle obtenue par OpenAI avec la mise à jour GPT-4 pour ChatGPT. Claude 2 est censé offrir une mémoire plus longue, et est également meilleur pour résoudre les questions mathématiques, alignées sur le code, ainsi que les requêtes signées par le raisonnement.

Anthropic affirme que Claude 2 a obtenu 76,5 % de réponses correctes aux questions à choix multiples de l’examen du barreau, ce qui représente un bond significatif de plus de 73 % par rapport au modèle Claude 1.3.

Claude 2 Long Input Output vimeo 844014740 hls google mediacdn sep 2666
L’entreprise précise que les utilisateurs peuvent désormais saisir des requêtes d’une valeur de 100 000 jetons. Pour mettre cela en perspective, ChatGPT ne peut traiter que des jetons d’une valeur maximale de 8 000 jetons. En termes linguistiques, environ 2 000 jetons envoyés à Claude correspondent à un essai de 1 500 mots. Anthropic a procédé à la mise à jour des jetons en mai 2023, notant que Claude pouvait désormais traiter un roman entier en moins d’une minute.

Pour les utilisateurs, cela signifie que Claude 2 peut désormais traiter facilement des documents longs comme des lettres et des histoires, tout en étant capable de condenser de longs documents en des formes concises.

Claude 2 semble séduire les entreprises

L’approche d’Anthropic semble trouver un écho auprès des entreprises. La startup travaille avec des « milliers d’entreprises » qui utilisent l’API de Claude, y compris des sociétés de productivité comme Slack et Notion. Elle a déclaré que la fenêtre contextuelle de 100 000 jetons (c’est-à-dire la quantité d’informations que vous pouvez saisir) dans Claude 2 permet de nouveaux cas d’utilisation tels que le résumé de longues conversations ou la rédaction de mémos et d’articles d’opinion.

Dans un secteur dominé par des acteurs majeurs comme OpenAI, Anthropic gagne du terrain en se concentrant sur le développement de solutions d’IA responsables, transparentes et faciles à utiliser.

Lire plus
Intelligence Artificielle

OpenAI lance l’API GPT-4 pour tous

openai lance api gpt 4 pour tous 0

Généralement considérée comme son produit API le plus puissant, l’API GPT-4 a été lancée pour la première fois en mars, mais a fait l’objet de tests fermés jusqu’à présent. En tant qu’API, les développeurs peuvent utiliser une interface spéciale pour intégrer le grand modèle linguistique (LLM) d’OpenAI dans leurs propres produits pour des utilisations telles que le résumé, l’aide au codage, l’analyse et la composition. Le modèle fonctionne à distance sur les serveurs d’OpenAI et fournit des résultats à d’autres applications via Internet.

OpenAI indique que l’API GPT-4 avec le contexte 8K est accessible aux développeurs existants qui ont un historique de paiement satisfaisant, et prévoit d’ouvrir l’accès à de nouveaux développeurs d’ici à la fin du mois de juillet. Afin de se démarquer des anciens modèles de type GPT-3, OpenAI a également décidé de commencer à retirer les modèles « Completions API » en faveur des nouveaux modèles Chat Completions API. Depuis son lancement en mars, OpenAI indique que ses modèles Chat Completions API représentent désormais 97 % de l’utilisation de l’API GPT d’OpenAI.

openai lance api gpt 4 pour tous 1 jpg

Ce plan de dépréciation implique le retrait des modèles qui font partie de Completions API dans 6 mois. À partir du 4 janvier 2024, ces anciens modèles, qui se contentent de compléter une invite au lieu d’engager un dialogue de type chat, seront remplacés par des versions plus récentes, et les développeurs qui utilisent certains de ces modèles devront mettre à jour leur intégration manuellement. Pour l’instant, les anciens modèles resteront disponibles mais seront étiquetés comme des produits « hérités ». Voici une liste partielle des modèles qui seront obsolètes :

  • ada
  • babbage
  • curie
  • davinci
  • davinci-instruct-beta
  • curie-instruct-beta
  • texte-ada-001
  • texte-babbage-001
  • texte-curie-001
  • texte-davinci-001
  • texte-davinci-002
  • texte-davinci-003

OpenAI fournira des remplacements directs pour ces anciens modèles. Par exemple, OpenAI recommande aux utilisateurs du modèle text-davinci-003 de passer au modèle gpt-3.5-turbo-instruct. De même, les modèles ada-002, babbage-002, curie-002 et davinci-002 remplaceront les versions antérieures de chacun d’entre eux.

Les applications utilisant certains de ces modèles GPT-3 (tels que ada, babbage, curie, davinci) seront « automatiquement mises à niveau vers les nouveaux modèles énumérés ci-dessus le 4 janvier 2024 », selon OpenAI.

La fin des modèles « Completions API »

OpenAI a également annoncé que « sur la base de la stabilité et de la préparation de ces modèles pour une utilisation à l’échelle de la production », elle rend également les API pour Whisper, DALL-E et GPT-3.5 Turbo « généralement disponibles ». L’entreprise prévoit de continuer à peaufiner les modèles tout au long de l’année.

Les développeurs trouveront plus de détails dans l’article de blog d’OpenAI relatif à l’annonce.

Lire plus